Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
| Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
| modul:mathe:ma4:thema:wahrscheinlichkeit:standardabweichung [2026/04/13 08:46] – [LU01b – Standardabweichung und die 68–95–99.7-Regel] kmaurizi | modul:mathe:ma4:thema:wahrscheinlichkeit:standardabweichung [2026/04/13 09:32] (aktuell) – kmaurizi | ||
|---|---|---|---|
| Zeile 1: | Zeile 1: | ||
| - | ====== | + | ====== |
| **Ziel:** Du kannst die Standardabweichung als Streuungsmass erklären, die 68–95–99.7-Regel anwenden und Werte mithilfe des **z-Scores standardisieren**. | **Ziel:** Du kannst die Standardabweichung als Streuungsmass erklären, die 68–95–99.7-Regel anwenden und Werte mithilfe des **z-Scores standardisieren**. | ||
| Zeile 11: | Zeile 11: | ||
| * **95 %** aller Werte liegen innerhalb von **± 2σ** vom Mittelwert. | * **95 %** aller Werte liegen innerhalb von **± 2σ** vom Mittelwert. | ||
| * **99.7 %** aller Werte liegen innerhalb von **± 3σ** vom Mittelwert. | * **99.7 %** aller Werte liegen innerhalb von **± 3σ** vom Mittelwert. | ||
| - | * Der **z-Score** gibt an, wie viele Standardabweichungen ein Wert vom Mittelwert entfernt ist: \(z = \frac{x - \mu}{\sigma}\) | ||
| ---- | ---- | ||
| Zeile 19: | Zeile 18: | ||
| Die **Standardabweichung σ** (Sigma) misst, wie stark die Werte eines Datensatzes um den **Mittelwert μ** herum streuen. | Die **Standardabweichung σ** (Sigma) misst, wie stark die Werte eines Datensatzes um den **Mittelwert μ** herum streuen. | ||
| - | {{: | + | {{: |
| ^ Sigma ^ Bedeutung ^ Kurvenform ^ | ^ Sigma ^ Bedeutung ^ Kurvenform ^ | ||
| Zeile 29: | Zeile 28: | ||
| Die Formel für die Standardabweichung lautet: | Die Formel für die Standardabweichung lautet: | ||
| - | \[ \sigma = \sqrt{\frac{1}{n} \sum_{i=1}^{n}(x_i - \mu)^2} \] | + | {{: |
| > **Hinweis: | > **Hinweis: | ||
| Zeile 39: | Zeile 38: | ||
| Bei einer normalverteilten Datenmenge gilt immer folgende **Faustregel**: | Bei einer normalverteilten Datenmenge gilt immer folgende **Faustregel**: | ||
| - | {{: | + | {{: |
| ^ Bereich ^ Anteil der Werte ^ Bedeutung ^ | ^ Bereich ^ Anteil der Werte ^ Bedeutung ^ | ||
| Zeile 55: | Zeile 54: | ||
| **Schritt 1 – Mittelwert berechnen: | **Schritt 1 – Mittelwert berechnen: | ||
| - | \[ \mu = \frac{1.1 + 1.7}{2} = 1.4 \text{ m} \] | + | |
| + | {{: | ||
| **Schritt 2 – Standardabweichung berechnen: | **Schritt 2 – Standardabweichung berechnen: | ||
| 95 % entsprechen ± 2σ → der Gesamtbereich von 1.1 bis 1.7 m umfasst 4σ: | 95 % entsprechen ± 2σ → der Gesamtbereich von 1.1 bis 1.7 m umfasst 4σ: | ||
| - | \[ \sigma = \frac{1.7 - 1.1}{4} = \frac{0.6}{4} = 0.15 \text{ m} \] | + | |
| + | {{: | ||
| **Kontrolle: | **Kontrolle: | ||
| Zeile 67: | Zeile 68: | ||
| * 3σ-Bereich: | * 3σ-Bereich: | ||
| - | ---- | ||
| - | |||
| - | ===== 3) Der z-Score (Standardwert) ===== | ||
| - | |||
| - | Der **z-Score** gibt an, wie viele Standardabweichungen ein bestimmter Wert \(x\) vom Mittelwert μ entfernt ist. | ||
| - | |||
| - | \[ \boxed{z = \frac{x - \mu}{\sigma}} \] | ||
| - | |||
| - | Dabei gilt: | ||
| - | |||
| - | ^ Symbol ^ Bedeutung ^ | ||
| - | | \(z\) | z-Score (Standardwert) | | ||
| - | | \(x\) | der zu standardisierende Wert | | ||
| - | | \(\mu\) | Mittelwert der Verteilung | | ||
| - | | \(\sigma\) | Standardabweichung | | ||
| - | |||
| - | ==== 3.1 Vorgehen ==== | ||
| - | |||
| - | - Mittelwert subtrahieren: | ||
| - | - Durch Standardabweichung dividieren: \(\div\; \sigma\) | ||
| - | |||
| - | > **Ergebnis: | ||
| - | |||
| - | ==== 3.2 Beispiel: Reisezeiten ==== | ||
| - | |||
| - | Eine Umfrage über tägliche Reisezeiten (in Minuten) ergab: | ||
| - | |||
| - | 26, 33, 65, 28, 34, 55, 25, 44, 50, 36, 26, 37, 43, 62, 35, 38, 45, 32, 28, 34 | ||
| - | |||
| - | * Mittelwert: \(\mu = 38.8\) Minuten | ||
| - | * Standardabweichung: | ||
| - | |||
| - | Die ersten drei Werte standardisiert: | ||
| - | |||
| - | ^ Originalwert \(x\) ^ Berechnung ^ z-Score ^ Interpretation ^ | ||
| - | | 26 | \(\frac{26 - 38.8}{11.4}\) | **−1.12** | 1.12σ unter dem Mittelwert | | ||
| - | | 33 | \(\frac{33 - 38.8}{11.4}\) | **−0.51** | 0.51σ unter dem Mittelwert | | ||
| - | | 65 | \(\frac{65 - 38.8}{11.4}\) | **+2.30** | 2.30σ über dem Mittelwert | | ||
| - | |||
| - | ==== 3.3 Wozu dient der z-Score? ==== | ||
| - | |||
| - | * **Vergleichbarkeit: | ||
| - | * **Tabellen: | ||
| - | * **Ausreisser erkennen:** Werte mit |z| > 3 gelten als statistisch ungewöhnlich. | ||
| - | |||
| - | ==== 3.4 Praxisbeispiel: | ||
| - | |||
| - | Ein Lehrer bewertet einen Test (max. 60 Punkte): | ||
| - | |||
| - | 20, 15, 26, 32, 18, 28, 35, 14, 26, 22, 17 | ||
| - | |||
| - | Der Test war zu schwer – die meisten Schüler bestehen nicht. Der Lehrer standardisiert die Noten und erklärt alle z-Scores unter −1 als „ungenügend": | ||
| - | |||
| - | * \(\mu = 23\), \(\sigma = 6.6\) | ||
| - | * z-Scores: −0.45, **−1.21**, | ||
| - | |||
| - | Nur **2 Schüler** (fett) gelten als ungenügend → deutlich fairer! | ||
| - | |||
| - | ---- | ||
| - | ===== 4) Prozentzonen der Standardnormalverteilung ===== | + | ===== 3) Prozentzonen der Standardnormalverteilung ===== |
| Die Standardnormalverteilung (μ = 0, σ = 1) lässt sich in Zonen aufteilen: | Die Standardnormalverteilung (μ = 0, σ = 1) lässt sich in Zonen aufteilen: | ||
| Zeile 151: | Zeile 93: | ||
| ---- | ---- | ||
| - | ===== 5) Praxisbeispiel: | + | ===== 4) Praxisbeispiel: |
| Eine Abfüllmaschine hat: \(\mu = 1010\) g, \(\sigma = 20\) g. | Eine Abfüllmaschine hat: \(\mu = 1010\) g, \(\sigma = 20\) g. | ||
| Zeile 160: | Zeile 102: | ||
| **Option A – Mittelwert erhöhen:** | **Option A – Mittelwert erhöhen:** | ||
| - | \[ \mu_{neu} = 1000 + 2.5 \times 20 = 1050 \text{ g} \] | + | |
| + | {{: | ||
| **Option B – Streuung verringern: | **Option B – Streuung verringern: | ||
| - | \[ \sigma_{neu} = \frac{10}{2.5} = 4 \text{ g} \] | + | |
| + | {{: | ||
| > **Fazit:** Mit der 68–95–99.7-Regel und dem z-Score können Produktionsprozesse **quantitativ gesteuert** werden – entweder durch Anpassen des Mittelwerts oder durch Verringern der Streuung. | > **Fazit:** Mit der 68–95–99.7-Regel und dem z-Score können Produktionsprozesse **quantitativ gesteuert** werden – entweder durch Anpassen des Mittelwerts oder durch Verringern der Streuung. | ||
| - | ---- | + | |
| + | ===== 5) Normalverteilung ohne Histogramm prüfen ===== | ||
| + | |||
| + | Manchmal liegt kein Histogramm vor – man hat nur die **rohen Datenwerte**. Trotzdem lässt sich mit der empirischen Regel prüfen, ob die Daten näherungsweise normalverteilt (hügelförmig) sind. | ||
| + | |||
| + | > **Grundidee: | ||
| + | |||
| + | ==== 5.1 Vorgehen (Schritt für Schritt) ==== | ||
| + | |||
| + | **Schritt 1 – Mittelwert μ und Standardabweichung σ berechnen** | ||
| + | |||
| + | Aus den Rohdaten: \(\mu = \bar{x}\) und \(\sigma\) wie gewohnt (Taschenrechner oder Excel). | ||
| + | |||
| + | **Schritt 2 – Die drei Intervallgrenzen bestimmen** | ||
| + | |||
| + | \[ | ||
| + | [\mu - \sigma \;;\; \mu + \sigma] \qquad | ||
| + | [\mu - 2\sigma \;;\; \mu + 2\sigma] \qquad | ||
| + | [\mu - 3\sigma \;;\; \mu + 3\sigma] | ||
| + | \] | ||
| + | |||
| + | **Schritt 3 – Werte in jedem Band zählen** | ||
| + | |||
| + | Wie viele Datenpunkte liegen innerhalb jedes Intervalls? → Anzahl durch Gesamtanzahl \(n\) dividieren → Prozentwert. | ||
| + | |||
| + | **Schritt 4 – Mit der 68–95–99.7-Regel vergleichen** | ||
| + | |||
| + | ^ Band ^ Gemessener Anteil ^ Erwarteter Anteil ^ Beurteilung ^ | ||
| + | | μ ± 1σ | (selbst berechnet) | **≈ 68 %** | Abweichung < 10 % → OK | | ||
| + | | μ ± 2σ | (selbst berechnet) | **≈ 95 %** | Abweichung < 5 % → OK | | ||
| + | | μ ± 3σ | (selbst berechnet) | **≈ 99.7 %** | Fast alle Werte → OK | | ||
| + | |||
| + | Wenn alle drei Werte gut übereinstimmen: | ||
| + | |||
| + | > **Wichtig: | ||
| + | |||
| + | ==== 5.2 Vollständiges Beispiel: Testergebnisse ==== | ||
| + | |||
| + | **Gegeben: | ||
| + | |||
| + | 62, 65, 68, 68, 70, 71, 72, 72, 73, 74, | ||
| + | 74, 75, 75, 76, 76, 77, 77, 78, 78, 79, | ||
| + | 79, 80, 81, 82, 82, 83, 84, 85, 87, 91 | ||
| + | |||
| + | **Schritt 1 – Kennzahlen berechnen: | ||
| + | |||
| + | \[ \mu = 76.8 \qquad \sigma = 6.1 \qquad n = 30 \] | ||
| + | |||
| + | **Schritt 2 – Intervallgrenzen: | ||
| + | |||
| + | \[ \mu \pm 1\sigma = [70.7 \;;\; 82.9] \] | ||
| + | \[ \mu \pm 2\sigma = [64.6 \;;\; 89.0] \] | ||
| + | \[ \mu \pm 3\sigma = [58.5 \;;\; 95.1] \] | ||
| + | |||
| + | **Schritt 3 – Werte zählen: | ||
| + | |||
| + | ^ Band ^ Intervall ^ Anzahl Werte ^ Anteil ^ | ||
| + | | μ ± 1σ | [70.7 – 82.9] | 21 von 30 | **70 %** | | ||
| + | | μ ± 2σ | [64.6 – 89.0] | 28 von 30 | **93 %** | | ||
| + | | μ ± 3σ | [58.5 – 95.1] | 30 von 30 | **100 %** | | ||
| + | |||
| + | **Schritt 4 – Vergleich und Urteil:** | ||
| + | |||
| + | {{: | ||
| + | |||
| + | ^ Band ^ Gemessen ^ Erwartet ^ Differenz ^ Urteil ^ | ||
| + | | μ ± 1σ | 70 % | 68 % | +2 % | ✓ passt gut | | ||
| + | | μ ± 2σ | 93 % | 95 % | −2 % | ✓ passt gut | | ||
| + | | μ ± 3σ | 100 % | 99.7 % | +0.3 % | ✓ passt gut | | ||
| + | |||
| + | **Fazit:** Alle drei Bänder stimmen gut mit den Erwartungswerten überein → Die Testergebnisse sind **näherungsweise normalverteilt**. | ||
| + | |||
| + | ==== 5.3 Gegenbeispiel: | ||
| + | |||
| + | **Gegeben: | ||
| + | |||
| + | 42, 45, 47, 48, 50, 51, 52, 53, 55, 58, | ||
| + | 60, 62, 65, 70, 80, 95, 110, 140, 200, 380 | ||
| + | |||
| + | \[ \mu = 88.2 \qquad \sigma = 82.5 \qquad n = 20 \] | ||
| + | |||
| + | ^ Band ^ Intervall ^ Anteil ^ Erwartet ^ Urteil ^ | ||
| + | | μ ± 1σ | [5.7 – 170.7] | 18 / 20 = **90 %** | 68 % | ✗ zu viele | | ||
| + | | μ ± 2σ | [−76.8 – 253.2] | 19 / 20 = **95 %** | 95 % | ~ passt zufällig | | ||
| + | | μ ± 3σ | [−159.3 – 335.7] | 19 / 20 = **95 %** | 99.7 % | ✗ zu wenige | | ||
| + | |||
| + | **Fazit:** Das 1σ-Band enthält 90 % statt 68 % → Die Daten sind **rechtsschief verteilt**, nicht normalverteilt. (Typisch für Einkommensdaten.) | ||
| + | |||
| + | ==== 5.4 Zusammenfassung: | ||
| + | |||
| + | < | ||
| + | 1. μ und σ berechnen | ||
| + | 2. Grenzen bestimmen: | ||
| + | 3. Werte in jedem Band zählen → Prozent berechnen | ||
| + | 4. Vergleichen: | ||
| + | ≈ 68 % im 1σ-Band? | ||
| + | ≈ 95 % im 2σ-Band? | ||
| + | ≈ 99.7% im 3σ-Band? | ||
| + | 5. Urteil: Alle drei passen → näherungsweise normalverteilt ✓ | ||
| + | | ||
| + | </ | ||
| + | |||
| + | > **Einschränkung: | ||
| ===== Verständnisfragen ===== | ===== Verständnisfragen ===== | ||
| Zeile 176: | Zeile 222: | ||
| - Warum ist die Standardisierung nützlich, wenn man Werte aus **verschiedenen Verteilungen** vergleichen will? | - Warum ist die Standardisierung nützlich, wenn man Werte aus **verschiedenen Verteilungen** vergleichen will? | ||
| - Eine Maschine produziert Teile mit \(\mu = 100\) mm und \(\sigma = 2\) mm. Wie gross ist der Anteil der Teile, die **kürzer als 96 mm** sind? | - Eine Maschine produziert Teile mit \(\mu = 100\) mm und \(\sigma = 2\) mm. Wie gross ist der Anteil der Teile, die **kürzer als 96 mm** sind? | ||
| - | |||
| - | ---- | ||
| - | |||
| - | **Zurück zu:** [[lu01a_normalverteilung|← LU01a – Normalverteilung]] | ||
| ---- | ---- | ||
| [[https:// | [[https:// | ||