LU02a - Normalverteilung

Dies ist eine alte Version des Dokuments!

Ziel: Du kannst erklären, was eine Normalverteilung ist, die 68-95-99.7-Regel anwenden und Datenwerte mithilfe des z-Scores standardisieren.

Normalverteilung: Daten häufen sich um einen zentralen Wert und nehmen nach beiden Seiten gleichmässig ab → Glockenform.
Mittelwert = Median = Modus (alle drei fallen zusammen).
68 % aller Werte liegen innerhalb von 1 Standardabweichung vom Mittelwert.
95 % aller Werte liegen innerhalb von 2 Standardabweichungen vom Mittelwert.
99.7 % aller Werte liegen innerhalb von 3 Standardabweichungen vom Mittelwert.
Der z-Score gibt an, wie viele Standardabweichungen ein Wert vom Mittelwert entfernt ist.

Daten können auf verschiedene Arten verteilt sein – sie können nach links oder rechts verzerrt sein, oder chaotisch durcheinander liegen. In vielen realen Situationen tendieren Messwerte jedoch dazu, sich um einen zentralen Wert zu gruppieren, ohne eine Tendenz nach links oder rechts zu zeigen. Diese Form nennt man Normalverteilung.

Sie sieht aus wie eine Glocke und wird deshalb oft auch Glockenkurve genannt.

Eine Normalverteilung hat folgende Eigenschaften:

Mittelwert = Median = Modus – alle drei Lagenmasse fallen auf denselben Punkt.
Die Kurve ist symmetrisch um den Mittelpunkt.
50 % der Werte liegen unterhalb des Mittelwerts, 50 % darüber.

Viele reale Phänomene folgen näherungsweise einer Normalverteilung:

Körpergrössen von Menschen
Abmessungen von Industrieprodukten
Messfehler
Blutdruck
Testergebnisse

Wichtig: Die meisten Daten sind nicht perfekt normalverteilt, aber die Normalverteilung hilft uns trotzdem, sie zu verstehen und Aussagen darüber zu machen.

Die Standardabweichung \(\sigma\) (Sigma) ist ein Mass dafür, wie stark die Werte um den Mittelwert streuen.

Bei einer Normalverteilung gilt näherungsweise:

Bereich	Anteil der Werte
Mittelwert ± 1 Standardabweichung	68 %
Mittelwert ± 2 Standardabweichungen	95 %
Mittelwert ± 3 Standardabweichungen	99.7 %

Diese Regel ist so wichtig, dass sie einen eigenen Namen hat: die 68-95-99.7-Regel (oder Empirische Regel).

In einer Schule sind 95 % der Schülerinnen und Schüler zwischen 1.1 m und 1.7 m gross.

Angenommen, die Daten sind normalverteilt – wie gross sind Mittelwert und Standardabweichung?

Mittelwert: Der Mittelwert liegt in der Mitte:

\[ \mu = \frac{1.1 + 1.7}{2} = 1.4 \text{ m} \]

Standardabweichung: 95 % entsprechen ± 2 Standardabweichungen (also insgesamt 4 Standardabweichungen):

\[ \sigma = \frac{1.7 - 1.1}{4} = \frac{0.6}{4} = 0.15 \text{ m} \]

Ein Wert von 1.7 m liegt also genau 2 Standardabweichungen über dem Mittelwert von 1.4 m.

Faustregel:

Ein Wert innerhalb von 1σ ist wahrscheinlich (68 von 100).

Ein Wert innerhalb von 2σ ist sehr wahrscheinlich (95 von 100).

Ein Wert innerhalb von 3σ ist fast sicher (997 von 1000).

Die Anzahl Standardabweichungen, die ein Wert vom Mittelwert entfernt ist, heisst z-Score (oder Standardwert).

\[ z = \frac{x - \mu}{\sigma} \]

Dabei gilt:

\(z\) = z-Score (Standardwert)
\(x\) = der zu standardisierende Wert
\(\mu\) (Mu) = Mittelwert der Verteilung
\(\sigma\) (Sigma) = Standardabweichung

Mittelwert subtrahieren: \(x - \mu\)
Durch die Standardabweichung dividieren: \(\div \; \sigma\)

Eine Umfrage über tägliche Reisezeiten (in Minuten) ergab:

26, 33, 65, 28, 34, 55, 25, 44, 50, 36, 26, 37, 43, 62, 35, 38, 45, 32, 28, 34

Mittelwert: \(\mu = 38.8\) Minuten
Standardabweichung: \(\sigma = 11.4\) Minuten

Die ersten drei Werte werden wie folgt standardisiert:

Originalwert \(x\)	Berechnung	z-Score
26	\(\frac{26 - 38.8}{11.4}\)	−1.12
33	\(\frac{33 - 38.8}{11.4}\)	−0.51
65	\(\frac{65 - 38.8}{11.4}\)	+2.30

Ein z-Score von −1.12 bedeutet: Der Wert 26 liegt 1.12 Standardabweichungen unterhalb des Mittelwerts.

Durch die Standardisierung können wir beliebige Normalverteilungen in die Standardnormalverteilung umrechnen (Mittelwert = 0, Standardabweichung = 1). Das erlaubt uns:

Werte aus verschiedenen Verteilungen direkt zu vergleichen.
Mit einer einzigen Standardnormaltabelle Wahrscheinlichkeiten abzulesen, anstatt für jede Verteilung neu zu rechnen.

Ein Lehrer bewertet einen Test (maximale Punktzahl: 60):

20, 15, 26, 32, 18, 28, 35, 14, 26, 22, 17

Die meisten Schülerinnen und Schüler haben weniger als 30 Punkte – der Test war offensichtlich sehr schwer. Der Lehrer entscheidet, die Noten zu standardisieren und nur Personen mit einem z-Score unter −1 als ungenügend zu bewerten.

Mittelwert: \(\mu = 23\)
Standardabweichung: \(\sigma = 6.6\)
z-Scores: −0.45, −1.21, 0.45, 1.36, −0.76, 0.76, 1.82, −1.36, 0.45, −0.15, −0.91

Resultat: Nur 2 Schülerinnen/Schüler fallen unter −1 und gelten als ungenügend – deutlich fairer!

Die Standardnormalverteilung lässt sich in Prozentzonen aufteilen, jeweils in Schritten von 0.5 Standardabweichungen:

Zone	Anteil in diesem Bereich	Kumulierter Anteil (von links)
unter −3σ	0.1 %	0.1 %
−3σ bis −2.5σ	0.5 %	0.6 %
−2σ bis −1.5σ	6.1 %	ca. 6.7 %
−1σ bis −0.5σ	15.0 %	ca. 30.9 %
−0.5σ bis 0	19.1 %	ca. 50.0 %
0 bis +0.5σ	19.1 %	ca. 69.1 %
+0.5σ bis +1σ	15.0 %	ca. 84.1 %
+1σ bis +1.5σ	9.2 %	ca. 93.3 %
+2σ bis +2.5σ	3.8 %	ca. 98.8 %
über +3σ	0.1 %	99.9 %

Dein Ergebnis liegt 0.5 Standardabweichungen über dem Durchschnitt (z = +0.5). Wie viele Personen haben schlechter abgeschnitten?

Anteil zwischen 0 und +0.5: 19.1 %
Anteil unter 0 (linke Hälfte): 50.0 %
Total: 69.1 % haben schlechter abgeschnitten als du.

Eine Maschine füllt Zuckerbeutel ab. Eine Stichprobe ergibt:

Mittelwert: \(\mu = 1010\) g
Standardabweichung: \(\sigma = 20\) g

Problem: Etwa 31 % der Beutel enthalten weniger als 1000 g – das ist zu viel!

Lösung: Wir wollen, dass 1000 g bei −2.5 Standardabweichungen liegt (nur 0.6 % zu wenig).

Option A – Mittelwert erhöhen:

\[ \text{Neuer Mittelwert} = 1000 + 2.5 \times 20 = 1000 + 50 = 1050 \text{ g} \]

Option B – Streuung verringern:

\[ \sigma_{neu} = \frac{10}{2.5} = 4 \text{ g} \]

Bei einer Standardabweichung von nur 4 g würden weniger als 0.6 % der Beutel das Gewichtslimit unterschreiten.

Fazit: Mit der Normalverteilung können wir Produktionsprozesse gezielt steuern – entweder durch Anpassen des Mittelwerts oder durch Verringern der Streuung.

Nenne drei reale Phänomene, die näherungsweise normalverteilt sind.
Ein Datensatz hat \(\mu = 50\) und \(\sigma = 10\). Welcher Anteil der Werte liegt zwischen 30 und 70?
Berechne den z-Score für einen Wert von \(x = 75\), wenn \(\mu = 60\) und \(\sigma = 8\).
Was bedeutet ein z-Score von −2.5 anschaulich?
Warum ist die Standardisierung nützlich, wenn man Werte aus verschiedenen Verteilungen vergleichen will?

Kevin Maurizi / Bearbeitet nach mathsisfun.com

LU02a - Normalverteilung

Kurztheorie (Merksätze)

1) Was ist eine Normalverteilung?

1.1 Eigenschaften der Normalverteilung

1.2 Beispiele aus der Praxis

2) Standardabweichungen und die 68-95-99.7-Regel

Beispiel: Körpergrössen in einer Schulklasse

3) Standardisierung und der z-Score

3.1 Vorgehen: Wert standardisieren

3.2 Beispiel: Reisezeit

3.3 Wozu dient die Standardisierung?

3.4 Beispiel: Testergebnisse fair beurteilen

4) Verteilung in Prozentzonen

Beispiel: Wie gut war dein Testergebnis?

5) Praxisbeispiel: Zuckerbeutel abfüllen

Verständnisfragen

BZZ - Modulwiki