LU01b - Stichprobe, Rangliste, Häufigkeitstabelle und Darstellung

Ziel: Du kannst Rohdaten (Urliste) ordnen und verdichten (geordnete Stichprobe, Strichliste, Häufigkeitstabelle). Du kannst eine Rangliste erstellen (inkl. Durchschnittsrang bei Mehrfachwerten) und den Modus bestimmen. Du kannst Daten mit Säulen- und Kreisdiagramm darstellen.

Eine Urliste enthält die erhobenen Werte in der Reihenfolge, in der sie gemessen/abgefragt wurden. Sie ist oft unübersichtlich – deshalb „verdichten“ wir die Daten.

Beispiel (Informatik): „Welchen Browser nutzt du am meisten?“ Urliste (24 Lernende): Chrome, Edge, Chrome, Firefox, Chrome, Safari, Chrome, Edge, Chrome, Firefox, Chrome, Edge, Chrome, Chrome, Firefox, Edge, Chrome, Safari, Edge, Chrome, Firefox, Edge, Chrome, Chrome

Fazit: So kann man schlecht erkennen, was häufig ist → wir ordnen/verdichten.

Stichprobe: die Menge der erhobenen Daten (z.B. „unsere Klasse heute“)
Stichprobenumfang n: Anzahl Datenpunkte (z.B. 24 Antworten)

In den Aufgaben wird oft so unterschieden:

nominal: Kategorien ohne Reihenfolge (z.B. Nationalität, Zivilstand, Lieblingsgetränk)
ordinal: Kategorien mit Reihenfolge (z.B. Energieklassen, Bewertungen „genügend–gut–sehr gut“)
kardinal: Zahlenwerte (du kannst zählen/messen) → entspricht quantitativ

(dazu gehören z.B. Alter, Lohn, Länge, Gewicht, Besucherzahlen)

Achtung: Zahlen können auch Codes sein (z.B. HTTP-Statuscode 404). Dann ist es meist nominal, weil es ein Label ist.

Bei numerischen Daten sortierst du die Werte vom kleinsten zum grössten Wert. Dann schreibst du sie oft als: x(1), x(2), x(3), …, x(n)

Beispiel (Informatik): Antwortzeiten in ms (Urliste) 120 / 95 / 95 / 140 / 110 / 120

Geordnete Stichprobe: x(1)=95, x(2)=95, x(3)=110, x(4)=120, x(5)=120, x(6)=140

Eine Rangliste ordnet jedem Stichprobenwert seinen Rang zu (Position in der sortierten Liste).

Dann ist der Rang eindeutig:

x(1) hat Rang 1
x(2) hat Rang 2
…
x(n) hat Rang n

Dann bekommen alle gleichen Werte den Durchschnittsrang.

Regel (Durchschnittsrang): Wenn ein Wert in der sortierten Liste die Ränge von k bis l belegen würde, dann erhält jeder dieser gleichen Werte den Rang:

(k + l) / 2

Beispiel (Antwortzeiten): Geordnet: 95, 95, 110, 120, 120, 140

Wert x(i)	„eigentliche“ Ränge	zugeteilter Rang
95	1 und 2	(1+2)/2 = 1.5
110	3	3
120	4 und 5	(4+5)/2 = 4.5
140	6	6

Eine Strichliste zählt, wie oft jede Ausprägung vorkommt (besonders nützlich bei Kategorien).

Beispiel (Browser):

Chrome: |||||||||||| (12)
Edge: |||||| (6)
Firefox:|||| (4)
Safari: || (2)

Die Häufigkeitstabelle zeigt:

n_i = absolute Häufigkeit (wie oft kommt Kategorie/Wert i vor?)
h_i = relative Häufigkeit (Anteil an n)

Formeln:

h_i = n_i / n
Prozent = h_i * 100

i	x_i (Ausprägung/Wert)	n_i (absolut)	h_i (relativ)	Prozent
1	…	…	…	…

Kontrolle:

Summe aller n_i = n
Summe aller h_i = 1 (oder 100%)

i	x_i	n_i	h_i	Prozent
1	Chrome	12	12/24 = 0.50	50%
2	Edge	6	6/24 = 0.25	25%
3	Firefox	4	4/24 = 0.1666…	16.67%
4	Safari	2	2/24 = 0.0833…	8.33%
	Summe	24	1.00	100%

Der Modus ist die Ausprägung, die am häufigsten vorkommt.

Beispiel (Browser): Chrome hat n_i = 12 → Modus = Chrome

Hinweis:

Es kann auch mehrere Modi geben (wenn mehrere Kategorien gleich oft am häufigsten sind).

Kategorielle Daten kann man häufig mit Säulen- oder Kreisdiagramm darstellen.

Für jede Ausprägung eine Säule
Alle Säulen gleich breit
Höhe = absolute oder relative Häufigkeit

Vorteil: Der Modus ist sofort sichtbar (höchste Säule).

Für jede Ausprägung ein Kreissegment
Segmentgrösse ist proportional zur relativen Häufigkeit

Standard-Vorgehen:

erstes Segment bei „12 Uhr“
Segmente im Uhrzeigersinn

Winkelberechnung:

Winkel_i = h_i * 360°
oder: Winkel_i = Prozent_i * 3.6°

Beispiel (Browser):

Chrome: 0.50 * 360° = 180°
Edge: 0.25 * 360° = 90°
Firefox:0.1666… * 360° = 60°
Safari: 0.0833… * 360° = 30°

Fazit: Für Vergleiche ist das Säulendiagramm meistens besser als das Kreisdiagramm, weil man Säulenhöhen schneller vergleichen kann als Flächen.

Was ist der Unterschied zwischen Urliste und geordneter Stichprobe?
Wie berechnest du h_i aus n_i und n?
Was ist der Modus?
Wie berechnest du den Winkel im Kreisdiagramm?
Wie bestimmst du den Rang bei einem Wert, der mehrfach vorkommt?

M3-LU01

Kevin Maurizi

LU01b - Stichprobe, Rangliste, Häufigkeitstabelle und Darstellung

1) Begriffe: Urliste, Stichprobe, Verdichtung

Urliste (Rohdaten)

Stichprobe und Stichprobenumfang n

2) Datenarten

3) Geordnete Stichprobe (sortieren)

4) Rangliste (Rangwertfolge)

Fall A: jeder Wert kommt nur einmal vor

Fall B: Werte kommen mehrfach vor (Tie)

5) Strichliste (Zählen)

6) Häufigkeitstabelle

Aufbau (typisch)

Beispiel (Browser, n=24)

7) Modus

8) Grafische Darstellung

8.1 Säulendiagramm (Balken/Säulen)

8.2 Kreisdiagramm

BZZ - Modulwiki