Dies ist eine alte Version des Dokuments!


LU01b - Stichprobe, Rangliste, Häufigkeitstabelle und Darstellung

Ziel: Du kannst Rohdaten (Urliste) ordnen und verdichten (geordnete Stichprobe, Strichliste, Häufigkeitstabelle). Du kannst eine Rangliste erstellen (inkl. Durchschnittsrang bei Mehrfachwerten) und den Modus bestimmen. Du kannst Daten mit Säulen- und Kreisdiagramm darstellen.

Eine Urliste enthält die erhobenen Werte in der Reihenfolge, in der sie gemessen/abgefragt wurden. Sie ist oft unübersichtlich – deshalb „verdichten“ wir die Daten.

Beispiel (Informatik): „Welchen Browser nutzt du am meisten?“ Urliste (24 Lernende): Chrome, Edge, Chrome, Firefox, Chrome, Safari, Chrome, Edge, Chrome, Firefox, Chrome, Edge, Chrome, Chrome, Firefox, Edge, Chrome, Safari, Edge, Chrome, Firefox, Edge, Chrome, Chrome

Fazit: So kann man schlecht erkennen, was häufig ist → wir ordnen/verdichten.

  • Stichprobe: die Menge der erhobenen Daten (z.B. „unsere Klasse heute“)
  • Stichprobenumfang n: Anzahl Datenpunkte (z.B. 24 Antworten)

In den Aufgaben wird oft so unterschieden:

  • nominal: Kategorien ohne Reihenfolge (z.B. Nationalität, Zivilstand, Lieblingsgetränk)
  • ordinal: Kategorien mit Reihenfolge (z.B. Energieklassen, Bewertungen „genügend–gut–sehr gut“)
  • kardinal: Zahlenwerte (du kannst zählen/messen) → entspricht quantitativ

(dazu gehören z.B. Alter, Lohn, Länge, Gewicht, Besucherzahlen)

Achtung: Zahlen können auch Codes sein (z.B. HTTP-Statuscode 404). Dann ist es meist nominal, weil es ein Label ist.

Bei numerischen Daten sortierst du die Werte vom kleinsten zum grössten Wert. Dann schreibst du sie oft als: x(1), x(2), x(3), …, x(n)

Beispiel (Informatik): Antwortzeiten in ms (Urliste) 120 / 95 / 95 / 140 / 110 / 120

Geordnete Stichprobe: x(1)=95, x(2)=95, x(3)=110, x(4)=120, x(5)=120, x(6)=140

Eine Rangliste ordnet jedem Stichprobenwert seinen Rang zu (Position in der sortierten Liste).

Dann ist der Rang eindeutig:

  • x(1) hat Rang 1
  • x(2) hat Rang 2
  • x(n) hat Rang n

Dann bekommen alle gleichen Werte den Durchschnittsrang.

Regel (Durchschnittsrang): Wenn ein Wert in der sortierten Liste die Ränge von k bis l belegen würde, dann erhält jeder dieser gleichen Werte den Rang:

  • (k + l) / 2

Beispiel (Antwortzeiten): Geordnet: 95, 95, 110, 120, 120, 140

Wert x(i) „eigentliche“ Ränge zugeteilter Rang
95 1 und 2 (1+2)/2 = 1.5
110 3 3
120 4 und 5 (4+5)/2 = 4.5
140 6 6

Eine Strichliste zählt, wie oft jede Ausprägung vorkommt (besonders nützlich bei Kategorien).

Beispiel (Browser):

  • Chrome: |||||||||||| (12)
  • Edge: |||||| (6)
  • Firefox:|||| (4)
  • Safari: || (2)

Die Häufigkeitstabelle zeigt:

  • n_i = absolute Häufigkeit (wie oft kommt Kategorie/Wert i vor?)
  • h_i = relative Häufigkeit (Anteil an n)

Formeln:

  • h_i = n_i / n
  • Prozent = h_i * 100
i x_i (Ausprägung/Wert) n_i (absolut) h_i (relativ) Prozent
1

Kontrolle:

  • Summe aller n_i = n
  • Summe aller h_i = 1 (oder 100%)
i x_i n_i h_i Prozent
1 Chrome 12 12/24 = 0.50 50%
2 Edge 6 6/24 = 0.25 25%
3 Firefox 4 4/24 = 0.1666… 16.67%
4 Safari 2 2/24 = 0.0833… 8.33%
Summe 24 1.00 100%

Der Modus ist die Ausprägung, die am häufigsten vorkommt.

Beispiel (Browser): Chrome hat n_i = 12 → Modus = Chrome

Hinweis:

  • Es kann auch mehrere Modi geben (wenn mehrere Kategorien gleich oft am häufigsten sind).

Kategorielle Daten kann man häufig mit Säulen- oder Kreisdiagramm darstellen.

  • Für jede Ausprägung eine Säule
  • Alle Säulen gleich breit
  • Höhe = absolute oder relative Häufigkeit

Vorteil: Der Modus ist sofort sichtbar (höchste Säule).

  • Für jede Ausprägung ein Kreissegment
  • Segmentgrösse ist proportional zur relativen Häufigkeit

Standard-Vorgehen:

  • erstes Segment bei „12 Uhr“
  • Segmente im Uhrzeigersinn

Winkelberechnung:

  • Winkel_i = h_i * 360°
  • oder: Winkel_i = Prozent_i * 3.6°

Beispiel (Browser):

  • Chrome: 0.50 * 360° = 180°
  • Edge: 0.25 * 360° = 90°
  • Firefox:0.1666… * 360° = 60°
  • Safari: 0.0833… * 360° = 30°

Fazit: Für Vergleiche ist das Säulendiagramm meistens besser als das Kreisdiagramm, weil man Säulenhöhen schneller vergleichen kann als Flächen.

1. Urliste lesen/erstellen 2. Strichliste (zählen) 3. Häufigkeitstabelle: n_i, h_i, Prozent 4. Fragen beantworten: „beliebtest/seltenst“, „wie viele“, „wie viel Prozent“ 5. Diagramm (Säulen oder Kreis) 6. Modus nennen

1. Urliste → geordnete Stichprobe x(1)…x(n) 2. Rangliste erstellen 3. Bei Mehrfachwerten: Durchschnittsrang angeben

  1. Was ist der Unterschied zwischen Urliste und geordneter Stichprobe?
  2. Wie berechnest du h_i aus n_i und n?
  3. Was ist der Modus?
  4. Wie berechnest du den Winkel im Kreisdiagramm?
  5. Wie bestimmst du den Rang bei einem Wert, der mehrfach vorkommt?

Kevin Maurizi

  • modul/mathe/ma4/thema/statistik/ordnenvondaten.1770014732.txt.gz
  • Zuletzt geändert: 2026/02/02 07:45
  • von kmaurizi