Ziel: Du kannst Rohdaten (Urliste) ordnen und verdichten (geordnete Stichprobe, Strichliste, Häufigkeitstabelle). Du kannst eine Rangliste erstellen (inkl. Durchschnittsrang bei Mehrfachwerten) und den Modus bestimmen. Du kannst Daten mit Säulen- und Kreisdiagramm darstellen.
Eine Urliste enthält die erhobenen Werte in der Reihenfolge, in der sie gemessen/abgefragt wurden. Sie ist oft unübersichtlich – deshalb „verdichten“ wir die Daten.
Beispiel (Informatik): „Welchen Browser nutzt du am meisten?“ Urliste (24 Lernende): Chrome, Edge, Chrome, Firefox, Chrome, Safari, Chrome, Edge, Chrome, Firefox, Chrome, Edge, Chrome, Chrome, Firefox, Edge, Chrome, Safari, Edge, Chrome, Firefox, Edge, Chrome, Chrome
Fazit: So kann man schlecht erkennen, was häufig ist → wir ordnen/verdichten.
In den Aufgaben wird oft so unterschieden:
(dazu gehören z.B. Alter, Lohn, Länge, Gewicht, Besucherzahlen)
Achtung: Zahlen können auch Codes sein (z.B. HTTP-Statuscode 404). Dann ist es meist nominal, weil es ein Label ist.
Bei numerischen Daten sortierst du die Werte vom kleinsten zum grössten Wert. Dann schreibst du sie oft als: x(1), x(2), x(3), …, x(n)
Beispiel (Informatik): Antwortzeiten in ms (Urliste) 120 / 95 / 95 / 140 / 110 / 120
Geordnete Stichprobe: x(1)=95, x(2)=95, x(3)=110, x(4)=120, x(5)=120, x(6)=140
Eine Rangliste ordnet jedem Stichprobenwert seinen Rang zu (Position in der sortierten Liste).
Dann ist der Rang eindeutig:
Dann bekommen alle gleichen Werte den Durchschnittsrang.
Regel (Durchschnittsrang): Wenn ein Wert in der sortierten Liste die Ränge von k bis l belegen würde, dann erhält jeder dieser gleichen Werte den Rang:
Beispiel (Antwortzeiten): Geordnet: 95, 95, 110, 120, 120, 140
| Wert x(i) | „eigentliche“ Ränge | zugeteilter Rang |
|---|---|---|
| 95 | 1 und 2 | (1+2)/2 = 1.5 |
| 110 | 3 | 3 |
| 120 | 4 und 5 | (4+5)/2 = 4.5 |
| 140 | 6 | 6 |
Eine Strichliste zählt, wie oft jede Ausprägung vorkommt (besonders nützlich bei Kategorien).
Beispiel (Browser):
Die Häufigkeitstabelle zeigt:
Formeln:
| i | x_i (Ausprägung/Wert) | n_i (absolut) | h_i (relativ) | Prozent |
|---|---|---|---|---|
| 1 | … | … | … | … |
Kontrolle:
| i | x_i | n_i | h_i | Prozent |
|---|---|---|---|---|
| 1 | Chrome | 12 | 12/24 = 0.50 | 50% |
| 2 | Edge | 6 | 6/24 = 0.25 | 25% |
| 3 | Firefox | 4 | 4/24 = 0.1666… | 16.67% |
| 4 | Safari | 2 | 2/24 = 0.0833… | 8.33% |
| Summe | 24 | 1.00 | 100% |
Der Modus ist die Ausprägung, die am häufigsten vorkommt.
Beispiel (Browser): Chrome hat n_i = 12 → Modus = Chrome
Hinweis:
Kategorielle Daten kann man häufig mit Säulen- oder Kreisdiagramm darstellen.
Vorteil: Der Modus ist sofort sichtbar (höchste Säule).
Standard-Vorgehen:
Winkelberechnung:
Beispiel (Browser):
Fazit: Für Vergleiche ist das Säulendiagramm meistens besser als das Kreisdiagramm, weil man Säulenhöhen schneller vergleichen kann als Flächen.