Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
| Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
| modul:mathe:ma4:thema:statistik:artenvondaten [2026/01/26 09:44] – kmaurizi | modul:mathe:ma4:thema:statistik:artenvondaten [2026/01/26 11:46] (aktuell) – [2.4 Ratio: echtes Null (0 = nichts)] kmaurizi | ||
|---|---|---|---|
| Zeile 2: | Zeile 2: | ||
| ====== LU01a - Arten von Daten ====== | ====== LU01a - Arten von Daten ====== | ||
| - | ^ Überblick ^ Inhalt ^ | + | <WRAP center round download 60%> |
| - | | **Ziel** | + | **Ziel:** Du kannst |
| - | | **Warum wichtig?** | Die Datenart entscheidet, | + | </WRAP> |
| - | | **Kompetenzbezug** | **AG1/AF1** (Grundbegriffe verstehen & anwenden), Vorbereitung für Lagewerte/ | + | |
| - | | **Dauer** | 1 Doppellektion (90’) | | + | |
| - | ===== 1. Einstieg: Was bedeutet „Daten“? ===== | + | ===== Warum ist das wichtig? ===== |
| + | Bevor du Daten auswertest, musst du wissen, **welche Art von Daten** du hast. | ||
| + | Die Datenart entscheidet, | ||
| + | * Darf ich **nur zählen** (Häufigkeiten) oder auch **rechnen**? | ||
| + | * Gibt es eine **Reihenfolge** (z.B. low/ | ||
| + | * Ist „0“ wirklich **nichts** (z.B. 0 Tickets)? | ||
| - | In der Datenanalyse beschreibt man reale Beobachtungen in strukturierter Form, um daraus Erkenntnisse abzuleiten. | + | Diese Seite passt direkt zur Aufgabe: **LU01.A01 - Datenarten klassifizieren**. |
| - | **Beispiele aus dem Informatik-Alltag** | + | ===== Kurztheorie (Merksätze) ===== |
| - | * Ladezeit | + | |
| - | * Anzahl Fehler in einem Log pro Stunde | + | * **Quantitativ (numerisch): |
| - | * Betriebssystem der User (Windows/ | + | * **Nominal: |
| - | * Zufriedenheit der User (Skala 1–5) | + | * **Ordinal: |
| - | * HTTP-Statuscodes | + | * **Intervall: |
| + | * **Ratio:** Abstände sinnvoll **und** echtes Null (z.B. ms, MB, Anzahl). | ||
| + | * **Diskret: | ||
| + | * **Stetig:** gemessen (beliebig fein) | ||
| - | Wichtig: Bevor du Kennzahlen berechnest oder Diagramme zeichnest, musst du wissen: **Welche Art von Daten ist das?** | + | <WRAP center round important 60%> |
| - | + | **Achtung:** Nur weil etwas wie eine Zahl aussieht, | |
| - | ===== 2. Grundbegriffe (kurz) ===== | + | **HTTP-Statuscodes** (200/404/500) sind meistens |
| - | + | </ | |
| - | ^ Begriff ^ Bedeutung ^ Beispiel ^ | + | |
| - | | **Merkmal / Variable** | Eigenschaft, | + | |
| - | | **Ausprägung** | konkreter Wert einer Variable | „Firefox“ | | + | |
| - | | **Beobachtung | + | |
| - | | **Stichprobe** | Teilmenge der Daten | 25 Lernende | | + | |
| - | | **Grundgesamtheit** | alle möglichen Fälle | alle Lernenden der Schule | | + | |
| - | + | ||
| - | ===== 3. Zwei Hauptklassen von Daten ===== | + | |
| - | ==== 3.1 Qualitative Daten (kategorisch) ==== | + | ===== 1) Zwei Hauptarten von Daten ===== |
| - | Qualitative Daten sind **Kategorien/ | + | ==== 1.1 Qualitative Daten (kategorisch) ==== |
| + | Qualitative Daten sind **Kategorien/ | ||
| + | * **zählen**, | ||
| + | * vergleichen: | ||
| + | * manchmal ordnen (nur bei ordinal) | ||
| - | **Beispiele** | + | **Informatik-Beispiele** |
| * Betriebssystem: | * Betriebssystem: | ||
| - | * Sprache: DE / EN / FR | + | * Team-Rolle: Dev / Ops / QA |
| - | * Bug-Typ: UI / Backend / Security | + | * Build-Status: success |
| - | + | * HTTP-Methode: | |
| - | ==== 3.2 Quantitative Daten (numerisch) ==== | + | |
| - | Quantitative Daten sind **Zahlenwerte**, die etwas **messen oder zählen**. | + | ==== 1.2 Quantitative Daten (numerisch) ==== |
| + | Quantitative Daten sind **Zahlen**, die **zählen** oder **messen**. | ||
| + | Du kannst damit rechnen | ||
| - | **Beispiele** | + | **Informatik-Beispiele** |
| - | * Ladezeit: 123 ms | + | * Anzahl Commits pro Woche (gezählt) |
| - | * RAM-Verbrauch: | + | * Anzahl offene Tickets im Sprint (gezählt) |
| - | * Anzahl Commits: 18 | + | * Ladezeit einer Webseite in ms (gemessen) |
| + | * Dateigrösse in MB (gemessen) | ||
| - | <WRAP round box 60%> | + | < |
| - | **Merksatz: | + | **Merksatz: |
| - | **Qualitativ** = Kategorien/ | + | **Qualitativ** = Kategorien/ |
| - | **Quantitativ** = Zahlenwerte (zählen oder messen). | + | **Quantitativ** = Zahlen zum Zählen/ |
| </ | </ | ||
| - | ===== 4. Skalentypen | + | ===== 2) Messniveau |
| + | Das Messniveau sagt dir, **was du über die Werte aussagen darfst**. | ||
| - | Die Skala sagt dir, **was du mit den Daten machen darfst**. | + | ==== 2.1 Nominal: Kategorien ohne Reihenfolge ==== |
| + | | ||
| + | * Du kannst sagen: „gleich/ | ||
| - | ==== 4.1 Nominalskala | + | **Informatik-Beispiele |
| + | * Betriebssystem (Windows/macOS/Linux) | ||
| + | * Browser (Chrome/ | ||
| + | * Team-Rolle (Dev/ | ||
| + | * HTTP-Statuscode (200/ | ||
| - | * **Keine | + | ==== 2.2 Ordinal: Kategorien mit Reihenfolge |
| - | * Erlaubt: Häufigkeiten, | + | * Es gibt eine Reihenfolge (z.B. low < medium < high). |
| - | * Nicht sinnvoll: Median, Mittelwert | + | * ABER: Der Abstand zwischen Stufen ist nicht exakt messbar. |
| - | **Beispiele (Informatik)** | + | **Informatik-Beispiele |
| - | * Browser: Chrome / Firefox / Safari | + | |
| - | * HTTP-Methode: GET / POST / PUT | + | |
| - | * Statuscode **als Kategorie**: | + | |
| - | → Achtung: Das sind Zahlen, aber sie funktionieren hier als **Labels**, nicht als Messwert! | + | |
| - | + | ||
| - | ==== 4.2 Ordinalskala | + | |
| - | + | ||
| - | | + | |
| - | * Abstände zwischen Stufen sind nicht zwingend gleich | + | |
| - | * Erlaubt: Median, Modus, Rangvergleiche, | + | |
| - | * Mittelwert: meist **nicht** sinnvoll (nur mit Vorsicht) | + | |
| - | + | ||
| - | **Beispiele** | + | |
| - | * Zufriedenheit: | + | |
| * Priorität: low / medium / high | * Priorität: low / medium / high | ||
| - | * Schulnoten | + | * Severity: minor / major / critical |
| + | * Zufriedenheit | ||
| - | ==== 4.3 Intervallskala (Abstände sinnvoll, aber kein „echtes Null“) | + | ==== 2.3 Intervall: |
| + | * Unterschiede sind sinnvoll („+10“). | ||
| + | * Null bedeutet nicht „nichts“. | ||
| + | * Aussagen wie „doppelt so viel“ sind hier **nicht** sinnvoll. | ||
| - | | + | **Beispiel** |
| - | * Nullpunkt ist **willkürlich** | + | * Temperatur in **°C** (0°C ist nicht „keine Temperatur“) |
| - | * Erlaubt: Mittelwert, Standardabweichung, | + | |
| - | * Verhältnis | + | |
| - | **Beispiele** | + | ==== 2.4 Ratio: echtes Null (0 = nichts) ==== |
| - | * Temperatur in °C (0°C ist nicht „keine Temperatur“) | + | * Null bedeutet wirklich |
| - | * Kalenderjahr (2026 ist nicht „doppelt so viel“ | + | * Aussagen wie „doppelt so viel“ |
| - | ==== 4.4 Ratioskala | + | **Informatik-Beispiele (ratio)** |
| + | * Ladezeit in ms (0 ms = keine Zeit) | ||
| + | * Dateigrösse in MB (0 MB = keine Daten) | ||
| + | * Anzahl Tickets/Commits | ||
| - | * Abstände sinnvoll **und** Null bedeutet „nichts“ | + | < |
| - | * Verhältnis ist sinnvoll („doppelt so viel“) | + | **Quick-Check: |
| - | * Erlaubt: alle üblichen Kennzahlen + viele Diagramme | + | Wenn **0** wirklich „nichts“ bedeutet → meistens |
| - | + | Wenn Werte **nur Codes** sind → meistens | |
| - | **Beispiele (Informatik)** | + | |
| - | * Dateigrösse (0 MB = keine Daten) | + | |
| - | * Laufzeit/ | + | |
| - | * Anzahl Requests (0 = kein Request) | + | |
| - | + | ||
| - | <WRAP round box 60%> | + | |
| - | **Quick-Check: | + | |
| - | Wenn „0“ wirklich „nichts“ bedeutet → meist **Ratioskala**. | + | |
| - | Wenn Zahlen | + | |
| </ | </ | ||
| - | ===== 5. Diskret vs. Stetig (nur bei quantitativen Daten) ===== | + | ===== 3) Diskret vs. Stetig (nur bei quantitativen Daten) ===== |
| - | ==== 5.1 Diskrete Daten (zählbar, ganze Werte) ==== | + | ==== 3.1 Diskret |
| + | * Werte sind zählbar: 0, | ||
| + | * entsteht durch **Zählen** | ||
| - | | + | **Informatik-Beispiele** |
| - | * Werte sind typischerweise ganze Zahlen | + | * Anzahl Commits |
| + | | ||
| + | * Anzahl Logins pro Tag | ||
| - | **Beispiele** | + | ==== 3.2 Stetig (gemessen) ==== |
| - | * Anzahl Commits pro Woche | + | * Werte können theoretisch beliebig fein sein (z.B. 12.3, 12.31, 12.312…) |
| - | * Anzahl Fehler pro Build | + | * entsteht durch **Messen** |
| - | | + | |
| - | ==== 5.2 Stetige Daten (messbar, beliebig fein) ==== | + | **Informatik-Beispiele** |
| - | + | * Ladezeit in ms | |
| - | * entstehen durch **Messen** | + | * Downloadrate |
| - | * theoretisch unendlich viele Zwischenwerte möglich | + | |
| - | + | ||
| - | **Beispiele** | + | |
| - | * Ladezeit in ms (in der Realität gemessen, kann sehr fein sein) | + | |
| * CPU-Temperatur | * CPU-Temperatur | ||
| - | * Netzwerk-Latenz | ||
| - | ===== 6. Welche Kennzahlen und Diagramme passen? | + | ===== 4) Typische Stolpersteine |
| + | * **„Zahl = quantitativ“** → falsch bei Codes (HTTP 404, Fehlercodes, | ||
| + | * **Ordinal vs. Intervall**: | ||
| + | * **Intervall vs. Ratio**: °C (Intervall) vs. ms/ | ||
| + | * **Diskret vs. Stetig**: Zählen (diskret) vs. Messen (stetig). | ||
| - | ^ Datenart / Skala ^ Sinnvolle Kennzahlen ^ Typische Diagramme ^ | ||
| - | | **Nominal (qualitativ)** | absolute/ | ||
| - | | **Ordinal (qualitativ)** | Median, Modus, Quartile (oft ok) | Balken, (Boxplot oft ok) | | ||
| - | | **Intervall (quantitativ)** | Mittelwert, Median, Stdabw. | Histogramm, Linie, Boxplot | | ||
| - | | **Ratio (quantitativ)** | Mittelwert, Median, Stdabw., Verhältnisse | Histogramm, Linie, Boxplot | | ||
| - | | **Diskret** | Mittelwert/ | ||
| - | | **Stetig** | Mittelwert/ | ||
| - | ===== 7. Beispiele (Informatik-Kontext) ===== | ||
| - | |||
| - | ==== Beispiel 1: HTTP-Statuscodes ==== | ||
| - | |||
| - | **Frage:** Ist 500 „mehr“ als 200? | ||
| - | **Antwort: | ||
| - | |||
| - | * Datenklasse: | ||
| - | * Skala: **nominal** | ||
| - | * Sinnvolle Auswertung: Häufigkeiten pro Code, Top-3 Codes, Balkendiagramm | ||
| - | |||
| - | ==== Beispiel 2: Zufriedenheit 1–5 ==== | ||
| - | |||
| - | * Datenklasse: | ||
| - | * Skala: **ordinal** | ||
| - | * Sinnvolle Auswertung: Median, Häufigkeiten, | ||
| - | |||
| - | **Interpretation: | ||
| - | |||
| - | ==== Beispiel 3: Ladezeit (ms) ==== | ||
| - | |||
| - | * Datenklasse: | ||
| - | * Skala: **Ratio** | ||
| - | * Typ: **stetig** | ||
| - | * Sinnvolle Auswertung: Mittelwert/ | ||
| - | |||
| - | ===== 8. Übung: Datenarten klassifizieren ===== | ||
| - | |||
| - | **Auftrag: | ||
| - | - qualitativ oder quantitativ? | ||
| - | - Skala (nominal/ | ||
| - | - falls quantitativ: | ||
| - | |||
| - | ^ Variable ^ qualit./ | ||
| - | | Betriebssystem (Windows/ | ||
| - | | Anzahl Commits pro Woche | | | | | ||
| - | | Ladezeit einer Seite (ms) | | | | | ||
| - | | HTTP-Statuscode (200/ | ||
| - | | Zufriedenheit (1–5) | | | | | ||
| - | | CPU-Temperatur in °C | | | | | ||
| - | | Dateigrösse in MB | | | | | ||
| - | |||
| - | ==== Musterlösung (kurz) ==== | ||
| - | * Betriebssystem → qualitativ, nominal | ||
| - | * Commits → quantitativ, | ||
| - | * Ladezeit → quantitativ, | ||
| - | * Statuscode → qualitativ, nominal | ||
| - | * Zufriedenheit → qualitativ, ordinal | ||
| - | * CPU-Temperatur °C → quantitativ, | ||
| - | * Dateigrösse MB → quantitativ, | ||
| - | |||
| - | ===== 9. Häufige Fehler ===== | ||
| - | |||
| - | * **„Zahlen = automatisch quantitativ“** → falsch. Codes (z.B. 404) sind oft **nominal**. | ||
| - | * **Mittelwert bei Ordinaldaten** (z.B. Zufriedenheit) → kann täuschen. | ||
| - | * **Diskret/ | ||
| - | * Diagramm falsch gewählt: Kreisdiagramm für sehr viele Kategorien ist unübersichtlich → besser Balken. | ||
| - | |||
| - | ===== 10. Mini-Check (Exit Ticket) ===== | ||
| + | <WRAP center round todo 60%> | ||
| - Nenne ein Beispiel für **nominale** Daten aus der Informatik. | - Nenne ein Beispiel für **nominale** Daten aus der Informatik. | ||
| - | - Warum ist der **HTTP-Statuscode** | + | - Ist „HTTP-Statuscode“ eher **nominal** oder **quantitativ**? Warum? |
| - | - Was ist der Unterschied zwischen **diskret** und **stetig**? | + | - „Anzahl Commits“: **diskret** oder **stetig**? Begründe mit 1 Satz. |
| + | - Was ist der Unterschied zwischen **Intervall** und **Ratio**? | ||
| + | </ | ||
| ---- | ---- | ||