Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
| Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
| modul:mathe:ma4:thema:statistik:artenvondaten [2026/01/26 09:42] – angelegt kmaurizi | modul:mathe:ma4:thema:statistik:artenvondaten [2026/01/26 11:46] (aktuell) – [2.4 Ratio: echtes Null (0 = nichts)] kmaurizi | ||
|---|---|---|---|
| Zeile 1: | Zeile 1: | ||
| + | ~~NOTOC~~ | ||
| ====== LU01a - Arten von Daten ====== | ====== LU01a - Arten von Daten ====== | ||
| - | ^ Überblick ^ Inhalt ^ | + | <WRAP center round download 60%> |
| - | | Ziel | Du kannst | + | **Ziel:** Du kannst |
| - | | Warum wichtig? | Die Datenart entscheidet, | + | </WRAP> |
| - | | Kompetenzbezug | AG1/AF1 (Grundbegriffe verstehen & anwenden), Vorbereitung für Lagewerte/ | + | |
| - | | Dauer | 1 Doppellektion (90’) | | + | |
| - | ===== 1. Einstieg: Was bedeutet „Daten“? ===== | + | ===== Warum ist das wichtig? ===== |
| + | Bevor du Daten auswertest, musst du wissen, **welche Art von Daten** du hast. | ||
| + | Die Datenart entscheidet, | ||
| + | * Darf ich **nur zählen** (Häufigkeiten) oder auch **rechnen**? | ||
| + | * Gibt es eine **Reihenfolge** (z.B. low/ | ||
| + | * Ist „0“ wirklich **nichts** (z.B. 0 Tickets)? | ||
| - | In der Datenanalyse beschreibt man reale Beobachtungen in strukturierter Form, um daraus Erkenntnisse abzuleiten. | + | Diese Seite passt direkt zur Aufgabe: **LU01.A01 - Datenarten klassifizieren**. |
| - | Beispiele aus dem Informatik-Alltag | + | ===== Kurztheorie (Merksätze) ===== |
| + | * **Qualitativ (kategorisch): | ||
| + | * **Quantitativ (numerisch): | ||
| + | * **Nominal: | ||
| + | * **Ordinal: | ||
| + | * **Intervall: | ||
| + | * **Ratio:** Abstände sinnvoll **und** echtes Null (z.B. ms, MB, Anzahl). | ||
| + | * **Diskret: | ||
| + | * **Stetig:** gemessen (beliebig fein) | ||
| - | Ladezeit einer Webseite in Millisekunden | + | <WRAP center round important 60%> |
| + | **Achtung: | ||
| + | **HTTP-Statuscodes** (200/ | ||
| + | </ | ||
| - | Anzahl Fehler in einem Log pro Stunde | + | ===== 1) Zwei Hauptarten von Daten ===== |
| - | Betriebssystem der User (Windows/macOS/Linux) | + | ==== 1.1 Qualitative Daten (kategorisch) ==== |
| + | Qualitative Daten sind **Kategorien/Labels**. Du arbeitest damit typischerweise so: | ||
| + | * **zählen**, | ||
| + | * vergleichen: | ||
| + | * manchmal ordnen (nur bei ordinal) | ||
| - | Zufriedenheit der User (Skala 1–5) | + | **Informatik-Beispiele** |
| + | * Betriebssystem: | ||
| + | * Team-Rolle: Dev / Ops / QA | ||
| + | * Build-Status: | ||
| + | * HTTP-Methode: | ||
| - | HTTP-Statuscodes | + | ==== 1.2 Quantitative Daten (numerisch) ==== |
| + | Quantitative Daten sind **Zahlen**, die **zählen** oder **messen**. | ||
| + | Du kannst damit rechnen (je nach Messniveau sinnvoll). | ||
| - | Wichtig: Bevor du Kennzahlen berechnest oder Diagramme zeichnest, musst du wissen: Welche Art von Daten ist das? | + | **Informatik-Beispiele** |
| + | * Anzahl Commits pro Woche (gezählt) | ||
| + | * Anzahl offene Tickets im Sprint (gezählt) | ||
| + | * Ladezeit einer Webseite in ms (gemessen) | ||
| + | * Dateigrösse in MB (gemessen) | ||
| - | ===== 2. Grundbegriffe (kurz) ===== | + | <WRAP center round tip 60%> |
| + | **Merksatz: | ||
| + | **Qualitativ** | ||
| + | **Quantitativ** | ||
| + | </ | ||
| - | ^ Begriff ^ Bedeutung ^ Beispiel ^ | + | ===== 2) Messniveau (Skalenniveau) ===== |
| - | | Merkmal / Variable | Eigenschaft, die beobachtet wird | „Browser-Typ“ | | + | Das Messniveau sagt dir, **was du über die Werte aussagen darfst**. |
| - | | Ausprägung | konkreter Wert einer Variable | „Firefox“ | | + | |
| - | | Beobachtung / Datensatz | eine Messung/ | + | |
| - | | Stichprobe | Teilmenge der Daten | 25 Lernende | | + | |
| - | | Grundgesamtheit | alle möglichen Fälle | alle Lernenden der Schule | | + | |
| - | ===== 3. Zwei Hauptklassen von Daten ===== | + | ==== 2.1 Nominal: Kategorien ohne Reihenfolge |
| + | * Es gibt **keine** natürliche Reihenfolge. | ||
| + | * Du kannst sagen: „gleich/ | ||
| - | ==== 3.1 Qualitative Daten (kategorisch) ==== | + | **Informatik-Beispiele |
| + | * Betriebssystem (Windows/ | ||
| + | * Browser (Chrome/ | ||
| + | * Team-Rolle (Dev/ | ||
| + | * HTTP-Statuscode (200/ | ||
| - | Qualitative Daten sind Kategorien/ | + | ==== 2.2 Ordinal: Kategorien mit Reihenfolge ==== |
| + | * Es gibt eine Reihenfolge | ||
| + | * ABER: Der Abstand zwischen Stufen ist nicht exakt messbar. | ||
| - | Beispiele | + | **Informatik-Beispiele |
| + | * Priorität: low / medium / high | ||
| + | * Severity: minor / major / critical | ||
| + | * Zufriedenheit (1–5) als Rangskala | ||
| - | Betriebssystem: Windows / macOS / Linux | + | ==== 2.3 Intervall: Abstände sind sinnvoll, aber Nullpunkt ist willkürlich ==== |
| + | * Unterschiede sind sinnvoll („+10“). | ||
| + | * Null bedeutet nicht „nichts“. | ||
| + | * Aussagen wie „doppelt so viel“ sind hier **nicht** sinnvoll. | ||
| - | Sprache: DE / EN / FR | + | **Beispiel** |
| + | * Temperatur in **°C** (0°C ist nicht „keine Temperatur“) | ||
| - | Bug-Typ: UI / Backend / Security | + | ==== 2.4 Ratio: echtes Null (0 = nichts) ==== |
| + | * Null bedeutet wirklich „nichts“. | ||
| + | * Aussagen wie „doppelt so viel“ sind sinnvoll. | ||
| - | ==== 3.2 Quantitative | + | **Informatik-Beispiele (ratio)** |
| + | * Ladezeit in ms (0 ms = keine Zeit) | ||
| + | * Dateigrösse in MB (0 MB = keine Daten) | ||
| + | * Anzahl Tickets/ | ||
| - | Quantitative Daten sind Zahlenwerte, | + | < |
| - | + | **Quick-Check:** \\ | |
| - | Beispiele | + | Wenn **0** wirklich „nichts“ bedeutet → meistens **Ratio**. \\ |
| - | + | Wenn Werte **nur Codes** sind → meistens **Nominal**. | |
| - | Ladezeit: 123 ms | + | |
| - | + | ||
| - | RAM-Verbrauch: | + | |
| - | + | ||
| - | Anzahl Commits: 18 | + | |
| - | + | ||
| - | <WRAP round box 60%> | + | |
| - | Merksatz: | + | |
| - | Qualitativ = Kategorien/ | + | |
| - | Quantitativ = Zahlenwerte (zählen oder messen). | + | |
| </ | </ | ||
| - | ===== 4. Skalentypen | + | ===== 3) Diskret vs. Stetig |
| - | Die Skala sagt dir, was du mit den Daten machen darfst. | + | ==== 3.1 Diskret (gezählt) ==== |
| + | * Werte sind zählbar: 0, | ||
| + | * entsteht durch **Zählen** | ||
| - | ==== 4.1 Nominalskala (nur „gleich/ | + | **Informatik-Beispiele** |
| + | * Anzahl Commits | ||
| + | * Anzahl offene Tickets | ||
| + | * Anzahl Logins pro Tag | ||
| - | Keine Reihenfolge | + | ==== 3.2 Stetig (gemessen) ==== |
| + | * Werte können theoretisch beliebig fein sein (z.B. 12.3, 12.31, 12.312…) | ||
| + | * entsteht durch **Messen** | ||
| - | Erlaubt: Häufigkeiten, | + | **Informatik-Beispiele** |
| + | * Ladezeit in ms | ||
| + | * Downloadrate in Mbit/s | ||
| + | * CPU-Temperatur | ||
| - | Nicht sinnvoll: Median, Mittelwert | + | ===== 4) Typische Stolpersteine ===== |
| + | * **„Zahl = quantitativ“** → falsch bei Codes (HTTP 404, Fehlercodes, | ||
| + | * **Ordinal vs. Intervall**: | ||
| + | * **Intervall vs. Ratio**: °C (Intervall) vs. ms/ | ||
| + | * **Diskret vs. Stetig**: Zählen (diskret) vs. Messen (stetig). | ||
| - | Beispiele (Informatik) | ||
| - | Browser: Chrome / Firefox / Safari | ||
| - | HTTP-Methode: | + | < |
| - | + | - Nenne ein Beispiel für **nominale** Daten aus der Informatik. | |
| - | Statuscode als Kategorie: 200 / 404 / 500 | + | - Ist „HTTP-Statuscode“ eher **nominal** oder **quantitativ**? |
| - | → Achtung: Das sind Zahlen, aber sie funktionieren hier als Labels, nicht als Messwert! | + | - „Anzahl Commits“: **diskret** oder **stetig**? Begründe mit 1 Satz. |
| - | + | - Was ist der Unterschied zwischen **Intervall** und **Ratio**? | |
| - | ==== 4.2 Ordinalskala (Reihenfolge, | + | |
| - | + | ||
| - | Rangfolge ist möglich | + | |
| - | + | ||
| - | Abstände zwischen Stufen sind nicht zwingend gleich | + | |
| - | + | ||
| - | Erlaubt: Median, Modus, Rangvergleiche, | + | |
| - | + | ||
| - | Mittelwert: meist nicht sinnvoll (nur mit Vorsicht) | + | |
| - | + | ||
| - | Beispiele | + | |
| - | + | ||
| - | Zufriedenheit: | + | |
| - | + | ||
| - | Priorität: low / medium / high | + | |
| - | + | ||
| - | Schulnoten (je nach System): Rangordnung vorhanden | + | |
| - | + | ||
| - | ==== 4.3 Intervallskala (Abstände sinnvoll, aber kein „echtes Null“) ==== | + | |
| - | + | ||
| - | Differenzen sind sinnvoll (z.B. +10) | + | |
| - | + | ||
| - | Nullpunkt ist willkürlich | + | |
| - | + | ||
| - | Erlaubt: Mittelwert, Standardabweichung, | + | |
| - | + | ||
| - | Verhältnis („doppelt so viel“) ist nicht sinnvoll | + | |
| - | + | ||
| - | Beispiele | + | |
| - | + | ||
| - | Temperatur in °C (0°C ist nicht „keine Temperatur“) | + | |
| - | + | ||
| - | Kalenderjahr (2026 ist nicht „doppelt so viel“ wie 1013) | + | |
| - | + | ||
| - | ==== 4.4 Ratioskala / Verhältnisskala (Abstände + echtes Null) ==== | + | |
| - | + | ||
| - | Abstände sinnvoll und Null bedeutet „nichts“ | + | |
| - | + | ||
| - | Verhältnis ist sinnvoll („doppelt so viel“) | + | |
| - | + | ||
| - | Erlaubt: alle üblichen Kennzahlen + viele Diagramme | + | |
| - | + | ||
| - | Beispiele (Informatik) | + | |
| - | + | ||
| - | Dateigrösse (0 MB = keine Daten) | + | |
| - | + | ||
| - | Laufzeit/ | + | |
| - | + | ||
| - | Anzahl Requests (0 = kein Request) | + | |
| - | + | ||
| - | <WRAP round box 60%> | + | |
| - | Quick-Check: | + | |
| - | Wenn „0“ wirklich | + | |
| - | Wenn Zahlen nur Codes sind (z.B. 404) → meist Nominalskala. | + | |
| </ | </ | ||
| - | ===== 5. Diskret vs. Stetig (nur bei quantitativen Daten) ===== | + | ---- |
| - | ==== 5.1 Diskrete Daten (zählbar, ganze Werte) ==== | + | {{tag> |
| + | [[https:// | ||
| - | entstehen durch Zählen | ||
| - | |||
| - | Werte sind typischerweise ganze Zahlen | ||
| - | |||
| - | Beispiele | ||
| - | |||
| - | Anzahl Commits pro Woche | ||
| - | |||
| - | Anzahl Fehler pro Build | ||
| - | |||
| - | Anzahl User in einem Chatraum | ||
| - | |||
| - | ==== 5.2 Stetige Daten (messbar, beliebig fein) ==== | ||
| - | |||
| - | entstehen durch Messen | ||
| - | |||
| - | theoretisch unendlich viele Zwischenwerte möglich | ||
| - | |||
| - | Beispiele | ||
| - | |||
| - | Ladezeit in ms (in der Realität gemessen, kann sehr fein sein) | ||
| - | |||
| - | CPU-Temperatur | ||
| - | |||
| - | Netzwerk-Latenz | ||
| - | |||
| - | ===== 6. Welche Kennzahlen und Diagramme passen? ===== | ||
| - | |||
| - | ^ Datenart / Skala ^ Sinnvolle Kennzahlen ^ Typische Diagramme ^ | ||
| - | | Nominal (qualitativ) | absolute/ | ||
| - | | Ordinal (qualitativ) | Median, Modus, Quartile (oft ok) | Balken, (Boxplot oft ok) | | ||
| - | | Intervall (quantitativ) | Mittelwert, Median, Stdabw. | Histogramm, Linie, Boxplot | | ||
| - | | Ratio (quantitativ) | Mittelwert, Median, Stdabw., Verhältnisse | Histogramm, Linie, Boxplot | | ||
| - | | Diskret | Mittelwert/ | ||
| - | | Stetig | Mittelwert/ | ||
| - | |||
| - | ===== 7. Beispiele (Informatik-Kontext) ===== | ||
| - | |||
| - | ==== Beispiel 1: HTTP-Statuscodes ==== | ||
| - | |||
| - | Frage: Ist 500 „mehr“ als 200? | ||
| - | Antwort: Als Zahl ja – aber als Bedeutung nicht. Es sind Kategorien. | ||
| - | |||
| - | Datenklasse: | ||
| - | |||
| - | Skala: nominal | ||
| - | |||
| - | Sinnvolle Auswertung: Häufigkeiten pro Code, Top-3 Codes, Balkendiagramm | ||
| - | |||
| - | ==== Beispiel 2: Zufriedenheit 1–5 ==== | ||
| - | |||
| - | Datenklasse: | ||
| - | |||
| - | Skala: ordinal | ||
| - | |||
| - | Sinnvolle Auswertung: Median, Häufigkeiten, | ||
| - | |||
| - | Interpretation: | ||
| - | |||
| - | ==== Beispiel 3: Ladezeit (ms) ==== | ||
| - | |||
| - | Datenklasse: | ||
| - | |||
| - | Skala: Ratio | ||
| - | |||
| - | Typ: stetig | ||
| - | |||
| - | Sinnvolle Auswertung: Mittelwert/ | ||
| - | |||
| - | ===== 8. Übung: Datenarten klassifizieren ===== | ||
| - | |||
| - | Auftrag: Bestimme für jede Variable: | ||
| - | |||
| - | qualitativ oder quantitativ? | ||
| - | |||
| - | Skala (nominal/ | ||
| - | |||
| - | falls quantitativ: | ||
| - | |||
| - | ^ Variable ^ qualit./ | ||
| - | | Betriebssystem (Windows/ | ||
| - | | Anzahl Commits pro Woche | | | | | ||
| - | | Ladezeit einer Seite (ms) | | | | | ||
| - | | HTTP-Statuscode (200/ | ||
| - | | Zufriedenheit (1–5) | | | | | ||
| - | | CPU-Temperatur in °C | | | | | ||
| - | | Dateigrösse in MB | | | | | ||
| - | |||
| - | ==== Musterlösung (kurz) ==== | ||
| - | |||
| - | Betriebssystem → qualitativ, nominal | ||
| - | |||
| - | Commits → quantitativ, | ||
| - | |||
| - | Ladezeit → quantitativ, | ||
| - | |||
| - | Statuscode → qualitativ, nominal | ||
| - | |||
| - | Zufriedenheit → qualitativ, ordinal | ||
| - | |||
| - | CPU-Temperatur °C → quantitativ, | ||
| - | |||
| - | Dateigrösse MB → quantitativ, | ||
| - | |||
| - | ===== 9. Häufige Fehler ===== | ||
| - | |||
| - | „Zahlen = automatisch quantitativ“ → falsch. Codes (z.B. 404) sind oft nominal. | ||
| - | |||
| - | Mittelwert bei Ordinaldaten (z.B. Zufriedenheit) → kann täuschen. | ||
| - | |||
| - | Diskret/ | ||
| - | |||
| - | Diagramm falsch gewählt: Kreisdiagramm für sehr viele Kategorien ist unübersichtlich → besser Balken. | ||
| - | |||
| - | ===== 10. Mini-Check (Exit Ticket) ===== | ||
| - | |||
| - | Nenne ein Beispiel für nominale Daten aus der Informatik. | ||
| - | |||
| - | Warum ist der HTTP-Statuscode meistens nicht quantitativ? | ||
| - | |||
| - | Was ist der Unterschied zwischen diskret und stetig? | ||
| - | |||
| - | {{tag> | ||
| - | [[https:// | ||
| - | }}]] Kevin Maurizi | ||