Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

--- modul:mathe:ma4:thema:statistik:artenvondaten [2026/01/26 09:44] – kmaurizi
+++ modul:mathe:ma4:thema:statistik:artenvondaten [2026/01/26 11:46] (aktuell) – [2.4 Ratio: echtes Null (0 = nichts)] kmaurizi
@@ Zeile 2: / Zeile 2: @@
 ====== LU01a - Arten von Daten ======
-^ Überblick ^ Inhalt ^
+<WRAP center round download 60%>
-| **Ziel** | Du kannst Datenarten unterscheiden (qualitativ/quantitativ) und die passende Skala (nominal/ordinal/intervall/ratio) erklären. |
+**Ziel:** Du kannst Variablen korrekt als **qualitativ/quantitativ** einordnen und das **Messniveau** (nominal/ordinal/intervall/ratio) bestimmen. Falls quantitativ: **diskret/stetig**.
-| **Warum wichtig?** | Die Datenart entscheidet, **welche Kennzahlen** (z.B. Mittelwert ja/nein) und **welche Diagramme** sinnvoll sind. |
+</WRAP>
-| **Kompetenzbezug** | **AG1/AF1** (Grundbegriffe verstehen & anwenden), Vorbereitung für Lagewerte/Verteilungen |
-| **Dauer** | 1 Doppellektion (90’) |
-===== 1. Einstieg: Was bedeutet „Daten“? =====
+===== Warum ist das wichtig? =====
+Bevor du Daten auswertest, musst du wissen, **welche Art von Daten** du hast.
+Die Datenart entscheidet, was sinnvoll ist:
+  * Darf ich **nur zählen** (Häufigkeiten) oder auch **rechnen**?
+  * Gibt es eine **Reihenfolge** (z.B. low/medium/high)?
+  * Ist „0“ wirklich **nichts** (z.B. 0 Tickets)?
-In der Datenanalyse beschreibt man reale Beobachtungen in strukturierter Form, um daraus Erkenntnisse abzuleiten.
+Diese Seite passt direkt zur Aufgabe: **LU01.A01 - Datenarten klassifizieren**.
-**Beispiele aus dem Informatik-Alltag**
+===== Kurztheorie (Merksätze) =====
-  * Ladezeit einer Webseite in Millisekunden
+  * **Qualitativ (kategorisch):** Werte sind **Labels/Kategorien** (z.B. Betriebssystem).
-  * Anzahl Fehler in einem Log pro Stunde
+  * **Quantitativ (numerisch):** Werte sind **Zahlenwerte zum Zählen/Messen** (z.B. Ladezeit).
-  * Betriebssystem der User (Windows/macOS/Linux)
+  * **Nominal:** Kategorien **ohne** Reihenfolge.
-  * Zufriedenheit der User (Skala 1–5)
+  * **Ordinal:** Kategorien **mit** Reihenfolge, aber Abstände unklar.
-  * HTTP-Statuscodes (200, 404, 500)
+  * **Intervall:** Abstände sinnvoll, Nullpunkt willkürlich (z.B. °C).
+  * **Ratio:** Abstände sinnvoll **und** echtes Null (z.B. ms, MB, Anzahl).
+  * **Diskret:** gezählt (0,1,2,3,...)
+  * **Stetig:** gemessen (beliebig fein)
-Wichtig: Bevor du Kennzahlen berechnest oder Diagramme zeichnest, musst du wissen: **Welche Art von Daten ist das?**
+<WRAP center round important 60%>
+**Achtung:** Nur weil etwas wie eine Zahl aussieht, ist es nicht automatisch quantitativ.  \\
-===== 2. Grundbegriffe (kurz) =====
+**HTTP-Statuscodes** (200/404/500) sind meistens **Kategorien** → **nominal**.
+</WRAP>
-^ Begriff ^ Bedeutung ^ Beispiel ^
-| **Merkmal / Variable** | Eigenschaft, die beobachtet wird | „Browser-Typ“ |
-| **Ausprägung** | konkreter Wert einer Variable | „Firefox“ |
-| **Beobachtung / Datensatz** | eine Messung/Eintrag | „Firefox“ bei Person A |
-| **Stichprobe** | Teilmenge der Daten | 25 Lernende |
-| **Grundgesamtheit** | alle möglichen Fälle | alle Lernenden der Schule |
-===== 3. Zwei Hauptklassen von Daten =====
-==== 3.1 Qualitative Daten (kategorisch) ====
+===== 1) Zwei Hauptarten von Daten =====
-Qualitative Daten sind **Kategorien/Labels**. Man rechnet damit nicht „normal“ (kein Mittelwert).
+==== 1.1 Qualitative Daten (kategorisch) ====
+Qualitative Daten sind **Kategorien/Labels**. Du arbeitest damit typischerweise so:
+  * **zählen**, wie oft etwas vorkommt (Häufigkeiten)
+  * vergleichen: **gleich / ungleich**
+  * manchmal ordnen (nur bei ordinal)
-**Beispiele**
+**Informatik-Beispiele**
   * Betriebssystem: Windows / macOS / Linux
-  * Sprache: DE / EN / FR
+  * Team-Rolle: Dev / Ops / QA
-  * Bug-Typ: UI / Backend / Security
+  * Build-Status: success / failed
+  * HTTP-Methode: GET / POST / PUT
-==== 3.2 Quantitative Daten (numerisch) ====
-Quantitative Daten sind **Zahlenwerte**, die etwas **messen oder zählen**. Hier sind mathematische Operationen sinnvoll (je nach Skala).
+==== 1.2 Quantitative Daten (numerisch) ====
+Quantitative Daten sind **Zahlen**, die **zählen** oder **messen**.
+Du kannst damit rechnen (je nach Messniveau sinnvoll).
-**Beispiele**
+**Informatik-Beispiele**
-  * Ladezeit: 123 ms
+  * Anzahl Commits pro Woche (gezählt)
-  * RAM-Verbrauch: 2.4 GB
+  * Anzahl offene Tickets im Sprint (gezählt)
-  * Anzahl Commits: 18
+  * Ladezeit einer Webseite in ms (gemessen)
+  * Dateigrösse in MB (gemessen)
-<WRAP round box 60%>
+<WRAP center round tip 60%>
-**Merksatz:**
+**Merksatz:**  \\
-**Qualitativ** = Kategorien/Labels.
+**Qualitativ** = Kategorien/Labels.  \\
-**Quantitativ** = Zahlenwerte (zählen oder messen).
+**Quantitativ** = Zahlen zum Zählen/Messen.
 </WRAP>
-===== 4. Skalentypen (Messniveaus) =====
+===== 2) Messniveau (Skalenniveau) =====
+Das Messniveau sagt dir, **was du über die Werte aussagen darfst**.
-Die Skala sagt dir, **was du mit den Daten machen darfst**.
+==== 2.1 Nominal: Kategorien ohne Reihenfolge ====
+  * Es gibt **keine** natürliche Reihenfolge.
+  * Du kannst sagen: „gleich/ungleich“ und **wie oft** etwas vorkommt.
-==== 4.1 Nominalskala (nur „gleich/ungleich“) ====
+**Informatik-Beispiele (nominal)**
+  * Betriebssystem (Windows/macOS/Linux)
+  * Browser (Chrome/Firefox/Safari)
+  * Team-Rolle (Dev/Ops/QA)
+  * HTTP-Statuscode (200/404/500) als Code/Kategorie
-  * **Keine Reihenfolge**
+==== 2.2 Ordinal: Kategorien mit Reihenfolge ====
-  * Erlaubt: Häufigkeiten, Modus, Balkendiagramm, Kreisdiagramm
+  * Es gibt eine Reihenfolge (z.B. low < medium < high).
-  * Nicht sinnvoll: Median, Mittelwert
+  * ABER: Der Abstand zwischen Stufen ist nicht exakt messbar.
-**Beispiele (Informatik)**
+**Informatik-Beispiele (ordinal)**
-  * Browser: Chrome / Firefox / Safari
-  * HTTP-Methode: GET / POST / PUT
-  * Statuscode **als Kategorie**: 200 / 404 / 500
-    → Achtung: Das sind Zahlen, aber sie funktionieren hier als **Labels**, nicht als Messwert!
-==== 4.2 Ordinalskala (Reihenfolge, aber Abstände unbekannt) ====
-  * **Rangfolge** ist möglich
-  * Abstände zwischen Stufen sind nicht zwingend gleich
-  * Erlaubt: Median, Modus, Rangvergleiche, Boxplot (oft ok), Balkendiagramm
-  * Mittelwert: meist **nicht** sinnvoll (nur mit Vorsicht)
-**Beispiele**
-  * Zufriedenheit: 1–5 (sehr schlecht … sehr gut)
   * Priorität: low / medium / high
-  * Schulnoten (je nach System): Rangordnung vorhanden
+  * Severity: minor / major / critical
+  * Zufriedenheit (1–5) als Rangskala
-==== 4.3 Intervallskala (Abstände sinnvoll, aber kein „echtes Null“) ====
+==== 2.3 Intervall: Abstände sind sinnvoll, aber Nullpunkt ist willkürlich ====
+  * Unterschiede sind sinnvoll („+10“).
+  * Null bedeutet nicht „nichts“.
+  * Aussagen wie „doppelt so viel“ sind hier **nicht** sinnvoll.
-  * Differenzen sind sinnvoll (z.B. +10)
+**Beispiel**
-  * Nullpunkt ist **willkürlich**
+  * Temperatur in **°C** (0°C ist nicht „keine Temperatur“)
-  * Erlaubt: Mittelwert, Standardabweichung, Histogramm, Linie
-  * Verhältnis („doppelt so viel“) ist **nicht** sinnvoll
-**Beispiele**
+==== 2.4 Ratio: echtes Null (0 = nichts) ====
-  * Temperatur in °C (0°C ist nicht „keine Temperatur“)
+  * Null bedeutet wirklich „nichts“.
-  * Kalenderjahr (2026 ist nicht „doppelt so viel“ wie 1013)
+  * Aussagen wie „doppelt so viel“ sind sinnvoll.
-==== 4.4 Ratioskala / Verhältnisskala (Abstände + echtes Null) ====
+**Informatik-Beispiele (ratio)**
+  * Ladezeit in ms (0 ms = keine Zeit)
+  * Dateigrösse in MB (0 MB = keine Daten)
+  * Anzahl Tickets/Commits (0 = nichts)
-  * Abstände sinnvoll **und** Null bedeutet „nichts“
+<WRAP center round tip 60%>
-  * Verhältnis ist sinnvoll („doppelt so viel“)
+**Quick-Check:**  \\
-  * Erlaubt: alle üblichen Kennzahlen + viele Diagramme
+Wenn **0** wirklich „nichts“ bedeutet → meistens **Ratio**.  \\
+Wenn Werte **nur Codes** sind → meistens **Nominal**.
-**Beispiele (Informatik)**
-  * Dateigrösse (0 MB = keine Daten)
-  * Laufzeit/Antwortzeit (0 ms = keine Zeit)
-  * Anzahl Requests (0 = kein Request)
-<WRAP round box 60%>
-**Quick-Check:**
-Wenn „0“ wirklich „nichts“ bedeutet → meist **Ratioskala**.
-Wenn Zahlen nur Codes sind (z.B. 404) → meist **Nominalskala**.
 </WRAP>
-===== 5. Diskret vs. Stetig (nur bei quantitativen Daten) =====
+===== 3) Diskret vs. Stetig (nur bei quantitativen Daten) =====
-==== 5.1 Diskrete Daten (zählbar, ganze Werte) ====
+==== 3.1 Diskret (gezählt) ====
+  * Werte sind zählbar: 0,1,2,3,…
+  * entsteht durch **Zählen**
-  * entstehen durch **Zählen**
+**Informatik-Beispiele**
-  * Werte sind typischerweise ganze Zahlen
+  * Anzahl Commits
+  * Anzahl offene Tickets
+  * Anzahl Logins pro Tag
-**Beispiele**
+==== 3.2 Stetig (gemessen) ====
-  * Anzahl Commits pro Woche
+  * Werte können theoretisch beliebig fein sein (z.B. 12.3, 12.31, 12.312…)
-  * Anzahl Fehler pro Build
+  * entsteht durch **Messen**
-  * Anzahl User in einem Chatraum
-==== 5.2 Stetige Daten (messbar, beliebig fein) ====
+**Informatik-Beispiele**
+  * Ladezeit in ms
-  * entstehen durch **Messen**
+  * Downloadrate in Mbit/s
-  * theoretisch unendlich viele Zwischenwerte möglich
-**Beispiele**
-  * Ladezeit in ms (in der Realität gemessen, kann sehr fein sein)
   * CPU-Temperatur
-  * Netzwerk-Latenz
-===== 6. Welche Kennzahlen und Diagramme passen? =====
+===== 4) Typische Stolpersteine =====
+  * **„Zahl = quantitativ“** → falsch bei Codes (HTTP 404, Fehlercodes, Postleitzahl).
+  * **Ordinal vs. Intervall**: Rangfolge heisst nicht automatisch „messbarer Abstand“.
+  * **Intervall vs. Ratio**: °C (Intervall) vs. ms/MB/Anzahl (Ratio).
+  * **Diskret vs. Stetig**: Zählen (diskret) vs. Messen (stetig).
-^ Datenart / Skala ^ Sinnvolle Kennzahlen ^ Typische Diagramme ^
-| **Nominal (qualitativ)** | absolute/relative Häufigkeit, Modus | Balken, Kreis |
-| **Ordinal (qualitativ)** | Median, Modus, Quartile (oft ok) | Balken, (Boxplot oft ok) |
-| **Intervall (quantitativ)** | Mittelwert, Median, Stdabw. | Histogramm, Linie, Boxplot |
-| **Ratio (quantitativ)** | Mittelwert, Median, Stdabw., Verhältnisse | Histogramm, Linie, Boxplot |
-| **Diskret** | Mittelwert/Median möglich (je nach Skala) | Balken, Histogramm (mit ganzen Klassen) |
-| **Stetig** | Mittelwert/Median/Stdabw. | Histogramm, Dichtekurve, Boxplot |
-===== 7. Beispiele (Informatik-Kontext) =====
-==== Beispiel 1: HTTP-Statuscodes ====
-**Frage:** Ist 500 „mehr“ als 200?
-**Antwort:** Als Zahl ja – aber als Bedeutung nicht. Es sind **Kategorien**.
-  * Datenklasse: **qualitativ**
-  * Skala: **nominal**
-  * Sinnvolle Auswertung: Häufigkeiten pro Code, Top-3 Codes, Balkendiagramm
-==== Beispiel 2: Zufriedenheit 1–5 ====
-  * Datenklasse: **qualitativ** (Ordinal)
-  * Skala: **ordinal**
-  * Sinnvolle Auswertung: Median, Häufigkeiten, Verteilung als Balken
-**Interpretation:** Median = 4 bedeutet „typisch eher gut“, aber „4 ist doppelt so gut wie 2“ ist nicht zwingend korrekt.
-==== Beispiel 3: Ladezeit (ms) ====
-  * Datenklasse: **quantitativ**
-  * Skala: **Ratio**
-  * Typ: **stetig**
-  * Sinnvolle Auswertung: Mittelwert/Median/Stdabw., Boxplot (Ausreisser!), Histogramm
-===== 8. Übung: Datenarten klassifizieren =====
-**Auftrag:** Bestimme für jede Variable:
-  - qualitativ oder quantitativ?
-  - Skala (nominal/ordinal/intervall/ratio)?
-  - falls quantitativ: diskret oder stetig?
-^ Variable ^ qualit./quant. ^ Skala ^ diskret/stetig ^
-| Betriebssystem (Windows/macOS/Linux) |  |  |  |
-| Anzahl Commits pro Woche |  |  |  |
-| Ladezeit einer Seite (ms) |  |  |  |
-| HTTP-Statuscode (200/404/500) |  |  |  |
-| Zufriedenheit (1–5) |  |  |  |
-| CPU-Temperatur in °C |  |  |  |
-| Dateigrösse in MB |  |  |  |
-==== Musterlösung (kurz) ====
-  * Betriebssystem → qualitativ, nominal
-  * Commits → quantitativ, ratio, diskret
-  * Ladezeit → quantitativ, ratio, stetig
-  * Statuscode → qualitativ, nominal
-  * Zufriedenheit → qualitativ, ordinal
-  * CPU-Temperatur °C → quantitativ, intervall, stetig
-  * Dateigrösse MB → quantitativ, ratio, stetig
-===== 9. Häufige Fehler =====
-  * **„Zahlen = automatisch quantitativ“** → falsch. Codes (z.B. 404) sind oft **nominal**.
-  * **Mittelwert bei Ordinaldaten** (z.B. Zufriedenheit) → kann täuschen.
-  * **Diskret/stetig** verwechseln: Zählen = diskret, Messen = stetig.
-  * Diagramm falsch gewählt: Kreisdiagramm für sehr viele Kategorien ist unübersichtlich → besser Balken.
-===== 10. Mini-Check (Exit Ticket) =====
+<WRAP center round todo 60%>
   - Nenne ein Beispiel für **nominale** Daten aus der Informatik.
-  - Warum ist der **HTTP-Statuscode** meistens **nicht** quantitativ?
+  - Ist „HTTP-Statuscode“ eher **nominal** oder **quantitativ**? Warum?
-  - Was ist der Unterschied zwischen **diskret** und **stetig**?
+  - „Anzahl Commits“: **diskret** oder **stetig**? Begründe mit 1 Satz.
+  - Was ist der Unterschied zwischen **Intervall** und **Ratio**?
+</WRAP>
 ----