Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

--- modul:mathe:ma4:thema:statistik:artenvondaten [2026/01/26 09:42] – angelegt kmaurizi
+++ modul:mathe:ma4:thema:statistik:artenvondaten [2026/01/26 11:46] (aktuell) – [2.4 Ratio: echtes Null (0 = nichts)] kmaurizi
@@ Zeile 1: / Zeile 1: @@
+~~NOTOC~~
 ====== LU01a - Arten von Daten ======
-^ Überblick ^ Inhalt ^
+<WRAP center round download 60%>
-| Ziel | Du kannst Datenarten unterscheiden (qualitativ/quantitativ) und die passende Skala (nominal/ordinal/intervall/ratio) erklären. |
+**Ziel:** Du kannst Variablen korrekt als **qualitativ/quantitativ** einordnen und das **Messniveau** (nominal/ordinal/intervall/ratio) bestimmen. Falls quantitativ: **diskret/stetig**.
-| Warum wichtig? | Die Datenart entscheidet, welche Kennzahlen (z.B. Mittelwert ja/nein) und welche Diagramme sinnvoll sind. |
+</WRAP>
-| Kompetenzbezug | AG1/AF1 (Grundbegriffe verstehen & anwenden), Vorbereitung für Lagewerte/Verteilungen |
-| Dauer | 1 Doppellektion (90’) |
-===== 1. Einstieg: Was bedeutet „Daten“? =====
+===== Warum ist das wichtig? =====
+Bevor du Daten auswertest, musst du wissen, **welche Art von Daten** du hast.
+Die Datenart entscheidet, was sinnvoll ist:
+  * Darf ich **nur zählen** (Häufigkeiten) oder auch **rechnen**?
+  * Gibt es eine **Reihenfolge** (z.B. low/medium/high)?
+  * Ist „0“ wirklich **nichts** (z.B. 0 Tickets)?
-In der Datenanalyse beschreibt man reale Beobachtungen in strukturierter Form, um daraus Erkenntnisse abzuleiten.
+Diese Seite passt direkt zur Aufgabe: **LU01.A01 - Datenarten klassifizieren**.
-Beispiele aus dem Informatik-Alltag
+===== Kurztheorie (Merksätze) =====
+  * **Qualitativ (kategorisch):** Werte sind **Labels/Kategorien** (z.B. Betriebssystem).
+  * **Quantitativ (numerisch):** Werte sind **Zahlenwerte zum Zählen/Messen** (z.B. Ladezeit).
+  * **Nominal:** Kategorien **ohne** Reihenfolge.
+  * **Ordinal:** Kategorien **mit** Reihenfolge, aber Abstände unklar.
+  * **Intervall:** Abstände sinnvoll, Nullpunkt willkürlich (z.B. °C).
+  * **Ratio:** Abstände sinnvoll **und** echtes Null (z.B. ms, MB, Anzahl).
+  * **Diskret:** gezählt (0,1,2,3,...)
+  * **Stetig:** gemessen (beliebig fein)
-Ladezeit einer Webseite in Millisekunden
+<WRAP center round important 60%>
+**Achtung:** Nur weil etwas wie eine Zahl aussieht, ist es nicht automatisch quantitativ.  \\
+**HTTP-Statuscodes** (200/404/500) sind meistens **Kategorien** → **nominal**.
+</WRAP>
-Anzahl Fehler in einem Log pro Stunde
+===== 1) Zwei Hauptarten von Daten =====
-Betriebssystem der User (Windows/macOS/Linux)
+==== 1.1 Qualitative Daten (kategorisch) ====
+Qualitative Daten sind **Kategorien/Labels**. Du arbeitest damit typischerweise so:
+  * **zählen**, wie oft etwas vorkommt (Häufigkeiten)
+  * vergleichen: **gleich / ungleich**
+  * manchmal ordnen (nur bei ordinal)
-Zufriedenheit der User (Skala 1–5)
+**Informatik-Beispiele**
+  * Betriebssystem: Windows / macOS / Linux
+  * Team-Rolle: Dev / Ops / QA
+  * Build-Status: success / failed
+  * HTTP-Methode: GET / POST / PUT
-HTTP-Statuscodes (200, 404, 500)
+==== 1.2 Quantitative Daten (numerisch) ====
+Quantitative Daten sind **Zahlen**, die **zählen** oder **messen**.
+Du kannst damit rechnen (je nach Messniveau sinnvoll).
-Wichtig: Bevor du Kennzahlen berechnest oder Diagramme zeichnest, musst du wissen: Welche Art von Daten ist das?
+**Informatik-Beispiele**
+  * Anzahl Commits pro Woche (gezählt)
+  * Anzahl offene Tickets im Sprint (gezählt)
+  * Ladezeit einer Webseite in ms (gemessen)
+  * Dateigrösse in MB (gemessen)
-===== 2. Grundbegriffe (kurz) =====
+<WRAP center round tip 60%>
+**Merksatz:**  \\
+**Qualitativ** = Kategorien/Labels.  \\
+**Quantitativ** = Zahlen zum Zählen/Messen.
+</WRAP>
-^ Begriff ^ Bedeutung ^ Beispiel ^
+===== 2) Messniveau (Skalenniveau) =====
-| Merkmal / Variable | Eigenschaft, die beobachtet wird | „Browser-Typ“ |
+Das Messniveau sagt dir, **was du über die Werte aussagen darfst**.
-| Ausprägung | konkreter Wert einer Variable | „Firefox“ |
-| Beobachtung / Datensatz | eine Messung/Eintrag | „Firefox“ bei Person A |
-| Stichprobe | Teilmenge der Daten | 25 Lernende |
-| Grundgesamtheit | alle möglichen Fälle | alle Lernenden der Schule |
-===== 3. Zwei Hauptklassen von Daten =====
+==== 2.1 Nominal: Kategorien ohne Reihenfolge ====
+  * Es gibt **keine** natürliche Reihenfolge.
+  * Du kannst sagen: „gleich/ungleich“ und **wie oft** etwas vorkommt.
-==== 3.1 Qualitative Daten (kategorisch) ====
+**Informatik-Beispiele (nominal)**
+  * Betriebssystem (Windows/macOS/Linux)
+  * Browser (Chrome/Firefox/Safari)
+  * Team-Rolle (Dev/Ops/QA)
+  * HTTP-Statuscode (200/404/500) als Code/Kategorie
-Qualitative Daten sind Kategorien/Labels. Man rechnet damit nicht „normal“ (kein Mittelwert).
+==== 2.2 Ordinal: Kategorien mit Reihenfolge ====
+  * Es gibt eine Reihenfolge (z.B. low < medium < high).
+  * ABER: Der Abstand zwischen Stufen ist nicht exakt messbar.
-Beispiele
+**Informatik-Beispiele (ordinal)**
+  * Priorität: low / medium / high
+  * Severity: minor / major / critical
+  * Zufriedenheit (1–5) als Rangskala
-Betriebssystem: Windows / macOS / Linux
+==== 2.3 Intervall: Abstände sind sinnvoll, aber Nullpunkt ist willkürlich ====
+  * Unterschiede sind sinnvoll („+10“).
+  * Null bedeutet nicht „nichts“.
+  * Aussagen wie „doppelt so viel“ sind hier **nicht** sinnvoll.
-Sprache: DE / EN / FR
+**Beispiel**
+  * Temperatur in **°C** (0°C ist nicht „keine Temperatur“)
-Bug-Typ: UI / Backend / Security
+==== 2.4 Ratio: echtes Null (0 = nichts) ====
+  * Null bedeutet wirklich „nichts“.
+  * Aussagen wie „doppelt so viel“ sind sinnvoll.
-==== 3.2 Quantitative Daten (numerisch) ====
+**Informatik-Beispiele (ratio)**
+  * Ladezeit in ms (0 ms = keine Zeit)
+  * Dateigrösse in MB (0 MB = keine Daten)
+  * Anzahl Tickets/Commits (0 = nichts)
-Quantitative Daten sind Zahlenwerte, die etwas messen oder zählen. Hier sind mathematische Operationen sinnvoll (je nach Skala).
+<WRAP center round tip 60%>
+**Quick-Check:**  \\
-Beispiele
+Wenn **0** wirklich „nichts“ bedeutet → meistens **Ratio**.  \\
+Wenn Werte **nur Codes** sind → meistens **Nominal**.
-Ladezeit: 123 ms
-RAM-Verbrauch: 2.4 GB
-Anzahl Commits: 18
-<WRAP round box 60%>
-Merksatz:
-Qualitativ = Kategorien/Labels.
-Quantitativ = Zahlenwerte (zählen oder messen).
 </WRAP>
-===== 4. Skalentypen (Messniveaus) =====
+===== 3) Diskret vs. Stetig (nur bei quantitativen Daten) =====
-Die Skala sagt dir, was du mit den Daten machen darfst.
+==== 3.1 Diskret (gezählt) ====
+  * Werte sind zählbar: 0,1,2,3,…
+  * entsteht durch **Zählen**
-==== 4.1 Nominalskala (nur „gleich/ungleich“) ====
+**Informatik-Beispiele**
+  * Anzahl Commits
+  * Anzahl offene Tickets
+  * Anzahl Logins pro Tag
-Keine Reihenfolge
+==== 3.2 Stetig (gemessen) ====
+  * Werte können theoretisch beliebig fein sein (z.B. 12.3, 12.31, 12.312…)
+  * entsteht durch **Messen**
-Erlaubt: Häufigkeiten, Modus, Balkendiagramm, Kreisdiagramm
+**Informatik-Beispiele**
+  * Ladezeit in ms
+  * Downloadrate in Mbit/s
+  * CPU-Temperatur
-Nicht sinnvoll: Median, Mittelwert
+===== 4) Typische Stolpersteine =====
+  * **„Zahl = quantitativ“** → falsch bei Codes (HTTP 404, Fehlercodes, Postleitzahl).
+  * **Ordinal vs. Intervall**: Rangfolge heisst nicht automatisch „messbarer Abstand“.
+  * **Intervall vs. Ratio**: °C (Intervall) vs. ms/MB/Anzahl (Ratio).
+  * **Diskret vs. Stetig**: Zählen (diskret) vs. Messen (stetig).
-Beispiele (Informatik)
-Browser: Chrome / Firefox / Safari
-HTTP-Methode: GET / POST / PUT
+<WRAP center round todo 60%>
+  - Nenne ein Beispiel für **nominale** Daten aus der Informatik.
-Statuscode als Kategorie: 200 / 404 / 500
+  - Ist „HTTP-Statuscode“ eher **nominal** oder **quantitativ**? Warum?
-→ Achtung: Das sind Zahlen, aber sie funktionieren hier als Labels, nicht als Messwert!
+  - „Anzahl Commits“: **diskret** oder **stetig**? Begründe mit 1 Satz.
+  - Was ist der Unterschied zwischen **Intervall** und **Ratio**?
-==== 4.2 Ordinalskala (Reihenfolge, aber Abstände unbekannt) ====
-Rangfolge ist möglich
-Abstände zwischen Stufen sind nicht zwingend gleich
-Erlaubt: Median, Modus, Rangvergleiche, Boxplot (oft ok), Balkendiagramm
-Mittelwert: meist nicht sinnvoll (nur mit Vorsicht)
-Beispiele
-Zufriedenheit: 1–5 (sehr schlecht … sehr gut)
-Priorität: low / medium / high
-Schulnoten (je nach System): Rangordnung vorhanden
-==== 4.3 Intervallskala (Abstände sinnvoll, aber kein „echtes Null“) ====
-Differenzen sind sinnvoll (z.B. +10)
-Nullpunkt ist willkürlich
-Erlaubt: Mittelwert, Standardabweichung, Histogramm, Linie
-Verhältnis („doppelt so viel“) ist nicht sinnvoll
-Beispiele
-Temperatur in °C (0°C ist nicht „keine Temperatur“)
-Kalenderjahr (2026 ist nicht „doppelt so viel“ wie 1013)
-==== 4.4 Ratioskala / Verhältnisskala (Abstände + echtes Null) ====
-Abstände sinnvoll und Null bedeutet „nichts“
-Verhältnis ist sinnvoll („doppelt so viel“)
-Erlaubt: alle üblichen Kennzahlen + viele Diagramme
-Beispiele (Informatik)
-Dateigrösse (0 MB = keine Daten)
-Laufzeit/Antwortzeit (0 ms = keine Zeit)
-Anzahl Requests (0 = kein Request)
-<WRAP round box 60%>
-Quick-Check:
-Wenn „0“ wirklich „nichts“ bedeutet → meist Ratioskala.
-Wenn Zahlen nur Codes sind (z.B. 404) → meist Nominalskala.
 </WRAP>
-===== 5. Diskret vs. Stetig (nur bei quantitativen Daten) =====
+----
-==== 5.1 Diskrete Daten (zählbar, ganze Werte) ====
+{{tag>M3-LU01}}
+[[https://creativecommons.org/licenses/by-nc-sa/4.0/|{{https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png}}]] Kevin Maurizi
-entstehen durch Zählen
-Werte sind typischerweise ganze Zahlen
-Beispiele
-Anzahl Commits pro Woche
-Anzahl Fehler pro Build
-Anzahl User in einem Chatraum
-==== 5.2 Stetige Daten (messbar, beliebig fein) ====
-entstehen durch Messen
-theoretisch unendlich viele Zwischenwerte möglich
-Beispiele
-Ladezeit in ms (in der Realität gemessen, kann sehr fein sein)
-CPU-Temperatur
-Netzwerk-Latenz
-===== 6. Welche Kennzahlen und Diagramme passen? =====
-^ Datenart / Skala ^ Sinnvolle Kennzahlen ^ Typische Diagramme ^
-| Nominal (qualitativ) | absolute/relative Häufigkeit, Modus | Balken, Kreis |
-| Ordinal (qualitativ) | Median, Modus, Quartile (oft ok) | Balken, (Boxplot oft ok) |
-| Intervall (quantitativ) | Mittelwert, Median, Stdabw. | Histogramm, Linie, Boxplot |
-| Ratio (quantitativ) | Mittelwert, Median, Stdabw., Verhältnisse | Histogramm, Linie, Boxplot |
-| Diskret | Mittelwert/Median möglich (je nach Skala) | Balken, Histogramm (mit ganzen Klassen) |
-| Stetig | Mittelwert/Median/Stdabw. | Histogramm, Dichtekurve, Boxplot |
-===== 7. Beispiele (Informatik-Kontext) =====
-==== Beispiel 1: HTTP-Statuscodes ====
-Frage: Ist 500 „mehr“ als 200?
-Antwort: Als Zahl ja – aber als Bedeutung nicht. Es sind Kategorien.
-Datenklasse: qualitativ
-Skala: nominal
-Sinnvolle Auswertung: Häufigkeiten pro Code, Top-3 Codes, Balkendiagramm
-==== Beispiel 2: Zufriedenheit 1–5 ====
-Datenklasse: qualitativ (Ordinal)
-Skala: ordinal
-Sinnvolle Auswertung: Median, Häufigkeiten, Verteilung als Balken
-Interpretation: Median = 4 bedeutet „typisch eher gut“, aber „4 ist doppelt so gut wie 2“ ist nicht zwingend korrekt.
-==== Beispiel 3: Ladezeit (ms) ====
-Datenklasse: quantitativ
-Skala: Ratio
-Typ: stetig
-Sinnvolle Auswertung: Mittelwert/Median/Stdabw., Boxplot (Ausreisser!), Histogramm
-===== 8. Übung: Datenarten klassifizieren =====
-Auftrag: Bestimme für jede Variable:
-qualitativ oder quantitativ?
-Skala (nominal/ordinal/intervall/ratio)?
-falls quantitativ: diskret oder stetig?
-^ Variable ^ qualit./quant. ^ Skala ^ diskret/stetig ^
-| Betriebssystem (Windows/macOS/Linux) | | | |
-| Anzahl Commits pro Woche | | | |
-| Ladezeit einer Seite (ms) | | | |
-| HTTP-Statuscode (200/404/500) | | | |
-| Zufriedenheit (1–5) | | | |
-| CPU-Temperatur in °C | | | |
-| Dateigrösse in MB | | | |
-==== Musterlösung (kurz) ====
-Betriebssystem → qualitativ, nominal
-Commits → quantitativ, ratio, diskret
-Ladezeit → quantitativ, ratio, stetig
-Statuscode → qualitativ, nominal
-Zufriedenheit → qualitativ, ordinal
-CPU-Temperatur °C → quantitativ, intervall, stetig
-Dateigrösse MB → quantitativ, ratio, stetig
-===== 9. Häufige Fehler =====
-„Zahlen = automatisch quantitativ“ → falsch. Codes (z.B. 404) sind oft nominal.
-Mittelwert bei Ordinaldaten (z.B. Zufriedenheit) → kann täuschen.
-Diskret/stetig verwechseln: Zählen = diskret, Messen = stetig.
-Diagramm falsch gewählt: Kreisdiagramm für sehr viele Kategorien ist unübersichtlich → besser Balken.
-===== 10. Mini-Check (Exit Ticket) =====
-Nenne ein Beispiel für nominale Daten aus der Informatik.
-Warum ist der HTTP-Statuscode meistens nicht quantitativ?
-Was ist der Unterschied zwischen diskret und stetig?
-{{tag>M3-LU01}}
-[[https://creativecommons.org/licenses/by-nc-sa/4.0/|{{https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png
-}}]] Kevin Maurizi