modul:mathe:ma4:thema:statistik:artenvondaten

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
modul:mathe:ma4:thema:statistik:artenvondaten [2026/01/26 09:44] kmaurizimodul:mathe:ma4:thema:statistik:artenvondaten [2026/01/26 11:46] (aktuell) – [2.4 Ratio: echtes Null (0 = nichts)] kmaurizi
Zeile 2: Zeile 2:
 ====== LU01a - Arten von Daten ====== ====== LU01a - Arten von Daten ======
  
-^ Überblick ^ Inhalt ^ +<WRAP center round download 60%> 
-**Ziel** Du kannst Datenarten unterscheiden (qualitativ/quantitativund die passende Skala (nominal/ordinal/intervall/ratio) erklären+**Ziel:** Du kannst Variablen korrekt als **qualitativ/quantitativ** einordnen und das **Messniveau** (nominal/ordinal/intervall/ratio) bestimmenFalls quantitativ: **diskret/stetig**. 
-**Warum wichtig?** | Die Datenart entscheidet, **welche Kennzahlen** (z.B. Mittelwert ja/nein) und **welche Diagramme** sinnvoll sind| +</WRAP>
-| **Kompetenzbezug** | **AG1/AF1** (Grundbegriffe verstehen & anwenden), Vorbereitung für Lagewerte/Verteilungen | +
-| **Dauer** | 1 Doppellektion (90’) |+
  
-===== 1. Einstieg: Was bedeutet „Daten“? =====+===== Warum ist das wichtig? ===== 
 +Bevor du Daten auswertest, musst du wissen, **welche Art von Daten** du hast. 
 +Die Datenart entscheidet, was sinnvoll ist: 
 +  * Darf ich **nur zählen** (Häufigkeiten) oder auch **rechnen**? 
 +  * Gibt es eine **Reihenfolge** (z.B. low/medium/high)? 
 +  * Ist „0“ wirklich **nichts** (z.B. 0 Tickets)?
  
-In der Datenanalyse beschreibt man reale Beobachtungen in strukturierter Form, um daraus Erkenntnisse abzuleiten.+Diese Seite passt direkt zur Aufgabe: **LU01.A01 - Datenarten klassifizieren**.
  
-**Beispiele aus dem Informatik-Alltag** +===== Kurztheorie (Merksätze) ===== 
-  * Ladezeit einer Webseite in Millisekunden +  * **Qualitativ (kategorisch):** Werte sind **Labels/Kategorien** (z.B. Betriebssystem). 
-  * Anzahl Fehler in einem Log pro Stunde +  * **Quantitativ (numerisch):** Werte sind **Zahlenwerte zum Zählen/Messen** (z.B. Ladezeit). 
-  * Betriebssystem der User (Windows/macOS/Linux+  * **Nominal:** Kategorien **ohne** Reihenfolge. 
-  * Zufriedenheit der User (Skala 1–5+  * **Ordinal:** Kategorien **mit** Reihenfolge, aber Abstände unklar. 
-  * HTTP-Statuscodes (200404500)+  * **Intervall:** Abstände sinnvoll, Nullpunkt willkürlich (z.B. °C). 
 +  * **Ratio:** Abstände sinnvoll **und** echtes Null (z.B. ms, MB, Anzahl). 
 +  * **Diskret:** gezählt (0,1,2,3,...) 
 +  * **Stetig:** gemessen (beliebig fein)
  
-Wichtig: Bevor du Kennzahlen berechnest oder Diagramme zeichnest, musst du wissen: **Welche Art von Daten ist das?** +<WRAP center round important 60%> 
- +**Achtung:** Nur weil etwas wie eine Zahl aussieht, ist es nicht automatisch quantitativ \\ 
-===== 2Grundbegriffe (kurz) ===== +**HTTP-Statuscodes** (200/404/500) sind meistens **Kategorien** → **nominal**. 
- +</WRAP>
-^ Begriff ^ Bedeutung ^ Beispiel ^ +
-**Merkmal / Variable** | Eigenschaft, die beobachtet wird | „Browser-Typ“ | +
-**Ausprägung** | konkreter Wert einer Variable | „Firefox“ | +
-| **Beobachtung Datensatz** | eine Messung/Eintrag | „Firefox“ bei Person A | +
-**Stichprobe** | Teilmenge der Daten | 25 Lernende | +
-**Grundgesamtheit** | alle möglichen Fälle | alle Lernenden der Schule | +
- +
-===== 3Zwei Hauptklassen von Daten =====+
  
-==== 3.Qualitative Daten (kategorisch) ====+====1) Zwei Hauptarten von Daten =====
  
-Qualitative Daten sind **Kategorien/Labels**. Man rechnet damit nicht „normal“ (kein Mittelwert).+==== 1.1 Qualitative Daten (kategorisch) ==== 
 +Qualitative Daten sind **Kategorien/Labels**. Du arbeitest damit typischerweise so: 
 +  * **zählen**, wie oft etwas vorkommt (Häufigkeiten) 
 +  * vergleichen: **gleich / ungleich** 
 +  * manchmal ordnen (nur bei ordinal)
  
-**Beispiele**+**Informatik-Beispiele**
   * Betriebssystem: Windows / macOS / Linux   * Betriebssystem: Windows / macOS / Linux
-  * SpracheDE EN FR +  * Team-RolleDev Ops QA 
-  * Bug-TypUI Backend / Security +  * Build-Statussuccess failed 
- +  * HTTP-Methode: GET / POST / PUT
-==== 3.2 Quantitative Daten (numerisch) ====+
  
-Quantitative Daten sind **Zahlenwerte**, die etwas **messen oder zählen**. Hier sind mathematische Operationen sinnvoll (je nach Skala).+==== 1.2 Quantitative Daten (numerisch) ==== 
 +Quantitative Daten sind **Zahlen**, die **zählen** oder **messen**. 
 +Du kannst damit rechnen (je nach Messniveau sinnvoll).
  
-**Beispiele** +**Informatik-Beispiele** 
-  * Ladezeit: 123 ms +  * Anzahl Commits pro Woche (gezählt) 
-  * RAM-Verbrauch: 2.4 GB +  * Anzahl offene Tickets im Sprint (gezählt) 
-  * Anzahl Commits: 18+  * Ladezeit einer Webseite in ms (gemessen) 
 +  * Dateigrösse in MB (gemessen)
  
-<WRAP round box 60%> +<WRAP center round tip 60%> 
-**Merksatz:**   +**Merksatz:**  \\ 
-**Qualitativ** = Kategorien/Labels.   +**Qualitativ** = Kategorien/Labels.  \\ 
-**Quantitativ** = Zahlenwerte (zählen oder messen).+**Quantitativ** = Zahlen zum Zählen/Messen.
 </WRAP> </WRAP>
  
-===== 4. Skalentypen (Messniveaus) =====+===== 2) Messniveau (Skalenniveau) ===== 
 +Das Messniveau sagt dir, **was du über die Werte aussagen darfst**.
  
-Die Skala sagt dir, **was du mit den Daten machen darfst**.+==== 2.1 Nominal: Kategorien ohne Reihenfolge ==== 
 +  Es gibt **keine** natürliche Reihenfolge. 
 +  * Du kannst sagen: „gleich/ungleich“ und **wie oft** etwas vorkommt.
  
-==== 4.1 Nominalskala (nur „gleich/ungleich“====+**Informatik-Beispiele (nominal)** 
 +  * Betriebssystem (Windows/macOS/Linux) 
 +  * Browser (Chrome/Firefox/Safari) 
 +  * Team-Rolle (Dev/Ops/QA) 
 +  * HTTP-Statuscode (200/404/500) als Code/Kategorie
  
-  * **Keine Reihenfolge** +==== 2.2 Ordinal: Kategorien mit Reihenfolge ==== 
-  * Erlaubt: Häufigkeiten, Modus, Balkendiagramm, Kreisdiagramm +  * Es gibt eine Reihenfolge (z.B. low < medium < high). 
-  * Nicht sinnvollMedian, Mittelwert+  * ABERDer Abstand zwischen Stufen ist nicht exakt messbar.
  
-**Beispiele (Informatik)** +**Informatik-Beispiele (ordinal)**
-  * Browser: Chrome / Firefox / Safari +
-  * HTTP-Methode: GET / POST / PUT +
-  * Statuscode **als Kategorie**: 200 / 404 / 500   +
-    → Achtung: Das sind Zahlen, aber sie funktionieren hier als **Labels**, nicht als Messwert! +
- +
-==== 4.2 Ordinalskala (Reihenfolge, aber Abstände unbekannt==== +
- +
-  * **Rangfolge** ist möglich +
-  * Abstände zwischen Stufen sind nicht zwingend gleich +
-  * Erlaubt: Median, Modus, Rangvergleiche, Boxplot (oft ok), Balkendiagramm +
-  * Mittelwert: meist **nicht** sinnvoll (nur mit Vorsicht) +
- +
-**Beispiele** +
-  * Zufriedenheit: 1–5 (sehr schlecht … sehr gut)+
   * Priorität: low / medium / high   * Priorität: low / medium / high
-  * Schulnoten (je nach System): Rangordnung vorhanden+  * Severity: minor / major / critical 
 +  * Zufriedenheit (1–5als Rangskala
  
-==== 4.3 Intervallskala (Abstände sinnvoll, aber kein „echtes Null“) ====+==== 2.3 Intervall: Abstände sind sinnvoll, aber Nullpunkt ist willkürlich ==== 
 +  * Unterschiede sind sinnvoll („+10“). 
 +  * Null bedeutet nicht „nichts“. 
 +  * Aussagen wie „doppelt so viel“ sind hier **nicht** sinnvoll.
  
-  Differenzen sind sinnvoll (z.B. +10) +**Beispiel** 
-  * Nullpunkt ist **willkürlich** +  * Temperatur in **°C** (0°C ist nicht keine Temperatur“)
-  * Erlaubt: Mittelwert, Standardabweichung, Histogramm, Linie +
-  * Verhältnis („doppelt so viel“) ist **nicht** sinnvoll+
  
-**Beispiele** +==== 2.4 Ratio: echtes Null (0 = nichts) ==== 
-  * Temperatur in °C (0°C ist nicht keine Temperatur) +  * Null bedeutet wirklich nichts. 
-  * Kalenderjahr (2026 ist nicht „doppelt so viel“ wie 1013)+  * Aussagen wie „doppelt so viel“ sind sinnvoll.
  
-==== 4.4 Ratioskala Verhältnisskala (Abstände + echtes Null) ====+**Informatik-Beispiele (ratio)** 
 +  * Ladezeit in ms (0 ms keine Zeit) 
 +  * Dateigrösse in MB (0 MB keine Daten) 
 +  * Anzahl Tickets/Commits (nichts)
  
-  * Abstände sinnvoll **und** Null bedeutet „nichts“ +<WRAP center round tip 60%> 
-  * Verhältnis ist sinnvoll („doppelt so viel“) +**Quick-Check:**  \\ 
-  * Erlaubt: alle üblichen Kennzahlen + viele Diagramme +Wenn **0** wirklich „nichts“ bedeutet → meistens **Ratio**.  \\ 
- +Wenn Werte **nur Codes** sind → meistens **Nominal**.
-**Beispiele (Informatik)** +
-  * Dateigrösse (0 MB = keine Daten) +
-  * Laufzeit/Antwortzeit (0 ms = keine Zeit) +
-  * Anzahl Requests (0 = kein Request) +
- +
-<WRAP round box 60%> +
-**Quick-Check:**   +
-Wenn 0“ wirklich „nichts“ bedeutet → meist **Ratioskala**.   +
-Wenn Zahlen nur Codes sind (z.B. 404) → meist **Nominalskala**.+
 </WRAP> </WRAP>
  
-===== 5. Diskret vs. Stetig (nur bei quantitativen Daten) =====+===== 3) Diskret vs. Stetig (nur bei quantitativen Daten) =====
  
-==== 5.1 Diskrete Daten (zählbar, ganze Werte) ====+==== 3.1 Diskret (gezählt) ==== 
 +  * Werte sind zählbar: 0,1,2,3,… 
 +  * entsteht durch **Zählen**
  
-  entstehen durch **Zählen** +**Informatik-Beispiele** 
-  * Werte sind typischerweise ganze Zahlen+  * Anzahl Commits 
 +  Anzahl offene Tickets 
 +  * Anzahl Logins pro Tag
  
-**Beispiele** +==== 3.2 Stetig (gemessen) ==== 
-  * Anzahl Commits pro Woche +  * Werte können theoretisch beliebig fein sein (z.B. 12.3, 12.31, 12.312…) 
-  * Anzahl Fehler pro Build +  * entsteht durch **Messen**
-  Anzahl User in einem Chatraum+
  
-==== 5.2 Stetige Daten (messbar, beliebig fein) ==== +**Informatik-Beispiele** 
- +  * Ladezeit in ms 
-  * entstehen durch **Messen** +  * Downloadrate in Mbit/s
-  * theoretisch unendlich viele Zwischenwerte möglich +
- +
-**Beispiele** +
-  * Ladezeit in ms (in der Realität gemessen, kann sehr fein sein)+
   * CPU-Temperatur   * CPU-Temperatur
-  * Netzwerk-Latenz 
  
-===== 6. Welche Kennzahlen und Diagramme passen? =====+===== 4) Typische Stolpersteine ===== 
 +  * **„Zahl = quantitativ“** → falsch bei Codes (HTTP 404, Fehlercodes, Postleitzahl). 
 +  * **Ordinal vs. Intervall**: Rangfolge heisst nicht automatisch „messbarer Abstand“. 
 +  * **Intervall vs. Ratio**: °C (Intervall) vs. ms/MB/Anzahl (Ratio). 
 +  * **Diskret vs. Stetig**: Zählen (diskret) vs. Messen (stetig).
  
-^ Datenart / Skala ^ Sinnvolle Kennzahlen ^ Typische Diagramme ^ 
-| **Nominal (qualitativ)** | absolute/relative Häufigkeit, Modus | Balken, Kreis | 
-| **Ordinal (qualitativ)** | Median, Modus, Quartile (oft ok) | Balken, (Boxplot oft ok) | 
-| **Intervall (quantitativ)** | Mittelwert, Median, Stdabw. | Histogramm, Linie, Boxplot | 
-| **Ratio (quantitativ)** | Mittelwert, Median, Stdabw., Verhältnisse | Histogramm, Linie, Boxplot | 
-| **Diskret** | Mittelwert/Median möglich (je nach Skala) | Balken, Histogramm (mit ganzen Klassen) | 
-| **Stetig** | Mittelwert/Median/Stdabw. | Histogramm, Dichtekurve, Boxplot | 
  
-===== 7. Beispiele (Informatik-Kontext) ===== 
- 
-==== Beispiel 1: HTTP-Statuscodes ==== 
- 
-**Frage:** Ist 500 „mehr“ als 200?   
-**Antwort:** Als Zahl ja – aber als Bedeutung nicht. Es sind **Kategorien**. 
- 
-  * Datenklasse: **qualitativ** 
-  * Skala: **nominal** 
-  * Sinnvolle Auswertung: Häufigkeiten pro Code, Top-3 Codes, Balkendiagramm 
- 
-==== Beispiel 2: Zufriedenheit 1–5 ==== 
- 
-  * Datenklasse: **qualitativ** (Ordinal) 
-  * Skala: **ordinal** 
-  * Sinnvolle Auswertung: Median, Häufigkeiten, Verteilung als Balken 
- 
-**Interpretation:** Median = 4 bedeutet „typisch eher gut“, aber „4 ist doppelt so gut wie 2“ ist nicht zwingend korrekt. 
- 
-==== Beispiel 3: Ladezeit (ms) ==== 
- 
-  * Datenklasse: **quantitativ** 
-  * Skala: **Ratio** 
-  * Typ: **stetig** 
-  * Sinnvolle Auswertung: Mittelwert/Median/Stdabw., Boxplot (Ausreisser!), Histogramm 
- 
-===== 8. Übung: Datenarten klassifizieren ===== 
- 
-**Auftrag:** Bestimme für jede Variable: 
-  - qualitativ oder quantitativ? 
-  - Skala (nominal/ordinal/intervall/ratio)? 
-  - falls quantitativ: diskret oder stetig? 
- 
-^ Variable ^ qualit./quant. ^ Skala ^ diskret/stetig ^ 
-| Betriebssystem (Windows/macOS/Linux) |  |  |  | 
-| Anzahl Commits pro Woche |  |  |  | 
-| Ladezeit einer Seite (ms) |  |  |  | 
-| HTTP-Statuscode (200/404/500) |  |  |  | 
-| Zufriedenheit (1–5) |  |  |  | 
-| CPU-Temperatur in °C |  |  |  | 
-| Dateigrösse in MB |  |  |  | 
- 
-==== Musterlösung (kurz) ==== 
-  * Betriebssystem → qualitativ, nominal 
-  * Commits → quantitativ, ratio, diskret 
-  * Ladezeit → quantitativ, ratio, stetig 
-  * Statuscode → qualitativ, nominal 
-  * Zufriedenheit → qualitativ, ordinal 
-  * CPU-Temperatur °C → quantitativ, intervall, stetig 
-  * Dateigrösse MB → quantitativ, ratio, stetig 
- 
-===== 9. Häufige Fehler ===== 
- 
-  * **„Zahlen = automatisch quantitativ“** → falsch. Codes (z.B. 404) sind oft **nominal**. 
-  * **Mittelwert bei Ordinaldaten** (z.B. Zufriedenheit) → kann täuschen. 
-  * **Diskret/stetig** verwechseln: Zählen = diskret, Messen = stetig. 
-  * Diagramm falsch gewählt: Kreisdiagramm für sehr viele Kategorien ist unübersichtlich → besser Balken. 
- 
-===== 10. Mini-Check (Exit Ticket) ===== 
  
 +<WRAP center round todo 60%>
   - Nenne ein Beispiel für **nominale** Daten aus der Informatik.   - Nenne ein Beispiel für **nominale** Daten aus der Informatik.
-  - Warum ist der **HTTP-Statuscode** meistens **nicht** quantitativ? +  - Ist „HTTP-Statuscode“ eher **nominal** oder **quantitativ**? Warum? 
-  - Was ist der Unterschied zwischen **diskret** und **stetig**?+  - „Anzahl Commits“: **diskret** oder **stetig**? Begründe mit 1 Satz. 
 +  - Was ist der Unterschied zwischen **Intervall** und **Ratio**? 
 +</WRAP>
  
 ---- ----
  • modul/mathe/ma4/thema/statistik/artenvondaten.1769417092.txt.gz
  • Zuletzt geändert: 2026/01/26 09:44
  • von kmaurizi