modul:mathe:ma4:thema:statistik:artenvondaten

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
modul:mathe:ma4:thema:statistik:artenvondaten [2026/01/26 09:42] – angelegt kmaurizimodul:mathe:ma4:thema:statistik:artenvondaten [2026/01/26 11:46] (aktuell) – [2.4 Ratio: echtes Null (0 = nichts)] kmaurizi
Zeile 1: Zeile 1:
 +~~NOTOC~~ 
 ====== LU01a - Arten von Daten ====== ====== LU01a - Arten von Daten ======
  
-^ Überblick ^ Inhalt ^ +<WRAP center round download 60%> 
-Ziel Du kannst Datenarten unterscheiden (qualitativ/quantitativund die passende Skala (nominal/ordinal/intervall/ratio) erklären+**Ziel:** Du kannst Variablen korrekt als **qualitativ/quantitativ** einordnen und das **Messniveau** (nominal/ordinal/intervall/ratio) bestimmenFalls quantitativ: **diskret/stetig**
-| Warum wichtig? | Die Datenart entscheidet, welche Kennzahlen (z.B. Mittelwert ja/nein) und welche Diagramme sinnvoll sind| +</WRAP>
-| Kompetenzbezug | AG1/AF1 (Grundbegriffe verstehen & anwenden), Vorbereitung für Lagewerte/Verteilungen | +
-| Dauer | 1 Doppellektion (90’) |+
  
-===== 1. Einstieg: Was bedeutet „Daten“? =====+===== Warum ist das wichtig? ===== 
 +Bevor du Daten auswertest, musst du wissen, **welche Art von Daten** du hast. 
 +Die Datenart entscheidet, was sinnvoll ist: 
 +  * Darf ich **nur zählen** (Häufigkeiten) oder auch **rechnen**? 
 +  * Gibt es eine **Reihenfolge** (z.B. low/medium/high)? 
 +  * Ist „0“ wirklich **nichts** (z.B. 0 Tickets)?
  
-In der Datenanalyse beschreibt man reale Beobachtungen in strukturierter Form, um daraus Erkenntnisse abzuleiten.+Diese Seite passt direkt zur Aufgabe: **LU01.A01 - Datenarten klassifizieren**.
  
-Beispiele aus dem Informatik-Alltag+===== Kurztheorie (Merksätze) ===== 
 +  * **Qualitativ (kategorisch):** Werte sind **Labels/Kategorien** (z.B. Betriebssystem). 
 +  * **Quantitativ (numerisch):** Werte sind **Zahlenwerte zum Zählen/Messen** (z.B. Ladezeit). 
 +  * **Nominal:** Kategorien **ohne** Reihenfolge. 
 +  * **Ordinal:** Kategorien **mit** Reihenfolge, aber Abstände unklar. 
 +  * **Intervall:** Abstände sinnvoll, Nullpunkt willkürlich (z.B. °C). 
 +  * **Ratio:** Abstände sinnvoll **und** echtes Null (z.B. ms, MB, Anzahl). 
 +  * **Diskret:** gezählt (0,1,2,3,...) 
 +  * **Stetig:** gemessen (beliebig fein)
  
-Ladezeit einer Webseite in Millisekunden+<WRAP center round important 60%> 
 +**Achtung:** Nur weil etwas wie eine Zahl aussieht, ist es nicht automatisch quantitativ.  \\ 
 +**HTTP-Statuscodes** (200/404/500) sind meistens **Kategorien** → **nominal**. 
 +</WRAP>
  
-Anzahl Fehler in einem Log pro Stunde+===== 1) Zwei Hauptarten von Daten =====
  
-Betriebssystem der User (Windows/macOS/Linux)+==== 1.1 Qualitative Daten (kategorisch) ==== 
 +Qualitative Daten sind **Kategorien/Labels**. Du arbeitest damit typischerweise so: 
 +  * **zählen**, wie oft etwas vorkommt (Häufigkeiten) 
 +  * vergleichen: **gleich ungleich** 
 +  * manchmal ordnen (nur bei ordinal)
  
-Zufriedenheit der User (Skala 1–5)+**Informatik-Beispiele** 
 +  * Betriebssystem: Windows / macOS / Linux 
 +  * Team-Rolle: Dev / Ops / QA 
 +  * Build-Status: success / failed 
 +  * HTTP-Methode: GET / POST / PUT
  
-HTTP-Statuscodes (200404, 500)+==== 1.2 Quantitative Daten (numerisch) ==== 
 +Quantitative Daten sind **Zahlen**die **zählen** oder **messen**. 
 +Du kannst damit rechnen (je nach Messniveau sinnvoll).
  
-Wichtig: Bevor du Kennzahlen berechnest oder Diagramme zeichnest, musst du wissen: Welche Art von Daten ist das?+**Informatik-Beispiele** 
 +  * Anzahl Commits pro Woche (gezählt) 
 +  * Anzahl offene Tickets im Sprint (gezählt) 
 +  * Ladezeit einer Webseite in ms (gemessen) 
 +  * Dateigrösse in MB (gemessen)
  
-===== 2Grundbegriffe (kurz) =====+<WRAP center round tip 60%> 
 +**Merksatz:**  \\ 
 +**Qualitativ** Kategorien/Labels.  \\ 
 +**Quantitativ** Zahlen zum Zählen/Messen. 
 +</WRAP>
  
-^ Begriff ^ Bedeutung ^ Beispiel ^ +===== 2) Messniveau (Skalenniveau) ===== 
-| Merkmal / Variable | Eigenschaft, die beobachtet wird | „Browser-Typ“ | +Das Messniveau sagt dir**was du über die Werte aussagen darfst**.
-| Ausprägung | konkreter Wert einer Variable | „Firefox“ | +
-| Beobachtung / Datensatz | eine Messung/Eintrag | „Firefox“ bei Person A | +
-| Stichprobe | Teilmenge der Daten | 25 Lernende | +
-| Grundgesamtheit | alle möglichen Fälle | alle Lernenden der Schule |+
  
-===== 3Zwei Hauptklassen von Daten =====+==== 2.1 Nominal: Kategorien ohne Reihenfolge ==== 
 +  * Es gibt **keine** natürliche Reihenfolge. 
 +  * Du kannst sagen: „gleich/ungleich“ und **wie oft** etwas vorkommt.
  
-==== 3.1 Qualitative Daten (kategorisch====+**Informatik-Beispiele (nominal)** 
 +  * Betriebssystem (Windows/macOS/Linux) 
 +  * Browser (Chrome/Firefox/Safari) 
 +  * Team-Rolle (Dev/Ops/QA) 
 +  * HTTP-Statuscode (200/404/500) als Code/Kategorie
  
-Qualitative Daten sind Kategorien/LabelsMan rechnet damit nicht „normal“ (kein Mittelwert).+==== 2.2 Ordinal: Kategorien mit Reihenfolge ==== 
 +  * Es gibt eine Reihenfolge (z.B. low < medium < high)
 +  * ABER: Der Abstand zwischen Stufen ist nicht exakt messbar.
  
-Beispiele+**Informatik-Beispiele (ordinal)** 
 +  * Priorität: low / medium / high 
 +  * Severity: minor / major / critical 
 +  * Zufriedenheit (1–5) als Rangskala
  
-BetriebssystemWindows / macOS / Linux+==== 2.3 IntervallAbstände sind sinnvoll, aber Nullpunkt ist willkürlich ==== 
 +  * Unterschiede sind sinnvoll („+10“). 
 +  * Null bedeutet nicht „nichts“. 
 +  * Aussagen wie „doppelt so viel“ sind hier **nicht** sinnvoll.
  
-Sprache: DE / EN / FR+**Beispiel** 
 +  * Temperatur in **°C** (0°C ist nicht „keine Temperatur“)
  
-Bug-TypUI / Backend / Security+==== 2.4 Ratioechtes Null (0 = nichts) ==== 
 +  * Null bedeutet wirklich „nichts“. 
 +  * Aussagen wie „doppelt so viel“ sind sinnvoll.
  
-==== 3.2 Quantitative Daten (numerisch) ====+**Informatik-Beispiele (ratio)** 
 +  * Ladezeit in ms (0 ms keine Zeit) 
 +  * Dateigrösse in MB (0 MB keine Daten) 
 +  * Anzahl Tickets/Commits (0 nichts)
  
-Quantitative Daten sind Zahlenwerte, die etwas messen oder zählen. Hier sind mathematische Operationen sinnvoll (je nach Skala). +<WRAP center round tip 60%> 
- +**Quick-Check:**  \\ 
-Beispiele +Wenn **0** wirklich „nichts“ bedeutet → meistens **Ratio** \\ 
- +Wenn Werte **nur Codes** sind → meistens **Nominal**.
-Ladezeit: 123 ms +
- +
-RAM-Verbrauch: 2.4 GB +
- +
-Anzahl Commits: 18 +
- +
-<WRAP round box 60%> +
-Merksatz+
-Qualitativ = Kategorien/Labels+
-Quantitativ = Zahlenwerte (zählen oder messen).+
 </WRAP> </WRAP>
  
-===== 4Skalentypen (Messniveaus) =====+===== 3) Diskret vsStetig (nur bei quantitativen Daten) =====
  
-Die Skala sagt dir, was du mit den Daten machen darfst.+==== 3.1 Diskret (gezählt) ==== 
 +  * Werte sind zählbar: 0,1,2,3,… 
 +  * entsteht durch **Zählen**
  
-==== 4.1 Nominalskala (nur „gleich/ungleich“) ====+**Informatik-Beispiele** 
 +  * Anzahl Commits 
 +  * Anzahl offene Tickets 
 +  * Anzahl Logins pro Tag
  
-Keine Reihenfolge+==== 3.2 Stetig (gemessen) ==== 
 +  * Werte können theoretisch beliebig fein sein (z.B. 12.3, 12.31, 12.312…) 
 +  * entsteht durch **Messen**
  
-Erlaubt: Häufigkeiten, Modus, Balkendiagramm, Kreisdiagramm+**Informatik-Beispiele** 
 +  * Ladezeit in ms 
 +  * Downloadrate in Mbit/s 
 +  * CPU-Temperatur
  
-Nicht sinnvoll: MedianMittelwert+===== 4) Typische Stolpersteine ===== 
 +  * **„Zahl = quantitativ“** → falsch bei Codes (HTTP 404Fehlercodes, Postleitzahl). 
 +  * **Ordinal vs. Intervall**: Rangfolge heisst nicht automatisch „messbarer Abstand“. 
 +  * **Intervall vs. Ratio**: °C (Intervall) vs. ms/MB/Anzahl (Ratio). 
 +  * **Diskret vs. Stetig**: Zählen (diskret) vs. Messen (stetig).
  
-Beispiele (Informatik) 
  
-Browser: Chrome / Firefox / Safari 
  
-HTTP-Methode: GET / POST / PUT +<WRAP center round todo 60%> 
- +  Nenne ein Beispiel für **nominale** Daten aus der Informatik. 
-Statuscode als Kategorie: 200 / 404 / 500 +  - Ist HTTP-Statuscode“ eher **nominal** oder **quantitativ**? Warum? 
-→ Achtung: Das sind Zahlen, aber sie funktionieren hier als Labels, nicht als Messwert! +  - Anzahl Commits: **diskret** oder **stetig**? Begründe mit 1 Satz
- +  - Was ist der Unterschied zwischen **Intervall** und **Ratio**?
-==== 4.2 Ordinalskala (Reihenfolge, aber Abstände unbekannt) ==== +
- +
-Rangfolge ist möglich +
- +
-Abstände zwischen Stufen sind nicht zwingend gleich +
- +
-Erlaubt: Median, Modus, Rangvergleiche, Boxplot (oft ok), Balkendiagramm +
- +
-Mittelwert: meist nicht sinnvoll (nur mit Vorsicht) +
- +
-Beispiele +
- +
-Zufriedenheit: 1–5 (sehr schlecht … sehr gut) +
- +
-Priorität: low / medium / high +
- +
-Schulnoten (je nach System): Rangordnung vorhanden +
- +
-==== 4.3 Intervallskala (Abstände sinnvoll, aber kein „echtes Null“) ==== +
- +
-Differenzen sind sinnvoll (z.B. +10) +
- +
-Nullpunkt ist willkürlich +
- +
-Erlaubt: Mittelwert, Standardabweichung, Histogramm, Linie +
- +
-Verhältnis („doppelt so viel“) ist nicht sinnvoll +
- +
-Beispiele +
- +
-Temperatur in °C (0°C ist nicht „keine Temperatur“) +
- +
-Kalenderjahr (2026 ist nicht „doppelt so viel“ wie 1013) +
- +
-==== 4.4 Ratioskala / Verhältnisskala (Abstände + echtes Null) ==== +
- +
-Abstände sinnvoll und Null bedeutet „nichts“ +
- +
-Verhältnis ist sinnvoll („doppelt so viel“) +
- +
-Erlaubt: alle üblichen Kennzahlen + viele Diagramme +
- +
-Beispiele (Informatik) +
- +
-Dateigrösse (0 MB = keine Daten) +
- +
-Laufzeit/Antwortzeit (0 ms = keine Zeit) +
- +
-Anzahl Requests (0 = kein Request) +
- +
-<WRAP round box 60%> +
-Quick-Check: +
-Wenn 0“ wirklich nichts“ bedeutet → meist Ratioskala+
-Wenn Zahlen nur Codes sind (z.B. 404) → meist Nominalskala.+
 </WRAP> </WRAP>
  
-===== 5. Diskret vs. Stetig (nur bei quantitativen Daten) =====+----
  
-==== 5.1 Diskrete Daten (zählbar, ganze Werte) ====+{{tag>M3-LU01}} 
 +[[https://creativecommons.org/licenses/by-nc-sa/4.0/|{{https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png}}]] Kevin Maurizi
  
-entstehen durch Zählen 
- 
-Werte sind typischerweise ganze Zahlen 
- 
-Beispiele 
- 
-Anzahl Commits pro Woche 
- 
-Anzahl Fehler pro Build 
- 
-Anzahl User in einem Chatraum 
- 
-==== 5.2 Stetige Daten (messbar, beliebig fein) ==== 
- 
-entstehen durch Messen 
- 
-theoretisch unendlich viele Zwischenwerte möglich 
- 
-Beispiele 
- 
-Ladezeit in ms (in der Realität gemessen, kann sehr fein sein) 
- 
-CPU-Temperatur 
- 
-Netzwerk-Latenz 
- 
-===== 6. Welche Kennzahlen und Diagramme passen? ===== 
- 
-^ Datenart / Skala ^ Sinnvolle Kennzahlen ^ Typische Diagramme ^ 
-| Nominal (qualitativ) | absolute/relative Häufigkeit, Modus | Balken, Kreis | 
-| Ordinal (qualitativ) | Median, Modus, Quartile (oft ok) | Balken, (Boxplot oft ok) | 
-| Intervall (quantitativ) | Mittelwert, Median, Stdabw. | Histogramm, Linie, Boxplot | 
-| Ratio (quantitativ) | Mittelwert, Median, Stdabw., Verhältnisse | Histogramm, Linie, Boxplot | 
-| Diskret | Mittelwert/Median möglich (je nach Skala) | Balken, Histogramm (mit ganzen Klassen) | 
-| Stetig | Mittelwert/Median/Stdabw. | Histogramm, Dichtekurve, Boxplot | 
- 
-===== 7. Beispiele (Informatik-Kontext) ===== 
- 
-==== Beispiel 1: HTTP-Statuscodes ==== 
- 
-Frage: Ist 500 „mehr“ als 200? 
-Antwort: Als Zahl ja – aber als Bedeutung nicht. Es sind Kategorien. 
- 
-Datenklasse: qualitativ 
- 
-Skala: nominal 
- 
-Sinnvolle Auswertung: Häufigkeiten pro Code, Top-3 Codes, Balkendiagramm 
- 
-==== Beispiel 2: Zufriedenheit 1–5 ==== 
- 
-Datenklasse: qualitativ (Ordinal) 
- 
-Skala: ordinal 
- 
-Sinnvolle Auswertung: Median, Häufigkeiten, Verteilung als Balken 
- 
-Interpretation: Median = 4 bedeutet „typisch eher gut“, aber „4 ist doppelt so gut wie 2“ ist nicht zwingend korrekt. 
- 
-==== Beispiel 3: Ladezeit (ms) ==== 
- 
-Datenklasse: quantitativ 
- 
-Skala: Ratio 
- 
-Typ: stetig 
- 
-Sinnvolle Auswertung: Mittelwert/Median/Stdabw., Boxplot (Ausreisser!), Histogramm 
- 
-===== 8. Übung: Datenarten klassifizieren ===== 
- 
-Auftrag: Bestimme für jede Variable: 
- 
-qualitativ oder quantitativ? 
- 
-Skala (nominal/ordinal/intervall/ratio)? 
- 
-falls quantitativ: diskret oder stetig? 
- 
-^ Variable ^ qualit./quant. ^ Skala ^ diskret/stetig ^ 
-| Betriebssystem (Windows/macOS/Linux) | | | | 
-| Anzahl Commits pro Woche | | | | 
-| Ladezeit einer Seite (ms) | | | | 
-| HTTP-Statuscode (200/404/500) | | | | 
-| Zufriedenheit (1–5) | | | | 
-| CPU-Temperatur in °C | | | | 
-| Dateigrösse in MB | | | | 
- 
-==== Musterlösung (kurz) ==== 
- 
-Betriebssystem → qualitativ, nominal 
- 
-Commits → quantitativ, ratio, diskret 
- 
-Ladezeit → quantitativ, ratio, stetig 
- 
-Statuscode → qualitativ, nominal 
- 
-Zufriedenheit → qualitativ, ordinal 
- 
-CPU-Temperatur °C → quantitativ, intervall, stetig 
- 
-Dateigrösse MB → quantitativ, ratio, stetig 
- 
-===== 9. Häufige Fehler ===== 
- 
-„Zahlen = automatisch quantitativ“ → falsch. Codes (z.B. 404) sind oft nominal. 
- 
-Mittelwert bei Ordinaldaten (z.B. Zufriedenheit) → kann täuschen. 
- 
-Diskret/stetig verwechseln: Zählen = diskret, Messen = stetig. 
- 
-Diagramm falsch gewählt: Kreisdiagramm für sehr viele Kategorien ist unübersichtlich → besser Balken. 
- 
-===== 10. Mini-Check (Exit Ticket) ===== 
- 
-Nenne ein Beispiel für nominale Daten aus der Informatik. 
- 
-Warum ist der HTTP-Statuscode meistens nicht quantitativ? 
- 
-Was ist der Unterschied zwischen diskret und stetig? 
- 
-{{tag>M3-LU01}} 
-[[https://creativecommons.org/licenses/by-nc-sa/4.0/|{{https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png 
-}}]] Kevin Maurizi 
  • modul/mathe/ma4/thema/statistik/artenvondaten.1769416978.txt.gz
  • Zuletzt geändert: 2026/01/26 09:42
  • von kmaurizi