~~NOTOC~~ ====== LU01a - Arten von Daten ====== **Ziel:** Du kannst Variablen korrekt als **qualitativ/quantitativ** einordnen und das **Messniveau** (nominal/ordinal/intervall/ratio) bestimmen. Falls quantitativ: **diskret/stetig**. ===== Warum ist das wichtig? ===== Bevor du Daten auswertest, musst du wissen, **welche Art von Daten** du hast. Die Datenart entscheidet, was sinnvoll ist: * Darf ich **nur zählen** (Häufigkeiten) oder auch **rechnen**? * Gibt es eine **Reihenfolge** (z.B. low/medium/high)? * Ist „0“ wirklich **nichts** (z.B. 0 Tickets)? Diese Seite passt direkt zur Aufgabe: **LU01.A01 - Datenarten klassifizieren**. ===== Kurztheorie (Merksätze) ===== * **Qualitativ (kategorisch):** Werte sind **Labels/Kategorien** (z.B. Betriebssystem). * **Quantitativ (numerisch):** Werte sind **Zahlenwerte zum Zählen/Messen** (z.B. Ladezeit). * **Nominal:** Kategorien **ohne** Reihenfolge. * **Ordinal:** Kategorien **mit** Reihenfolge, aber Abstände unklar. * **Intervall:** Abstände sinnvoll, Nullpunkt willkürlich (z.B. °C). * **Ratio:** Abstände sinnvoll **und** echtes Null (z.B. ms, MB, Anzahl). * **Diskret:** gezählt (0,1,2,3,...) * **Stetig:** gemessen (beliebig fein) **Achtung:** Nur weil etwas wie eine Zahl aussieht, ist es nicht automatisch quantitativ. \\ **HTTP-Statuscodes** (200/404/500) sind meistens **Kategorien** → **nominal**. ===== 1) Zwei Hauptarten von Daten ===== ==== 1.1 Qualitative Daten (kategorisch) ==== Qualitative Daten sind **Kategorien/Labels**. Du arbeitest damit typischerweise so: * **zählen**, wie oft etwas vorkommt (Häufigkeiten) * vergleichen: **gleich / ungleich** * manchmal ordnen (nur bei ordinal) **Informatik-Beispiele** * Betriebssystem: Windows / macOS / Linux * Team-Rolle: Dev / Ops / QA * Build-Status: success / failed * HTTP-Methode: GET / POST / PUT ==== 1.2 Quantitative Daten (numerisch) ==== Quantitative Daten sind **Zahlen**, die **zählen** oder **messen**. Du kannst damit rechnen (je nach Messniveau sinnvoll). **Informatik-Beispiele** * Anzahl Commits pro Woche (gezählt) * Anzahl offene Tickets im Sprint (gezählt) * Ladezeit einer Webseite in ms (gemessen) * Dateigrösse in MB (gemessen) **Merksatz:** \\ **Qualitativ** = Kategorien/Labels. \\ **Quantitativ** = Zahlen zum Zählen/Messen. ===== 2) Messniveau (Skalenniveau) ===== Das Messniveau sagt dir, **was du über die Werte aussagen darfst**. ==== 2.1 Nominal: Kategorien ohne Reihenfolge ==== * Es gibt **keine** natürliche Reihenfolge. * Du kannst sagen: „gleich/ungleich“ und **wie oft** etwas vorkommt. **Informatik-Beispiele (nominal)** * Betriebssystem (Windows/macOS/Linux) * Browser (Chrome/Firefox/Safari) * Team-Rolle (Dev/Ops/QA) * HTTP-Statuscode (200/404/500) als Code/Kategorie ==== 2.2 Ordinal: Kategorien mit Reihenfolge ==== * Es gibt eine Reihenfolge (z.B. low < medium < high). * ABER: Der Abstand zwischen Stufen ist nicht exakt messbar. **Informatik-Beispiele (ordinal)** * Priorität: low / medium / high * Severity: minor / major / critical * Zufriedenheit (1–5) als Rangskala ==== 2.3 Intervall: Abstände sind sinnvoll, aber Nullpunkt ist willkürlich ==== * Unterschiede sind sinnvoll („+10“). * Null bedeutet nicht „nichts“. * Aussagen wie „doppelt so viel“ sind hier **nicht** sinnvoll. **Beispiel** * Temperatur in **°C** (0°C ist nicht „keine Temperatur“) ==== 2.4 Ratio: echtes Null (0 = nichts) ==== * Null bedeutet wirklich „nichts“. * Aussagen wie „doppelt so viel“ sind sinnvoll. **Informatik-Beispiele (ratio)** * Ladezeit in ms (0 ms = keine Zeit) * Dateigrösse in MB (0 MB = keine Daten) * Anzahl Tickets/Commits (0 = nichts) **Quick-Check:** \\ Wenn **0** wirklich „nichts“ bedeutet → meistens **Ratio**. \\ Wenn Werte **nur Codes** sind → meistens **Nominal**. ===== 3) Diskret vs. Stetig (nur bei quantitativen Daten) ===== ==== 3.1 Diskret (gezählt) ==== * Werte sind zählbar: 0,1,2,3,… * entsteht durch **Zählen** **Informatik-Beispiele** * Anzahl Commits * Anzahl offene Tickets * Anzahl Logins pro Tag ==== 3.2 Stetig (gemessen) ==== * Werte können theoretisch beliebig fein sein (z.B. 12.3, 12.31, 12.312…) * entsteht durch **Messen** **Informatik-Beispiele** * Ladezeit in ms * Downloadrate in Mbit/s * CPU-Temperatur ===== 4) Typische Stolpersteine ===== * **„Zahl = quantitativ“** → falsch bei Codes (HTTP 404, Fehlercodes, Postleitzahl). * **Ordinal vs. Intervall**: Rangfolge heisst nicht automatisch „messbarer Abstand“. * **Intervall vs. Ratio**: °C (Intervall) vs. ms/MB/Anzahl (Ratio). * **Diskret vs. Stetig**: Zählen (diskret) vs. Messen (stetig). - Nenne ein Beispiel für **nominale** Daten aus der Informatik. - Ist „HTTP-Statuscode“ eher **nominal** oder **quantitativ**? Warum? - „Anzahl Commits“: **diskret** oder **stetig**? Begründe mit 1 Satz. - Was ist der Unterschied zwischen **Intervall** und **Ratio**? ---- {{tag>M3-LU01}} [[https://creativecommons.org/licenses/by-nc-sa/4.0/|{{https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png}}]] Kevin Maurizi