~~NOTOC~~
====== LU01a - Arten von Daten ======
**Ziel:** Du kannst Variablen korrekt als **qualitativ/quantitativ** einordnen und das **Messniveau** (nominal/ordinal/intervall/ratio) bestimmen. Falls quantitativ: **diskret/stetig**.
===== Warum ist das wichtig? =====
Bevor du Daten auswertest, musst du wissen, **welche Art von Daten** du hast.
Die Datenart entscheidet, was sinnvoll ist:
* Darf ich **nur zählen** (Häufigkeiten) oder auch **rechnen**?
* Gibt es eine **Reihenfolge** (z.B. low/medium/high)?
* Ist „0“ wirklich **nichts** (z.B. 0 Tickets)?
Diese Seite passt direkt zur Aufgabe: **LU01.A01 - Datenarten klassifizieren**.
===== Kurztheorie (Merksätze) =====
* **Qualitativ (kategorisch):** Werte sind **Labels/Kategorien** (z.B. Betriebssystem).
* **Quantitativ (numerisch):** Werte sind **Zahlenwerte zum Zählen/Messen** (z.B. Ladezeit).
* **Nominal:** Kategorien **ohne** Reihenfolge.
* **Ordinal:** Kategorien **mit** Reihenfolge, aber Abstände unklar.
* **Intervall:** Abstände sinnvoll, Nullpunkt willkürlich (z.B. °C).
* **Ratio:** Abstände sinnvoll **und** echtes Null (z.B. ms, MB, Anzahl).
* **Diskret:** gezählt (0,1,2,3,...)
* **Stetig:** gemessen (beliebig fein)
**Achtung:** Nur weil etwas wie eine Zahl aussieht, ist es nicht automatisch quantitativ. \\
**HTTP-Statuscodes** (200/404/500) sind meistens **Kategorien** → **nominal**.
===== 1) Zwei Hauptarten von Daten =====
==== 1.1 Qualitative Daten (kategorisch) ====
Qualitative Daten sind **Kategorien/Labels**. Du arbeitest damit typischerweise so:
* **zählen**, wie oft etwas vorkommt (Häufigkeiten)
* vergleichen: **gleich / ungleich**
* manchmal ordnen (nur bei ordinal)
**Informatik-Beispiele**
* Betriebssystem: Windows / macOS / Linux
* Team-Rolle: Dev / Ops / QA
* Build-Status: success / failed
* HTTP-Methode: GET / POST / PUT
==== 1.2 Quantitative Daten (numerisch) ====
Quantitative Daten sind **Zahlen**, die **zählen** oder **messen**.
Du kannst damit rechnen (je nach Messniveau sinnvoll).
**Informatik-Beispiele**
* Anzahl Commits pro Woche (gezählt)
* Anzahl offene Tickets im Sprint (gezählt)
* Ladezeit einer Webseite in ms (gemessen)
* Dateigrösse in MB (gemessen)
**Merksatz:** \\
**Qualitativ** = Kategorien/Labels. \\
**Quantitativ** = Zahlen zum Zählen/Messen.
===== 2) Messniveau (Skalenniveau) =====
Das Messniveau sagt dir, **was du über die Werte aussagen darfst**.
==== 2.1 Nominal: Kategorien ohne Reihenfolge ====
* Es gibt **keine** natürliche Reihenfolge.
* Du kannst sagen: „gleich/ungleich“ und **wie oft** etwas vorkommt.
**Informatik-Beispiele (nominal)**
* Betriebssystem (Windows/macOS/Linux)
* Browser (Chrome/Firefox/Safari)
* Team-Rolle (Dev/Ops/QA)
* HTTP-Statuscode (200/404/500) als Code/Kategorie
==== 2.2 Ordinal: Kategorien mit Reihenfolge ====
* Es gibt eine Reihenfolge (z.B. low < medium < high).
* ABER: Der Abstand zwischen Stufen ist nicht exakt messbar.
**Informatik-Beispiele (ordinal)**
* Priorität: low / medium / high
* Severity: minor / major / critical
* Zufriedenheit (1–5) als Rangskala
==== 2.3 Intervall: Abstände sind sinnvoll, aber Nullpunkt ist willkürlich ====
* Unterschiede sind sinnvoll („+10“).
* Null bedeutet nicht „nichts“.
* Aussagen wie „doppelt so viel“ sind hier **nicht** sinnvoll.
**Beispiel**
* Temperatur in **°C** (0°C ist nicht „keine Temperatur“)
==== 2.4 Ratio: echtes Null (0 = nichts) ====
* Null bedeutet wirklich „nichts“.
* Aussagen wie „doppelt so viel“ sind sinnvoll.
**Informatik-Beispiele (ratio)**
* Ladezeit in ms (0 ms = keine Zeit)
* Dateigrösse in MB (0 MB = keine Daten)
* Anzahl Tickets/Commits (0 = nichts)
**Quick-Check:** \\
Wenn **0** wirklich „nichts“ bedeutet → meistens **Ratio**. \\
Wenn Werte **nur Codes** sind → meistens **Nominal**.
===== 3) Diskret vs. Stetig (nur bei quantitativen Daten) =====
==== 3.1 Diskret (gezählt) ====
* Werte sind zählbar: 0,1,2,3,…
* entsteht durch **Zählen**
**Informatik-Beispiele**
* Anzahl Commits
* Anzahl offene Tickets
* Anzahl Logins pro Tag
==== 3.2 Stetig (gemessen) ====
* Werte können theoretisch beliebig fein sein (z.B. 12.3, 12.31, 12.312…)
* entsteht durch **Messen**
**Informatik-Beispiele**
* Ladezeit in ms
* Downloadrate in Mbit/s
* CPU-Temperatur
===== 4) Typische Stolpersteine =====
* **„Zahl = quantitativ“** → falsch bei Codes (HTTP 404, Fehlercodes, Postleitzahl).
* **Ordinal vs. Intervall**: Rangfolge heisst nicht automatisch „messbarer Abstand“.
* **Intervall vs. Ratio**: °C (Intervall) vs. ms/MB/Anzahl (Ratio).
* **Diskret vs. Stetig**: Zählen (diskret) vs. Messen (stetig).
- Nenne ein Beispiel für **nominale** Daten aus der Informatik.
- Ist „HTTP-Statuscode“ eher **nominal** oder **quantitativ**? Warum?
- „Anzahl Commits“: **diskret** oder **stetig**? Begründe mit 1 Satz.
- Was ist der Unterschied zwischen **Intervall** und **Ratio**?
----
{{tag>M3-LU01}}
[[https://creativecommons.org/licenses/by-nc-sa/4.0/|{{https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png}}]] Kevin Maurizi