LU01a - Arten von Daten
Ziel: Du kannst Variablen korrekt als qualitativ/quantitativ einordnen und das Messniveau (nominal/ordinal/intervall/ratio) bestimmen. Falls quantitativ: diskret/stetig.
Warum ist das wichtig?
Bevor du Daten auswertest, musst du wissen, welche Art von Daten du hast.
Die Datenart entscheidet, was sinnvoll ist:
Darf ich nur zählen (Häufigkeiten) oder auch rechnen?
Gibt es eine Reihenfolge (z.B. low/medium/high)?
Ist „0“ wirklich nichts (z.B. 0 Tickets)?
Diese Seite passt direkt zur Aufgabe: LU01.A01 - Datenarten klassifizieren.
Kurztheorie (Merksätze)
Qualitativ (kategorisch): Werte sind Labels/Kategorien (z.B. Betriebssystem).
Quantitativ (numerisch): Werte sind Zahlenwerte zum Zählen/Messen (z.B. Ladezeit).
Nominal: Kategorien ohne Reihenfolge.
Ordinal: Kategorien mit Reihenfolge, aber Abstände unklar.
Intervall: Abstände sinnvoll, Nullpunkt willkürlich (z.B. °C).
Ratio: Abstände sinnvoll
und echtes Null (z.B. ms,
MB, Anzahl).
Diskret: gezählt (0,1,2,3,…)
Stetig: gemessen (beliebig fein)
Achtung: Nur weil etwas wie eine Zahl aussieht, ist es nicht automatisch quantitativ.
HTTP-Statuscodes (200/404/500) sind meistens Kategorien → nominal.
1) Zwei Hauptarten von Daten
1.1 Qualitative Daten (kategorisch)
Qualitative Daten sind Kategorien/Labels. Du arbeitest damit typischerweise so:
zählen, wie oft etwas vorkommt (Häufigkeiten)
vergleichen: gleich / ungleich
manchmal ordnen (nur bei ordinal)
Informatik-Beispiele
Betriebssystem: Windows / macOS / Linux
Team-Rolle: Dev / Ops / QA
Build-Status: success / failed
HTTP-Methode: GET / POST / PUT
1.2 Quantitative Daten (numerisch)
Quantitative Daten sind Zahlen, die zählen oder messen.
Du kannst damit rechnen (je nach Messniveau sinnvoll).
Informatik-Beispiele
Anzahl Commits pro Woche (gezählt)
Anzahl offene Tickets im Sprint (gezählt)
Ladezeit einer Webseite in ms (gemessen)
Dateigrösse in
MB (gemessen)
Merksatz:
Qualitativ = Kategorien/Labels.
Quantitativ = Zahlen zum Zählen/Messen.
2) Messniveau (Skalenniveau)
Das Messniveau sagt dir, was du über die Werte aussagen darfst.
2.1 Nominal: Kategorien ohne Reihenfolge
Informatik-Beispiele (nominal)
Betriebssystem (Windows/macOS/Linux)
Browser (Chrome/Firefox/Safari)
Team-Rolle (Dev/Ops/QA)
HTTP-Statuscode (200/404/500) als Code/Kategorie
2.2 Ordinal: Kategorien mit Reihenfolge
Informatik-Beispiele (ordinal)
Priorität: low / medium / high
Severity: minor / major / critical
Zufriedenheit (1–5) als Rangskala
2.3 Intervall: Abstände sind sinnvoll, aber Nullpunkt ist willkürlich
Unterschiede sind sinnvoll („+10“).
Null bedeutet nicht „nichts“.
Aussagen wie „doppelt so viel“ sind hier nicht sinnvoll.
Beispiel
2.4 Ratio: echtes Null (0 = nichts)
Informatik-Beispiele (ratio)
Quick-Check:
Wenn 0 wirklich „nichts“ bedeutet → meistens Ratio.
Wenn Werte nur Codes sind → meistens Nominal.
3) Diskret vs. Stetig (nur bei quantitativen Daten)
3.1 Diskret (gezählt)
Werte sind zählbar: 0,1,2,3,…
entsteht durch Zählen
Informatik-Beispiele
Anzahl Commits
Anzahl offene Tickets
Anzahl Logins pro Tag
3.2 Stetig (gemessen)
Informatik-Beispiele
Ladezeit in ms
Downloadrate in Mbit/s
CPU-Temperatur
4) Typische Stolpersteine
„Zahl = quantitativ“ → falsch bei Codes (HTTP 404, Fehlercodes, Postleitzahl).
Ordinal vs. Intervall: Rangfolge heisst nicht automatisch „messbarer Abstand“.
Intervall vs. Ratio: °C (Intervall) vs. ms/
MB/Anzahl (Ratio).
Diskret vs. Stetig: Zählen (diskret) vs. Messen (stetig).
Nenne ein Beispiel für nominale Daten aus der Informatik.
Ist „HTTP-Statuscode“ eher nominal oder quantitativ? Warum?
„Anzahl Commits“: diskret oder stetig? Begründe mit 1 Satz.
Was ist der Unterschied zwischen Intervall und Ratio?
Kevin Maurizi