Dies ist eine alte Version des Dokuments!


LU01a - Arten von Daten

Überblick Inhalt
Ziel Du kannst Datenarten unterscheiden (qualitativ/quantitativ) und die passende Skala (nominal/ordinal/intervall/ratio) erklären.
Warum wichtig? Die Datenart entscheidet, welche Kennzahlen (z.B. Mittelwert ja/nein) und welche Diagramme sinnvoll sind.
Kompetenzbezug AG1/AF1 (Grundbegriffe verstehen & anwenden), Vorbereitung für Lagewerte/Verteilungen
Dauer 1 Doppellektion (90’)

In der Datenanalyse beschreibt man reale Beobachtungen in strukturierter Form, um daraus Erkenntnisse abzuleiten.

Beispiele aus dem Informatik-Alltag

Ladezeit einer Webseite in Millisekunden

Anzahl Fehler in einem Log pro Stunde

Betriebssystem der User (Windows/macOS/Linux)

Zufriedenheit der User (Skala 1–5)

HTTP-Statuscodes (200, 404, 500)

Wichtig: Bevor du Kennzahlen berechnest oder Diagramme zeichnest, musst du wissen: Welche Art von Daten ist das?

Begriff Bedeutung Beispiel
Merkmal / Variable Eigenschaft, die beobachtet wird „Browser-Typ“
Ausprägung konkreter Wert einer Variable „Firefox“
Beobachtung / Datensatz eine Messung/Eintrag „Firefox“ bei Person A
Stichprobe Teilmenge der Daten 25 Lernende
Grundgesamtheit alle möglichen Fälle alle Lernenden der Schule

Qualitative Daten sind Kategorien/Labels. Man rechnet damit nicht „normal“ (kein Mittelwert).

Beispiele

Betriebssystem: Windows / macOS / Linux

Sprache: DE / EN / FR

Bug-Typ: UI / Backend / Security

Quantitative Daten sind Zahlenwerte, die etwas messen oder zählen. Hier sind mathematische Operationen sinnvoll (je nach Skala).

Beispiele

Ladezeit: 123 ms

RAM-Verbrauch: 2.4 GB

Anzahl Commits: 18

Merksatz: Qualitativ = Kategorien/Labels. Quantitativ = Zahlenwerte (zählen oder messen).

Die Skala sagt dir, was du mit den Daten machen darfst.

Keine Reihenfolge

Erlaubt: Häufigkeiten, Modus, Balkendiagramm, Kreisdiagramm

Nicht sinnvoll: Median, Mittelwert

Beispiele (Informatik)

Browser: Chrome / Firefox / Safari

HTTP-Methode: GET / POST / PUT

Statuscode als Kategorie: 200 / 404 / 500 → Achtung: Das sind Zahlen, aber sie funktionieren hier als Labels, nicht als Messwert!

Rangfolge ist möglich

Abstände zwischen Stufen sind nicht zwingend gleich

Erlaubt: Median, Modus, Rangvergleiche, Boxplot (oft ok), Balkendiagramm

Mittelwert: meist nicht sinnvoll (nur mit Vorsicht)

Beispiele

Zufriedenheit: 1–5 (sehr schlecht … sehr gut)

Priorität: low / medium / high

Schulnoten (je nach System): Rangordnung vorhanden

Differenzen sind sinnvoll (z.B. +10)

Nullpunkt ist willkürlich

Erlaubt: Mittelwert, Standardabweichung, Histogramm, Linie

Verhältnis („doppelt so viel“) ist nicht sinnvoll

Beispiele

Temperatur in °C (0°C ist nicht „keine Temperatur“)

Kalenderjahr (2026 ist nicht „doppelt so viel“ wie 1013)

Abstände sinnvoll und Null bedeutet „nichts“

Verhältnis ist sinnvoll („doppelt so viel“)

Erlaubt: alle üblichen Kennzahlen + viele Diagramme

Beispiele (Informatik)

Dateigrösse (0 MB = keine Daten)

Laufzeit/Antwortzeit (0 ms = keine Zeit)

Anzahl Requests (0 = kein Request)

Quick-Check: Wenn „0“ wirklich „nichts“ bedeutet → meist Ratioskala. Wenn Zahlen nur Codes sind (z.B. 404) → meist Nominalskala.

entstehen durch Zählen

Werte sind typischerweise ganze Zahlen

Beispiele

Anzahl Commits pro Woche

Anzahl Fehler pro Build

Anzahl User in einem Chatraum

entstehen durch Messen

theoretisch unendlich viele Zwischenwerte möglich

Beispiele

Ladezeit in ms (in der Realität gemessen, kann sehr fein sein)

CPU-Temperatur

Netzwerk-Latenz

Datenart / Skala Sinnvolle Kennzahlen Typische Diagramme
Nominal (qualitativ) absolute/relative Häufigkeit, Modus Balken, Kreis
Ordinal (qualitativ) Median, Modus, Quartile (oft ok) Balken, (Boxplot oft ok)
Intervall (quantitativ) Mittelwert, Median, Stdabw. Histogramm, Linie, Boxplot
Ratio (quantitativ) Mittelwert, Median, Stdabw., Verhältnisse Histogramm, Linie, Boxplot
Diskret Mittelwert/Median möglich (je nach Skala) Balken, Histogramm (mit ganzen Klassen)
Stetig Mittelwert/Median/Stdabw. Histogramm, Dichtekurve, Boxplot

Frage: Ist 500 „mehr“ als 200? Antwort: Als Zahl ja – aber als Bedeutung nicht. Es sind Kategorien.

Datenklasse: qualitativ

Skala: nominal

Sinnvolle Auswertung: Häufigkeiten pro Code, Top-3 Codes, Balkendiagramm

Datenklasse: qualitativ (Ordinal)

Skala: ordinal

Sinnvolle Auswertung: Median, Häufigkeiten, Verteilung als Balken

Interpretation: Median = 4 bedeutet „typisch eher gut“, aber „4 ist doppelt so gut wie 2“ ist nicht zwingend korrekt.

Datenklasse: quantitativ

Skala: Ratio

Typ: stetig

Sinnvolle Auswertung: Mittelwert/Median/Stdabw., Boxplot (Ausreisser!), Histogramm

Auftrag: Bestimme für jede Variable:

qualitativ oder quantitativ?

Skala (nominal/ordinal/intervall/ratio)?

falls quantitativ: diskret oder stetig?

Variable qualit./quant. Skala diskret/stetig
Betriebssystem (Windows/macOS/Linux)
Anzahl Commits pro Woche
Ladezeit einer Seite (ms)
HTTP-Statuscode (200/404/500)
Zufriedenheit (1–5)
CPU-Temperatur in °C
Dateigrösse in MB

Betriebssystem → qualitativ, nominal

Commits → quantitativ, ratio, diskret

Ladezeit → quantitativ, ratio, stetig

Statuscode → qualitativ, nominal

Zufriedenheit → qualitativ, ordinal

CPU-Temperatur °C → quantitativ, intervall, stetig

Dateigrösse MB → quantitativ, ratio, stetig

„Zahlen = automatisch quantitativ“ → falsch. Codes (z.B. 404) sind oft nominal.

Mittelwert bei Ordinaldaten (z.B. Zufriedenheit) → kann täuschen.

Diskret/stetig verwechseln: Zählen = diskret, Messen = stetig.

Diagramm falsch gewählt: Kreisdiagramm für sehr viele Kategorien ist unübersichtlich → besser Balken.

Nenne ein Beispiel für nominale Daten aus der Informatik.

Warum ist der HTTP-Statuscode meistens nicht quantitativ?

Was ist der Unterschied zwischen diskret und stetig?

Kevin Maurizi

  • modul/mathe/ma4/thema/statistik/artenvondaten.1769416978.txt.gz
  • Zuletzt geändert: 2026/01/26 09:42
  • von kmaurizi