LU02a - Theorie

Ergänzende Theorie zur Datenerfassung, Datenanalyse und Datenbereinigung

1. Analyse der Daten (vor dem Bereinigen)

Bevor Daten bereinigt oder verarbeitet werden, müssen sie analysiert werden. Dabei geht es darum zu verstehen, welche Daten vorliegen und welche Probleme auftreten könnten. Typische Fragen bei der Datenanalyse sind:

Diese Voranalyse hilft zu entscheiden, welche Bereinigungen notwendig sind.



2. Datenformate

Damit Daten ausgewertet werden können, müssen sie im richtigen Format vorliegen. Beispiele:

Je besser das Format, desto leichter kann eine Software die Daten korrekt interpretieren.



3. Typische Probleme bei der Datenerfassung

Bei der Erfassung – egal ob manuell oder elektronisch – können Fehler entstehen:

Manuelle Erfassung

Elektronische Erfassung

Datenübernahme aus bestehenden Systemen



4. Datenbereinigung

Die Datenbereinigung (engl. Data Cleaning) dient dazu, Daten korrekt, vollständig und einheitlich zu machen. Wichtige Schritte sind: a) Fehlerhafte Werte korrigieren

b) Fehlende Werte behandeln

c) Dubletten entfernen

d) Vereinheitlichung

e) Plausibilitätskontrolle Dies bedeutet, zu prüfen, ob die Werte realistisch sind:



5. Ziel der Datenbereinigung

Nach der Bereinigung sollen die Daten …

… sein, damit die anschliessende Analyse, z. B. mit Excel, Datenbanken oder Statistikprogrammen, zuverlässig funktioniert.


BZZ