LU03.A02 - Kaggle-Kurs: Pandas-Challenge
Rahmenbedingungen
- Sozialform: individual
- Hilfsmittel:
- OpenBooks
- Zeit: 4 Lektionen Stunden (Mittelwert, basierend Selbstkompetenz)
- Erwartetes Resultat:
- Das Pandas-Challenge wurde sorgfältig und vollständig bearbeitet.
- Die Bearbeigung des Python-Kurses ist im Kaggle-Python-Notebook nachweisbar.
Ausgangslage
Python ist bekanntlich die beliebteste Programmiersprache im Bereich Machine Learning. Ein wichtiger Grund ist, dass es eine Reihe von sehr wichtigen Bibliotheken anbietet, darunter auch die PANDAS-Bibliothek.
Facts:
- PANDAS ist eine Python-Bibliothek zur Datenverarbeitung.
- Im Machine Learning ist sie nicht optional, sondern die Phase vor dem eigentlichen „KI-Teil“.
- Kurzs: Ohne pandas - viel Hoffnung, wenig Ergebnisse
- Ein Werkzeug zum Einlesen, Verstehen, Bereinigen und Vorbereiten von Daten
- Arbeitet mit tabellarischen Daten (aehnlich Excel, nur reproduzierbar und ohne Maus)
- Zentrale Datenstruktur: DataFrame
- Tabelle mit Zeilen,
- Spalten,
- Spaltennamen und Datentypen
