Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
| Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
| de:modul:m245:learningunits:lu03:theorie:01 [2025/12/19 15:24] – gelöscht - Externe Bearbeitung (Unbekanntes Datum) 127.0.0.1 | de:modul:m245:learningunits:lu03:theorie:01 [2026/01/06 08:58] (aktuell) – vdemir | ||
|---|---|---|---|
| Zeile 1: | Zeile 1: | ||
| + | ====== LU03a - Kaggle.com Übersicht | ||
| + | ===== Worum geht es bei Kaggle ===== | ||
| + | Kaggle ist im Kern eine Lern-, Wettbewerbs- und Austauschplattform rund um Data Science und Machine Learning. Oder anders gesagt: der Ort, an dem Modelle gegeneinander antreten und Egos leise leiden. | ||
| + | |||
| + | {{: | ||
| + | |||
| + | ===== Was stellt Kaggle zur Verfügfung ===== | ||
| + | |||
| + | **1. Datasets** - Kaggle stellt tausende offene Datensaetze bereit | ||
| + | * CSVs, Bilder, Text, Zeitreihen | ||
| + | * von trivial („Titanic“) bis brutal realistisch | ||
| + | * geeignet fuers Lernen, Ueben und Scheitern im geschuetzten Raum | ||
| + | * Kurz: Daten, ohne erst wochenlang Datenschutzformulare auszufuellen. | ||
| + | |||
| + | **2. Wettbewerbe** - das Herzstueck von Kaggle | ||
| + | * Man bekommt: | ||
| + | * einen Datensatz | ||
| + | * eine Aufgabenstellung (z. B. Klassifikation, | ||
| + | * eine Bewertungsmetrik (Accuracy, RMSE, Log Loss, …) | ||
| + | * Man liefert: | ||
| + | * ein Modell | ||
| + | * eine Vorhersagedatei | ||
| + | * und Lektio in Demut, wenn man auf Platz 12'348 landet | ||
| + | * Es gibt: | ||
| + | * Lern-Wettbewerbe (einsteigerfreundlich) | ||
| + | * Forschungsnahe Challenges | ||
| + | * Industrie-Wettbewerbe mit Preisgeld | ||
| + | |||
| + | **3. Notebooks** | ||
| + | * Interaktive Jupyter-Notebooks im Browser | ||
| + | * Python, R | ||
| + | * vorinstallierte Libraries | ||
| + | * direkter Zugriff auf Kaggle-Daten | ||
| + | * Man kann | ||
| + | * eigene Loesungen bauen | ||
| + | * Code anderer Leute lesen | ||
| + | * sich fragen, warum deren Feature Engineering funktioniert und das eigene nicht | ||
| + | |||
| + | **4. Kurse** - Kostenlose Micro-Courses zu: | ||
| + | * Python | ||
| + | * Pandas | ||
| + | * Machine Learning | ||
| + | * Deep Learning | ||
| + | * Feature Engineering | ||
| + | |||
| + | **5. Community** | ||
| + | * Diskussionen zu Modellen und Loesungen | ||
| + | * Erklaerungen zu Gewinneransaetzen | ||
| + | * Austausch ueber Best Practices | ||
| + | |||
| + | Man lernt hier schnell: | ||
| + | * wie Profis denken | ||
| + | * wie viele Tricks es gibt | ||
| + | * wie wenig „einfach mal ein Modell trainieren“ wirklich ist | ||
| + | |||
| + | **6. Was Kaggle liefert **: Kaggle ist ein Trainingslager fuer Data Science: | ||
| + | * echte Daten | ||
| + | * echte Probleme | ||
| + | * echte Metriken | ||
| + | * echter Realitaetsschock | ||
| + | |||
| + | **7. Was Kaggle nicht liefert** | ||
| + | * Kein Ersatz fuer solides Statistik- oder ML-Verstaendnis | ||
| + | * Keine Garantie, dass dein Wettbewerbsmodell produktionsreif ist | ||
| + | * Kein Ort fuer „einfach nur Theorie“ | ||
| + | |||
| + | |||
| + | |||
| + | [[https:// | ||