Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
de:modul:m245:learningunits:lu03:theorie:01 [2025/12/19 15:24] – gelöscht - Externe Bearbeitung (Unbekanntes Datum) 127.0.0.1de:modul:m245:learningunits:lu03:theorie:01 [2026/01/06 08:58] (aktuell) vdemir
Zeile 1: Zeile 1:
 +====== LU03a - Kaggle.com Übersicht  ======
  
 +===== Worum geht es bei Kaggle ===== 
 +Kaggle ist im Kern eine Lern-, Wettbewerbs- und Austauschplattform rund um Data Science und Machine Learning. Oder anders gesagt: der Ort, an dem Modelle gegeneinander antreten und Egos leise leiden.
 +
 +{{:de:modul:m245:learningunits:lu02:theorie:kaggle_com.png?800|}}
 +
 +===== Was stellt Kaggle zur Verfügfung =====
 +
 +**1. Datasets** - Kaggle stellt tausende offene Datensaetze bereit
 +  * CSVs, Bilder, Text, Zeitreihen
 +  * von trivial („Titanic“) bis brutal realistisch
 +  * geeignet fuers Lernen, Ueben und Scheitern im geschuetzten Raum  
 +  * Kurz: Daten, ohne erst wochenlang Datenschutzformulare auszufuellen.
 +
 +**2. Wettbewerbe** - das Herzstueck von Kaggle
 +  * Man bekommt:
 +    * einen Datensatz
 +    * eine Aufgabenstellung (z. B. Klassifikation, Regression)
 +    * eine Bewertungsmetrik (Accuracy, RMSE, Log Loss, …)
 +  * Man liefert:
 +    * ein Modell
 +    * eine Vorhersagedatei
 +    * und Lektio in Demut, wenn man auf Platz 12'348 landet
 +  * Es gibt:
 +    * Lern-Wettbewerbe (einsteigerfreundlich)
 +    * Forschungsnahe Challenges
 +    * Industrie-Wettbewerbe mit Preisgeld
 +
 +**3. Notebooks** 
 +  * Interaktive Jupyter-Notebooks im Browser
 +    * Python, R
 +    * vorinstallierte Libraries
 +    * direkter Zugriff auf Kaggle-Daten
 +  * Man kann
 +    * eigene Loesungen bauen
 +    * Code anderer Leute lesen
 +    * sich fragen, warum deren Feature Engineering funktioniert und das eigene nicht
 +
 +**4. Kurse** - Kostenlose Micro-Courses zu:
 +  * Python
 +  * Pandas
 +  * Machine Learning
 +  * Deep Learning
 +  * Feature Engineering
 +
 +**5. Community**
 +  * Diskussionen zu Modellen und Loesungen
 +  * Erklaerungen zu Gewinneransaetzen
 +  * Austausch ueber Best Practices
 +
 +Man lernt hier schnell:
 +  * wie Profis denken
 +  * wie viele Tricks es gibt
 +  * wie wenig „einfach mal ein Modell trainieren“ wirklich ist
 +
 +**6. Was Kaggle liefert **: Kaggle ist ein Trainingslager fuer Data Science:
 +  * echte Daten
 +  * echte Probleme
 +  * echte Metriken
 +  * echter Realitaetsschock
 +
 +**7. Was Kaggle nicht liefert**
 +  * Kein Ersatz fuer solides Statistik- oder ML-Verstaendnis
 +  * Keine Garantie, dass dein Wettbewerbsmodell produktionsreif ist
 +  * Kein Ort fuer „einfach nur Theorie“
 +
 +
 +
 +[[https://creativecommons.org/licenses/by-nc-sa/4.0/|{{https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png}}]] Volkan Demir