Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
de:modul:m245:learningunits:lu02:loesungen:l01 [2026/01/05 12:36] vdemirde:modul:m245:learningunits:lu02:loesungen:l01 [2026/04/08 08:31] (aktuell) vdemir
Zeile 2: Zeile 2:
  
  
-===== Auftrag A – Grundlagen (Theorie=====+===== Auftrag AGrundlagen/Theorie =====
  
 **1.** Supervised Learning VS Unsupervised Learning **1.** Supervised Learning VS Unsupervised Learning
-  * **Supervised Learning:**Das Modell lernt mit gelabelten Daten, d. h. Eingabedaten und die richtige Antwort sind bekannt. Klassischer Frontalunterricht. +  * **Supervised Learning:**Das Modell lernt mit gelabelten Daten, d. h. Eingabedaten und die richtige Antwort sind bekannt. Wie der klassische Frontalunterricht. 
-  * **Unsupervised Learning:** Das Modell bekommt keine Zielvariable und versucht selbst, Muster oder Strukturen zu finden. Gruppenarbeit ohne Aufgabenstellung.+  * **Unsupervised Learning:** Das Modell bekommt keine Zielvariable und versucht selbst, Muster oder Strukturen zu finden. Wie Gruppenarbeit ohne Aufgabenstellung.
  
 **2.** Handelt es sich bei diesem Problem um (mit Begründung): Klassifikation oder Regression? **2.** Handelt es sich bei diesem Problem um (mit Begründung): Klassifikation oder Regression?
   * **Klassifikation**   * **Klassifikation**
-  * Begruendung: Die Zielvariable Kaufentscheidung hat diskrete Werte (Ja / Nein). Zahlen vorhersagen waere Regression, hier geht es um Kategorien.+  * Begründung: Die Zielvariable Kaufentscheidung hat diskrete Werte (Ja / Nein). Zahlen vorhersagen wäre Regression, hier geht es um Kategorien.
  
 **3. ** Nenne Sie zwei typische Algorithmen, die für dieses Problem geeignet waeren, und begründen Sie jeweils in einem Satz. **3. ** Nenne Sie zwei typische Algorithmen, die für dieses Problem geeignet waeren, und begründen Sie jeweils in einem Satz.
-  * **Logistische Regression:** Gut geeignet fuer binäre Klassifikationsprobleme und leicht interpretierbar (im Gegensatz zu manchem Buzzword-Modell)+  * **Logistische Regression:** Gut geeignet fuer binäre Klassifikationsprobleme und leicht interpretierbar. 
-  * **Decision Tree: ** Trifft Entscheidungen anhand klarer Regeln und ist auch fuer Menschen nachvollziehbar – ein seltenes Gut.+  * **Decision Tree: ** Trifft Entscheidungen anhand klarer Regeln und ist auch für Menschen nachvollziehbar.
  
-===== Auftrag B – Datenverstaendnis  =====+===== Auftrag B: Datenverständnis  =====
 **4. **Welche der oben genannten Merkmale sind numerisch, welche kategorisch? **4. **Welche der oben genannten Merkmale sind numerisch, welche kategorisch?
  
   * **Numerisch:**   * **Numerisch:**
     * Alter     * Alter
-    * Anzahl der bisherigen Einkaeufe+    * Anzahl der bisherigen Einkäufe
     * Verweildauer auf der Produktseite     * Verweildauer auf der Produktseite
   * **Kategorisch:**   * **Kategorisch:**
Zeile 28: Zeile 28:
 **5. **Warum ist es problematisch, die Zielvariable als Feature zu verwenden? **5. **Warum ist es problematisch, die Zielvariable als Feature zu verwenden?
   * Weil das Modell sonst die Antwort bereits kennt.   * Weil das Modell sonst die Antwort bereits kennt.
-  * Das nennt man Data Leakage und fuehrt zu beeindruckend guten Ergebnissen, die in der Realitaet genau gar nichts taugen.+  * Das nennt man Data Leakage und führt zu beeindruckend guten Ergebnissen, die in der Realität genau gar nichts taugen.
  
-===== Auftrag C – Praxisdenken =====+===== Auftrag CPraxisdenken =====
  
 **6. **Beschreiben Sie in 4–5 Schritten den typischen Ablauf eines Machine-Learning-Projekts (von Daten bis Modellbewertung). **6. **Beschreiben Sie in 4–5 Schritten den typischen Ablauf eines Machine-Learning-Projekts (von Daten bis Modellbewertung).
   - Problem definieren (was soll vorhergesagt werden?)   - Problem definieren (was soll vorhergesagt werden?)
   - Daten sammeln und vorbereiten (bereinigen, skalieren, encoden)   - Daten sammeln und vorbereiten (bereinigen, skalieren, encoden)
-  - Daten in Trainings- und Testdaten aufteilen+  - Daten in Trainings- und Testdaten aufteilen (80:20)
   - Modell trainieren   - Modell trainieren
   - Modell evaluieren und verbessern   - Modell evaluieren und verbessern
   - Optionaler Schritt 6: Erkennen, dass alles komplizierter ist als gedacht.   - Optionaler Schritt 6: Erkennen, dass alles komplizierter ist als gedacht.
  
-**7. **Nennen Sie zwei Risiken, die auftreten koennen, wenn:+**7. **Nennen Sie zwei Risiken, die auftreten können, wenn:
   * zu wenige Trainingsdaten vorhanden sind   * zu wenige Trainingsdaten vorhanden sind
     * Modell lernt keine stabilen Muster     * Modell lernt keine stabilen Muster
Zeile 48: Zeile 48:
     * Katastrophale Leistung bei neuen Daten      * Katastrophale Leistung bei neuen Daten 
  
-**8.** Was ist //Overfitting// – erklaert so, dass es auch jemand versteht, der glaubt, KI sei Bewusstsein.+**8.** Was ist //Overfitting// – erklären Sie so, dass es auch jemand versteht, der glaubt, KI sei Bewusstsein.
   * Overfitting bedeutet, dass ein Modell die Trainingsdaten auswendig lernt, inklusive Zufall und Rauschen, anstatt allgemeine Muster zu erkennen.   * Overfitting bedeutet, dass ein Modell die Trainingsdaten auswendig lernt, inklusive Zufall und Rauschen, anstatt allgemeine Muster zu erkennen.
-  * Es ist wie jemand, der eine Matheaufgabe perfekt loest – solange sie exakt gleich aussieht wie im Heft.+  * Es ist wie jemand, der eine Matheaufgabe perfekt löst – solange sie exakt gleich aussieht wie im Heft.
  
 ---- ----
 [[https://creativecommons.org/licenses/by-nc-sa/4.0/|{{https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png}}]] Volkan Demir [[https://creativecommons.org/licenses/by-nc-sa/4.0/|{{https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png}}]] Volkan Demir
  • de/modul/m245/learningunits/lu02/loesungen/l01.txt
  • Zuletzt geändert: 2026/04/08 08:31
  • von vdemir