Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
| Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
| de:modul:m245:learningunits:lu02:theorie:02 [2025/12/21 13:09] – vdemir | de:modul:m245:learningunits:lu02:theorie:02 [2026/04/08 14:06] (aktuell) – vdemir | ||
|---|---|---|---|
| Zeile 1: | Zeile 1: | ||
| - | ====== | + | ====== |
| - | ===== Typen von Machine Learning ===== | + | ===== Varianten |
| + | Es gibt grundsätzlich drei Arten von Algorithmen im Bereich des maschinellen Lernens: | ||
| - | ===== Wichtiges Vokabular im Zusammenhang mit Machine Learning | + | |
| - | Bevor wir tiefer in die Materie tauchen, sollten einige Begrifflichkeiten geklärt werden. | + | * Unsupervided Learning (Unüberwachtes Lernen) |
| - | + | * Reinforcement Learning (Verstärkendes Lernen) | |
| - | **Trainingsdaten** | + | |
| - | Daraus lernt das Modell | + | |
| - | + | ||
| - | **Testdaten** | + | |
| - | Damit prueft man, ob es wirklich gelernt hat | + | |
| - | + | ||
| - | **Overfitting** | + | |
| - | Modell lernt auswendig, versteht aber nichts | + | |
| - | + | ||
| - | + | ||
| - | **Underfitting** | + | |
| - | Modell versteht gar nichts | + | |
| - | + | ||
| - | **Generalisation** | + | |
| - | Das eigentliche Ziel | + | |
| + | {{: | ||
| Zeile 27: | Zeile 14: | ||
| // | // | ||
| - | {{: | + | {{: |
| Es funktioniert, | Es funktioniert, | ||
| Zeile 39: | Zeile 26: | ||
| Innerhalb des Moduls 245 werden wir uns auf diese Methode fokussieren. | Innerhalb des Moduls 245 werden wir uns auf diese Methode fokussieren. | ||
| + | |||
| + | {{: | ||
| ==== Unsuperviced Machine Learning ==== | ==== Unsuperviced Machine Learning ==== | ||
| Zeile 54: | Zeile 43: | ||
| * Empfehlungssysteme | * Empfehlungssysteme | ||
| - | ---- | + | Innerhalb des Moduls 245 werden die diese Methode **nicht** angwenden. |
| - | [[https:// | + | |
| - | Innerhalb des Moduls 245 werden die diese Methode nicht angwenden. | + | {{: |
| ==== Reinforcement Learning ==== | ==== Reinforcement Learning ==== | ||
| Reinforcement Learning (RL) ist eine Art des maschinellen Lernens, bei dem ein Agent lernt, optimale Entscheidungen zu treffen, indem er mit einer Umgebung interagiert und für seine Handlungen Belohnungen (positives Feedback) oder Strafen (negatives Feedback) erhält, ähnlich wie beim menschlichen Lernen durch Versuch und Irrtum, um ein Ziel zu erreichen. Es ist eine leistungsstarke Methode für KI, um komplexe Verhaltensweisen wie das Spielen von Spielen oder die Steuerung von Robotern ohne explizite Programmierung zu erlernen, wobei der Schwerpunkt auf der Maximierung der kumulativen Belohnungen im Laufe der Zeit liegt. Zu den Schlüsselelementen gehören der Agent, die Umgebung, Aktionen, Zustände, Belohnungen und eine Richtlinie (Strategie). | Reinforcement Learning (RL) ist eine Art des maschinellen Lernens, bei dem ein Agent lernt, optimale Entscheidungen zu treffen, indem er mit einer Umgebung interagiert und für seine Handlungen Belohnungen (positives Feedback) oder Strafen (negatives Feedback) erhält, ähnlich wie beim menschlichen Lernen durch Versuch und Irrtum, um ein Ziel zu erreichen. Es ist eine leistungsstarke Methode für KI, um komplexe Verhaltensweisen wie das Spielen von Spielen oder die Steuerung von Robotern ohne explizite Programmierung zu erlernen, wobei der Schwerpunkt auf der Maximierung der kumulativen Belohnungen im Laufe der Zeit liegt. Zu den Schlüsselelementen gehören der Agent, die Umgebung, Aktionen, Zustände, Belohnungen und eine Richtlinie (Strategie). | ||
| - | Innerhalb des Moduls 245 werden die diese Methode nicht angwenden. | + | Innerhalb des Moduls 245 werden die diese Methode |
| - | + | ||
| - | ---- | + | |
| ===== Superviced Learning im Detail ===== | ===== Superviced Learning im Detail ===== | ||
| - | ===== Grundidee | + | ==== Grundidee ==== |
| Wir haben einen Datensatz aus (x, y)-Paaren: | Wir haben einen Datensatz aus (x, y)-Paaren: | ||
| * x = Eingabedaten = Features, z.B. Bildpixel, Messwerte, Texteigenschaften | * x = Eingabedaten = Features, z.B. Bildpixel, Messwerte, Texteigenschaften | ||
| Zeile 75: | Zeile 61: | ||
| Das Modell sucht eine Funktion //y ≈ f(x)// und versucht, moeglichst wenig falsch zu liegen. | Das Modell sucht eine Funktion //y ≈ f(x)// und versucht, moeglichst wenig falsch zu liegen. | ||
| - | **Typische Aufgaben** | + | ==== Typische Aufgaben |
| ^ # ^ Klassifikation ^ Merkmal(Feature) ^Ziel (Label) ^ | ^ # ^ Klassifikation ^ Merkmal(Feature) ^Ziel (Label) ^ | ||
| Zeile 84: | Zeile 70: | ||
| | 5. | Kundenabwanderung (Churn Prediction) | Vertragslaufzeit, | | 5. | Kundenabwanderung (Churn Prediction) | Vertragslaufzeit, | ||
| + | ==== Wie läuft das Training ab? ==== | ||
| - | ===== Wie läuft das Training ab? ===== | + | ^ Schritt ^ Tätigkeit ^ Kommentar ^ |
| - | + | ^ 1. ^ Daten sammeln | |
| - | - **Daten sammeln**: Mit korrekten Labels (der teuerste Teil) | + | ^ 2. ^ Modell initialisieren |
| - | - **Modell initialisieren:** Startet ahnungslos (wie Erstsemester) | + | ^ 3. ^ Vorhersage machen |
| - | - **Vorhersage machen**: Modell rät | + | ^ 4. ^ Fehler berechnen |
| - | - **Fehler berechnen**: Mean Squared Error(Abweichung von der Vorhersage), | + | ^ 5. ^ Modell anpassen |
| - | - **Modell anpassen**: Gewichte korrigieren (Gradient Descent) | + | ^ 6. ^ Wiederholen |
| - | - **Wiederholen**: Bis Fehler klein genug oder Geduld am Ende | + | |
| - | + | ||
| - | + | ||
| - | ===== Vor- und Nachteile ===== | + | |
| - | + | ||
| - | **Vorteile ** | + | |
| - | * Gute Ergebnisse, wenn viele korrekt gelabelte Daten da sind | + | |
| - | * Relativ gut interpretierbar (je nach Modell) | + | |
| - | * Industriestandard fuer viele Anwendungen | + | |
| - | + | ||
| - | **Nachteile** | + | |
| - | * Labels sind teuer und fehleranfaellig | + | |
| - | * Modell kann Bias der Trainingsdaten uebernehmen | + | |
| - | * Lernt nur das, was man ihm zeigt (keine Magie) | + | |
| + | ==== Vor- und Nachteile ==== | ||
| + | ^ <color # | ||
| + | | <color # | ||
| + | | <color # | ||
| + | | <color # | ||
| ---- | ---- | ||
| [[https:// | [[https:// | ||