Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
| Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
| de:modul:m245:learningunits:lu02:theorie:02 [2025/12/21 13:28] – [Wie läuft das Training ab?] vdemir | de:modul:m245:learningunits:lu02:theorie:02 [2026/04/08 14:06] (aktuell) – vdemir | ||
|---|---|---|---|
| Zeile 1: | Zeile 1: | ||
| - | ====== | + | ====== |
| - | ===== Wichtiges Vokabular im Zusammenhang mit Machine Learning | + | ===== Varianten von Machine Learning |
| - | Bevor wir tiefer in die Materie tauchen, sollten einige Begrifflichkeiten geklärt werden. | + | Es gibt grundsätzlich drei Arten von Algorithmen im Bereich des maschinellen Lernens: |
| - | **Trainingsdaten** | + | |
| - | Daraus lernt das Modell | + | * Unsupervided Learning (Unüberwachtes Lernen) |
| + | * Reinforcement Learning (Verstärkendes Lernen) | ||
| - | **Testdaten** | + | {{: |
| - | Damit prueft man, ob es wirklich gelernt hat | + | |
| - | **Overfitting** | ||
| - | Modell lernt auswendig, versteht aber nichts | ||
| - | |||
| - | **Underfitting** | ||
| - | Modell versteht gar nichts | ||
| - | |||
| - | **Generalisation** | ||
| - | Das eigentliche Ziel | ||
| - | |||
| - | ===== Typen von Machine Learning ===== | ||
| ==== Superviced Machine Learning ==== | ==== Superviced Machine Learning ==== | ||
| // | // | ||
| - | {{: | + | {{: |
| Es funktioniert, | Es funktioniert, | ||
| Zeile 60: | Zeile 50: | ||
| Reinforcement Learning (RL) ist eine Art des maschinellen Lernens, bei dem ein Agent lernt, optimale Entscheidungen zu treffen, indem er mit einer Umgebung interagiert und für seine Handlungen Belohnungen (positives Feedback) oder Strafen (negatives Feedback) erhält, ähnlich wie beim menschlichen Lernen durch Versuch und Irrtum, um ein Ziel zu erreichen. Es ist eine leistungsstarke Methode für KI, um komplexe Verhaltensweisen wie das Spielen von Spielen oder die Steuerung von Robotern ohne explizite Programmierung zu erlernen, wobei der Schwerpunkt auf der Maximierung der kumulativen Belohnungen im Laufe der Zeit liegt. Zu den Schlüsselelementen gehören der Agent, die Umgebung, Aktionen, Zustände, Belohnungen und eine Richtlinie (Strategie). | Reinforcement Learning (RL) ist eine Art des maschinellen Lernens, bei dem ein Agent lernt, optimale Entscheidungen zu treffen, indem er mit einer Umgebung interagiert und für seine Handlungen Belohnungen (positives Feedback) oder Strafen (negatives Feedback) erhält, ähnlich wie beim menschlichen Lernen durch Versuch und Irrtum, um ein Ziel zu erreichen. Es ist eine leistungsstarke Methode für KI, um komplexe Verhaltensweisen wie das Spielen von Spielen oder die Steuerung von Robotern ohne explizite Programmierung zu erlernen, wobei der Schwerpunkt auf der Maximierung der kumulativen Belohnungen im Laufe der Zeit liegt. Zu den Schlüsselelementen gehören der Agent, die Umgebung, Aktionen, Zustände, Belohnungen und eine Richtlinie (Strategie). | ||
| - | Innerhalb des Moduls 245 werden die diese Methode nicht angwenden. | + | Innerhalb des Moduls 245 werden die diese Methode |
| ===== Superviced Learning im Detail ===== | ===== Superviced Learning im Detail ===== | ||
| Zeile 91: | Zeile 81: | ||
| ==== Vor- und Nachteile ==== | ==== Vor- und Nachteile ==== | ||
| - | ^Vorteile ^Nachteile ^ | + | ^ <color #22b14c>Vorteile</ |
| - | | Gute Ergebnisse, wenn viele korrekt gelabelte Daten da sind | Labels sind teuer und fehleranfällig | | + | | <color #22b14c>Gute Ergebnisse, wenn viele korrekt gelabelte Daten da sind </ |
| - | | Relativ gut interpretierbar (je nach Modell) | Modell kann Bias der Trainingsdaten uebernehmen | | + | | <color #22b14c>Relativ gut interpretierbar (je nach Modell)</ |
| - | | Industriestandard fuer viele Anwendungen | Lernt nur das, was man ihm zeigt (keine Magie)| | + | | <color #22b14c>Industriestandard fuer viele Anwendungen</ |
| ---- | ---- | ||
| [[https:// | [[https:// | ||