LU02a - Types of Machine Learning - TBD
Typen von Machine Learning
Superviced Machine Learning
Supervised Learning ist eine Art des maschinellen Lernens, bei dem Algorithmen aus gekennzeichneten Datensätzen (Eingabe-Ausgabe-Paaren) lernen, Eingaben den richtigen Ausgaben zuzuordnen, sodass sie genaue Vorhersagen oder Entscheidungen zu neuen, unbekannten Daten treffen können, beispielsweise zur Identifizierung von Spam oder zur Vorhersage von Immobilienpreisen.
Es funktioniert, indem ein Modell anhand von Beispielen trainiert und seine internen Parameter angepasst werden, um Fehler zu minimieren. Es lässt sich grob in Klassifizierungsaufgaben (Kategorisierung von Daten) und Regressionsaufgaben (Vorhersage numerischer Werte) unterteilen und wird häufig bei den nachfolgenden Aufgaben eingesetzt:
- Klassifizierung
- Regression
- Betrugserkennung
- Bilderkennung
- medizinischen Diagnos
- autonome Mobilität (Züge, Autos, …)
Innerhalb des Moduls 245 werden wir uns auf diese Methode fokussieren.
Unsuperviced Machine Learning
Unsuperviced Learning ist eine Art des maschinellen Lernens, bei dem Algorithmen ohne menschliche Anleitung Muster und Erkenntnisse in unbeschrifteten Daten finden und sich dabei auf die Entdeckung versteckter Strukturen, Gruppierungen (Clustering) oder Beziehungen (Assoziationsregeln) konzentrieren, indem sie Ähnlichkeiten und Unterschiede identifizieren.
Im Gegensatz zum überwachten Lernen sagt es keine bestimmten Ergebnisse voraus, sondern untersucht Daten, um inhärente (dazugehörige) Muster aufzudecken, wodurch es sich hervorragend für die nachfolgenden Aufgaben eignet:
- Kundensegmentierung
- Anomalieerkennung
- Datenreduktion (Dimensionsreduktion)
- Clustering,
- Marktsegmentierung
- Empfehlungssysteme
Innerhalb des Moduls 245 werden die diese Methode nicht angwenden.
Reinforcement Learning
Reinforcement Learning (RL) ist eine Art des maschinellen Lernens, bei dem ein Agent lernt, optimale Entscheidungen zu treffen, indem er mit einer Umgebung interagiert und für seine Handlungen Belohnungen (positives Feedback) oder Strafen (negatives Feedback) erhält, ähnlich wie beim menschlichen Lernen durch Versuch und Irrtum, um ein Ziel zu erreichen. Es ist eine leistungsstarke Methode für KI, um komplexe Verhaltensweisen wie das Spielen von Spielen oder die Steuerung von Robotern ohne explizite Programmierung zu erlernen, wobei der Schwerpunkt auf der Maximierung der kumulativen Belohnungen im Laufe der Zeit liegt. Zu den Schlüsselelementen gehören der Agent, die Umgebung, Aktionen, Zustände, Belohnungen und eine Richtlinie (Strategie).
Innerhalb des Moduls 245 werden die diese Methode nicht angwenden.
Superviced Learning im Detail
Grundidee
Wir haben einen Datensatz aus (x, y)-Paaren:
- x = Eingabedaten = Features, z.B. Bildpixel, Messwerte, Texteigenschaften
- y = Zielwert / Label, z.B. „Katze“, „Hund“, Preis, Ja/Nein
Das Modell sucht eine Funktion y ≈ f(x) und versucht, moeglichst wenig falsch zu liegen.
Typische Aufgaben
| # | Klassifikation | Merkmal(Feature) | Ziel (Label) |
|---|---|---|---|
| 1. | E-Mail-Spam-Erkennung | Anzahl bestimmter Schlagwoerter (z. B. „gratis“, „jetzt kaufen“), Anzahl Links, Laenge der E-Mail, Absender-Domain | Spam / Kein Spam |
| 2. | Kreditwuerdigkeit von Kunden | Einkommen, Alter, Anzahl bestehender Kredite, Zahlungsverzug in der Vergangenheit | Kredit genehmigt / Kredit abgelehnt |
| 3. | Handschriftliche Ziffernerkennung | Pixelwerte eines Bildes (z. B. 28×28 Graustufen) | Ziffer 0–9 |
| 4. | Krankheitsdiagnose (vereinfacht) | Koerpertemperatur, Blutdruck, Laborwerte, Alter | Krank, Gesund |
| 5. | Kundenabwanderung (Churn Prediction) | Vertragslaufzeit, Monatliche Kosten, Anzahl Support-Anfragen, Nutzungsintensitaet | Kunde bleibt, Kunde kuendigt |
Wie laeuft das Training ab?
- Daten sammeln: Mit korrekten Labels (der teuerste Teil)
- Modell initialisieren: Startet ahnungslos (wie Erstsemester)
- Vorhersage machen: Modell rät
- Fehler berechnen: Mean Squared Error(Abweichung von der Vorhersage), Cross-Entropy (Genauigkeit mit der Vorhersage)
- Modell anpassen: Gewichte korrigieren (Gradient Descent)
- Wiederholen: Bis Fehler klein genug oder Geduld am Ende
Wichtiges Vokabular im Zusammenhang mit Machine Learning
- Trainingsdaten: Daraus lernt das Modell
- Testdaten: Damit prueft man, ob es wirklich gelernt hat
- Overfitting: Modell lernt auswendig, versteht aber nichts
- Underfitting: Modell versteht gar nichts
- Generalisation: Das eigentliche Ziel
Vor- und Nachteile
Vorteile
- Gute Ergebnisse, wenn viele korrekt gelabelte Daten da sind
- Relativ gut interpretierbar (je nach Modell)
- Industriestandard fuer viele Anwendungen
Nachteile
- Labels sind teuer und fehleranfaellig
- Modell kann Bias der Trainingsdaten uebernehmen
- Lernt nur das, was man ihm zeigt (keine Magie)


