LU02a - Types of Machine Learning - TBD

Dies ist eine alte Version des Dokuments!

Supervised Learning ist eine Art des maschinellen Lernens, bei dem Algorithmen aus gekennzeichneten Datensätzen (Eingabe-Ausgabe-Paaren) lernen, Eingaben den richtigen Ausgaben zuzuordnen, sodass sie genaue Vorhersagen oder Entscheidungen zu neuen, unbekannten Daten treffen können, beispielsweise zur Identifizierung von Spam oder zur Vorhersage von Immobilienpreisen.

Es funktioniert, indem ein Modell anhand von Beispielen trainiert und seine internen Parameter angepasst werden, um Fehler zu minimieren. Es lässt sich grob in Klassifizierungsaufgaben (Kategorisierung von Daten) und Regressionsaufgaben (Vorhersage numerischer Werte) unterteilen und wird häufig bei den nachfolgenden Aufgaben eingesetzt:

Klassifizierung
Regression
Betrugserkennung
Bilderkennung
medizinischen Diagnos
autonome Mobilität (Züge, Autos, …)

Innerhalb des Moduls 245 werden wir uns auf diese Methode fokussieren.

Unsuperviced Learning ist eine Art des maschinellen Lernens, bei dem Algorithmen ohne menschliche Anleitung Muster und Erkenntnisse in unbeschrifteten Daten finden und sich dabei auf die Entdeckung versteckter Strukturen, Gruppierungen (Clustering) oder Beziehungen (Assoziationsregeln) konzentrieren, indem sie Ähnlichkeiten und Unterschiede identifizieren.

Im Gegensatz zum überwachten Lernen sagt es keine bestimmten Ergebnisse voraus, sondern untersucht Daten, um inhärente (dazugehörige) Muster aufzudecken, wodurch es sich hervorragend für die nachfolgenden Aufgaben eignet:

Kundensegmentierung
Anomalieerkennung
Datenreduktion (Dimensionsreduktion)
Clustering,
Marktsegmentierung
Empfehlungssysteme

Volkan Demir

Innerhalb des Moduls 245 werden die diese Methode nicht angwenden.

Reinforcement Learning (RL) ist eine Art des maschinellen Lernens, bei dem ein Agent lernt, optimale Entscheidungen zu treffen, indem er mit einer Umgebung interagiert und für seine Handlungen Belohnungen (positives Feedback) oder Strafen (negatives Feedback) erhält, ähnlich wie beim menschlichen Lernen durch Versuch und Irrtum, um ein Ziel zu erreichen. Es ist eine leistungsstarke Methode für KI, um komplexe Verhaltensweisen wie das Spielen von Spielen oder die Steuerung von Robotern ohne explizite Programmierung zu erlernen, wobei der Schwerpunkt auf der Maximierung der kumulativen Belohnungen im Laufe der Zeit liegt. Zu den Schlüsselelementen gehören der Agent, die Umgebung, Aktionen, Zustände, Belohnungen und eine Richtlinie (Strategie).

Innerhalb des Moduls 245 werden die diese Methode nicht angwenden.

Wir haben einen Datensatz aus (x, y)-Paaren:

x = Eingabedaten = Features, z.B. Bildpixel, Messwerte, Texteigenschaften
y = Zielwert / Label, z.B. „Katze“, „Hund“, Preis, Ja/Nein

Das Modell sucht eine Funktion y ≈ f(x) und versucht, moeglichst wenig falsch zu liegen.

Typische Aufgaben

#	Klassifikation	Merkmal(Feature)	Ziel (Label)
1.	E-Mail-Spam-Erkennung	Anzahl bestimmter Schlagwoerter (z. B. „gratis“, „jetzt kaufen“), Anzahl Links, Laenge der E-Mail, Absender-Domain	Spam / Kein Spam
2.	Kreditwuerdigkeit von Kunden	Einkommen, Alter, Anzahl bestehender Kredite, Zahlungsverzug in der Vergangenheit	Kredit genehmigt / Kredit abgelehnt
3.	Handschriftliche Ziffernerkennung	Pixelwerte eines Bildes (z. B. 28×28 Graustufen)	Ziffer 0–9
4.	Krankheitsdiagnose (vereinfacht)	Koerpertemperatur, Blutdruck, Laborwerte, Alter	Krank, Gesund
5.	Kundenabwanderung (Churn Prediction)	Vertragslaufzeit, Monatliche Kosten, Anzahl Support-Anfragen, Nutzungsintensitaet	Kunde bleibt, Kunde kuendigt

Daten sammeln: Mit korrekten Labels (der teuerste Teil)
Modell initialisieren: Startet ahnungslos (wie Erstsemester)
Vorhersage machen: Modell rät
Fehler berechnen: Mean Squared Error(Abweichung von der Vorhersage), Cross-Entropy (Genauigkeit mit der Vorhersage)
Modell anpassen: Gewichte korrigieren (Gradient Descent)
Wiederholen: Bis Fehler klein genug oder Geduld am Ende

Trainingsdaten: Daraus lernt das Modell
Testdaten: Damit prueft man, ob es wirklich gelernt hat
Overfitting: Modell lernt auswendig, versteht aber nichts
Underfitting: Modell versteht gar nichts
Generalisation: Das eigentliche Ziel