Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
| Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
| de:modul:ffit:3-jahr:java:learningunits:lu11:b [2025/11/18 01:59] – apeter | de:modul:ffit:3-jahr:java:learningunits:lu11:b [2025/11/18 02:35] (aktuell) – apeter | ||
|---|---|---|---|
| Zeile 3: | Zeile 3: | ||
| RAG (Retrieval-Augmented Generation) ist eine gängige Variante, um Fragen zu benutzerspezifischen Dokumenten zu beantworten. | RAG (Retrieval-Augmented Generation) ist eine gängige Variante, um Fragen zu benutzerspezifischen Dokumenten zu beantworten. | ||
| - | {{: | + | {{: |
| + | © https:// | ||
| - | ==== How to AI ==== | + | Vorneweg muss man die gewünschten Daten (z.B. Lernunterlagen) ... |
| - | Ein | + | - ... in Chunks unterteilen |
| + | - ... " | ||
| + | - ... in die Vektordatenbank speichern | ||
| + | Der Ablauf funktioniert grob so: | ||
| + | - Der Benutzer gibt eine Frage ein, welche an die Applikation geschickt wird. | ||
| + | - Die Frage wird " | ||
| + | - Von der Vektordatenbank werden die n passendsten Chunks im Klartext an die Applikation zurückgegeben. | ||
| + | - Die Applikation schickt die originale Frage im Klartext mitsamt den Chunks an ein LLM-Model | ||
| + | - Das LLM-Model schickt eine Antwort zurück an die Applikation | ||
| + | - Die Applikation kann z.B. Quellen o. Ä. bei Bedarf ergänzen und die Antwort an den Benutzer zurückschicken. | ||
| - | <code java> | + | ==== Vector-Embedding==== |
| - | </code> | + | Bei einem Vector-Embedding werden Daten (oftmals Textblöcke) in Vektoren mit hunderten von Dimensionen umgewandelt. |
| + | |||
| + | {{: | ||
| + | © https:// | ||
| + | |||
| + | ==== Vektordatenbank ==== | ||
| + | |||
| + | In einer Vektordatenbank sind Objekte mit ähnlicher Bedeutung aufgrund des zuvor angewendeten Embeddings nahe beieinander. | ||
| + | Im nachfolgenden Beispiel sieht man die Tiere links, während die Früchte rechts sind. | ||
| + | |||
| + | Nebst den Zielobjekten können auch Fragen embedded werden. Wird zum Beispiel nach " | ||
| + | |||
| + | {{: | ||
| + | © https:// | ||