RAG (Retrieval-Augmented Generation) ist eine gängige Variante, um Fragen zu benutzerspezifischen Dokumenten zu beantworten.
© https://www.ridgerun.ai/post/how-to-evaluate-retrieval-augmented-generation-rag-systems
Vorneweg muss man die gewünschten Daten (z.B. Lernunterlagen) …
Der Ablauf funktioniert grob so:
Bei einem Vector-Embedding werden Daten (oftmals Textblöcke) in Vektoren mit hunderten von Dimensionen umgewandelt.
In einer Vektordatenbank sind Objekte mit ähnlicher Bedeutung aufgrund des zuvor angewendeten Embeddings nahe beieinander. Im nachfolgenden Beispiel sieht man die Tiere links, während die Früchte rechts sind.
Nebst den Zielobjekten können auch Fragen embedded werden. Wird zum Beispiel nach „Kitten“ gesucht, kann die Vektordatenbank mittels einer „Similarity search“ die nächstgelegenen Objekte ermitteln und zurückgeben. In diesem Beispiel also „Cat“.
© https://nlpcloud.com/de/fine-tuning-semantic-search-model-with-sentence-transformers-for-rag-application.html