Kapitel 14
RAG & Wissensspeicher
In diesem Kapitel geht es darum, wie NOVA Wissen nutzen kann, ohne jedes Detail in Modellgewichte trainieren zu mßssen. Dabei klären wir auch die wichtige Rollenverteilung: NOVA ist ein KI-System. MiniNovaLM ist ihr eigenes trainierbares Modell. RAG ist ihr Wissenszugriff. Ollama ist ein optionaler lokaler Sprachgenerator, den NOVA verwenden kann.
Ollama in NOVA
Warum wir Ollama in NOVA einbauen
MiniNovaLM ist unser eigenes kleines Sprachmodell. Es ist didaktisch extrem wichtig, weil wir daran verstehen, wie Tokenisierung, Sequenzen, Training, Checkpoints und Generierung zusammenhängen. Aber MiniNovaLM ist bewusst klein und daher sprachlich noch begrenzt.
Ollama erlaubt NOVA, zusätzlich ein stärkeres lokales Sprachmodell als Generator zu verwenden. Dadurch kann NOVA aus gefundenen Quellen flßssigere und besser strukturierte Antworten erzeugen, ohne dass wir NOVAs eigene Architektur aufgeben.
Die saubere Idee ist also nicht: âOllama ersetzt NOVAâ. Die saubere Idee ist: âNOVA nutzt Ollama als optionalen Generator.â
Rollenverteilung in NOVA + Ollama
Frage
Der User stellt eine Frage an NOVA.
Retrieval
NOVA sucht passende Quellen im Wissensspeicher.
Kontext
NOVA baut aus Frage und Quellen einen Prompt-Kontext.
Generator
Ollama formuliert aus diesem Kontext eine Antwort.
PrĂźfung
NOVA zeigt Antwort, Quellen und Modus sichtbar an.
Was bei einer Frage passiert
Wenn du im RAG-Labor eine Frage stellst, passiert didaktisch betrachtet eine Kette aus mehreren Schritten. Diese Kette ist wichtiger als die reine Antwort am Ende.
Ablauf
Was Ollama verbessert
- ⢠flßssigere Sprache
- ⢠bessere Zusammenfassung längerer Quellen
- ⢠natßrlichere Erklärungen
- ⢠bessere Strukturierung einer Antwort
Was Ollama nicht lĂśst
- ⢠falsch gefundene Quellen
- ⢠fehlende Quellen im Kontext
- ⢠unklare Rollenbeschreibung im Prompt
- ⢠fehlende Fakten im Wissensspeicher
Warum Ollama manchmal trotzdem falsch antwortet
Wenn Ollama im RAG-Modus eine Frage falsch beantwortet, obwohl die Artikel im AI-Lab vorhanden sind, bedeutet das nicht automatisch, dass Ollama âdummâ ist oder dass NOVA keine KI ist.
Wahrscheinlicher ist: Die passenden Chunks wurden nicht gefunden, nicht hoch genug bewertet oder nicht klar genug in den Prompt gelegt. Ein RAG-System ist nur so gut wie die Kombination aus Wissensspeicher, Retriever, Prompt und Generator.
Checkpoint
Ollama macht NOVA sprachlich stärker. Aber NOVA bleibt die KI-Architektur: Memory, MiniNovaLM, RAG, Safety, Wissensspeicher und Antwortsteuerung.
NOVA Energie-Log
RTX-Verbrauch
NOVA schätzt hier, wie viel GPU-Energie deine Bildanalyse- und CUDA-Läufe bisher ungefähr verbraucht haben.
Lade Energie-Daten...