RAG & Wissensspeicher

In diesem Kapitel geht es darum, wie NOVA Wissen nutzen kann, ohne jedes Detail in Modellgewichte trainieren zu müssen. Dabei klären wir auch die wichtige Rollenverteilung: NOVA ist ein KI-System. MiniNovaLM ist ihr eigenes trainierbares Modell. RAG ist ihr Wissenszugriff. Ollama ist ein optionaler lokaler Sprachgenerator, den NOVA verwenden kann.

Abschnitt 10 von 1414.10

Ollama in NOVA

Warum wir Ollama in NOVA einbauen

MiniNovaLM ist unser eigenes kleines Sprachmodell. Es ist didaktisch extrem wichtig, weil wir daran verstehen, wie Tokenisierung, Sequenzen, Training, Checkpoints und Generierung zusammenhängen. Aber MiniNovaLM ist bewusst klein und daher sprachlich noch begrenzt.

Ollama erlaubt NOVA, zusätzlich ein stärkeres lokales Sprachmodell als Generator zu verwenden. Dadurch kann NOVA aus gefundenen Quellen flüssigere und besser strukturierte Antworten erzeugen, ohne dass wir NOVAs eigene Architektur aufgeben.

Die saubere Idee ist also nicht: „Ollama ersetzt NOVA“. Die saubere Idee ist: „NOVA nutzt Ollama als optionalen Generator.“

Rollenverteilung in NOVA + Ollama

Frage

Der User stellt eine Frage an NOVA.

Retrieval

NOVA sucht passende Quellen im Wissensspeicher.

Kontext

NOVA baut aus Frage und Quellen einen Prompt-Kontext.

Generator

Ollama formuliert aus diesem Kontext eine Antwort.

Prüfung

NOVA zeigt Antwort, Quellen und Modus sichtbar an.

Was bei einer Frage passiert

Wenn du im RAG-Labor eine Frage stellst, passiert didaktisch betrachtet eine Kette aus mehreren Schritten. Diese Kette ist wichtiger als die reine Antwort am Ende.

Ablauf

1. Der User stellt eine Frage.

2. NOVA bestimmt den passenden Wissensbereich.

3. NOVA sucht relevante Chunks im gemeinsamen und persönlichen Wissen.

4. NOVA baut aus Frage und Quellen einen Kontext.

5. Je nach Antwortmodus formuliert Classic, Ollama oder später MiniNovaLM die Antwort.

6. Die Antwort wird zusammen mit Quellen und Modus angezeigt.

Was Ollama verbessert

• flüssigere Sprache
• bessere Zusammenfassung längerer Quellen
• natürlichere Erklärungen
• bessere Strukturierung einer Antwort

Was Ollama nicht löst

• falsch gefundene Quellen
• fehlende Quellen im Kontext
• unklare Rollenbeschreibung im Prompt
• fehlende Fakten im Wissensspeicher

Warum Ollama manchmal trotzdem falsch antwortet

Wenn Ollama im RAG-Modus eine Frage falsch beantwortet, obwohl die Artikel im AI-Lab vorhanden sind, bedeutet das nicht automatisch, dass Ollama „dumm“ ist oder dass NOVA keine KI ist.

Wahrscheinlicher ist: Die passenden Chunks wurden nicht gefunden, nicht hoch genug bewertet oder nicht klar genug in den Prompt gelegt. Ein RAG-System ist nur so gut wie die Kombination aus Wissensspeicher, Retriever, Prompt und Generator.

Checkpoint

Ollama macht NOVA sprachlich stärker. Aber NOVA bleibt die KI-Architektur: Memory, MiniNovaLM, RAG, Safety, Wissensspeicher und Antwortsteuerung.

NOVA wird geladen...

NOVA Energie-Log

RTX-Verbrauch

NOVA schätzt hier, wie viel GPU-Energie deine Bildanalyse- und CUDA-Läufe bisher ungefähr verbraucht haben.

Lade Energie-Daten...