Kapitel 14
RAG & Wissensspeicher
In diesem Kapitel geht es darum, wie NOVA Wissen nutzen kann, ohne jedes Detail in Modellgewichte trainieren zu mßssen. Dabei klären wir auch die wichtige Rollenverteilung: NOVA ist ein KI-System. MiniNovaLM ist ihr eigenes trainierbares Modell. RAG ist ihr Wissenszugriff. Ollama ist ein optionaler lokaler Sprachgenerator, den NOVA verwenden kann.
Was ist Ollama?
Ollama ist ein lokaler Modell-Runner, nicht NOVA selbst
Ollama ist eine lokale Laufzeitumgebung fĂźr Sprachmodelle. Man kann sich Ollama wie einen Motor vorstellen, der ein bereits vorhandenes Sprachmodell auf deinem Rechner ausfĂźhrt. Dieses Modell kann Text verstehen, Text fortsetzen und Antworten formulieren.
Wichtig ist die Abgrenzung: Ollama ist nicht NOVAs Memory, nicht NOVAs RAG-Speicher, nicht NOVAs Fortschrittssystem und nicht MiniNovaLM. Ollama ist ein zusätzlicher lokaler Generator, den NOVA verwenden kann.
NOVA bleibt das Ăźbergeordnete KI-System. NOVA entscheidet, welcher Kontext gesucht wird, welche Quellen verwendet werden, welcher Antwortmodus aktiv ist und wie das Ergebnis im AI-Lab sichtbar gemacht wird.
NOVA
- ⢠ist unser KI-System im AI-Lab
- ⢠hat Zustand, Memory und Fortschritt
- ⢠besitzt MiniNovaLM als eigenes trainierbares Modell
- ⢠sucht Wissen ßber RAG
- ⢠orchestriert Antwortmodi
Ollama
- ⢠fßhrt lokale Sprachmodelle aus
- ⢠formuliert Antworten aus einem Prompt
- ⢠hat nicht automatisch NOVAs Zustand
- ⢠hat nicht automatisch Zugriff auf alle Quellen
- ⢠ist ein austauschbarer Generator
Motor-Vergleich
Warum Ollama trotzdem Quellen braucht
Auch wenn Ollama ein starkes Sprachmodell ausfĂźhren kann, kennt es nicht automatisch den aktuellen Zustand deines AI-Lab-Projekts. Es weiĂ nicht automatisch, welche Kurskapitel importiert wurden, welche Dateien du hochgeladen hast oder wie NOVA aktuell aufgebaut ist.
Im RAG-Modus bekommt Ollama deshalb nicht einfach nur die User-Frage. NOVA sucht zuerst Quellen, baut daraus einen Kontext und gibt diesen Kontext an den Generator weiter. Wenn die passenden Quellen nicht im Kontext landen, kann auch ein guter Generator eine unpassende Antwort geben.
Checkpoint
Ollama ist nicht âdie NOVAâ. Ollama ist ein lokaler Sprachgenerator, den NOVA nutzen kann. NOVA bleibt das KI-System, das Wissen sucht, Zustand hält und die Antwort steuert.
NOVA Energie-Log
RTX-Verbrauch
NOVA schätzt hier, wie viel GPU-Energie deine Bildanalyse- und CUDA-Läufe bisher ungefähr verbraucht haben.
Lade Energie-Daten...