RAG & Wissensspeicher

In diesem Kapitel geht es darum, wie NOVA Wissen nutzen kann, ohne jedes Detail in Modellgewichte trainieren zu müssen. Dabei klären wir auch die wichtige Rollenverteilung: NOVA ist ein KI-System. MiniNovaLM ist ihr eigenes trainierbares Modell. RAG ist ihr Wissenszugriff. Ollama ist ein optionaler lokaler Sprachgenerator, den NOVA verwenden kann.

Abschnitt 9 von 1414.9

Was ist Ollama?

Ollama ist ein lokaler Modell-Runner, nicht NOVA selbst

Ollama ist eine lokale Laufzeitumgebung für Sprachmodelle. Man kann sich Ollama wie einen Motor vorstellen, der ein bereits vorhandenes Sprachmodell auf deinem Rechner ausführt. Dieses Modell kann Text verstehen, Text fortsetzen und Antworten formulieren.

Wichtig ist die Abgrenzung: Ollama ist nicht NOVAs Memory, nicht NOVAs RAG-Speicher, nicht NOVAs Fortschrittssystem und nicht MiniNovaLM. Ollama ist ein zusätzlicher lokaler Generator, den NOVA verwenden kann.

NOVA bleibt das übergeordnete KI-System. NOVA entscheidet, welcher Kontext gesucht wird, welche Quellen verwendet werden, welcher Antwortmodus aktiv ist und wie das Ergebnis im AI-Lab sichtbar gemacht wird.

NOVA

• ist unser KI-System im AI-Lab
• hat Zustand, Memory und Fortschritt
• besitzt MiniNovaLM als eigenes trainierbares Modell
• sucht Wissen über RAG
• orchestriert Antwortmodi

Ollama

• führt lokale Sprachmodelle aus
• formuliert Antworten aus einem Prompt
• hat nicht automatisch NOVAs Zustand
• hat nicht automatisch Zugriff auf alle Quellen
• ist ein austauschbarer Generator

Motor-Vergleich

NOVA ist das Fahrzeug: Steuerung, Anzeige, Speicher, Logik, Lernstand und Route.

MiniNovaLM ist NOVAs eigener kleiner Motor, den wir selbst gebaut und trainiert haben.

Ollama ist ein stärkerer zusätzlicher Motor, den NOVA bei Bedarf verwenden kann.

RAG ist das Navigationssystem: Es sucht passende Informationen für die aktuelle Frage.

Warum Ollama trotzdem Quellen braucht

Auch wenn Ollama ein starkes Sprachmodell ausführen kann, kennt es nicht automatisch den aktuellen Zustand deines AI-Lab-Projekts. Es weiß nicht automatisch, welche Kurskapitel importiert wurden, welche Dateien du hochgeladen hast oder wie NOVA aktuell aufgebaut ist.

Im RAG-Modus bekommt Ollama deshalb nicht einfach nur die User-Frage. NOVA sucht zuerst Quellen, baut daraus einen Kontext und gibt diesen Kontext an den Generator weiter. Wenn die passenden Quellen nicht im Kontext landen, kann auch ein guter Generator eine unpassende Antwort geben.

Checkpoint

Ollama ist nicht „die NOVA“. Ollama ist ein lokaler Sprachgenerator, den NOVA nutzen kann. NOVA bleibt das KI-System, das Wissen sucht, Zustand hält und die Antwort steuert.

NOVA wird geladen...

NOVA Energie-Log

RTX-Verbrauch

NOVA schätzt hier, wie viel GPU-Energie deine Bildanalyse- und CUDA-Läufe bisher ungefähr verbraucht haben.

Lade Energie-Daten...