RAG & Wissensspeicher

In diesem Kapitel geht es darum, wie NOVA Wissen nutzen kann, ohne jedes Detail in Modellgewichte trainieren zu müssen. Dabei klären wir auch die wichtige Rollenverteilung: NOVA ist ein KI-System. MiniNovaLM ist ihr eigenes trainierbares Modell. RAG ist ihr Wissenszugriff. Ollama ist ein optionaler lokaler Sprachgenerator, den NOVA verwenden kann.

Abschnitt 3 von 1414.3

Chunking

Warum Wissen in Abschnitte zerlegt wird

Dokumente sind oft zu groß, um sie vollständig in eine Antwort zu legen. Außerdem enthält ein Dokument viele Abschnitte, die für eine konkrete Frage gar nicht relevant sind.

Deshalb zerlegt ein RAG-System Dokumente in kleinere Einheiten. Diese Einheiten nennt man Chunks. Ein Chunk soll genug Zusammenhang enthalten, aber klein genug sein, damit NOVA ihn gezielt finden und verwenden kann.

Dokument in Chunks

Dokument = Chunk 1 + Chunk 2 + Chunk 3 + ...

Die Suche arbeitet später mit einzelnen Abschnitten statt mit dem gesamten Dokument.

Zu kleine Chunks

• enthalten zu wenig Zusammenhang
• einzelne Sätze wirken isoliert
• Antworten werden lückenhaft
• mehr Treffer sind nötig

Zu große Chunks

• enthalten zu viele Nebenthemen
• verbrauchen viel Kontextplatz
• erschweren präzise Suche
• Antworten werden unscharf

Beispiel

Ein Kurskapitel wird nicht als ein riesiger Text gespeichert.

Es wird in sinnvolle Abschnitte zerlegt.

Jeder Abschnitt bekommt Metadaten wie Titel, Quelle und Position.

Bei einer Frage sucht NOVA nur die passendsten Abschnitte.

Checkpoint

Chunking entscheidet stark darüber, ob NOVA später die richtigen Quellen findet.

NOVA wird geladen...

NOVA Energie-Log

RTX-Verbrauch

NOVA schätzt hier, wie viel GPU-Energie deine Bildanalyse- und CUDA-Läufe bisher ungefähr verbraucht haben.

Lade Energie-Daten...