RAG & Wissensspeicher

In diesem Kapitel geht es darum, wie NOVA Wissen nutzen kann, ohne jedes Detail in Modellgewichte trainieren zu müssen. Dabei klären wir auch die wichtige Rollenverteilung: NOVA ist ein KI-System. MiniNovaLM ist ihr eigenes trainierbares Modell. RAG ist ihr Wissenszugriff. Ollama ist ein optionaler lokaler Sprachgenerator, den NOVA verwenden kann.

Abschnitt 7 von 1414.7

Kontextfenster & Prompt

Gefundene Quellen müssen sinnvoll eingesetzt werden

Retrieval allein reicht nicht. Die gefundenen Chunks müssen so in einen Prompt eingebaut werden, dass der Antwortgenerator sie sinnvoll nutzen kann.

Dabei gibt es eine Grenze: das Kontextfenster. Es ist der Platz, den ein Modell gleichzeitig betrachten kann. Wenn zu viele Quellen eingefügt werden, wird der Prompt lang, unübersichtlich und schlechter steuerbar.

Prompt-Aufbau

Regeln + gefundene Quellen + Frage

Ein guter RAG-Prompt gibt dem Generator klare Quellen und klare Antwortregeln.

Zu wenig Kontext

• wichtige Informationen fehlen
• Antwort bleibt allgemein
• Generator muss eher raten

Zu viel Kontext

• irrelevante Informationen stören
• Prompt wird unübersichtlich
• Antwort verliert Fokus

Checkpoint

RAG ist Suche plus Kontextgestaltung. Die Qualität des Prompts entscheidet mit über die Qualität der Antwort.

NOVA wird geladen...

NOVA Energie-Log

RTX-Verbrauch

NOVA schätzt hier, wie viel GPU-Energie deine Bildanalyse- und CUDA-Läufe bisher ungefähr verbraucht haben.

Lade Energie-Daten...