In der KI bezeichnet ein Agent ein System, das Informationen aufnimmt, verarbeitet und daraus eine Ausgabe oder Aktion erzeugt. Das kann ein Programm sein, ein Spam-Filter, ein Chatbot, ein Roboter oder ein ganzes KI-System wie NOVA. Agenten sind deshalb ein zentrales Denkmodell, um KI nicht nur als Modell, sondern als handelndes System zu verstehen.

Grundidee

Ein Agent verbindet Wahrnehmung, Verarbeitung und Handlung

Ganz allgemein kann man einen Agenten als System betrachten, das aus einer Eingabe eine Ausgabe erzeugt. Diese Sicht ist bewusst breit. Ein Taschenrechner, ein Spam-Filter, ein Chatbot und ein Roboter können alle als Agenten beschrieben werden, obwohl sie sehr unterschiedlich komplex sind.

In der KI interessiert uns besonders, wie ein Agent seine Eingaben interpretiert, welche Informationen er speichert, welche Ziele er verfolgt und wie er entscheidet, welche Aktion als Nächstes sinnvoll ist.

Bei einfachen Software-Agenten ist die Welt oft nur ein digitaler Eingabestrom: Text, Mausklicks, Dateien oder API-Anfragen. Bei Hardware-Agenten kommt eine echte Umgebung hinzu. Ein Roboter muss mit Sensoren wahrnehmen und mit Motoren, Greifern oder anderen Aktuatoren handeln.

Agenten-Schema: Wahrnehmung / Eingabe → Verarbeitung / Entscheidung → Ausgabe / Aktion → eventuell Veränderung der Umgebung

Zwischenfrage

NOVA fragt: Ist NOVA eher ein einzelnes Modell oder ein Agent?

NOVA ist aktuell noch kein vollständiges Agentensystem. Sie ist ein lokales KI-System mit mehreren Agenten-Bausteinen: Eingaben, Speicher, RAG, Modelle, Regeln und Antworten. Den echten Agenten-Orchestrator bauen wir später.

Zwei Grundformen

Software-Agenten und Hardware-Agenten

Der Unterschied liegt vor allem darin, ob der Agent nur in einer digitalen Umgebung arbeitet oder zusätzlich physische Sensoren und Aktuatoren besitzt.

Software-Agent

digital

Ein Software-Agent ist ein Programm, das Eingaben verarbeitet und Ausgaben erzeugt. Er muss keine echte physische Welt wahrnehmen.

Spam-FilterSuchmaschineChatbotEmpfehlungssystemNOVA im Browser oder Telegram

Hardware-Agent

physisch

Ein Hardware-Agent besitzt Sensoren und Aktuatoren. Er kann seine Umgebung wahrnehmen und durch Aktionen verändern.

autonomer RoboterStaubsaugerroboterselbstfahrendes AutoDrohneRoboterarm

Animiertes Denkbild

Vom Software-Agenten zum Roboter-Agenten

Ein Software-Agent verarbeitet digitale Eingaben. Ein Hardware-Agent ist zusätzlich mit der Welt verbunden: Sensoren liefern Wahrnehmungen, Aktuatoren führen Aktionen aus und verändern die Umgebung.

Mini-Check

NOVA fragt: Warum reicht bei einem Roboter ein normales Programm allein nicht aus?

Weil ein Roboter in einer veränderlichen Umgebung handelt. Er braucht Sensoren, Zustände, Ziele und oft Gedächtnis.

Intelligenz-Stufen

Reflex-Agenten, Gedächtnis-Agenten und zielorientierte Agenten

Agenten lassen sich danach unterscheiden, wie viel Information sie für ihre Entscheidung verwenden. Ein sehr einfacher Agent reagiert nur auf die aktuelle Eingabe. Ein stärkerer Agent speichert frühere Zustände. Ein zielorientierter Agent betrachtet zusätzlich, welchen Zustand er erreichen soll.

Ein fahrender Roboter zeigt, warum Gedächtnis wichtig ist. Wenn er nur seinen aktuellen Ort kennt, weiß er noch nicht, wie schnell er fährt. Speichert er aber seinen vorherigen Ort und die vergangene Zeit, kann er aus der Ortsänderung seine Geschwindigkeit berechnen.

Reflex-Agent

Reagiert direkt auf die aktuelle Eingabe. Beispiel: Wenn Sensor dunkel, dann Licht einschalten.

Agent mit Gedächtnis

Speichert frühere Wahrnehmungen und kann daraus Zustände ableiten, die aktuell nicht direkt sichtbar sind.

Zielorientierter Agent

Wählt Aktionen abhängig davon, welches Ziel erreicht werden soll. Beispiel: Route zu Raum 179 statt Raum 105.

Reflex-Agent: aktuelle Eingabe → Aktion Gedächtnis-Agent: aktuelle Eingabe + gespeicherte Vergangenheit → Aktion Zielorientierter Agent: Zustand + Ziel → passende Aktion

Zwischenfrage

NOVA fragt: Warum ist NOVA ohne Gedächtnis weniger nützlich?

Ohne Gedächtnis kann NOVA nur auf den aktuellen Prompt reagieren. Mit Gedächtnis kann sie Fortschritt, Missionen, User-Kontext und frühere Zustände berücksichtigen.

Kosten und Nutzen

Nicht jeder Fehler ist gleich schlimm

Ein zielorientierter Agent versucht, sein Ziel zu erreichen. Aber in vielen echten Aufgaben reicht das nicht. Man muss auch betrachten, wie schlimm unterschiedliche Fehler sind. Ein Agent kann zwar insgesamt weniger Fehler machen, aber trotzdem schlechter sein, wenn seine wenigen Fehler sehr teuer sind.

Das klassische Beispiel ist ein Spam-Filter. Wenn eine Spam-Mail im Posteingang landet, ist das nervig. Wenn aber eine wichtige echte E-Mail fälschlich gelöscht wird, kann das viel schlimmer sein.

Deshalb unterscheidet man kostenorientierte und nutzenorientierte Agenten. Ein kostenorientierter Agent soll langfristig die Kosten seiner Fehlentscheidungen minimieren. Ein nutzenorientierter Agent soll langfristig den Nutzen seiner Entscheidungen maximieren.

Beispiel: Spam-Filter

Weniger Fehler ist nicht automatisch besser

Agent 1 macht insgesamt nur 12 Fehler. Agent 2 macht 38 Fehler. Aber Agent 1 löscht 11 echte E-Mails als Spam. Diese Fehler können viel teurer sein.

Kosten zählen, nicht nur Fehlerzahl.

Agent 1

Nur 12 Fehler, aber 11 wichtige E-Mails gehen verloren.

Echt

Spam

lässt durch

189

korrekt

Spam bleibt

löscht

echte Mail weg

799

korrekt

Agent 2

38 Fehler, aber keine echte E-Mail wird gelöscht.

Echt

Spam

lässt durch

200

korrekt

Spam bleibt

löscht

nichts verloren

762

korrekt

NOVA rechnet nach

NOVA fragt: Welcher Spam-Filter ist besser: der mit weniger Fehlern oder der mit weniger schlimmen Fehlern?

In echten Systemen zählt nicht nur die Anzahl der Fehler. Entscheidend sind oft die Kosten der jeweiligen Fehlerart.

Lernen

Lernfähige Agenten verbessern ihr Verhalten durch Erfahrung

Für die KI sind lernfähige Agenten besonders interessant. Sie können Trainingsbeispiele, erfolgreiche Aktionen oder positives und negatives Feedback nutzen, um ihr Verhalten zu verändern.

Ziel ist nicht nur, einmal eine richtige Aktion zu wählen. Ziel ist, über viele Situationen hinweg besser zu werden. Der mittlere Nutzen der Aktionen soll steigen oder die mittleren Kosten sollen sinken.

Viele moderne KI-Verfahren passen genau in dieses Bild: Klassifikation lernt aus Beispielen und Reinforcement Learning lernt aus Belohnung und Bestrafung. NOVA nutzt aktuell schon mehrere KI-Bausteine wie Status, Speicher, Trainingsläufe und RAG-Wissen. Ein echter lernfähiger Agent, der selbstständig Ziele verfolgt und Aktionen plant, wird später als eigener Ausbauschritt entwickelt.

Trainingsbeispiele

Der Agent sieht Beispiele mit gewünschten Antworten und passt seine Parameter an.

Feedback

Der Agent bekommt positives oder negatives Signal und verändert sein Verhalten entsprechend.

Langfristiger Nutzen

Der Agent soll nicht nur einmal gut reagieren, sondern im Mittel bessere Entscheidungen treffen.

Umgebung

Agenten hängen stark von ihrer Umgebung ab

Beim Entwurf eines Agenten muss man seine Umgebung verstehen. Weiß der Agent alles? Ist die Welt vorhersagbar? Gibt es endlich viele Zustände oder unendlich viele Möglichkeiten? Diese Eigenschaften entscheiden, wie schwer die Aufgabe ist.

vollständig beobachtbar

Der Agent kennt den kompletten relevanten Zustand der Welt. Beispiel: ein einfaches Brettspiel mit sichtbarem Spielbrett.

teilweise beobachtbar

Der Agent sieht nur einen Ausschnitt oder unsichere Signale. Beispiel: ein Roboter mit begrenzten Sensoren.

deterministisch

Eine Aktion führt im gleichen Zustand immer zum gleichen Ergebnis. Das macht Planung deutlich einfacher.

nichtdeterministisch

Eine Aktion kann unterschiedliche Folgen haben. Der Agent muss mit Unsicherheit umgehen.

diskret

Es gibt endlich oder klar abzählbar viele Zustände und Aktionen. Beispiel: Schachzüge.

stetig

Zustände oder Aktionen können kontinuierliche Werte annehmen. Beispiel: Geschwindigkeit, Position, Winkel.

Zwischenfrage

NOVA fragt: Ist die echte Welt für Roboter eher vollständig beobachtbar oder teilweise beobachtbar?

Meist nur teilweise beobachtbar: Sensoren sind begrenzt, verrauscht und zeigen nie die ganze Welt perfekt.

Verteilte Agenten

Manchmal entsteht Intelligenz erst durch Zusammenarbeit

Nicht immer sitzt die Intelligenz in einem einzelnen Agenten. Verteilte Agentensysteme bestehen aus mehreren Agenten, die jeweils eigene Informationen, Ziele oder Aufgaben haben und zusammen ein größeres Verhalten erzeugen.

Beispiele sind Schwarmrobotik, Multiagentensysteme, verteilte Planung oder ein KI-System, in dem verschiedene spezialisierte Module zusammenarbeiten. NOVA ist dafür vorbereitet, aber aktuell noch kein vollständig autonomes Multiagentensystem. Später kann ein Orchestrator Vision, RAG, Mini-LLM, Speicher, Missionen und externe Schnittstellen gezielt verbinden.

Einzelner Agent: ein System entscheidet allein Verteilte Agenten: mehrere Systeme kooperieren → gemeinsames Verhalten

Ausblick

Vom Agenten zum wissensbasierten System

Für sehr einfache Agenten reicht die Sicht „Eingabe → Aktion“ aus. Bei komplexeren Anwendungen wird das Programmieren aber schnell unübersichtlich. Dann ist es sinnvoll, Wissen und Verarbeitung zu trennen.

In klassischen wissensbasierten Systemen liegt Wissen in einer Wissensbasis. Ein Inferenzmechanismus nutzt dieses Wissen, um Fragen zu beantworten, Schlüsse zu ziehen oder Pläne zu erstellen. Diese Idee ist auch für moderne Systeme wichtig: Wissen, Suche, Schlussfolgern und Lernen sind verschiedene Bausteine.

Für NOVA bedeutet das: Nicht jedes Wissen muss im Modellgewicht stecken. Wissen kann auch in RAG, Datenbanken, Dokumenten, Memory oder Regeln liegen. Aktuell werden diese Quellen noch durch klare Backend-Logik und feste Workflows genutzt. Später kann ein Agenten-Orchestrator entscheiden, wann welche Quelle sinnvoll ist.

NOVA-Kompass

NOVA als Vorstufe zu einem Agentensystem verstehen

NOVA ist nicht nur ein Chatfenster. NOVA nimmt Eingaben entgegen, schaut in Speicher, kann RAG-Wissen abrufen, Vision-Modelle nutzen, Trainingszustände anzeigen und Antworten erzeugen. Fachlich sauberer ist aber: NOVA ist aktuell noch kein vollständig autonomer Agent. Sie ist ein lokales KI-System mit mehreren Bausteinen, aus denen später ein Agentensystem entstehen kann.

Manche Teile von NOVA sind reflex-artig: Wenn ein Status abgefragt wird, antwortet das System direkt. Manche Teile nutzen Gedächtnis: Missionen, Fortschritt und User-Kontext. Manche Teile unterstützen ein Ziel: dir beim Lernen zu helfen. Was noch fehlt, ist die autonome Agenten-Schicht: NOVA plant noch nicht selbstständig mehrere Schritte, wählt nicht eigenständig Werkzeuge aus und prüft noch nicht autonom Zwischenergebnisse. Genau das bauen wir später.

NOVA als Software-Agent

Im Browser, Backend oder Telegram verarbeitet NOVA digitale Eingaben und erzeugt Antworten.

NOVA mit Gedächtnis

NOVA kann Zustand, Missionen, Fortschritt, Wissen und frühere Interaktionen berücksichtigen.

NOVA mit Zielrichtung

NOVA ist auf nützliches Lernen, klare Erklärung und prüfbaren Fortschritt ausgerichtet. Eine echte autonome Zielplanung kommt später.

NOVA als modulares System

RAG, Vision, MiniNovaLM, Memory, Backend, Frontend und Sicherheitslogik sind getrennte Bausteine. Ein Agenten-Orchestrator kann später darüber gelegt werden.

Merksätze

Was du aus Kapitel 1.4 mitnehmen sollst

Agenten verarbeiten Eingaben zu Ausgaben oder Aktionen

Das Agentenmodell hilft, KI-Systeme als handelnde Systeme zu verstehen.

Hardware-Agenten haben Sensoren und Aktuatoren

Sie nehmen die Welt wahr und verändern sie durch Aktionen.

Gedächtnis macht Agenten stärker

Frühere Wahrnehmungen können für aktuelle Entscheidungen entscheidend sein.

Ziele, Kosten und Nutzen verändern Entscheidungen

Ein Agent soll nicht nur reagieren, sondern sinnvolle Ziele erreichen und Fehlerkosten beachten.

NOVA ist eine Agenten-Vorstufe

NOVA verbindet bereits Eingaben, Speicher, RAG, Modelle, Regeln, Training und Antworten. Die autonome Agenten-Schicht bauen wir später.

Kapitel-Check

Checkerfragen zu Kapitel 1.4

Kreuze die Aussagen an, die richtig sind. Wenn du alle korrekt hast, freut sich NOVA und klatscht kurz für dich.

Ergebnis: noch offen

Ein Agent ist allgemein ein System, das Informationen verarbeitet und aus Eingaben Ausgaben oder Aktionen erzeugt.

Ein Software-Agent besitzt immer physische Sensoren und Aktuatoren.

Ein Hardware-Agent kann mit Sensoren seine Umgebung wahrnehmen und mit Aktuatoren auf sie einwirken.

Ein Reflex-Agent entscheidet nur auf Basis der aktuellen Eingabe oder Wahrnehmung.

Ein Agent mit Gedächtnis kann frühere Wahrnehmungen speichern und für spätere Entscheidungen nutzen.

Ein fahrender Roboter kann seine Geschwindigkeit aus einem einzigen Ortswert zuverlässig bestimmen.

Ein zielorientierter Agent wählt Aktionen abhängig davon, welches Ziel erreicht werden soll.

Ein kostenorientierter Agent berücksichtigt, dass nicht jeder Fehler gleich schlimm ist.

Ein lernfähiger Agent kann sich durch Trainingsbeispiele oder Feedback so verändern, dass seine Entscheidungen langfristig besser werden.

Eine Umgebung ist vollständig beobachtbar, wenn der Agent nur einen kleinen Teil der Welt kennt.

← Zurück zu 1.2 Geschichte Weiter: Wissensbasierte Systeme →

NOVA wird geladen...

NOVA Energie-Log

RTX-Verbrauch

NOVA schätzt hier, wie viel GPU-Energie deine Bildanalyse- und CUDA-Läufe bisher ungefähr verbraucht haben.

Lade Energie-Daten...

🤖 NOVA

Status, Fortschritt und Energieverbrauch.

NOVA wird geladen...

NOVA Energie-Log

RTX-Verbrauch

NOVA schätzt hier, wie viel GPU-Energie deine Bildanalyse- und CUDA-Läufe bisher ungefähr verbraucht haben.

Lade Energie-Daten...