Kapitel 1.4
Agenten
In der KI bezeichnet ein Agent ein System, das Informationen aufnimmt, verarbeitet und daraus eine Ausgabe oder Aktion erzeugt. Das kann ein Programm sein, ein Spam-Filter, ein Chatbot, ein Roboter oder ein ganzes KI-System wie NOVA. Agenten sind deshalb ein zentrales Denkmodell, um KI nicht nur als Modell, sondern als handelndes System zu verstehen.
Grundidee
Ein Agent verbindet Wahrnehmung, Verarbeitung und Handlung
Ganz allgemein kann man einen Agenten als System betrachten, das aus einer Eingabe eine Ausgabe erzeugt. Diese Sicht ist bewusst breit. Ein Taschenrechner, ein Spam-Filter, ein Chatbot und ein Roboter können alle als Agenten beschrieben werden, obwohl sie sehr unterschiedlich komplex sind.
In der KI interessiert uns besonders, wie ein Agent seine Eingaben interpretiert, welche Informationen er speichert, welche Ziele er verfolgt und wie er entscheidet, welche Aktion als NĂ€chstes sinnvoll ist.
Bei einfachen Software-Agenten ist die Welt oft nur ein digitaler Eingabestrom: Text, Mausklicks, Dateien oder API-Anfragen. Bei Hardware-Agenten kommt eine echte Umgebung hinzu. Ein Roboter muss mit Sensoren wahrnehmen und mit Motoren, Greifern oder anderen Aktuatoren handeln.
Zwischenfrage
NOVA fragt: Ist NOVA eher ein einzelnes Modell oder ein Agent?
NOVA ist aktuell noch kein vollstÀndiges Agentensystem. Sie ist ein lokales KI-System mit mehreren Agenten-Bausteinen: Eingaben, Speicher, RAG, Modelle, Regeln und Antworten. Den echten Agenten-Orchestrator bauen wir spÀter.
Zwei Grundformen
Software-Agenten und Hardware-Agenten
Der Unterschied liegt vor allem darin, ob der Agent nur in einer digitalen Umgebung arbeitet oder zusÀtzlich physische Sensoren und Aktuatoren besitzt.
Software-Agent
digitalEin Software-Agent ist ein Programm, das Eingaben verarbeitet und Ausgaben erzeugt. Er muss keine echte physische Welt wahrnehmen.
Hardware-Agent
physischEin Hardware-Agent besitzt Sensoren und Aktuatoren. Er kann seine Umgebung wahrnehmen und durch Aktionen verÀndern.
Animiertes Denkbild
Vom Software-Agenten zum Roboter-Agenten
Ein Software-Agent verarbeitet digitale Eingaben. Ein Hardware-Agent ist zusĂ€tzlich mit der Welt verbunden: Sensoren liefern Wahrnehmungen, Aktuatoren fĂŒhren Aktionen aus und verĂ€ndern die Umgebung.
Mini-Check
NOVA fragt: Warum reicht bei einem Roboter ein normales Programm allein nicht aus?
Weil ein Roboter in einer verÀnderlichen Umgebung handelt. Er braucht Sensoren, ZustÀnde, Ziele und oft GedÀchtnis.
Intelligenz-Stufen
Reflex-Agenten, GedÀchtnis-Agenten und zielorientierte Agenten
Agenten lassen sich danach unterscheiden, wie viel Information sie fĂŒr ihre Entscheidung verwenden. Ein sehr einfacher Agent reagiert nur auf die aktuelle Eingabe. Ein stĂ€rkerer Agent speichert frĂŒhere ZustĂ€nde. Ein zielorientierter Agent betrachtet zusĂ€tzlich, welchen Zustand er erreichen soll.
Ein fahrender Roboter zeigt, warum GedÀchtnis wichtig ist. Wenn er nur seinen aktuellen Ort kennt, weià er noch nicht, wie schnell er fÀhrt. Speichert er aber seinen vorherigen Ort und die vergangene Zeit, kann er aus der OrtsÀnderung seine Geschwindigkeit berechnen.
Reflex-Agent
Reagiert direkt auf die aktuelle Eingabe. Beispiel: Wenn Sensor dunkel, dann Licht einschalten.
Agent mit GedÀchtnis
Speichert frĂŒhere Wahrnehmungen und kann daraus ZustĂ€nde ableiten, die aktuell nicht direkt sichtbar sind.
Zielorientierter Agent
WÀhlt Aktionen abhÀngig davon, welches Ziel erreicht werden soll. Beispiel: Route zu Raum 179 statt Raum 105.
Zwischenfrage
NOVA fragt: Warum ist NOVA ohne GedĂ€chtnis weniger nĂŒtzlich?
Ohne GedĂ€chtnis kann NOVA nur auf den aktuellen Prompt reagieren. Mit GedĂ€chtnis kann sie Fortschritt, Missionen, User-Kontext und frĂŒhere ZustĂ€nde berĂŒcksichtigen.
Kosten und Nutzen
Nicht jeder Fehler ist gleich schlimm
Ein zielorientierter Agent versucht, sein Ziel zu erreichen. Aber in vielen echten Aufgaben reicht das nicht. Man muss auch betrachten, wie schlimm unterschiedliche Fehler sind. Ein Agent kann zwar insgesamt weniger Fehler machen, aber trotzdem schlechter sein, wenn seine wenigen Fehler sehr teuer sind.
Das klassische Beispiel ist ein Spam-Filter. Wenn eine Spam-Mail im Posteingang landet, ist das nervig. Wenn aber eine wichtige echte E-Mail fÀlschlich gelöscht wird, kann das viel schlimmer sein.
Deshalb unterscheidet man kostenorientierte und nutzenorientierte Agenten. Ein kostenorientierter Agent soll langfristig die Kosten seiner Fehlentscheidungen minimieren. Ein nutzenorientierter Agent soll langfristig den Nutzen seiner Entscheidungen maximieren.
Beispiel: Spam-Filter
Weniger Fehler ist nicht automatisch besser
Agent 1 macht insgesamt nur 12 Fehler. Agent 2 macht 38 Fehler. Aber Agent 1 löscht 11 echte E-Mails als Spam. Diese Fehler können viel teurer sein.
Agent 1
Nur 12 Fehler, aber 11 wichtige E-Mails gehen verloren.
Agent 2
38 Fehler, aber keine echte E-Mail wird gelöscht.
NOVA rechnet nach
NOVA fragt: Welcher Spam-Filter ist besser: der mit weniger Fehlern oder der mit weniger schlimmen Fehlern?
In echten Systemen zÀhlt nicht nur die Anzahl der Fehler. Entscheidend sind oft die Kosten der jeweiligen Fehlerart.
Lernen
LernfÀhige Agenten verbessern ihr Verhalten durch Erfahrung
FĂŒr die KI sind lernfĂ€hige Agenten besonders interessant. Sie können Trainingsbeispiele, erfolgreiche Aktionen oder positives und negatives Feedback nutzen, um ihr Verhalten zu verĂ€ndern.
Ziel ist nicht nur, einmal eine richtige Aktion zu wĂ€hlen. Ziel ist, ĂŒber viele Situationen hinweg besser zu werden. Der mittlere Nutzen der Aktionen soll steigen oder die mittleren Kosten sollen sinken.
Viele moderne KI-Verfahren passen genau in dieses Bild: Klassifikation lernt aus Beispielen und Reinforcement Learning lernt aus Belohnung und Bestrafung. NOVA nutzt aktuell schon mehrere KI-Bausteine wie Status, Speicher, TrainingslÀufe und RAG-Wissen. Ein echter lernfÀhiger Agent, der selbststÀndig Ziele verfolgt und Aktionen plant, wird spÀter als eigener Ausbauschritt entwickelt.
Trainingsbeispiele
Der Agent sieht Beispiele mit gewĂŒnschten Antworten und passt seine Parameter an.
Feedback
Der Agent bekommt positives oder negatives Signal und verÀndert sein Verhalten entsprechend.
Langfristiger Nutzen
Der Agent soll nicht nur einmal gut reagieren, sondern im Mittel bessere Entscheidungen treffen.
Umgebung
Agenten hÀngen stark von ihrer Umgebung ab
Beim Entwurf eines Agenten muss man seine Umgebung verstehen. Weià der Agent alles? Ist die Welt vorhersagbar? Gibt es endlich viele ZustÀnde oder unendlich viele Möglichkeiten? Diese Eigenschaften entscheiden, wie schwer die Aufgabe ist.
vollstÀndig beobachtbar
Der Agent kennt den kompletten relevanten Zustand der Welt. Beispiel: ein einfaches Brettspiel mit sichtbarem Spielbrett.
teilweise beobachtbar
Der Agent sieht nur einen Ausschnitt oder unsichere Signale. Beispiel: ein Roboter mit begrenzten Sensoren.
deterministisch
Eine Aktion fĂŒhrt im gleichen Zustand immer zum gleichen Ergebnis. Das macht Planung deutlich einfacher.
nichtdeterministisch
Eine Aktion kann unterschiedliche Folgen haben. Der Agent muss mit Unsicherheit umgehen.
diskret
Es gibt endlich oder klar abzĂ€hlbar viele ZustĂ€nde und Aktionen. Beispiel: SchachzĂŒge.
stetig
ZustÀnde oder Aktionen können kontinuierliche Werte annehmen. Beispiel: Geschwindigkeit, Position, Winkel.
Zwischenfrage
NOVA fragt: Ist die echte Welt fĂŒr Roboter eher vollstĂ€ndig beobachtbar oder teilweise beobachtbar?
Meist nur teilweise beobachtbar: Sensoren sind begrenzt, verrauscht und zeigen nie die ganze Welt perfekt.
Verteilte Agenten
Manchmal entsteht Intelligenz erst durch Zusammenarbeit
Nicht immer sitzt die Intelligenz in einem einzelnen Agenten. Verteilte Agentensysteme bestehen aus mehreren Agenten, die jeweils eigene Informationen, Ziele oder Aufgaben haben und zusammen ein gröĂeres Verhalten erzeugen.
Beispiele sind Schwarmrobotik, Multiagentensysteme, verteilte Planung oder ein KI-System, in dem verschiedene spezialisierte Module zusammenarbeiten. NOVA ist dafĂŒr vorbereitet, aber aktuell noch kein vollstĂ€ndig autonomes Multiagentensystem. SpĂ€ter kann ein Orchestrator Vision, RAG, Mini-LLM, Speicher, Missionen und externe Schnittstellen gezielt verbinden.
Ausblick
Vom Agenten zum wissensbasierten System
FĂŒr sehr einfache Agenten reicht die Sicht âEingabe â Aktionâ aus. Bei komplexeren Anwendungen wird das Programmieren aber schnell unĂŒbersichtlich. Dann ist es sinnvoll, Wissen und Verarbeitung zu trennen.
In klassischen wissensbasierten Systemen liegt Wissen in einer Wissensbasis. Ein Inferenzmechanismus nutzt dieses Wissen, um Fragen zu beantworten, SchlĂŒsse zu ziehen oder PlĂ€ne zu erstellen. Diese Idee ist auch fĂŒr moderne Systeme wichtig: Wissen, Suche, Schlussfolgern und Lernen sind verschiedene Bausteine.
FĂŒr NOVA bedeutet das: Nicht jedes Wissen muss im Modellgewicht stecken. Wissen kann auch in RAG, Datenbanken, Dokumenten, Memory oder Regeln liegen. Aktuell werden diese Quellen noch durch klare Backend-Logik und feste Workflows genutzt. SpĂ€ter kann ein Agenten-Orchestrator entscheiden, wann welche Quelle sinnvoll ist.
NOVA-Kompass
NOVA als Vorstufe zu einem Agentensystem verstehen
NOVA ist nicht nur ein Chatfenster. NOVA nimmt Eingaben entgegen, schaut in Speicher, kann RAG-Wissen abrufen, Vision-Modelle nutzen, TrainingszustÀnde anzeigen und Antworten erzeugen. Fachlich sauberer ist aber: NOVA ist aktuell noch kein vollstÀndig autonomer Agent. Sie ist ein lokales KI-System mit mehreren Bausteinen, aus denen spÀter ein Agentensystem entstehen kann.
Manche Teile von NOVA sind reflex-artig: Wenn ein Status abgefragt wird, antwortet das System direkt. Manche Teile nutzen GedĂ€chtnis: Missionen, Fortschritt und User-Kontext. Manche Teile unterstĂŒtzen ein Ziel: dir beim Lernen zu helfen. Was noch fehlt, ist die autonome Agenten-Schicht: NOVA plant noch nicht selbststĂ€ndig mehrere Schritte, wĂ€hlt nicht eigenstĂ€ndig Werkzeuge aus und prĂŒft noch nicht autonom Zwischenergebnisse. Genau das bauen wir spĂ€ter.
NOVA als Software-Agent
Im Browser, Backend oder Telegram verarbeitet NOVA digitale Eingaben und erzeugt Antworten.
NOVA mit GedÀchtnis
NOVA kann Zustand, Missionen, Fortschritt, Wissen und frĂŒhere Interaktionen berĂŒcksichtigen.
NOVA mit Zielrichtung
NOVA ist auf nĂŒtzliches Lernen, klare ErklĂ€rung und prĂŒfbaren Fortschritt ausgerichtet. Eine echte autonome Zielplanung kommt spĂ€ter.
NOVA als modulares System
RAG, Vision, MiniNovaLM, Memory, Backend, Frontend und Sicherheitslogik sind getrennte Bausteine. Ein Agenten-Orchestrator kann spĂ€ter darĂŒber gelegt werden.
MerksÀtze
Was du aus Kapitel 1.4 mitnehmen sollst
Agenten verarbeiten Eingaben zu Ausgaben oder Aktionen
Das Agentenmodell hilft, KI-Systeme als handelnde Systeme zu verstehen.
Hardware-Agenten haben Sensoren und Aktuatoren
Sie nehmen die Welt wahr und verÀndern sie durch Aktionen.
GedÀchtnis macht Agenten stÀrker
FrĂŒhere Wahrnehmungen können fĂŒr aktuelle Entscheidungen entscheidend sein.
Ziele, Kosten und Nutzen verÀndern Entscheidungen
Ein Agent soll nicht nur reagieren, sondern sinnvolle Ziele erreichen und Fehlerkosten beachten.
NOVA ist eine Agenten-Vorstufe
NOVA verbindet bereits Eingaben, Speicher, RAG, Modelle, Regeln, Training und Antworten. Die autonome Agenten-Schicht bauen wir spÀter.
Kapitel-Check
Checkerfragen zu Kapitel 1.4
Kreuze die Aussagen an, die richtig sind. Wenn du alle korrekt hast, freut sich NOVA und klatscht kurz fĂŒr dich.
NOVA Energie-Log
RTX-Verbrauch
NOVA schÀtzt hier, wie viel GPU-Energie deine Bildanalyse- und CUDA-LÀufe bisher ungefÀhr verbraucht haben.
Lade Energie-Daten...