🧠 AI-Lab

Account

Lade Account...

Kapitel 1.4

Agenten

In der KI bezeichnet ein Agent ein System, das Informationen aufnimmt, verarbeitet und daraus eine Ausgabe oder Aktion erzeugt. Das kann ein Programm sein, ein Spam-Filter, ein Chatbot, ein Roboter oder ein ganzes KI-System wie NOVA. Agenten sind deshalb ein zentrales Denkmodell, um KI nicht nur als Modell, sondern als handelndes System zu verstehen.

Grundidee

Ein Agent verbindet Wahrnehmung, Verarbeitung und Handlung

Ganz allgemein kann man einen Agenten als System betrachten, das aus einer Eingabe eine Ausgabe erzeugt. Diese Sicht ist bewusst breit. Ein Taschenrechner, ein Spam-Filter, ein Chatbot und ein Roboter können alle als Agenten beschrieben werden, obwohl sie sehr unterschiedlich komplex sind.

In der KI interessiert uns besonders, wie ein Agent seine Eingaben interpretiert, welche Informationen er speichert, welche Ziele er verfolgt und wie er entscheidet, welche Aktion als NĂ€chstes sinnvoll ist.

Bei einfachen Software-Agenten ist die Welt oft nur ein digitaler Eingabestrom: Text, Mausklicks, Dateien oder API-Anfragen. Bei Hardware-Agenten kommt eine echte Umgebung hinzu. Ein Roboter muss mit Sensoren wahrnehmen und mit Motoren, Greifern oder anderen Aktuatoren handeln.

Agenten-Schema: Wahrnehmung / Eingabe → Verarbeitung / Entscheidung → Ausgabe / Aktion → eventuell VerĂ€nderung der Umgebung

Zwischenfrage

NOVA fragt: Ist NOVA eher ein einzelnes Modell oder ein Agent?

NOVA ist aktuell noch kein vollstÀndiges Agentensystem. Sie ist ein lokales KI-System mit mehreren Agenten-Bausteinen: Eingaben, Speicher, RAG, Modelle, Regeln und Antworten. Den echten Agenten-Orchestrator bauen wir spÀter.

Zwei Grundformen

Software-Agenten und Hardware-Agenten

Der Unterschied liegt vor allem darin, ob der Agent nur in einer digitalen Umgebung arbeitet oder zusÀtzlich physische Sensoren und Aktuatoren besitzt.

Software-Agent

digital

Ein Software-Agent ist ein Programm, das Eingaben verarbeitet und Ausgaben erzeugt. Er muss keine echte physische Welt wahrnehmen.

Spam-FilterSuchmaschineChatbotEmpfehlungssystemNOVA im Browser oder Telegram

Hardware-Agent

physisch

Ein Hardware-Agent besitzt Sensoren und Aktuatoren. Er kann seine Umgebung wahrnehmen und durch Aktionen verÀndern.

autonomer RoboterStaubsaugerroboterselbstfahrendes AutoDrohneRoboterarm

Animiertes Denkbild

Vom Software-Agenten zum Roboter-Agenten

Ein Software-Agent verarbeitet digitale Eingaben. Ein Hardware-Agent ist zusĂ€tzlich mit der Welt verbunden: Sensoren liefern Wahrnehmungen, Aktuatoren fĂŒhren Aktionen aus und verĂ€ndern die Umgebung.

Software-AgentBenutzerEingabeProgrammAgentAusgabeAntwortHardware-AgentUmgebungRoboterSoftware-AgentSensorenAktuatoren

Mini-Check

NOVA fragt: Warum reicht bei einem Roboter ein normales Programm allein nicht aus?

Weil ein Roboter in einer verÀnderlichen Umgebung handelt. Er braucht Sensoren, ZustÀnde, Ziele und oft GedÀchtnis.

Intelligenz-Stufen

Reflex-Agenten, GedÀchtnis-Agenten und zielorientierte Agenten

Agenten lassen sich danach unterscheiden, wie viel Information sie fĂŒr ihre Entscheidung verwenden. Ein sehr einfacher Agent reagiert nur auf die aktuelle Eingabe. Ein stĂ€rkerer Agent speichert frĂŒhere ZustĂ€nde. Ein zielorientierter Agent betrachtet zusĂ€tzlich, welchen Zustand er erreichen soll.

Ein fahrender Roboter zeigt, warum GedĂ€chtnis wichtig ist. Wenn er nur seinen aktuellen Ort kennt, weiß er noch nicht, wie schnell er fĂ€hrt. Speichert er aber seinen vorherigen Ort und die vergangene Zeit, kann er aus der OrtsĂ€nderung seine Geschwindigkeit berechnen.

Reflex-Agent

Reagiert direkt auf die aktuelle Eingabe. Beispiel: Wenn Sensor dunkel, dann Licht einschalten.

Agent mit GedÀchtnis

Speichert frĂŒhere Wahrnehmungen und kann daraus ZustĂ€nde ableiten, die aktuell nicht direkt sichtbar sind.

Zielorientierter Agent

WÀhlt Aktionen abhÀngig davon, welches Ziel erreicht werden soll. Beispiel: Route zu Raum 179 statt Raum 105.

Reflex-Agent: aktuelle Eingabe → Aktion GedĂ€chtnis-Agent: aktuelle Eingabe + gespeicherte Vergangenheit → Aktion Zielorientierter Agent: Zustand + Ziel → passende Aktion

Zwischenfrage

NOVA fragt: Warum ist NOVA ohne GedĂ€chtnis weniger nĂŒtzlich?

Ohne GedĂ€chtnis kann NOVA nur auf den aktuellen Prompt reagieren. Mit GedĂ€chtnis kann sie Fortschritt, Missionen, User-Kontext und frĂŒhere ZustĂ€nde berĂŒcksichtigen.

Kosten und Nutzen

Nicht jeder Fehler ist gleich schlimm

Ein zielorientierter Agent versucht, sein Ziel zu erreichen. Aber in vielen echten Aufgaben reicht das nicht. Man muss auch betrachten, wie schlimm unterschiedliche Fehler sind. Ein Agent kann zwar insgesamt weniger Fehler machen, aber trotzdem schlechter sein, wenn seine wenigen Fehler sehr teuer sind.

Das klassische Beispiel ist ein Spam-Filter. Wenn eine Spam-Mail im Posteingang landet, ist das nervig. Wenn aber eine wichtige echte E-Mail fÀlschlich gelöscht wird, kann das viel schlimmer sein.

Deshalb unterscheidet man kostenorientierte und nutzenorientierte Agenten. Ein kostenorientierter Agent soll langfristig die Kosten seiner Fehlentscheidungen minimieren. Ein nutzenorientierter Agent soll langfristig den Nutzen seiner Entscheidungen maximieren.

Beispiel: Spam-Filter

Weniger Fehler ist nicht automatisch besser

Agent 1 macht insgesamt nur 12 Fehler. Agent 2 macht 38 Fehler. Aber Agent 1 löscht 11 echte E-Mails als Spam. Diese Fehler können viel teurer sein.

Kosten zÀhlen, nicht nur Fehlerzahl.

Agent 1

Nur 12 Fehler, aber 11 wichtige E-Mails gehen verloren.

Echt
Spam
lÀsst durch
189
korrekt
1
Spam bleibt
löscht
11
echte Mail weg
799
korrekt

Agent 2

38 Fehler, aber keine echte E-Mail wird gelöscht.

Echt
Spam
lÀsst durch
200
korrekt
38
Spam bleibt
löscht
0
nichts verloren
762
korrekt

NOVA rechnet nach

NOVA fragt: Welcher Spam-Filter ist besser: der mit weniger Fehlern oder der mit weniger schlimmen Fehlern?

In echten Systemen zÀhlt nicht nur die Anzahl der Fehler. Entscheidend sind oft die Kosten der jeweiligen Fehlerart.

Lernen

LernfÀhige Agenten verbessern ihr Verhalten durch Erfahrung

FĂŒr die KI sind lernfĂ€hige Agenten besonders interessant. Sie können Trainingsbeispiele, erfolgreiche Aktionen oder positives und negatives Feedback nutzen, um ihr Verhalten zu verĂ€ndern.

Ziel ist nicht nur, einmal eine richtige Aktion zu wĂ€hlen. Ziel ist, ĂŒber viele Situationen hinweg besser zu werden. Der mittlere Nutzen der Aktionen soll steigen oder die mittleren Kosten sollen sinken.

Viele moderne KI-Verfahren passen genau in dieses Bild: Klassifikation lernt aus Beispielen und Reinforcement Learning lernt aus Belohnung und Bestrafung. NOVA nutzt aktuell schon mehrere KI-Bausteine wie Status, Speicher, TrainingslÀufe und RAG-Wissen. Ein echter lernfÀhiger Agent, der selbststÀndig Ziele verfolgt und Aktionen plant, wird spÀter als eigener Ausbauschritt entwickelt.

Trainingsbeispiele

Der Agent sieht Beispiele mit gewĂŒnschten Antworten und passt seine Parameter an.

Feedback

Der Agent bekommt positives oder negatives Signal und verÀndert sein Verhalten entsprechend.

Langfristiger Nutzen

Der Agent soll nicht nur einmal gut reagieren, sondern im Mittel bessere Entscheidungen treffen.

Umgebung

Agenten hÀngen stark von ihrer Umgebung ab

Beim Entwurf eines Agenten muss man seine Umgebung verstehen. Weiß der Agent alles? Ist die Welt vorhersagbar? Gibt es endlich viele ZustĂ€nde oder unendlich viele Möglichkeiten? Diese Eigenschaften entscheiden, wie schwer die Aufgabe ist.

vollstÀndig beobachtbar

Der Agent kennt den kompletten relevanten Zustand der Welt. Beispiel: ein einfaches Brettspiel mit sichtbarem Spielbrett.

teilweise beobachtbar

Der Agent sieht nur einen Ausschnitt oder unsichere Signale. Beispiel: ein Roboter mit begrenzten Sensoren.

deterministisch

Eine Aktion fĂŒhrt im gleichen Zustand immer zum gleichen Ergebnis. Das macht Planung deutlich einfacher.

nichtdeterministisch

Eine Aktion kann unterschiedliche Folgen haben. Der Agent muss mit Unsicherheit umgehen.

diskret

Es gibt endlich oder klar abzĂ€hlbar viele ZustĂ€nde und Aktionen. Beispiel: SchachzĂŒge.

stetig

ZustÀnde oder Aktionen können kontinuierliche Werte annehmen. Beispiel: Geschwindigkeit, Position, Winkel.

Zwischenfrage

NOVA fragt: Ist die echte Welt fĂŒr Roboter eher vollstĂ€ndig beobachtbar oder teilweise beobachtbar?

Meist nur teilweise beobachtbar: Sensoren sind begrenzt, verrauscht und zeigen nie die ganze Welt perfekt.

Verteilte Agenten

Manchmal entsteht Intelligenz erst durch Zusammenarbeit

Nicht immer sitzt die Intelligenz in einem einzelnen Agenten. Verteilte Agentensysteme bestehen aus mehreren Agenten, die jeweils eigene Informationen, Ziele oder Aufgaben haben und zusammen ein grĂ¶ĂŸeres Verhalten erzeugen.

Beispiele sind Schwarmrobotik, Multiagentensysteme, verteilte Planung oder ein KI-System, in dem verschiedene spezialisierte Module zusammenarbeiten. NOVA ist dafĂŒr vorbereitet, aber aktuell noch kein vollstĂ€ndig autonomes Multiagentensystem. SpĂ€ter kann ein Orchestrator Vision, RAG, Mini-LLM, Speicher, Missionen und externe Schnittstellen gezielt verbinden.

Einzelner Agent: ein System entscheidet allein Verteilte Agenten: mehrere Systeme kooperieren → gemeinsames Verhalten

Ausblick

Vom Agenten zum wissensbasierten System

FĂŒr sehr einfache Agenten reicht die Sicht „Eingabe → Aktion“ aus. Bei komplexeren Anwendungen wird das Programmieren aber schnell unĂŒbersichtlich. Dann ist es sinnvoll, Wissen und Verarbeitung zu trennen.

In klassischen wissensbasierten Systemen liegt Wissen in einer Wissensbasis. Ein Inferenzmechanismus nutzt dieses Wissen, um Fragen zu beantworten, SchlĂŒsse zu ziehen oder PlĂ€ne zu erstellen. Diese Idee ist auch fĂŒr moderne Systeme wichtig: Wissen, Suche, Schlussfolgern und Lernen sind verschiedene Bausteine.

FĂŒr NOVA bedeutet das: Nicht jedes Wissen muss im Modellgewicht stecken. Wissen kann auch in RAG, Datenbanken, Dokumenten, Memory oder Regeln liegen. Aktuell werden diese Quellen noch durch klare Backend-Logik und feste Workflows genutzt. SpĂ€ter kann ein Agenten-Orchestrator entscheiden, wann welche Quelle sinnvoll ist.

NOVA-Kompass

NOVA als Vorstufe zu einem Agentensystem verstehen

NOVA ist nicht nur ein Chatfenster. NOVA nimmt Eingaben entgegen, schaut in Speicher, kann RAG-Wissen abrufen, Vision-Modelle nutzen, TrainingszustÀnde anzeigen und Antworten erzeugen. Fachlich sauberer ist aber: NOVA ist aktuell noch kein vollstÀndig autonomer Agent. Sie ist ein lokales KI-System mit mehreren Bausteinen, aus denen spÀter ein Agentensystem entstehen kann.

Manche Teile von NOVA sind reflex-artig: Wenn ein Status abgefragt wird, antwortet das System direkt. Manche Teile nutzen GedĂ€chtnis: Missionen, Fortschritt und User-Kontext. Manche Teile unterstĂŒtzen ein Ziel: dir beim Lernen zu helfen. Was noch fehlt, ist die autonome Agenten-Schicht: NOVA plant noch nicht selbststĂ€ndig mehrere Schritte, wĂ€hlt nicht eigenstĂ€ndig Werkzeuge aus und prĂŒft noch nicht autonom Zwischenergebnisse. Genau das bauen wir spĂ€ter.

NOVA als Software-Agent

Im Browser, Backend oder Telegram verarbeitet NOVA digitale Eingaben und erzeugt Antworten.

NOVA mit GedÀchtnis

NOVA kann Zustand, Missionen, Fortschritt, Wissen und frĂŒhere Interaktionen berĂŒcksichtigen.

NOVA mit Zielrichtung

NOVA ist auf nĂŒtzliches Lernen, klare ErklĂ€rung und prĂŒfbaren Fortschritt ausgerichtet. Eine echte autonome Zielplanung kommt spĂ€ter.

NOVA als modulares System

RAG, Vision, MiniNovaLM, Memory, Backend, Frontend und Sicherheitslogik sind getrennte Bausteine. Ein Agenten-Orchestrator kann spĂ€ter darĂŒber gelegt werden.

MerksÀtze

Was du aus Kapitel 1.4 mitnehmen sollst

1

Agenten verarbeiten Eingaben zu Ausgaben oder Aktionen

Das Agentenmodell hilft, KI-Systeme als handelnde Systeme zu verstehen.

2

Hardware-Agenten haben Sensoren und Aktuatoren

Sie nehmen die Welt wahr und verÀndern sie durch Aktionen.

3

GedÀchtnis macht Agenten stÀrker

FrĂŒhere Wahrnehmungen können fĂŒr aktuelle Entscheidungen entscheidend sein.

4

Ziele, Kosten und Nutzen verÀndern Entscheidungen

Ein Agent soll nicht nur reagieren, sondern sinnvolle Ziele erreichen und Fehlerkosten beachten.

5

NOVA ist eine Agenten-Vorstufe

NOVA verbindet bereits Eingaben, Speicher, RAG, Modelle, Regeln, Training und Antworten. Die autonome Agenten-Schicht bauen wir spÀter.

Kapitel-Check

Checkerfragen zu Kapitel 1.4

Kreuze die Aussagen an, die richtig sind. Wenn du alle korrekt hast, freut sich NOVA und klatscht kurz fĂŒr dich.

Ergebnis: noch offen
NOVA wird geladen...

NOVA Energie-Log

RTX-Verbrauch

NOVA schÀtzt hier, wie viel GPU-Energie deine Bildanalyse- und CUDA-LÀufe bisher ungefÀhr verbraucht haben.

Lade Energie-Daten...