Account

Lade Account...

Kapitel 0 · 0.5

Theoretische Informatik

Theoretische Informatik klingt am Anfang abstrakt. In Wahrheit ist sie das Fundament unter fast allem, was wir später bauen: Algorithmen, Suche, Sortierung, Graphen, Vektoren, Automaten, formale Sprachen, Grammatiken, Berechenbarkeit und Grenzen von Maschinen. Ohne diese Grundlagen wirkt moderne KI wie Magie. Mit diesen Grundlagen sieht man: KI ist ein System aus berechenbaren Bausteinen.

Warum dieses Kapitel existiert

KI steht nicht außerhalb der Informatik

Ein Sprachmodell kann beeindruckend antworten. Ein Bildmodell kann Objekte erkennen. Ein RAG-System kann Dokumente durchsuchen. Trotzdem laufen all diese Systeme nicht außerhalb der Informatik. Sie verarbeiten Zeichen, Zahlen, Vektoren, Zustände, Speicher und Wahrscheinlichkeiten.

Ein Algorithmus ist nicht automatisch KI. Ein Modell ersetzt nicht jede Regel. Ein neuronales Netz ist nicht automatisch die beste Lösung. Oft ist ein sauberer Suchalgorithmus, ein Sortierverfahren, eine Zustandsmaschine oder eine Datenstruktur besser als ein Modell.

Für NOVA ist das zentral. NOVA soll nicht überall blind ein LLM draufwerfen. NOVA soll wissen, wann sie suchen, sortieren, vergleichen, trainieren, abrufen, klassifizieren oder einfach eine klare Regel ausführen muss.

Regel ≠ Modell Suche ≠ Training Speicher ≠ Verständnis Algorithmus ≠ neuronales Netz gute Architektur = passendes Werkzeug für passendes Problem

Algorithmus

Was ist ein Algorithmus?

Ein Algorithmus ist eine endliche, eindeutig beschriebene Handlungsanweisung zur Lösung eines Problems. Er bekommt eine Eingabe, führt definierte Schritte aus und erzeugt eine Ausgabe.

Das klingt einfach, ist aber mächtig. Ein Algorithmus kann Zahlen sortieren, einen kürzesten Weg finden, eine Datei komprimieren, einen Text parsen oder eine Liste durchsuchen. Dafür braucht er kein Bewusstsein und kein Training. Er folgt einer präzisen Vorschrift.

In mathematischer Form können wir einen Algorithmus als Abbildung verstehen. Er nimmt Werte aus einer Eingabemenge und liefert Werte aus einer Ausgabemenge.

A: X → Y x ∈ X = Eingabe y ∈ Y = Ausgabe A(x) = Ergebnis des Algorithmus

Der Unterschied zu Machine Learning ist wichtig: Einen klassischen Algorithmus schreiben wir direkt auf. Ein Modell im Machine Learning wird dagegen aus Beispielen angepasst. Beides kann später in NOVA zusammenarbeiten.

Klassische Problemlösungen

Animierte Algorithmen: Schritt für Schritt durchlaufen

Algorithmen versteht man besser, wenn man sieht, wie sie arbeiten. Deshalb laufen die Beispiele hier nicht nur als Text, sondern als kleine Animationen. Du kannst sie abspielen, pausieren, zurücksetzen oder Schritt für Schritt durchgehen.

Der wichtige Punkt: Diese Verfahren sind keine neuronalen Netze. Sie lernen nicht aus Daten. Sie folgen exakt beschriebenen Regeln. Genau deshalb sind sie für NOVA trotzdem wichtig.

QuickSort: Pivot wählen und rekursiv sortieren

QuickSort wählt ein Pivot-Element. Kleinere Elemente kommen nach links, größere nach rechts. Danach werden beide Seiten rekursiv sortiert.

In der Praxis sehr wichtig, weil QuickSort im Mittel schnell ist und oft wenig Zusatzspeicher braucht.

Animiertes Beispiel

Schritt 1 von 6

Ausgangsliste

QuickSort startet mit der unsortierten Liste.

Laufzeit

Im Mittel O(n log n), im schlechtesten Fall O(n²), wenn die Pivot-Wahl ungünstig ist.

NOVA-Bezug

NOVA braucht solche Verfahren, wenn sie Daten effizient ordnen muss. Ein LLM sollte nicht für Aufgaben benutzt werden, die ein Algorithmus exakt lösen kann.

Pseudocode

quicksort(L):
  wenn Länge(L) <= 1:
    gib L zurück

  pivot = wähle ein Element aus L
  links = alle Elemente < pivot
  mitte = alle Elemente == pivot
  rechts = alle Elemente > pivot

  gib quicksort(links) + mitte + quicksort(rechts) zurück

Komplexität

Warum Effizienz wichtig ist

Ein Algorithmus kann korrekt sein und trotzdem praktisch unbrauchbar, wenn er zu langsam ist. Deshalb betrachtet man nicht nur, ob ein Verfahren funktioniert, sondern wie stark sein Aufwand mit der Eingabegröße wächst.

Die O-Notation beschreibt dieses Wachstum grob. Sie sagt nicht, wie viele Millisekunden ein Programm exakt braucht, sondern wie sich der Aufwand verhält, wenn n größer wird.

Notation	Name	Intuition	Beispiel
O(1)	konstant	Aufwand bleibt gleich	Array-Zugriff per Index
O(log n)	logarithmisch	Suchraum wird halbiert	binäre Suche
O(n)	linear	einmal durch alle Daten	lineare Suche
O(n log n)	linear-logarithmisch	typisch für gute Sortierung	Merge Sort, QuickSort im Mittel
O(n²)	quadratisch	alle Paare vergleichen	Bubble Sort, Doppelschleifen
O(2ⁿ)	exponentiell	alle Möglichkeiten explodieren	Teilmenge aller Entscheidungen
O(n!)	faktoriell	alle Reihenfolgen testen	Brute-Force-TSP

Beispiel bei n = 1.000.000 O(1): ungefähr 1 Schritt O(log n): ungefähr 20 Schritte O(n): ungefähr 1.000.000 Schritte O(n²): ungefähr 1.000.000.000.000 Schritte

Genau deshalb ist „funktioniert doch“ nicht genug. Ein Verfahren muss auch skalieren. NOVA kann auf kleinen Demo-Daten schnell wirken, aber bei großen Wissensspeichern, Bilddaten oder Trainingsläufen braucht sie effiziente Verfahren.

Graphen und Optimierung

Travelling Salesman und Chinese Postman

Graphprobleme sind überall: Routenplanung, Netzwerke, Abhängigkeiten, Webseiten, Dokumentverweise, Missionszustände und Wissensgraphen. Ein Graph besteht aus Knoten und Kanten.

Die Knoten können Orte sein. Die Kanten sind Verbindungen zwischen diesen Orten. Eine Kante kann ein Gewicht haben: Entfernung, Zeit, Energie, Risiko oder Kosten. Wenn Orte Koordinaten besitzen, kann die Distanz zwischen zwei Orten mit Vektorrechnung berechnet werden.

G = (V, E) V = Menge der Knoten E = Menge der Kanten w(e) = Kosten oder Gewicht einer Kante Kosten(Pfad) = Σ w(e)

Aktuelle Route

A → B → C → D → E → A

Kosten ≈ 803.4

Vergleichstour

A → B → D → C → E → A

Kosten ≈ 953.3

Schon bei fünf Knoten sieht man: Eine andere Reihenfolge kann andere Gesamtkosten erzeugen. TSP sucht nicht irgendeine Runde, sondern die beste.

Travelling Salesman Problem

Beim Travelling Salesman Problem, kurz TSP, soll eine Rundreise gefunden werden, die jeden Knoten genau einmal besucht und am Ende zum Start zurückkehrt. Ziel ist die minimale Gesamtlänge.

Mathematisch betrachtet man eine Menge von Städten V und eine Distanzfunktion d. Eine Tour ist eine Permutation der Städte. Gesucht ist die Permutation mit minimalen Gesamtkosten.

V = {A, B, C, D, E} π = Reihenfolge der Städte Tour: π₁ → π₂ → ... → πₙ → π₁ Kosten(π) = Σᵢ d(πᵢ, πᵢ₊₁) mit πₙ₊₁ = π₁ Ziel: π* = argmin Kosten(π)

Beispiel mit A = (60, 80) und B = (210, 45):

d(A,B) = √((210 - 60)² + (45 - 80)²) d(A,B) = √(150² + (-35)²) d(A,B) = √(22500 + 1225) d(A,B) = √23725 ≈ 154.0

alle Reihenfolgen: n! symmetrische Rundreisen: (n - 1)! / 2 n = 5 → 12 echte Rundreisen n = 10 → 181.440 echte Rundreisen n = 20 → 60.822.550.204.416.000 echte Rundreisen

Distanzmatrix aus Koordinaten

Für TSP und viele Graphprobleme brauchen wir Distanzen zwischen Knoten. Aus Koordinaten wird eine Distanzmatrix. Jede Zelle zeigt die Entfernung zwischen zwei Knoten.

von / nach	A	B	C	D	E
A	0.0	154.0	290.4	295.8	190.1
B	154.0	0.0	148.7	212.7	215.1
C	290.4	148.7	0.0	139.5	257.0
D	295.8	212.7	139.5	0.0	171.2
E	190.1	215.1	257.0	171.2	0.0

Eine solche Matrix ist später auch für KI nützlich: Bei Embeddings vergleichen wir keine Städte, sondern Vektoren. Die Idee bleibt ähnlich: Wir messen Nähe, Abstand oder Ähnlichkeit.

Warum das für NOVA zählt

Wenn NOVA später Missionen plant, Aufgaben priorisiert oder Wege durch einen Wissensgraphen sucht, muss sie unterscheiden: Will sie bestimmte Knoten besuchen? Will sie alle Verbindungen abdecken? Will sie die kürzeste Route? Oder sucht sie nur eine gute Heuristik? Das ist klassische Informatik, nicht Magie.

Vektoren

Die Brücke von Informatik zu Machine Learning

Vektoren sind geordnete Zahlenlisten. Sie sind eine der wichtigsten Brücken zwischen klassischer Informatik, Mathematik und moderner KI. Ein Bild kann als Vektor oder Tensor dargestellt werden. Ein Text kann über Embeddings als Vektor dargestellt werden.

Wenn wir Objekte als Vektoren darstellen, können wir Abstände, Ähnlichkeiten und Richtungen berechnen.

Vektor x = [x₁, x₂, ..., xₙ] Beispiel: x = [Breite, Höhe, Gewicht, Rundheit] NOVA-Beispiel: x = [0.8, 0.5, 0.7, 0.1]

Interaktives Beispiel

Ändere die Werte der beiden 2D-Vektoren. Danach siehst du Distanz, Skalarprodukt und Cosine Similarity.

a₁2

a₂1

b₁4

b₂3

Rechnung

a = [2, 1] b = [4, 3] a · b = 2·4 + 1·3 = 11.00 ||a|| = √(2² + 1²) = 2.236 ||b|| = √(4² + 3²) = 5.000 Distanz = √((2-4)² + (1-3)²) = 2.828 cos(a,b) = (a·b) / (||a||·||b||) = 0.984

Distanz misst, wie weit zwei Punkte auseinander liegen. Cosine Similarity misst eher, ob zwei Vektoren in eine ähnliche Richtung zeigen. Für RAG und Embeddings ist diese Richtung oft wichtiger als die reine Länge.

Überleitung zu RAG und Embeddings

Wenn NOVA später Dokumente durchsucht, vergleicht sie nicht nur Buchstaben. Ein Textabschnitt kann als Embedding-Vektor gespeichert werden. Eine Frage wird ebenfalls in einen Vektor übersetzt. Danach sucht NOVA nach Vektoren mit hoher Ähnlichkeit.

Formale Sprachen

Sprache als Menge von Zeichenketten

Eine formale Sprache ist eine Menge von Wörtern über einem Alphabet. Ein Alphabet ist eine Menge erlaubter Zeichen. Ein Wort ist eine endliche Folge solcher Zeichen. Eine Sprache ist eine Menge solcher Wörter.

Diese Reihenfolge ist wichtig: Erst verstehen wir, was eine formale Sprache ist. Dann ordnet die Chomsky-Hierarchie verschiedene Sprachtypen. Danach schauen wir uns konkrete Automaten und Grammatiken an.

Alphabet: Σ = { a, b } Wort: w = abbab Menge aller Wörter: Σ* Sprache: L ⊆ Σ*

Beispiel einer Sprache

L = { w ∈ {a,b}* | w beginnt mit a und endet mit b } erlaubt: ab, aab, abb, aaab nicht erlaubt: a, b, ba, bba

Chomsky-Hierarchie

Der Rahmen: Welche Maschine erkennt welche Sprache?

Die Chomsky-Hierarchie kommt vor den konkreten Grammatikbeispielen, weil sie den Rahmen liefert. Sie ordnet formale Sprachen danach, welche Art von Regeln nötig ist und welches Maschinenmodell diese Sprache erkennen kann.

Ebene	Sprachtyp	Maschinenmodell	Beispiel	Intuition
Typ 3	Regulär	Endlicher Automat	{ a bⁿ \| n ≥ 0 }	einfache Muster ohne unbegrenzten Speicher
Typ 2	Kontextfrei	Kellerautomat	{ aⁿ bⁿ \| n ≥ 0 }	verschachtelte Strukturen mit Stack
Typ 1	Kontextsensitiv	beschränkte Turingmaschine	{ aⁿ bⁿ cⁿ \| n ≥ 1 }	mehrere abhängige Bedingungen
Typ 0	Rekursiv aufzählbar	Turingmaschine	allgemeine berechenbare Probleme	volle allgemeine Berechnung

Danach sind Automaten und Grammatiken keine losen Beispiele mehr: Ein endlicher Automat gehört zu regulären Sprachen. Ein Kellerautomat gehört zu kontextfreien Sprachen. Eine Turingmaschine steht für allgemeine Berechnung.

Automaten

Zustände, Übergänge und akzeptierte Wörter

Ein Automat ist ein Modell für ein System mit Zuständen. Er liest Eingaben Zeichen für Zeichen und wechselt abhängig vom aktuellen Zustand und dem gelesenen Zeichen in einen neuen Zustand.

Das ist extrem wichtig, weil viele Software-Systeme als Zustandsmaschinen verstanden werden können: Login-Flows, Missionsstufen, Roboterzustände, Parser, Dialogzustände oder Trainingsphasen.

DFA = (Q, Σ, δ, q₀, F) Q = Menge der Zustände Σ = Alphabet δ = Übergangsfunktion q₀ = Startzustand F = akzeptierende Endzustände

Beispielautomat für L = { a bⁿ | n ≥ 0 }

Dieser Automat akzeptiert Wörter, die mit genau einem a beginnen und danach nur noch b enthalten. Beispiele: a, ab, abb, abbb.

Zustand	bei a	bei b	Bedeutung
q0	q1	qdead	Start, noch kein a gelesen
q1	qdead	q1	akzeptierend, danach nur b
qdead	qdead	qdead	Fehlerzustand

Interaktiver Test

Gib ein Wort über dem Alphabet {a,b} ein. Der Automat prüft, ob es zur Sprache a bⁿ gehört.

Zustandslauf

q0 → a:q1 → b:q1 → b:q1 → b:q1

Akzeptiert: Das Wort gehört zur Sprache.

NOVA-Bezug

Eine Missionspipeline kann ähnlich funktionieren: Zustand lesen, Ereignis verarbeiten, neuen Zustand setzen. Das ist keine neuronale Magie, sondern saubere Zustandslogik.

Grammatikbeispiele

Wie Regeln Wörter erzeugen

Nachdem der Rahmen durch die Chomsky-Hierarchie klar ist, schauen wir uns konkrete Grammatikregeln an. Eine Grammatik beschreibt, wie Wörter einer Sprache erzeugt werden.

G = (V, Σ, P, S) V = Nichtterminale, also Hilfssymbole Σ = Terminale, also echte Zeichen der Sprache P = Produktionsregeln S = Startsymbol

Typ 3: Reguläre Grammatik

S → aB B → bB B → ε

L = { a bⁿ | n ≥ 0 } Beispiele: a, ab, abb, abbb, ...

Typ 2: Kontextfreie Grammatik

S → aSb S → ε

Eine mögliche Ableitung:

S → aSb → aaSbb → aaaSbbb → aaabbb

L = { aⁿ bⁿ | n ≥ 0 } Beispiele: ε, ab, aabb, aaabbb Nicht erlaubt: abb, aab, abab, ba

Typ 1: Kontextsensitiv

L = { aⁿ bⁿ cⁿ | n ≥ 1 } Beispiele: abc, aabbcc, aaabbbccc Nicht erlaubt: aabcc, abbccc, aabbc

Berechenbarkeit

Nicht alles, was man fragen kann, ist automatisch lösbar

Theoretische Informatik zeigt nicht nur, was Maschinen können. Sie zeigt auch Grenzen. Es gibt Probleme, für die kein allgemeiner Algorithmus existiert. Das berühmteste Beispiel ist das Halteproblem.

Das Halteproblem fragt: Gibt es einen Algorithmus, der für jedes beliebige Programm und jede Eingabe entscheidet, ob dieses Programm irgendwann anhält? Die Antwort ist nein.

Halteproblem: Eingabe: Programm P und Eingabe x Frage: Hält P(x) irgendwann an? Aussage: Es gibt keinen allgemeinen Algorithmus, der das für alle P und x korrekt entscheidet.

Für KI ist diese Denkweise wichtig. Ein Modell kann beeindruckend wirken, aber es hebt grundlegende Grenzen der Berechnung nicht auf. Es kann falsche Antworten geben, unsicher sein, Kontext verlieren oder ein Problem nur heuristisch annähern.

NOVA-Überleitung

Warum NOVA diese Theorie braucht

Regeln

Menüführung, feste Workflows, API-Routen und Statuslogik sind besser als klare Regeln modelliert.

Automaten

Missionen, Trainingsstufen und Zustände lassen sich als Zustandsmaschinen verstehen.

Suche

RAG, Logs, Dokumente und Erinnerungen brauchen Suchverfahren und Datenstrukturen.

Vektoren

Embeddings, Ähnlichkeit, Dokumentensuche und Bildfeatures beruhen auf Vektorrechnung.

Modelle

Bildklassifikation, Sprachverarbeitung und Vorhersagen brauchen gelernte Parameter.

Training

Training verändert Parameter. Retrieval sucht Informationen. Diese Unterscheidung bleibt für NOVA entscheidend.

Ein schlechtes KI-System nennt alles „KI“. Ein gutes System trennt: Was ist Regel? Was ist Suche? Was ist Speicher? Was ist Vektorvergleich? Was ist Modell? Was ist Training? Genau diese Trennung macht NOVA später nachvollziehbar.

Zusammenfassung

Was du hier mitnehmen sollst

✓ Algorithmen sind präzise Verfahren, nicht automatisch KI.
✓ Animationen zeigen, dass Algorithmen Schritt für Schritt Zustände verändern.
✓ Suchen, Sortieren, QuickSort, Merge Sort und Graphverfahren sind klassische Problemlösungen.
✓ Laufzeitkomplexität erklärt, warum ein korrektes Verfahren trotzdem praktisch schlecht sein kann.
✓ Travelling Salesman und Chinese Postman zeigen, dass Planung und Routenprobleme mathematisch verschieden sein können.
✓ Vektoren sind die Brücke von klassischer Mathematik zu Machine Learning, Embeddings, RAG und Ähnlichkeit.
✓ Die sinnvolle Reihenfolge ist: formale Sprachen, Chomsky-Hierarchie, Automaten und dann konkrete Grammatikbeispiele.
✓ Berechenbarkeit zeigt Grenzen: Nicht jede Frage ist allgemein algorithmisch lösbar.
✓ NOVA wird besser, wenn wir Regeln, Automaten, Speicher, Suche, Modelle, Vektoren und Training sauber trennen.

← Zurück Weiter: Geschichte der KI →

NOVA wird geladen...

NOVA Energie-Log

RTX-Verbrauch

NOVA schätzt hier, wie viel GPU-Energie deine Bildanalyse- und CUDA-Läufe bisher ungefähr verbraucht haben.

Lade Energie-Daten...