Kapitel 1
Lernen & Machine Learning
In diesem Kapitel geht es um die Frage, wie Maschinen Ăźberhaupt lernen kĂśnnen. Wir betrachten Daten, Modelle, Fehler, Training und die wichtigsten Arten des maschinellen Lernens. Dieses Kapitel ist das Fundament fĂźr alles, was danach kommt: Neuron, Perzeptron, MLP, Backpropagation, CNNs, Transformer und LLMs.
Inhaltsverzeichnis
1.1 Was bedeutet Lernen?
Lernen bedeutet, dass ein System sein Verhalten durch Erfahrung verbessert. Beim Menschen geschieht das durch Wahrnehmung, Erinnerung, Feedback, Fehler und Korrektur. Ein Kind lernt laufen, indem es immer wieder versucht aufzustehen, hinfällt, korrigiert und erneut probiert.
Beim maschinellen Lernen ist die Idee ähnlich, aber die Umsetzung ist mathematisch. Ein Modell sieht Beispiele, berechnet eine Ausgabe, vergleicht diese Ausgabe mit einem Ziel oder einer Bewertung und verändert anschlieĂend seine inneren Werte.
Versuch â Fehler â Korrektur â Verbesserung
Lernen bei Maschinen:
Daten â Vorhersage â Fehler â Parameter-Update
Wichtig ist: Ein lernendes System soll nicht einfach alte Beispiele speichern. Es soll aus Beispielen ein Muster ableiten, das auch bei neuen Situationen funktioniert. Diese Fähigkeit nennt man Generalisierung.
1.2 Daten und Datensätze
Maschinen lernen aus Daten. Daten sind Beispiele aus der Welt, die in eine Form gebracht werden, mit der ein Computer rechnen kann. Ein Bild ist fĂźr uns ein Bild. FĂźr einen Computer ist es eine groĂe Matrix aus Zahlen. Ein Text ist fĂźr uns Sprache. FĂźr ein Modell wird er später in Tokens und Zahlen umgewandelt.
Ein einzelnes Beispiel nennt man oft Sample oder Beobachtung. Viele Beispiele zusammen nennt man Datensatz. Ein Datensatz kann aus Bildern, Texten, Tabellen, Audiodaten, Sensordaten oder Kombinationen davon bestehen.
Sample 2: Bild eines Hundes
Sample 3: Bild eines Autos
...
Datensatz = viele Samples
Die Qualität der Daten ist entscheidend. Ein Modell kann nur aus dem lernen, was in den Daten enthalten ist. Wenn die Daten falsch, einseitig, unvollständig oder verzerrt sind, wird auch das Modell falsche oder verzerrte Muster lernen.
1.3 Features und Labels
Ein Feature ist eine Eigenschaft eines Beispiels, die ein Modell als Eingabe bekommt. Wenn wir ein Hauspreis-Modell bauen, kÜnnten Features zum Beispiel Wohnfläche, Lage, Baujahr, Anzahl der Zimmer und Entfernung zur nächsten Bahnstation sein.
x = [82, 3, 1998, 0.7]
Mathematisch werden Features häufig als Vektor geschrieben. Ein Vektor ist einfach eine geordnete Liste von Zahlen. Genau diese Denkweise brauchen wir später beim kßnstlichen Neuron.
Ein Label ist die gewĂźnschte Antwort. Beim Hauspreis-Beispiel wäre das Label der tatsächliche Verkaufspreis. Beim Spamfilter wäre das Label âSpamâ oder âKein Spamâ. Beim Katzenbild wäre das Label âKatzeâ.
x ist die Eingabe. y ist die richtige Antwort. Diese Schreibweise ist extrem wichtig, weil sie später Ăźberall wieder auftaucht: beim Perzeptron, beim MLP, bei CNNs und auch beim Training groĂer Sprachmodelle.
1.4 Modelle als Funktionen
Ein Modell ist eine mathematische Funktion. Es bekommt Eingaben und erzeugt eine Ausgabe. In der einfachsten Form kann man schreiben:
f ist das Modell. x ist die Eingabe. š ist die Vorhersage des Modells. Das Dach ßber dem y bedeutet: Das ist nicht die echte Antwort, sondern nur die geschätzte Antwort.
Die echte Antwort nennen wir y. Der Unterschied zwischen y und š ist der Fehler. Wenn ein Modell lernt, versucht es, diesen Fehler kleiner zu machen.
y = echte Antwort
š = Vorhersage
Fehler = Unterschied zwischen y und š
Modelle besitzen Parameter. Parameter sind innere Werte, die beim Training verändert werden. Bei neuronalen Netzen heiĂen diese Werte meistens Gewichte und Bias-Werte.
θ steht hier fßr die Parameter des Modells. Lernen bedeutet also: Wir suchen Parameter θ, bei denen die Vorhersagen des Modells mÜglichst gut werden.
1.5 Training und Fehler
Training ist der Prozess, bei dem ein Modell seine Parameter anpasst. Am Anfang sind die Parameter oft zufällig oder schlecht gewählt. Das Modell macht daher schlechte Vorhersagen. Durch viele Beispiele wird der Fehler gemessen und das Modell schrittweise verbessert.
2. Vorhersage š berechnen
3. Mit echter Antwort y vergleichen
4. Fehler berechnen
5. Parameter anpassen
6. Wiederholen
Bei einfachen Modellen kann der Fehler zum Beispiel so aussehen:
In vielen echten ML-Systemen verwendet man nicht einfach diesen Unterschied, sondern eine Loss-Funktion. Eine Loss-Funktion misst, wie schlecht ein Modell auf einem Beispiel oder einem ganzen Datensatz ist.
Das Ziel des Trainings ist dann:
Wir wollen also die Parameter so verändern, dass der Loss mÜglichst klein wird. Diese Idee nennt man Optimierung.
1.6 Supervised Learning
Supervised Learning bedeutet Ăźberwachtes Lernen. Das Modell lernt mit Beispielen, bei denen die richtige Antwort bekannt ist. Es bekommt also Eingaben x und Labels y.
D ist der Datensatz. Jedes Beispiel besteht aus einer Eingabe und einer richtigen Antwort. Das Modell versucht, eine Funktion zu lernen, die aus x mÜglichst zuverlässig y vorhersagt.
Bild â Katze / Hund
Patientendaten â Risiko niedrig / hoch
Hausdaten â Preis
Supervised Learning kann in zwei groĂe Gruppen aufgeteilt werden: Klassifikation und Regression.
Klassifikation
Das Modell wählt eine Kategorie. Beispiel: Katze oder Hund, Spam oder kein Spam.
Regression
Das Modell sagt eine Zahl voraus. Beispiel: Hauspreis, Temperatur oder Umsatz.
Das Perzeptron, das wir später bauen, ist ein einfaches Beispiel fßr Supervised Learning. Es bekommt Eingaben und gewßnschte Ausgaben und passt seine Gewichte an, wenn es falsch liegt.
1.7 Unsupervised Learning
Unsupervised Learning bedeutet unĂźberwachtes Lernen. Hier gibt es keine Labels. Das Modell bekommt nur Daten und soll selbst Strukturen finden.
Stell dir vor, ein Streamingdienst kennt dein HĂśrverhalten, aber niemand hat vorher jeden Nutzer mit Labels wie âRock-Fanâ, âJazz-Fanâ oder âPodcast-HĂśrerâ markiert. Trotzdem kann das System Gruppen von Nutzern finden, die sich ähnlich verhalten.
â
Ăhnlichkeiten finden
â
Gruppen / Muster / Strukturen
Ein typisches Beispiel ist Clustering. Dabei versucht ein Algorithmus, ähnliche Datenpunkte zu Gruppen zusammenzufassen.
Unsupervised Learning ist besonders nßtzlich, wenn Labels teuer, unvollständig oder gar nicht vorhanden sind. Es hilft, Daten besser zu verstehen, bevor man ein ßberwachtes Modell trainiert.
1.8 Reinforcement Learning
Reinforcement Learning bedeutet Lernen durch Belohnung und Bestrafung. Hier lernt ein Agent durch Interaktion mit einer Umgebung. Er fßhrt Aktionen aus, erhält Feedback und versucht, seine Strategie zu verbessern.
â
Aktion a
â
Belohnung r
â
neuer Zustand s'
Ein Roboter kÜnnte eine Belohnung bekommen, wenn er sich seinem Ziel nähert, und eine Strafe, wenn er gegen eine Wand fährt. Ein Spiel-Agent bekommt Punkte, wenn er gewinnt, und verliert Punkte bei schlechten Aktionen.
Reinforcement Learning ist besonders wichtig fĂźr Spiele, Robotik, Steuerungsprobleme und Systeme, bei denen Entscheidungen Ăźber mehrere Schritte hinweg bewertet werden mĂźssen.
1.9 Overfitting und Underfitting
Ein Modell soll nicht nur auf Trainingsdaten gut sein, sondern auch auf neuen Daten. Genau hier entstehen zwei wichtige Probleme: Overfitting und Underfitting.
Overfitting bedeutet, dass ein Modell die Trainingsdaten zu stark auswendig lernt. Es ist im Training sehr gut, aber bei neuen Daten schlecht.
Trainingsfehler niedrig
Testfehler hoch
Underfitting ist das Gegenteil. Das Modell ist zu einfach oder wurde zu schlecht trainiert. Es erkennt selbst in den Trainingsdaten kaum Muster.
Trainingsfehler hoch
Testfehler hoch
Ein gutes Modell findet die Mitte: Es lernt echte Muster, aber nicht bloĂ die Trainingsdaten auswendig.
1.10 Die Mathematik dahinter
Sehr viele Machine-Learning-Verfahren lassen sich als Optimierungsproblem beschreiben. Wir haben ein Modell mit Parametern θ. Dieses Modell macht Vorhersagen. Eine Loss-Funktion misst, wie schlecht diese Vorhersagen sind. Training bedeutet, θ so zu verändern, dass der Loss kleiner wird.
Das sieht kompliziert aus, bedeutet aber einfach: Wir suchen die besten Parameter θ*, bei denen der Fehler mÜglichst klein ist.
Später lernen wir Gradient Descent kennen. Dort wird berechnet, in welche Richtung die Parameter verändert werden mßssen, damit der Loss kleiner wird. Bei neuronalen Netzen passiert genau das mit Gewichten und Bias-Werten.
â
Loss prĂźfen
â
bessere Richtung finden
â
wiederholen
Zusammenfassung
- â Lernen bedeutet Verbesserung durch Erfahrung.
- â Machine Learning lernt aus Daten.
- â Features sind Eingaben, Labels sind Zielwerte.
- â Modelle sind Funktionen mit Parametern.
- â Training minimiert Fehler.
- â Supervised Learning nutzt Labels.
- â Unsupervised Learning sucht Strukturen ohne Labels.
- â Reinforcement Learning lernt durch Belohnung.
- â Overfitting bedeutet Auswendiglernen statt Generalisieren.