Kapitel 0 ¡ 0.6

Lernen allgemein

Lernen ist der zentrale Begriff der gesamten Plattform. Bevor wir Machine Learning mathematisch betrachten, schauen wir zuerst auf Lernen im Alltag.

Lernen heißt Veränderung

Lernen bedeutet, dass ein System durch Erfahrung sein Verhalten verändert. Ein Mensch lernt, ein Tier lernt, und auch Maschinen kÜnnen in einem mathematischen Sinn lernen.

Wichtig ist: Lernen ist nicht einfach Speichern. Wenn du nur eine Antwort auswendig kennst, kannst du sie vielleicht wiedergeben. Aber echtes Lernen zeigt sich, wenn du auch neue Situationen bewältigen kannst.

Merksatz: Lernen bedeutet, aus Erfahrung ein Verhalten abzuleiten, das bei neuen Situationen besser funktioniert.

Beispiel: Fahrradfahren

Niemand lernt Fahrradfahren durch eine perfekte Formel. Du setzt dich auf das Fahrrad, wackelst, korrigierst, fällst vielleicht hin und versuchst es erneut.

Versuch → Fehler → Korrektur → neuer Versuch → Verbesserung

Das ist die gleiche Grundstruktur wie beim maschinellen Lernen. Ein Modell macht eine Vorhersage, bekommt Feedback und wird angepasst.

Mathematische Grundidee

Man kann Lernen grob als Optimierungsproblem betrachten. Ein System hat einen aktuellen Zustand. Es macht einen Fehler. Dann verändert es sich so, dass dieser Fehler kleiner wird.

Ziel: Fehler minimieren

Später schreiben wir das als Loss-Funktion:

min L

Das bedeutet: Wir suchen Modellparameter, bei denen der Fehler L mĂśglichst klein wird.

Lernen braucht Feedback

Ohne RĂźckmeldung kann ein System kaum gezielt besser werden. Beim Menschen kann Feedback direkt oder indirekt sein: Lob, Schmerz, Erfolg, Misserfolg oder eine Korrektur.

In Machine Learning ist Feedback meist mathematisch:

richtige Antwort y
Vorhersage š
Fehler = Unterschied zwischen y und š

Dieses Feedback bestimmt, wie stark ein Modell angepasst wird.

Generalisierung

Das Ziel von Lernen ist nicht, alte Beispiele auswendig zu kennen. Das Ziel ist, neue Beispiele korrekt zu behandeln.

Beispiel: Ein Kind erkennt einen Hund, den es noch nie gesehen hat. Das ist Generalisierung.

In Machine Learning ist Generalisierung extrem wichtig. Ein Modell soll nicht nur auf Trainingsdaten gut sein, sondern auf neuen Daten.