Masterclass · Kapitel 18
Bilder als Tensoren
Wie NOVA Bilder mathematisch sieht
Du verstehst, wie aus einem Bild ein Tensor wird, warum Normalisierung wichtig ist und warum CNNs Nachbarschaften besser nutzen als einfache MLPs.
Diese Masterclass verbindet Theorie, Mathematik und echten NOVA-Code. Sie zeigt nicht nur, was ein Konzept bedeutet, sondern wo es in unserer Vision-Forge-Pipeline auftaucht.
Abschnitt 1 von 4Kapitel 18
18.1 NOVA sieht keine Fotos, sondern Zahlenfelder
NOVA sieht keine Fotos, sondern Zahlenfelder
FĂŒr dich ist ein Bild ein Hund, ein Auto oder eine Flasche.
FĂŒr NOVA ist ein Bild zuerst ein Tensor: viele Zahlen in einer festen Struktur.
Ein RGB-Bild hat drei FarbkanĂ€le: Rot, GrĂŒn und Blau.
Mathematischer Kern
Ein Bild mit 128Ă128 Pixeln und 3 KanĂ€len:
x â R^(3Ă128Ă128)
Das sind 49.152 Zahlen pro Bild.
Tensorform in PyTorch
# Einzelbild:
image.shape == [3, 128, 128]
# Batch mit 512 Bildern:
images.shape == [512, 3, 128, 128]NOVA wird geladen...
NOVA Energie-Log
RTX-Verbrauch
NOVA schÀtzt hier, wie viel GPU-Energie deine Bildanalyse- und CUDA-LÀufe bisher ungefÀhr verbraucht haben.
Lade Energie-Daten...