diff --git a/courses/223015b/slides/2025-12-19-termin-1-grundlagen-text-audio.md b/courses/223015b/slides/2025-12-19-termin-1-grundlagen-text-audio.md index b5b1d0d..a697dd8 100644 --- a/courses/223015b/slides/2025-12-19-termin-1-grundlagen-text-audio.md +++ b/courses/223015b/slides/2025-12-19-termin-1-grundlagen-text-audio.md @@ -183,6 +183,18 @@ Die Frage ist nicht ob, sondern wie komprimiert wird. # Zwei Philosophien der Kompression + + --- # Verlustfreie Kompression (Lossless) @@ -922,6 +934,15 @@ Prognose 2028: 394 ZB --- + + + + + +![bg fit](./assets/growth of big data.png) + +--- + # AI-generierte Inhalte 2025 **Wie viel Content ist heute synthetisch?** diff --git a/courses/223015b/slides/2026-01-09-termin-2-bild-audio-video.md b/courses/223015b/slides/2026-01-09-termin-2-bild-audio-video.md index 0d32c0b..653d0dd 100644 --- a/courses/223015b/slides/2026-01-09-termin-2-bild-audio-video.md +++ b/courses/223015b/slides/2026-01-09-termin-2-bild-audio-video.md @@ -106,7 +106,7 @@ Hochschule der Medien Stuttgart **Ein Dateiformat definiert:** - Ob und wie Daten komprimiert werden - Welche Metadaten enthalten sind -- Wie Daten *codiert* und *decodiert* (*Co·dec*) +- Wie Daten *»codiert«"* und *»decodiert«* (*Co·dec*) | Ziel | Bild | Audio | Dokument | |------|------|-------|----------| @@ -354,9 +354,9 @@ Banding: Zu wenig Bits für feine Farbabstufungen. | 30 | ~50 KB | Deutlich sichtbar | **Sweet Spot: 85-90** -~10× Kompression, für Menschen kaum unterscheidbar. +~10× Kompression ist für den Menschen kaum unterscheidbar. -¹ je nach Programm seine eigene Bedeutung von bspw. f80% +¹ je nach Programm unterschiedliche Kompression + + + + ![bg right:20%](./assets/Barn-yuv.png) -# JPEG: Schritt 1 – Farbraum wechseln +# JPEG: Schritt 1 – Farbraumkonversion **RGB → Y'CbCr** (seltener Y'UV) @@ -431,47 +437,100 @@ Das Auge merkt es kaum, weil Helligkeit erhalten bleibt. --- -# JPEG: Schritt 3 – DCT +# JPEG: Schritt 3 – Block-Aufteilung -**Discrete Cosine Transform:** -Bild in 8×8-Pixel-Blöcke aufteilen. -Jeden Block in **räumliche Frequenzen** zerlegen. +**Das Bild wird in 8×8-Pixel-Blöcke zerlegt.** -**Räumliche Frequenz = Wie schnell ändern sich Pixelwerte?** -- **Niedrig:** Große, gleichmäßige Flächen (Himmel) -- **Hoch:** Schnelle Wechsel, feine Details (Haare, Kanten) +Jeder Block wird unabhängig verarbeitet. +Bei 1920×1080: Das sind 240 × 135 = 32.400 Blöcke. + +**Level Shift:** +Alle Pixelwerte werden um −128 verschoben. +Bereich vorher: 0 bis 255 +Bereich nachher: −128 bis +127 + +**Warum −128?** +Die DCT arbeitet besser mit Werten, die um Null zentriert sind. --- -# JPEG: Schritt 4 – Quantisierung +# JPEG: Schritt 4 – DCT + +**Discrete Cosine Transform** +Jeder 8×8-Block wird von Pixelwerten in 64 Frequenzkoeffizienten umgewandelt. + +**Die 64 Koeffizienten:** + +| Position | Name | Bedeutung | +|----------|------|-----------| +| (0,0) | DC | Durchschnittshelligkeit des Blocks | +| Rest | AC | Helligkeitsänderungen (Frequenzen) | + +**Energy Compaction – der Schlüssel zur Kompression:** +Bei typischen Fotos landet über 90% der visuellen Information in den ersten 10–15 Koeffizienten (oben links). DCT selbst ist verlustfrei und reversibel! + + + +--- + +# JPEG: Schritt 5 – Quantisierung **Hier passiert der Datenverlust.** -Hohe räumliche Frequenzen (Details) → grob speichern oder weglassen -Niedrige Frequenzen (Flächen) → erhalten +Die DCT hat sortiert: Wichtiges von Unwichtigem getrennt +**Jetzt wird aufgeräumt:** +- Wichtige Werte (niedrige Frequenz, große Flächen) → präzise behalten +- Unwichtige Werte (hohe Freqzenz, feine Details) → vergröbern oder auf Null setzen + +**Das Ergebnis:** +Von den 64 Werten pro Block bleiben oft nur 5–15 übrig. +Der Rest wird zu Nullen (lassen sich extrem gut komprimieren) --- + +![bg fit](./assets/quantized-image-8-colors.jpg) + + + + +--- + # JPEG: Schritt 5 – Zigzag & RLE **Nach Quantisierung:** Viele Werte sind 0 (v.a. hohe Frequenzen). @@ -496,6 +555,11 @@ Lange Null-Sequenzen sind ideal für RLE. --- + + + + + # JPEG: Schritt 6 – Huffman-Coding **Verlustfreie Kompression der Restwerte**