diff --git a/courses/223015b/slides/2025-12-19-termin-1-grundlagen-text-audio.md b/courses/223015b/slides/2025-12-19-termin-1-grundlagen-text-audio.md index b82ae6f..93b9a1e 100644 --- a/courses/223015b/slides/2025-12-19-termin-1-grundlagen-text-audio.md +++ b/courses/223015b/slides/2025-12-19-termin-1-grundlagen-text-audio.md @@ -4,7 +4,7 @@ theme: gaia paginate: true backgroundColor: #fff header: "Dateiformate, Schnittstellen, Speichermedien & Distributionswege (223015b)" -footer: "Michael Czechowski – HdM Stuttgart – WS 2025/26" +footer: "Michael Czechowski – HdM Stuttgart" title: Dateiformate, Schnittstellen, Speichermedien & Distributionswege --- @@ -55,7 +55,7 @@ section.klausur { #e3f2fd 40px, #fff 40px, #fff 80px - ); + ) !important; } section.aufgabe { background: #e3f2fd !important; @@ -77,8 +77,6 @@ section.aufgabe footer { Digital- und Medienwirtschaft Hochschule der Medien Stuttgart -**Wintersemester 2025/26** - [https://librete.ch/hdm/223015b/](https://librete.ch/hdm/223015b/) --- @@ -94,44 +92,187 @@ Hochschule der Medien Stuttgart --- -![bg right:40%](./assets/matrix-code.png) + -# WTF!? - -``` -89 50 4E 47 0D 0A 1A 0A -00 00 00 0D 49 48 44 52 -00 00 01 90 00 00 01 2C -``` +# Das Problem der Datengröße --- -![bg right:30%](./assets/matrix-code.png) +# Ein konkretes Beispiel -# What the HEX-Code +**Eine Minute Musik in CD-Qualität:** -``` -89 50 4E 47 ... -``` +44.100 Messungen/Sekunde +× 16 Bit pro Messung +× 2 Kanäle (Stereo) +× 60 Sekunden -| Binär | Hex | Dez | ASCII | -|-------|-----|-----|-------| -| `1000 1001` | `89` | 137 | ✗ (> 127) | -| `0101 0000` | `50` | 80 | **P** | -| `0100 1110` | `4E` | 78 | **N** | -| `0100 0111` | `47` | 71 | **G** | - -→ **PNG**-Signatur! (Das `89` markiert: "Ich bin binär, kein Text!") += **10,6 MB pro Minute** --- +# Das Problem skaliert + +| Inhalt | Unkomprimiert | +|--------|-------------:| +| 1 Song (4 Min) | ~42 MB | +| 1 Album (60 Min) | ~635 MB | +| 10.000 Songs | ~420 GB | + +**Kontext 1990er:** +- Festplatte: 100-500 MB +- Modem: 56 kbit/s → 1 Song dauert Stunden + + + +--- + +# Video eskaliert + +**Eine Minute 4K-Video (unkomprimiert):** + +3840 × 2160 Pixel +× 3 Byte pro Pixel (RGB) +× 30 Bilder pro Sekunde +× 60 Sekunden + += **~45 GB pro Minute** + +Ein 2-Stunden-Film: über **5 Terabyte** + + + +--- + +# Kompressionsraten in der Praxis + +| Medium | Unkomprimiert | Komprimiert | Faktor | +|--------|-------------:|------------:|-------:| +| 1 Song (4 Min) | ~42 MB | ~4 MB (MP3 320) | ~10× | +| 1 Foto (12 MP) | ~36 MB | ~3 MB (JPEG) | ~12× | +| 1 Min 4K-Video | ~45 GB | ~375 MB (H.264) | ~120× | + + + +--- + + + +# Zwei Philosophien der Kompression + +--- + +# Verlustfreie Kompression (Lossless) + +**Prinzip:** Redundanz entfernen + +**Beispiel Lauflängenkodierung:** +``` +Original: AAAAABBBCCCCCCCC (16 Zeichen) +Komprimiert: 5A3B8C (6 Zeichen) +``` + +→ 62% kleiner, 100% wiederherstellbar + +**Anwendung:** ZIP, PNG, FLAC, Programmcode + + + +--- + +# Verlustbehaftete Kompression (Lossy) + +**Prinzip:** Irrelevanz entfernen + +**Die Frage:** Was nimmt ein Mensch nicht wahr? + +- Das Ohr hört nicht alle Frequenzen gleich gut +- Das Auge sieht nicht alle Farbnuancen +- Laute Töne überdecken leise Töne + +→ Warum Daten speichern, die niemand wahrnimmt? + + + +--- + + + + + + +# Verlustfrei vs. Verlustbehaftet + +| | Verlustfrei (Lossless) | Verlustbehaftet (Lossy) | +|---|---|---| +| **Prinzip** | **Redundanz** entfernen | **Irrelevanz** entfernen | +| **Reversibel** | Ja (Original wiederherstellbar) | Nein (Information unwiederbringlich weg) | +| **Reduktion** | 30-50% | 80-99% | +| **Formate** | ZIP, PNG, FLAC, GIF | JPEG, MP3, H.264/H.265 | + +**Faustregel:** +- Medien für Endnutzer → Lossy oft akzeptabel +- Quellmaterial, Code, Archive → Lossless nötig + + + +--- + + + + +![bg fit](./assets/compression-types.png) + + + +--- + + + + +# Die Grundbausteine +## Bits, Bytes und ihre Darstellung + +--- + @@ -233,231 +374,13 @@ Praktikabilität: Rechnung: 2·2·2·2·2·2·2·2 = 256 mögliche Kombinationen -von griech. hexa „sechs“ und lat. decem „zehn“ +von griech. hexa „sechs" und lat. decem „zehn" Eselsbrücke: 1 Byte = 1 Buchstabe/Symbol (in ASCII/UTF-8 für einfache Zeichen) --> --- - - - - - -# Dateneinheiten - -| Einheit | Bytes | Potenz | Beispiel | -|---------|-------|--------|----------| -| **1 Byte** | 1 | 10⁰ | Farbwerte eines Pixels | -| **1 Kilobyte (KB)** | 1.000 | 10³ | Kleiner Programmcode | -| **1 Megabyte (MB)** | 1 Million (Mio.) | 10⁶ | Textdokument | -| **1 Gigabyte (GB)** | 1 Milliarde (Mrd.) | 10⁹ | Kinofilm in FullHD | -| **1 Terabyte (TB)** | 1 Billion (Bio.) | 10¹² | ~12h Video in 4K | - - - ---- - - - - - - -# Dateneinheiten (Fortsetzung) - -| Einheit | Bytes | Potenz | Beispiel | -|---------|-------|--------|----------| -| **1 Petabyte (PB)** | 1 Billiarde (Brd.) | 10¹⁵ | Netflix-Gesamtarchiv | -| **1 Exabyte (EB)** | 1 Trillion (Trill.) | 10¹⁸ | Alle E-Mails weltweit/Tag | -| **1 Zettabyte (ZB)** | 1 Trilliarde | 10²¹ | Internet-Traffic 2016 | -| **1 Yottabyte (YB)** | 1 Quadrillion | 10²⁴ | *Noch nie erreicht* | - - - ---- - -# Datenwachstum der Menschheit - -| Jahr | Datenmenge | Kontext | -|------|------------|---------| -| **100.000 v. Chr.** | 0 | Erste Menschen, nur Sprache | -| **3.000 v. Chr.** | ~wenige KB | Keilschrift, Hieroglyphen | -| **1450** | ~wenige GB | Gutenberg, Buchdruck | -| **1986** | **2,6 EB** | 99% analog (Bücher, Vinyl, VHS) | -| **2007** | **295 EB** | 94% digital | -| **2025** | **181 ZB** | 90% unstrukturiert | - - - ---- - - - - - - -# Der digitale Wendepunkt - -| Jahr | Analog | Digital | Digital-Anteil | -|------|--------|---------|----------------| -| **1986** | 2,6 EB | 0,02 EB | **1%** | -| **2002** | — | — | **50%** (Wendepunkt) | -| **2007** | 18 EB | 277 EB | **94%** | - -**Perspektive:** -- 1986: "Petabyte" war ein theoretisches Konzept -- 2025: ~181 Zettabyte jährlich produziert - -**Magnetband lebt:** LTO-Tapes bleiben günstigstes Archivmedium -(AWS Glacier, Film-Archive, Rechenzentren) - - - ---- - -# 181 Zettabyte – Was bedeutet das? - -**2025:** Welt erzeugt **181 ZB** pro Jahr - -- **2,5 Quintillionen Bytes** täglich -- **29 Terabyte** pro Sekunde -- **90%** davon: unstrukturiert (Videos, Bilder, Audio) -- **70%** davon: von Nutzern generiert - -**Zum Vergleich:** -- 1 ZB = 250 Milliarden DVDs -- 181 ZB = Jeder Mensch erzeugt ~23 TB/Jahr - - - ---- - -# AI-generierte Inhalte 2025 - -**Wie viel Content ist heute synthetisch?** - -| Bereich | AI-Anteil | -|---------|-----------| -| **Neue Webseiten** | ~74% enthalten AI-Content | -| **Web-Text gesamt** | ~30-40% AI-generiert | -| **Neue Artikel** | ~52% von AI geschrieben | -| **Social-Media-Bilder** | ~71% AI-generiert | - -**Prognose 2026:** 90% des Online-Contents synthetisch - - - ---- - - - -# ASCII -## One *Zeichensatz* to rule them all - - - ---- - - - - - -![bg fit](./assets/original-ascii-table.png) - - - ---- - @@ -574,7 +497,7 @@ background-color: #FF0000; = Rot → **1 Byte reicht nicht!** - --- + + +# Hexadezimal +## Die Sprache der Datei-Analyse + +--- + # Hexadezimal: Lesbarkeit **Binär ist unleserlich:** -`01001101 01010000 00110011` +`01010000 01001110 01000111` **Hexadezimal (Base 16):** -`4D 50 33` (= "MP3" in ASCII) +`50 4E 47` (= "PNG" in ASCII) **Jede Hex-Ziffer = 4 Bits (ein "Nibble")** 0-9, A-F (10=A, 11=B, ..., 15=F) @@ -684,6 +611,44 @@ Hex-Editor = Standard-Tool für Dateianalyse und Reverse Engineering --- +![bg right:40%](./assets/matrix-code.png) + +# WTF!? + +``` +89 50 4E 47 0D 0A 1A 0A +00 00 00 0D 49 48 44 52 +00 00 01 90 00 00 01 2C +``` + +--- + +![bg right:30%](./assets/matrix-code.png) + +# What the HEX-Code + +``` +89 50 4E 47 ... +``` + +| Binär | Hex | Dez | ASCII | +|-------|-----|-----|-------| +| `1000 1001` | `89` | 137 | ✗ (> 127) | +| `0101 0000` | `50` | 80 | **P** | +| `0100 1110` | `4E` | 78 | **N** | +| `0100 0111` | `47` | 71 | **G** | + +→ **PNG**-Signatur! (Das `89` markiert: "Ich bin binär, kein Text!") + + + +--- + @@ -766,31 +731,208 @@ Windows vertraut der Endung, aber "file" (Linux) liest Magic Number --- - + + + + -![bg contain right:22%](./assets/qr/hexed-it.png) +# Dateneinheiten -# Hands-On: HEX Files - -**Aufgabe (30 Min):** - -1. Drei Dateien ohne Dateiendung: - `hex1` `hex2` `hex3` -3. Lies erste 16 Bytes aus und identifiziere Dateiformat (Magic Number) -5. *Optional: Datei umbenennen und korrekte Dateiendung anhängen (bspw. `.jpg`)* - -**Tools:** -- Hex-Editor: [hexed.it](https://hexed.it) -- Magic Numbers: [en.wikipedia.org/wiki/List_of_file_signatures](https://en.wikipedia.org/wiki/List_of_file_signatures) +| Einheit | Bytes | Potenz | Beispiel | +|---------|------:|:------:|----------| +| **Byte** | 1 | 10⁰ | Farbwerte eines Pixels | +| **Kilobyte (KB)** | 1.000 | 10³ | Kleiner Programmcode | +| **Megabyte (MB)** | 1 Million | 10⁶ | Textdokument | +| **Gigabyte (GB)** | 1 Milliarde | 10⁹ | Kinofilm in FullHD | +| **Terabyte (TB)** | 1 Billion | 10¹² | ~12h Video in 4K | +| **Petabyte (PB)** | 1 Billiarde | 10¹⁵ | Netflix-Gesamtarchiv | +| **Exabyte (EB)** | 1 Trillion | 10¹⁸ | Alle E-Mails weltweit/Tag | +| **Zettabyte (ZB)** | 1 Trilliarde | 10²¹ | Internet-Traffic 2016 | + +--- + +# Datenwachstum der Menschheit + +| Jahr | Datenmenge | Kontext | +|------|------------|---------| +| **100.000 v. Chr.** | 0 | Erste Menschen, nur Sprache | +| **3.000 v. Chr.** | ~wenige KB | Keilschrift, Hieroglyphen | +| **1450** | ~wenige GB | Gutenberg, Buchdruck | +| **1986** | **2,6 EB** | 99% analog (Bücher, Vinyl, VHS) | +| **2007** | **295 EB** | 94% digital | +| **2025** | **181 ZB** | 90% unstrukturiert | + + + +--- + + + + + + +# Der digitale Wendepunkt + +| Jahr | Analog | Digital | Digital-Anteil | +|------|--------|---------|----------------| +| **1986** | 2,6 EB | 0,02 EB | **1%** | +| **2002** | — | — | **50%** (Wendepunkt) | +| **2007** | 18 EB | 277 EB | **94%** | + +**Perspektive:** +- 1986: "Petabyte" war ein theoretisches Konzept +- 2025: ~181 Zettabyte jährlich produziert + +**Magnetband lebt:** LTO-Tapes bleiben günstigstes Archivmedium +(AWS Glacier, Film-Archive, Rechenzentren) + + + +--- + + + + + +![bg fit](./assets/2011-hilbert.png) + + +--- + +# 181 Zettabyte – Was bedeutet das? + +**2025:** Welt erzeugt **181 ZB** pro Jahr + +- **2,5 Quintillionen Bytes** täglich +- **29 Terabyte** pro Sekunde +- **90%** davon: unstrukturiert (Videos, Bilder, Audio) +- **70%** davon: von NutzerInnen generiert + +**Zum Vergleich:** +- 1 ZB = 250 Milliarden DVDs +- 181 ZB = Jeder Mensch erzeugt ~23 TB/Jahr + + + +--- + +# AI-generierte Inhalte 2025 + +**Wie viel Content ist heute synthetisch?** + +| Bereich | AI-Anteil | +|---------|-----------| +| **Neue Webseiten** | ~74% enthalten AI-Content | +| **Web-Text gesamt** | ~30-40% AI-generiert | +| **Neue Artikel** | ~52% von AI geschrieben | +| **Social-Media-Bilder** | ~71% AI-generiert | + +**Prognose 2026:** 90% des Online-Contents synthetisch + + + +--- + + + +# ASCII +## One *Zeichensatz* to rule them all + + + +--- + + + + + +![bg fit](./assets/ascii-table-colored.png) + + --- @@ -824,13 +966,13 @@ Visueller Kontrast: Analog vs. Digital ### Distribution: physisch (Kauf, Verleih, Kopie) * **Text** - * Bücher, Zeitungen, Zeitschriften, Lochkarten + - Bücher, Zeitungen, Zeitschriften, Lochkarten * **Bild** - * Fotografie (Negativ, Dia, Polaroid), Mikrofilm + - Fotografie (Negativ, Dia, Polaroid), Mikrofilm * **Audio:** - * Schallplatte (Vinyl, Schellack), Tonband, Musikkassette + - Schallplatte (Vinyl, Schellack), Tonband, Musikkassette * **Video:** - * Film (35mm, Super 8), VHS, Betamax + - Film (35mm, Super 8), VHS, Betamax --- @@ -891,13 +1033,13 @@ Paradox: Gerade die Perfektion wurde zum "Problem" ### Distribution: Datenträger (CD, USB), Download, Streaming, P2P * **Text** - * E-Book (PDF, EPUB), Dokumente (TXT, DOCX) + - E-Book (PDF, EPUB), Dokumente (TXT, DOCX) * **Bild** - * Digitalfoto (JPEG, PNG, RAW, WebP, GIF) + - Digitalfoto (JPEG, PNG, RAW, WebP, GIF) * **Audio** - * Audiodatei (MP3, FLAC, WAV, AAC, OGG) + - Audiodatei (MP3, FLAC, WAV, AAC, OGG) * **Video** - * Videodatei (MP4, MKV, AVI, WebM) + - Videodatei (MP4, MKV, AVI, WebM) --- @@ -909,13 +1051,13 @@ Paradox: Gerade die Perfektion wurde zum "Problem" # Digitale Speichermedien * **Optische Speicher** - * CD, DVD, Blue-Ray + - CD, DVD, Blu-ray * **Magnetische Speicher** - * Festplatte (HDD), Magnetband (LTO) + - Festplatte (HDD), Magnetband (LTO) * **Flash-Speicher** - * SSD, USB-Stick, SD-Karte + - SSD, USB-Stick, SD-Karte * **Cloud-Speicher** - * Dropbox, Google Drive, iCloud, AWS S3 + - Dropbox, Google Drive, iCloud, AWS S3 --- @@ -923,7 +1065,9 @@ Paradox: Gerade die Perfektion wurde zum "Problem" **CD-Qualität (1982):** Ziel: Analoge Schallwelle möglichst originalgetreu rekonstruieren -44.100 Hz × 16 Bit × 2 Kanäle = **10,6 MB/Minute** +44.100 Hz × 16 Bit × 2 Kanäle = **10,584 MB/Minute** + + | Inhalt | Größe | Problem (1990er) | |--------|-------|------------------| @@ -977,7 +1121,7 @@ Fangfrage: "Wie hoch ist die Sample Rate von Vinyls?" -> *Vinyl has no sample ra --> --- - + # Die Abtastrate (Sample Rate) **Analog → Digital ≙ Kontinuierlich → Diskret** ``` @@ -1138,7 +1282,7 @@ Karlheinz Brandenburg, Diplom-Ingenieur **1995:** .mp3 Dateiendung offiziell - - ---- - - - - -![bg fit](./assets/compression-types.png) - - ---- - - - - - - -# Verlustfrei vs. Verlustbehaftet - -| | Verlustfrei (Lossless) | Verlustbehaftet (Lossy) | -|---|---|---| -| **Prinzip** | **Redundanz** entfernen | **Irrelevanz** entfernen | -| **Reversibel** | Ja (Original wiederherstellbar) | Nein (Daten unwiederbringlich weg) | -| **Reduktion** | 30-50% | 80-99% | -| **Formate** | ZIP, PNG, FLAC, GIF | JPEG, MP3, H.264/H.265 | - -**Faustregel:** - * **Medien**, Bilder, Videos, Audio → (tendenziell) verlustbehaftet - * **Vektorgrafiken**, Textdokumente, Archive, Programmcode → verlustfrei - - - --- # Beispiel: Verlustbehaftet (lossy) @@ -1336,6 +1439,8 @@ PSYCHOAKUSTIK (MP3): KERNKONZEPT: Kompression = Modell der menschlichen Wahrnehmung --> + ---- - - - - - -![bg fit](./assets/audio-spectrogram.png) - - --- @@ -1384,7 +1475,7 @@ Visuell: Dunkle Bereiche = fehlende Frequenzen **2017:** Patente laufen aus → MP3 ist frei - - -# Hands-On: Audio-Spektrogram - -**Aufgabe (30 Min):** - -* Live Spektrogram untersuchen https://borismus.github.io/spectrogram/ -* Mit Effekten experimentieren https://audiomass.co/ -* Spektrogramme vergleichen Audacity (kostenloser Download nötig) [https://manual.audacityteam.org/man/spectrogram_view.html](https://manual.audacityteam.org/man/spectrogram_view.html) - - - ---- - # Fragen & Diskussion @@ -1505,3 +1576,52 @@ Diese Präsentation ist lizenziert unter **Creative Commons Attribution-ShareAli Vollständige Lizenz: https://creativecommons.org/licenses/by-sa/4.0/ +--- + + + + +# Selbstlernen: Audio-Spektrogram + +**Aufgabe (30 Min):** + +- Live Spektrogram untersuchen https://borismus.github.io/spectrogram/ +- Mit Effekten experimentieren https://audiomass.co/ +- Spektrogramme vergleichen Audacity (kostenloser Download nötig) [https://manual.audacityteam.org/man/spectrogram_view.html](https://manual.audacityteam.org/man/spectrogram_view.html) + + + +--- + + + + +![bg contain right:22%](./assets/qr/hexed-it.png) + +# Selbstlernen: HEX Files + +1. Drei Dateien ohne Dateiendung: + `hex1` `hex2` `hex3` +3. Lies erste 16 Bytes aus und identifiziere Dateiformat (Magic Number) +5. *Optional: Datei umbenennen und korrekte Dateiendung anhängen (bspw. `.jpg`)* + +**Tools:** +- Hex-Editor: [hexed.it](https://hexed.it) +- Magic Numbers: [en.wikipedia.org/wiki/List_of_file_signatures](https://en.wikipedia.org/wiki/List_of_file_signatures) + + +