--- marp: true theme: gaia paginate: true backgroundColor: #fff header: "Dateiformate, Schnittstellen, Speichermedien & Distributionswege (223015b)" footer: "Michael Czechowski – HdM Stuttgart – SoSe 2026" title: Dateiformate, Schnittstellen, Speichermedien & Distributionswege --- ![bg cover opacity:0.2](./assets/radek-grzybowski-eBRTYyjwpRY-unsplash.jpg) # Dateiformate, Schnittstellen, Speichermedien & Distributionswege **223015b** · Modul "Technik 1" · 1. Semester Digital- und Medienwirtschaft Hochschule der Medien Stuttgart [https://librete.ch/hdm/223015b/](https://librete.ch/hdm/223015b/) --- ![bg fit](./assets/qrcode-1.svg) --- # Teil 1: Einführung ## Grundlagen, Text & Audio --- # Was sind Daten? --- # Was sind (digitale) Daten? * **Text** — Artikel, Gesetzestext, Hausarbeit → `.txt` `.docx` `.pdf` * **Bild** — Foto, Screenshot, 3D-Rendering, Illustration → `.jpg` `.png` `.svg` * **Audio** — Song, Podcast, Sprachmemo → `.mp3` `.wav` `.flac` * **Video** — Reel, Film, Stream → `.mp4` `.mov` `.mkv` --- # Was sind (digitale) Daten? - **Text** — Artikel, Gesetzestext, Hausarbeit → `.txt` `.docx` `.pdf` - **Bild** — Foto, Screenshot, 3D-Rendering, Illustration → `.jpg` `.png` `.svg` - **Audio** — Song, Podcast, Sprachmemo → `.mp3` `.wav` `.flac` - **Video** — Reel, Film, Stream → `.mp4` `.mov` `.mkv` **Am Ende alles nur Nullen und Einsen** --- # Bandbreite: Was bedeuten 150 mbps? **150mbps** = **150 Mbit/s** ≠ **150 MB/s** Wenn **1 Byte (B) = 8 bit (b)**, dann **150 Mbit/s ÷ 8** = **18,75 MB/s** | Bandbreite | MB/s | 1 GB Film | |---------|-----:|----------:| | 16 Mbit/s (ADSL) | 2 MB/s | ~8 Min | | 50 Mbit/s (ADSL) | 6,25 MB/s | ~2,7 Min | | 150 Mbit/s (ADSL) | 18,75 MB/s | ~54 Sek | | 1 Gbit/s (Glasfaser) | 125 MB/s | ~8 Sek | --- # Wie viele Megabyte können bei einer Bandbreite von 250 Mbit/s pro Minute heruntergeladen werden? * A) 1,8 GB * B) 31,25 MB * C) 1.875 MB * D) 250 MB --- # Upload: Der stille Flaschenhals **ADSL = Asymmetric Digital Subscriber Line** | Bandbreite | Download | Upload | |---------|----------:|-------:| | 16 Mbit/s DSL | 16 Mbit/s | 1 Mbit/s | | 50 Mbit/s DSL | 50 Mbit/s | 10 Mbit/s | | 150 Mbit/s DSL | 150 Mbit/s | 40 Mbit/s | | Glasfaser (FTTH) | 1 Gbit/s | 1 Gbit/s | **50 MB Upload bei 10 Mbit/s = ~40 Sekunden** --- # Analog vs. Digital --- ![bg fit right:40%](./assets/druckwelle.png) # Schall ist eine Druckwelle * Lautsprecher drückt Luft → Luftmoleküle schwingen * Die Welle breitet sich aus — kontinuierlich, ohne Stufen * Vakuum: Keine Schallübertragung möglich (kein Medium) --- ![bg fit right:40%](./assets/druckwelle.png) # Schall ist eine Druckwelle - Lautsprecher drückt Luft → Luftmoleküle schwingen - Die Welle breitet sich aus — kontinuierlich, ohne Stufen - Vakuum: Keine Schallübertragung möglich (kein Medium) **Vinyl:** Die Rille *ist* die Schallwelle — physische Kopie der Druckschwankung in Rillengeometrie --- ![bg fit right:35%](./assets/samplerate.webp) # Abtastung (Sampling) **Problem:** Eine kontinuierliche Welle lässt sich nicht direkt als Zahl speichern **Lösung:** Wir messen sie in regelmäßigen Abständen * 44.100 Messungen *pro Sekunde* = **Abtastrate** (Sample Rate) * Einheit: Hz (Hertz) = *pro Sekunde* * Nyquist-Theorem: min. 2× höchste darzustellende Frequenz → 44.100 ÷ 2 = 22.050 Hz (Mensch hört ~20–20 kHz) --- ![bg fit right:35%](./assets/samplerate.webp) # Das digitale Ergebnis Jede Messung = ein Zahlenwert **Wie genau ist jede Messung? → Bittiefe (Bit Depth)** | Bittiefe | Stufen | Dynamikumfang | |----------|-------:|---------------| | 8 Bit | 256 | ~48 dB | | 16 Bit (CD) | 65.536 | ~96 dB | | 24 Bit (Studio) | 16.777.216 | ~144 dB | **Ergebnis:** Eine Datei aus Zahlen --- ![bg fit right:35%](./assets/samplerate.webp) # Zurück zu Analog Beim Abspielen läuft der Prozess rückwärts: * Zahlen → **DAC** (Digital-Analog-Converter) * DAC → elektrische Spannung * Spannung → Lautsprechermembran schwingt * Membran → Luft schwingt * Luft → Druckwelle → Ohr --- ![bg fit right:35%](./assets/samplerate.webp) # Zurück zu Analog Beim Abspielen läuft der Prozess rückwärts: - Zahlen → **DAC** (Digital-Analog-Converter) - DAC → elektrische Spannung - Spannung → Lautsprechermembran schwingt - Membran → Luft schwingt - Luft → Druckwelle → Ohr **Was wir hören ist wieder analog** --- # Das Problem der Datengröße --- # Das Problem der Datengröße ## oder knappen Speichers --- ![bg fit](./assets/compact-disc-cd.jpg) --- ![bg right:40%](./assets/IMG_3617.jpg) # Ein konkretes Beispiel **Eine Minute Musik in CD-Qualität:** **44.100 Messungen** (pro Sekunde) --- ![bg right:40%](./assets/IMG_3617.jpg) # Ein konkretes Beispiel **Eine Minute Musik in CD-Qualität:** **44.100 Messungen** (pro Sekunde) × **16 Bit** (pro Messung) --- ![bg right:40%](./assets/IMG_3617.jpg) # Ein konkretes Beispiel **Eine Minute Musik in CD-Qualität:** **44.100 Messungen** (pro Sekunde) × **16 Bit** (pro Messung) × **2 Kanäle** (Stereo) --- ![bg right:40%](./assets/IMG_3617.jpg) # Ein konkretes Beispiel **Eine Minute Musik in CD-Qualität:** **44.100 Messungen** (pro Sekunde) × **16 Bit** (pro Messung) × **2 Kanäle** (Stereo) × **60 Sekunden** = **10,6 MB pro Minute** --- ![bg right:40%](./assets/IMG_3617.jpg) # Ein konkretes Beispiel **Eine Minute Musik in CD-Qualität:** **44.100 Messungen** (pro Sekunde) × **16 Bit** (pro Messung) × **2 Kanäle** (Stereo) × **60 Sekunden** = **10,6 MB pro Minute** = **10.600.000 Byte pro Minute** --- ![bg right:40%](./assets/IMG_3617.jpg) # Ein konkretes Beispiel **Eine Minute Musik in CD-Qualität:** **44.100 Messungen** (pro Sekunde) × **16 Bit** (pro Messung) × **2 Kanäle** (Stereo) × **60 Sekunden** = **10,6 MB pro Minute** = **10.600.000 Byte pro Minute** = **84.800.000 bit pro Minute** --- ![bg right:40%](./assets/IMG_3617.jpg) # Das Problem skaliert | Inhalt | Unkomprimiert | |--------|-------------:| | 1 Song (4 Min) | ~42 MB | | 1 Album (60 Min) | ~635 MB | | 10.000 Songs | ~420 GB | **Kontext 1990er:** - Übliche Festplattengröße: 100–500 MB - 56 kbit/s Modem → Einfache Songs laden Stunden --- ![bg right:32% contain](./assets/kubrick.jpg) # Video eskaliert **Eine Minute 4K-Video (unkomprimiert):** **3840 × 2160 Pixel** (Auflösung pro Bild) × **3 Byte** (pro Pixel – RGB) × **30 Bilder** (pro Sekunde) × **60 Sekunden** = **~45 GB pro Minute** Kinofilm in üblicher Länge (~120min) über **5 TB (Terabyte)** --- ![bg right:40%](./assets/artemis.jpg) # Artemis II orbitiert | | Apollo (1969) | Artemis II (2026) | |---|---|---| | Bandbreite | ~50 kbit/s | 260 Mbit/s | | Video | SW, ~320 Zeilen | HD live, 4K gespeichert | | Codec | analog | H.265 (HEVC) | 260.000.000 Bit/s ÷ 8 (Bit pro Byte) = 32,5 MB/s × 60 Sekunden = **1,95 GB pro Minute** *Apollo: 50 kbit/s = 0,375 MB/min* --- # Kompressionsraten in der Praxis | Medium | Unkomprimiert | Komprimiert | Faktor | |--------|-------------:|------------:|-------:| | 1 Song (4 Min) | ~42 MB | ~4 MB (MP3 128) | ~10× | | 1 Foto (12 MP) | ~36 MB | ~3 MB (JPEG) | ~12× | | 1 Min 4K-Video | ~45 GB | ~375 MB (H.264) | ~120× | --- # Zwei Arten der Datenkompression --- # Zwei Arten von Datenkompressionsalgorithmen --- --- # Verlustfreie Kompression (Lossless) **Prinzip:** Redundanz entfernen --- # Verlustfreie Kompression (Lossless) **Prinzip:** Redundanz entfernen Beispiel **Lauflängenkodierung** (Run-Length-Encoding – RLE): ``` Original: AAAAABBBCCCCCCCC (16 Zeichen) Komprimiert: 5A3B8C (6 Zeichen) ``` → Komprimiert 62% kleiner und **100% wiederherstellbar** --- # Verlustfreie Kompression (Lossless) **Prinzip:** Redundanz entfernen Beispiel **Lauflängenkodierung** (Run-Length-Encoding – RLE): ``` Original: AAAAABBBCCCCCCCC (16 Zeichen) Komprimiert: 5A3B8C (6 Zeichen) ``` → Komprimiert 62% kleiner und **100% wiederherstellbar** **Anwendung:** * ZIP-Archive, PNG-Bilder, FLAC-Audiodateien, RAW-Dateien, Programmcode --- # Verlustbehaftete Kompression (Lossy) **Prinzip:** Irrelevanz entfernen → *Wozu Daten speichern, die niemand wahrnimmt?* --- # Verlustbehaftete Kompression (Lossy) **Prinzip:** Irrelevanz entfernen → *Wozu Daten speichern, die niemand wahrnimmt?* **Originaldatei nicht wiederherstellbar (!)** **Die Frage:** Was nimmt ein Mensch eigentlich (nicht oder sehr schlecht) wahr? * Das Ohr hört nicht alle Frequenzen (hohe und tiefe Töne) gleich gut * Laute Töne überdecken leise Töne (Maskierung) * Das Auge sieht nicht alle Farbnuancen gleich scharf * Luminanz (Helligkeit/Dunkelheit) besser erkennen als Chrominanz (Farbunterschiede/Farbigkeit) * und Vieles mehr --- # Verlustfrei vs. Verlustbehaftet | | Verlustfrei (Lossless) | Verlustbehaftet (Lossy) | |---|---|---| | **Prinzip** | **Redundanz** entfernen | **Irrelevanz** entfernen | | **Reversibel** | Ja | Nein (Information unwiederbringlich verloren) | | **Reduktion** | 30–50% | 80–99% | | **Formate** | ZIP, PNG, FLAC, GIF, ... | JPEG, MP3, H.264/H.265, ... | **Faustregel:** - Medien für EndnutzerInnen (Ton, Bild, Film) → Lossy oft akzeptabel - Quellmaterial, Code, Archive (RAW) → Lossless nötig --- # Die Grundbausteine ## Bits, Bytes und ihre Darstellung --- ![bg](./assets/lightbulb-onoff.png) --- ![bg](./assets/morpheus.jpg) --- # Das bit ### Kleinste *logische* Informationseinheit * **0 oder 1** * AN oder AUS * Strom fließt oder nicht * Schwarz oder Weiß * Richtig oder Falsch * Take the red pill or blue pill --- # Das Byte ### Die kleinste *adressierbare* Informationseinheit --- # Das Byte ### Die kleinste *adressierbare* Informationseinheit ### 1 Byte = 8 Bits ``` 0 0 1 0 1 0 1 0 = 42 ``` --- # Das Byte ### Die kleinste *adressierbare* Informationseinheit ### 1 Byte = 8 Bits ``` 0 0 0 0 0 0 0 0 = 0 0 0 0 0 0 0 0 1 = 1 0 0 0 0 0 0 1 0 = 2 0 0 0 0 0 0 1 1 = 3 0 0 0 0 0 1 0 0 = 4 0 1 0 0 0 0 0 0 = 64 0 1 1 1 1 1 1 1 = 127 1 1 1 1 1 1 1 1 = ? ``` --- # Das Byte ### Die kleinste *adressierbare* Informationseinheit ### 1 Byte = 8 Bits ``` 0 0 0 0 0 0 0 0 = 0 0 0 0 0 0 0 0 1 = 1 0 0 0 0 0 0 1 0 = 2 0 0 0 0 0 0 1 1 = 3 0 0 0 0 0 1 0 0 = 4 0 1 0 0 0 0 0 0 = 64 0 1 1 1 1 1 1 1 = 127 1 1 1 1 1 1 1 1 = ? ``` 2 * 2 * 2 * 2 * 2 * 2 * 2 * 2 = 2⁸ = **256 mögliche Zustände** --- »256 Shades of Gray« ![bg fit](./assets/grayscale-gradient.png) --- # Was kann man mit 256 Zuständen machen? * **256 Zeichen** (Buchstaben, Zahlen, Symbole) * **256 Helligkeit bzw. Luminanz** (0 = Schwarz/Dunkel, 255 = Weiß/Hell) * **256 Lautstärkestufen** * **Zahlen 0–255** (oder –128 bis +127) --- ![bg fit](./assets/rgb-color-model.png) --- ![bg fit](./assets/rgb-color-model-with-title.png) --- ![bg right:50%](./assets/addaptive-substractive-colors.jpg) # Farben: RGB-Modell **1 Pixel = 3 Byte** - **Rot:** 0–255 - **Grün:** 0–255 - **Blau:** 0–255 **Beispiele:** `FF 00 00` = Rot `00 FF 00` = Grün `00 00 FF` = Blau `00 00 00` = Schwarz `FF FF FF` = Weiß --- # Das Problem: Sprachen **Die Welt hat mehr als 256 Zeichen (!)** - Englisches Alphabet: 52 (A–Z, a–z) - + Ziffern: 10 (0–9) - + Sonderzeichen: ~30 **≈ 90 Zeichen passen problemlos in 1 Byte** **Jedoch ohne** ä, ö, ü, ß, é, à, ç, α, β, 中, 日, 🌸 --- # Unicode: Ein Standard für alle **Unicode (1991):** Jedes Schriftsystem der Welt **>150.000 Zeichen:** - Latein, Kyrillisch, Arabisch, Chinesisch, Japanisch... - Mathematische Symbole, Emoji, historische Schriften **UTF-8:** Variable Länge (1–4 Bytes pro Zeichen) - **Zeichen 0–127: identisch mit ASCII** (Abwärtskompatibilität!) - 1.112.064 gültige Codepunkte - Umlaute: 2 Bytes · CJK: 3 Bytes · Emoji: 4 Bytes --- # Beispiel: Bytes zählen **Text:** `"Hello·🌸·こんにちは·(Kon-ni-chi-wa)"` | Zeichen | Bytes | |---------|-------| | `Hello·` | 6 × 1 = **6 Bytes** (ASCII) | | `🌸` | **4 Bytes** (Emoji) | | `·` | **1 Byte** | | `こんにちは` | 5 × 3 = **15 Bytes** (Hiragana) | | `·(Kon-ni-chi-wa)` | **16 Bytes** (ASCII) | **Gesamt: 42 Bytes** für 29 sichtbare Zeichen --- # Hexadezimal ## Die Sprache der Datei-Analyse --- # Hexadezimal: Lesbarkeit **Für den Menschen ungeeignet:** `01010000 01001110 01000111` **Hexadezimal (Base 16):** `50 4E 47` `5 = 0101` `0 = 0000` `4 = 0100` `E = 1110` `4 = 0100` `7 = 0111` **Jede Hex-Ziffer = 4 Bits (ein "Nibble")** 0–9, A–F (10=A, 11=B, ..., 15=F) --- # ASCII ## One *Zeichensatz* to rule them all --- ![bg fit](./assets/ascii-table-colored.png) --- ![bg right:40%](./assets/matrix-code.png) # WTF!? ``` 89 50 4E 47 0D 0A 1A 0A 00 00 00 0D 49 48 44 52 00 00 01 90 00 00 01 2C ``` --- ![bg right:30%](./assets/matrix-code.png) # What the HEX-Code ``` 89 50 4E 47 ... ``` | Binär | Hex | Dez | ASCII | |-------|-----|-----|-------| | `1000 1001` | `89` | 137 | ✗ (> 127) | | `0101 0000` | `50` | 80 | **P** | | `0100 1110` | `4E` | 78 | **N** | | `0100 0111` | `47` | 71 | **G** | → `89` übersteigt den ASCII-Raum und markiert eine Binärdatei --- ![bg fit](./assets/hex-code-hidden.png) --- ![bg fit](./assets/hex-code.png) --- ![bg fit](./assets/8bit-P-character.png) --- # Magic Numbers **Dateityp-Identifikation durch erste Bytes** | Format | Magic Number (Hex) | Lesbar? | |--------|-------------------|---------| | PNG | `89 50 4E 47` | ✗ P N G | | JPEG | `FF D8 FF` | ✗ ✗ ✗ | | PDF | `25 50 44 46` | % P D F ✓ | | ZIP | `50 4B 03 04` | P K ✗ ✗ | **Wichtig:** ASCII = nur 0–127! Werte darüber (z.B. `89` = 137) sind **nicht druckbar** (non-printable). *Hex-Editoren zeigen dafür `.` oder `ÿ` als Platzhalter.* --- # Dateneinheiten | Einheit | Bytes | Potenz | Beispiel | |---------|------:|:------:|----------| | **Byte** | 1 | 10⁰ | Farbwert eines Pixels | | **Kilobyte (KB)** | 1.000 | 10³ | Kleiner Programmcode | | **Megabyte (MB)** | 1 Million | 10⁶ | Textdokument | | **Gigabyte (GB)** | 1 Milliarde | 10⁹ | Kinofilm in FullHD | | **Terabyte (TB)** | 1 Billion | 10¹² | ~12h Video in 4K | | **Petabyte (PB)** | 1 Billiarde | 10¹⁵ | Netflix-Gesamtarchiv | | **Exabyte (EB)** | 1 Trillion | 10¹⁸ | Alle E-Mails weltweit/Tag | | **Zettabyte (ZB)** | 1 Trilliarde | 10²¹ | Globale Datenmenge 2025 | --- # Datenwachstum der Menschheit | Jahr | Datenmenge | Kontext | |------|------------|---------| | **100.000 v. Chr.** | 0 | Erste Menschen, nur Sprache | | **3.000 v. Chr.** | ~wenige KB | Keilschrift, Hieroglyphen | | **1450** | ~wenige GB | Gutenberg, Buchdruck | | **1986** | **2,6 EB** | 99% analog (Bücher, Vinyl, VHS) | | **2007** | **295 EB** | 94% digital | | **~2025** | **~175–181 ZB** | Prognose (IDC DataSphere Forecast, 2021) | --- # Der digitale Wendepunkt | Jahr | Analog | Digital | Digital-Anteil | |------|--------|---------|----------------| | **1986** | 2,6 EB | 0,02 EB | **1%** | | **2002** | — | — | **50%** (Wendepunkt) | | **2007** | 18 EB | 277 EB | **94%** | **Perspektive:** - 1986: "Petabyte" war ein theoretisches Konzept - Magnetband lebt: LTO-Tapes bleiben günstigstes Archivmedium (AWS Glacier, Film-Archive, Rechenzentren) --- # Digitaler Wendepunkt – Vertiefung Die Studie von Hilbert & López (Science 332, 2011) analysierte 60 Speichertechnologien von 1986–2007. Der Wendepunkt 2002 markiert den Moment, ab dem mehr Information digital als analog existierte. **Was 1986 „analog" bedeutete:** - Bücher, Zeitungen, Magazine: ~8 EB - Vinyl-Schallplatten, Musikkassetten: ~12 EB - VHS-Kassetten, Filmrollen: ~60 EB **Warum analog stagnierte:** Physische Medien haben Kapazitätsgrenzen. Eine VHS speichert ~10 GB; eine Blu-ray (2006) bereits 50 GB auf kleinerer Fläche. **LTO-Magnetband überlebt** trotz „alter" Technologie: | Medium | Kosten/TB | Lebensdauer | Energiebedarf | |--------|-----------|-------------|---------------| | SSD | ~50 € | 5–10 Jahre | Dauerstrom | | HDD | ~15 € | 3–5 Jahre aktiv | Dauerstrom | | LTO-9 | ~5 € | 30+ Jahre | Nur beim Zugriff | AWS Glacier, Google Coldline und Film-Archive nutzen LTO — langsamer Zugriff, aber unschlagbar günstig und langlebig. --- ![bg fit](./assets/2011-hilbert.png) --- # 181 Zettabyte – Was bedeutet das? **Prognose 2025:** Welt erzeugt ca. **175–181 ZB** pro Jahr - **1 ZB** = 250 Milliarden DVDs - **29 Terabyte** pro Sekunde (Hochrechnung) **Zum Vergleich:** - 2007: 295 Exabyte (Hilbert & López, Science 2011) - 2020: ~64 Zettabyte (IDC) - ~2025: ~175–181 ZB (IDC DataSphere Forecast, Prognose von 2021) --- ![bg fit](./assets/growth-of-big-data.png) --- # AI-generierte Inhalte 2025 **Wie viel Content ist heute synthetisch?** | Bereich | AI-Anteil | |---------|-----------| | **Neue Webseiten** | ~74% enthalten AI-Content | | **Web-Text gesamt** | ~30–40% AI-generiert | | **Neue Artikel** | ~52% von AI geschrieben | | **Social-Media-Bilder** | ~71% AI-generiert | **Prognose 2026:** 90% des Online-Contents synthetisch --- # Teil 2: Die MP3-Revolution ## Psychoakustik & Audio-Kompression --- ![bg](./assets/cassette-ipod.png) --- # Analoge Medien ### Distribution: physisch (Kauf, Verleih, Kopie) * **Text** - Bücher, Zeitungen, Zeitschriften, Lochkarten * **Bild** - Fotografie (Negativ, Dia, Polaroid), Mikrofilm * **Audio:** - Schallplatte (Vinyl, Schellack), Tonband, Musikkassette * **Video:** - Film (35mm, Super 8), VHS, Betamax --- # Analoge Medien – Vertiefung Analoge Speicherung codiert Information als **kontinuierliche physikalische Größe**: Rillentiefe (Vinyl), Magnetfeldstärke (Tonband), Silberkorn-Dichte (Film). Es gibt keine diskreten Stufen — theoretisch unendliche Auflösung, praktisch begrenzt durch Rauschen. **Generationsverlust** entsteht, weil jede Kopie neues Rauschen addiert: - Schallplatte → Kassette: Frequenzgang leidet, Rauschen steigt - VHS → VHS: Farbsättigung sinkt, Schärfe nimmt ab - 3. Generation: oft unbrauchbar | Medium | Typische Auflösung | Dynamik | |--------|-------------------|---------| | Vinyl (audiophil) | ~20–20.000 Hz | ~70 dB | | Tonband (Studio) | ~30–15.000 Hz | ~55 dB | | 35mm Film | ~4K-äquivalent | ~13 Blendenstufen | **Paradox der Analogtechnik:** Das Original ist einzigartig und unersetzlich — aber genau deshalb anfällig. Jedes Abspielen einer Schallplatte trägt mikroskopisch Material ab; jeder Filmdurchlauf riskiert Kratzer. --- # Analoge Medien: Vor- und Nachteile | Vorteile | Nachteile | |----------|-----------| | Kein Abspielgerät nötig (Buch, Foto) | Qualitätsverlust bei jeder Kopie | | Haptisches Erlebnis | Physischer Verschleiß | | Unabhängig von Strom/Internet | Begrenzte Haltbarkeit | | Keine Formatkonvertierung | Platzbedarf bei Lagerung | | Eindeutiges Original | Aufwendige Durchsuchbarkeit | --- # Von Analog zu Digital: Die Kopier-Revolution **Das Problem analoger Kopien:** Kassette → Kassette → Kassette = immer schlechter **Was Digital anders macht:** * **Identische Kopien** — kein Qualitätsverlust, nie * **Einfache Massenproduktion** — Copy & Paste * **Perfekte Archivierung** — Bits verändern sich nicht **Daher: "Raubkopien"** Der Begriff entstand, weil digitale Kopien *tatsächlich identisch* mit dem Original waren — nicht wie bei Kassetten eine schlechtere Version. Quelle: [c64-wiki.de/wiki/Raubkopie](https://www.c64-wiki.de/wiki/Raubkopie) --- # Digitale Medien ### Distribution: Datenträger (CD, USB), Download, Streaming, P2P * **Text** - E-Book (PDF, EPUB), Dokumente (TXT, DOCX) * **Bild** - Digitalfoto (JPEG, PNG, RAW, WebP, GIF) * **Audio** - Audiodatei (MP3, FLAC, WAV, AAC, OGG) * **Video** - Videodatei (MP4, MKV, AVI, WebM) --- # Digitale Medien – Vertiefung Digitale Speicherung quantisiert kontinuierliche Signale in diskrete Werte. Der **Quantisierungsfehler** (Differenz zum Original) ist der Preis der Digitalisierung — aber einmal digitalisiert, bleibt die Information exakt. **Bit-identische Kopien** revolutionierten die Medienindustrie: - Keine Qualitätskette mehr: 1000. Kopie = 1. Kopie = Original - Kosten pro Kopie: praktisch null (nur Speicherplatz) - Perfekte Archivierung: Bits altern nicht (nur der Datenträger) | Aspekt | Analog | Digital | |--------|--------|---------| | Kopiervorgang | Physikalischer Prozess | Bit-Kopie | | Qualität pro Generation | Verschlechtert | Identisch | | Fehlerkorrektur | Unmöglich | Möglich (ECC, RAID) | | Formatmigration | Verlust | Verlustfrei möglich | **Die Kehrseite:** Digitale Obsoleszenz. Ein DOCX von 2025 ist in 50 Jahren womöglich unlesbar — während ein Buch von 1525 heute noch lesbar ist. Offene Formate (PDF/A, FLAC, PNG) mildern dieses Risiko. --- # Digitale Speichermedien * **Optische Speicher** - CD, DVD, Blu-ray * **Magnetische Speicher** - Festplatte (HDD), Magnetband (LTO) * **Flash-Speicher** - SSD, USB-Stick, SD-Karte * **Cloud-Speicher** - Dropbox, Google Drive, iCloud, AWS S3 --- # Digitale Speichermedien – Vertiefung Jede Technologie hat physikalische Vor- und Nachteile: **Optisch (CD/DVD/Blu-ray):** Laser liest Pits (Vertiefungen) und Lands (Erhöhungen). Robust gegen Magnetfelder, aber empfindlich gegenüber Kratzern und UV-Licht. M-DISC verspricht 1000 Jahre — unter Laborbedingungen. **Magnetisch (HDD/LTO):** Magnetisierte Bereiche auf rotierenden Platten oder Band. HDDs haben bewegliche Teile (Verschleiß); LTO-Bänder sind passiv und extrem langlebig, aber sequentieller Zugriff. **Flash (SSD/USB/SD):** Elektronen in Floating Gates speichern Bits. Keine beweglichen Teile, aber begrenzte Schreibzyklen (TLC: ~3.000, SLC: ~100.000). Ohne Strom verlieren Zellen nach Jahren ihre Ladung. | Szenario | Empfehlung | Grund | |----------|------------|-------| | Betriebssystem | NVMe SSD | Geschwindigkeit | | Videoarchiv | HDD | Kapazität/Preis | | Langzeitarchiv | LTO + M-DISC | Lebensdauer | | Austausch | USB/SD | Portabilität | **Cloud** ist physisch HDD/SSD/LTO in Rechenzentren — kein eigenes Medium, sondern Zugriffsmethode. --- # Das Speicherproblem der Digitalisierung **Ziel: Analoge Schallwelle möglichst originalgetreu rekonstruieren** *CD-Qualität (1982): 44.100 Hz × 16 Bit × 2 Kanäle = 10,584 MB/Minute* | Inhalt | Größe | Problem (1990er) | |--------|-------|------------------| | 1 Song (4 Min) | ~42 MB | Ausreichend Speicher | | 1 Album (60 Min) | ~635 MB | Gesamte Festplatte | --- ![bg cover](./assets/spectogram-chet-baker.png) --- # Die Abtastrate (Sample Rate) **Analog → Digital ≙ Kontinuierlich → Diskret** **Nyquist-Theorem:** > Um eine Frequenz zu rekonstruieren, braucht man mindestens **2× so viele Samples**. 44.100 Hz ÷ 2 = **22.050 Hz** max. darstellbare Frequenz (Mensch hört: ~20 Hz bis ~20.000 Hz → passt!) --- # Die Bittiefe (Bit Depth) **Wie genau messen wir jeden Punkt?** | Bittiefe | Stufen | Dynamikumfang | |----------|--------|---------------| | 8 Bit | 256 | ~48 dB | | 16 Bit (CD) | 65.536 | ~96 dB | | 24 Bit (Studio) | 16.777.216 | ~144 dB | **16 Bit = 2¹⁶ = 65.536 Lautstärkestufen** (von absoluter Stille bis maximaler Lautstärke) --- # Abtastrate (Sample Rate) × Bittiefe (Bit Depth) **Zwei Dimensionen der Digitalisierung:** | Dimension | Was bedeutet es? | CD-Qualität | |-----------|------------------|-------------| | **Abtastrate** (Sample Rate) | Messungen pro Sekunde (horizontal) | 44.100 Hz | | **Bittiefe** (Bit Depth) | Genauigkeit pro Messung (vertikal) | 16 Bit | **44.100 Hz × 16 Bit** × 2 Kanäle = 10,584 MB/Minute --- # Kompression ## Weniger Daten, gleiche(?) Information --- # Wo liegt der Hebel für Kompression? **CD-Qualität:** 44.100 Hz × 16 Bit × 2 Kanäle = **10,6 MB/Min** **MP3 (128 kbps):** = **~1 MB/Min** (Faktor 10!) **Container-Parameter (das Raster):** | Parameter | Reduzieren → | Konsequenz | |-----------|--------------|------------| | Abtastrate | Weniger Messpunkte/Sek | Max. Frequenz sinkt | | Bittiefe | Weniger Lautstärkestufen | Mehr Rauschen | | Kanäle | Mono statt Stereo | Kein Raumklang | --- # Psychoakustik: Der MP3-Trick **Inhalt (was durchs Raster geht):** | Methode | Reduzieren → | Konsequenz | |---------|--------------|------------| | Psychoakustik | Unhörbare Frequenzen | Kaum wahrnehmbar | → **MP3 nutzt hauptsächlich Psychoakustik** → Container bleibt ähnlich, Inhalt wird "ausgedünnt" --- # Die Geburt der MP3 **1982:** Universität Erlangen-Nürnberg Karlheinz Brandenburg, Diplom-Ingenieur **1987:** Fraunhofer IIS entwickelt MPEG-1 Audio Layer III **1988:** Patentanmeldung **1992:** Erste Software-Implementierung **1995:** .mp3 Dateiendung offiziell --- ![bg right:40%](./assets/karlheinz-brandenburg.jpg) # Karlheinz Brandenburg **"Vater der MP3"** - Diplom-Ingenieur, Universität Erlangen-Nürnberg - Fraunhofer IIS (Institut für Integrierte Schaltungen) - Forschung ab 1982, Patent 1988 --- ![bg right:50%](./assets/suzanne-vega.jpg) # Suzanne Vega **"Tom's Diner" (1987)** - Der erste Song, der als MP3 kodiert wurde - A cappella (keine Instrumente) - Klare, hohe Frequenzen - Perfekter Stresstest für Kompression - Brandenburg hörte "Tom's Diner" über 10.000 Mal --- # Wie funktioniert MP3? Ein Zusammenspiel aus vielen Faktoren: * **1. Frequenz-Analyse (FFT)** Audio → Frequenzspektrum * **2. Psychoakustisches Modell** Welche Töne hört Mensch nicht? * **3. Quantisierung** Unwichtige Frequenzen reduzieren * **4. Huffman-Coding** Lossless-Kompression der Restdaten --- # Bitrate: Der Qualitäts-Knopf | Bitrate | Qualität | Kompression | |---------|----------|-------------| | **128 kbps** | Hörbar schlechter | ~11x | | **192 kbps** | Akzeptabel | ~7x | | **256 kbps** | Gut | ~5,5x | | **320 kbps** | "CD-Qualität" | ~4,4x | **Original CD:** 1.411 kbps (unkomprimiert) --- # Der Patentkrieg **1990er:** Fraunhofer + Thomson halten MP3-Patente **Lizenzgebühren:** - $0,75 pro Decoder - $2,50 pro Encoder **Problem:** Napster (1999) → unkontrollierte Verbreitung **2017:** Patente laufen aus → MP3 ist frei --- ![bg right:50% fit](./assets/napster-2001.png) # Napster (1999) **P2P-Filesharing für MP3s** - Shawn Fanning, 19 Jahre alt - 80 Millionen User in 2 Jahren - Musikindustrie verklagt (2001) - Pandora's Box: Nicht mehr aufzuhalten --- ![bg right:40% contain](./assets/bittorrent.png) # Napster & Musikindustrie **1999:** Napster startet **2001:** 80 Millionen User **Musikindustrie:** - CDs kosten $15–20 - MP3s gratis (illegal, aber yolo) - Einzelne Songs statt Alben **2001:** Napster wird verklagt und schließt **Aber:** Pandora's Box offen → LimeWire, Kazaa, BitTorrent, später Spotify --- # Kulturelle Revolution **MP3 veränderte:** ✓ Musik wurde portabel (Walkman → iPod) ✓ Alben wurden irrelevant (Playlists) ✓ Musikkonsum explodierte (kostenlos/billig) ✓ KünstlerInnen verloren Kontrolle **Aber auch:** ❌ KünstlerInnen verdienen weniger pro Stream ❌ Audio-Qualität sank (Loudness War) ❌ Physische Medien starben --- # Fragen & Diskussion **Kontakt:** lb-czechowski@hdm-stuttgart.de **Folien:** Online verfügbar unter https://librete.ch/hdm/223015b --- # Lizenz & Attribution Diese Präsentation ist lizenziert unter **Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)** - Erlaubt Teilen & Anpassen mit Namensnennung - Adaptionen müssen unter gleicher Lizenz geteilt werden Vollständige Lizenz: https://creativecommons.org/licenses/by-sa/4.0/ --- # Selbstlernen: Audio-Spektrogramm **Aufgabe (30 Min):** - Live Spektrogramm untersuchen https://borismus.github.io/spectrogram/ - Mit Effekten experimentieren https://audiomass.co/ - Spektrogramme vergleichen Audacity (kostenloser Download nötig) [https://manual.audacityteam.org/man/spectrogram_view.html](https://manual.audacityteam.org/man/spectrogram_view.html) --- ![bg contain right:22%](./assets/qr/hexed-it.png) # Selbstlernen: HEX Files 1. Drei Dateien ohne Dateiendung: `hex1` `hex2` `hex3` 3. Lies erste 16 Bytes aus und identifiziere Dateiformat (Magic Number) 5. *Optional: Datei umbenennen und korrekte Dateiendung anhängen (bspw. `.jpg`)* **Tools:** - Hex-Editor: [hexed.it](https://hexed.it) - Magic Numbers: [en.wikipedia.org/wiki/List_of_file_signatures](https://en.wikipedia.org/wiki/List_of_file_signatures)