--- marp: true theme: gaia paginate: true backgroundColor: #fff header: "Dateiformate, Schnittstellen, Speichermedien & Distributionswege (223015b)" footer: "Michael Czechowski – HdM Stuttgart – SoSe 2026" title: Dateiformate, Schnittstellen, Speichermedien & Distributionswege --- ![bg cover opacity:0.2](./assets/radek-grzybowski-eBRTYyjwpRY-unsplash.jpg) # Dateiformate, Schnittstellen, Speichermedien & Distributionswege **223015b** · Modul "Technik 1" · 1. Semester Digital- und Medienwirtschaft Hochschule der Medien Stuttgart [https://librete.ch/hdm/223015b/](https://librete.ch/hdm/223015b/) --- ![bg fit](./assets/qrcode-1.svg) --- # Teil 1: Einführung ## Grundlagen, Text & Audio --- # Das Problem der Datengröße --- # Ein konkretes Beispiel **Eine Minute Musik in CD-Qualität:** 44.100 Messungen/Sekunde × 16 Bit pro Messung × 2 Kanäle (Stereo) × 60 Sekunden = **10,6 MB pro Minute** --- # Das Problem skaliert | Inhalt | Unkomprimiert | |--------|-------------:| | 1 Song (4 Min) | ~42 MB | | 1 Album (60 Min) | ~635 MB | | 10.000 Songs | ~420 GB | **Kontext 1990er:** - Festplatte: 100-500 MB - Modem: 56 kbit/s → 1 Song dauert Stunden --- # Video eskaliert **Eine Minute 4K-Video (unkomprimiert):** 3840 × 2160 Pixel × 3 Byte pro Pixel (RGB) × 30 Bilder pro Sekunde × 60 Sekunden = **~45 GB pro Minute** Ein 2-Stunden-Film: über **5 Terabyte** --- # Kompressionsraten in der Praxis | Medium | Unkomprimiert | Komprimiert | Faktor | |--------|-------------:|------------:|-------:| | 1 Song (4 Min) | ~42 MB | ~4 MB (MP3 320) | ~10× | | 1 Foto (12 MP) | ~36 MB | ~3 MB (JPEG) | ~12× | | 1 Min 4K-Video | ~45 GB | ~375 MB (H.264) | ~120× | --- # Zwei Philosophien der Kompression --- # Verlustfreie Kompression (Lossless) **Prinzip:** Redundanz entfernen **Beispiel Lauflängenkodierung:** ``` Original: AAAAABBBCCCCCCCC (16 Zeichen) Komprimiert: 5A3B8C (6 Zeichen) ``` → 62% kleiner, 100% wiederherstellbar **Anwendung:** ZIP, PNG, FLAC, Programmcode --- # Verlustbehaftete Kompression (Lossy) **Prinzip:** Irrelevanz entfernen **Die Frage:** Was nimmt ein Mensch nicht wahr? - Das Ohr hört nicht alle Frequenzen gleich gut - Das Auge sieht nicht alle Farbnuancen - Laute Töne überdecken leise Töne → Warum Daten speichern, die niemand wahrnimmt? --- # Verlustfrei vs. Verlustbehaftet | | Verlustfrei (Lossless) | Verlustbehaftet (Lossy) | |---|---|---| | **Prinzip** | **Redundanz** entfernen | **Irrelevanz** entfernen | | **Reversibel** | Ja (Original wiederherstellbar) | Nein (Information unwiederbringlich weg) | | **Reduktion** | 30-50% | 80-99% | | **Formate** | ZIP, PNG, FLAC, GIF | JPEG, MP3, H.264/H.265 | **Faustregel:** - Medien für Endnutzer → Lossy oft akzeptabel - Quellmaterial, Code, Archive → Lossless nötig --- # Kompression – Vertiefung Claude Shannon definierte 1948 die **Entropie** als theoretische Untergrenze der Kompression. Ein Text mit gleichmäßiger Zeichenverteilung hat hohe Entropie (schwer komprimierbar); repetitive Texte haben niedrige Entropie. **Verlustfreie Kompression** erreicht diese Grenze durch: - **Statistische Kodierung:** Huffman, Arithmetic Coding - **Wörterbuch-Methoden:** LZ77, LZ78, DEFLATE (ZIP, PNG) - Originalzustand ist exakt rekonstruierbar **Verlustbehaftete Kompression** unterschreitet die Grenze, indem sie menschliche Wahrnehmungsgrenzen ausnutzt: | Sinneskanal | Psychophysisches Modell | Ausnutzung | |-------------|------------------------|------------| | Gehör | Maskierungseffekte, Hörschwelle | MP3: Töne unter Maskierungsschwelle weglassen | | Sehen | Farbauflösung, Kontrastempfindlichkeit | JPEG: Chroma-Subsampling, hohe Frequenzen verwerfen | **Shannon-Limit:** Verlustfreie Kompression kann nicht unter die Entropie; verlustbehaftete kann beliebig weit gehen – auf Kosten der Qualität. --- ![bg fit](./assets/compression-types.png) --- # Die Grundbausteine ## Bits, Bytes und ihre Darstellung --- ![bg](./assets/lightbulb-onoff.png) --- # Das Bit **Kleinste Informationseinheit** - **0 oder 1** - AN oder AUS - Strom fließt oder nicht --- # Das Byte --- # Das Byte **1 Byte = 8 Bits** ``` 0 1 0 0 1 1 0 1 ``` --- # Das Byte **1 Byte = 8 Bits** ``` 0 1 0 0 1 1 0 1 ``` 2⁸ = **256 Möglichkeiten** (0-255) --- »256 Shades of Gray« ![bg fit](./assets/grayscale-gradient.png) --- # Was kann man mit 256 Zuständen machen? * **256 Zeichen** (Buchstaben, Zahlen, Symbole) * **256 Helligkeit bzw. Luminanz** (0 = Schwarz/Dunkel, 255 = Weiß/Hell) * **256 Lautstärkestufen** * **Zahlen 0-255** (oder -128 bis +127) --- ![bg fit](./assets/rgb-color-model.png) --- ![bg fit](./assets/rgb-color-model-with-title.png) --- ![bg right:50%](./assets/addaptive-substractive-colors.jpg) # Farben: RGB-Modell **1 Pixel = 3 Bytes** - **Rot:** 0-255 - **Grün:** 0-255 - **Blau:** 0-255 **Beispiele:** `FF 00 00` = Rot `00 FF 00` = Grün `00 00 FF` = Blau `00 00 00` = Schwarz `FF FF FF` = Weiß --- ![bg fit](./assets/hex-dec-lookup-table.png) --- # Das Problem: Sprachen **Die Welt hat mehr als 256 Zeichen!** - Englisches Alphabet: 52 (A-Z, a-z) - + Ziffern: 10 (0-9) - + Sonderzeichen: ~30 **≈ 90 Zeichen → passt in 1 Byte** **Aber:** ä, ö, ü, ß, é, à, ç, α, β, 中, 日, 😀 → **1 Byte reicht nicht!** --- # Unicode: Ein Standard für alle (8 Bit) **Unicode (1991):** Jedes Schriftsystem der Welt **>150.000 Zeichen:** - Latein, Kyrillisch, Arabisch, Chinesisch, Japanisch... - Mathematische Symbole, Emoji, historische Schriften **UTF-8:** Variable Länge (1-4 Bytes pro Zeichen) - **Zeichen 0-127: identisch mit ASCII** (Abwärtskompatibilität!) - 1.112.064 gültige Zeichen - Umlaute: 2 Bytes · CJK: 3 Bytes · Emoji: 4 Bytes --- # Beispiel: Bytes zählen **Text:** `"Hello·🌸·こんにちは·(Kon-ni-chi-wa)"` | Zeichen | Bytes | |---------|-------| | `Hello·` | 6 × 1 = **6 Bytes** (ASCII) | | `🌸` | **4 Bytes** (Emoji) | | `·` | **1 Byte** | | `こんにちは` | 5 × 3 = **15 Bytes** (Hiragana) | | `·(Kon-ni-chi-wa)` | **16 Bytes** (ASCII) | **Gesamt: 42 Bytes** für 29 sichtbare Zeichen --- # Hexadezimal ## Die Sprache der Datei-Analyse --- # Hexadezimal: Lesbarkeit **Binär ist unleserlich:** `01010000 01001110 01000111` **Hexadezimal (Base 16):** `50 4E 47` (= "PNG" in ASCII) **Jede Hex-Ziffer = 4 Bits (ein "Nibble")** 0-9, A-F (10=A, 11=B, ..., 15=F) **ASCII Tabelle (0-127):** [https://www.asciitable.com](https://www.asciitable.com) --- # ASCII ## One *Zeichensatz* to rule them all --- ![bg fit](./assets/ascii-table-colored.png) --- ![bg right:40%](./assets/matrix-code.png) # WTF!? ``` 89 50 4E 47 0D 0A 1A 0A 00 00 00 0D 49 48 44 52 00 00 01 90 00 00 01 2C ``` --- ![bg right:30%](./assets/matrix-code.png) # What the HEX-Code ``` 89 50 4E 47 ... ``` | Binär | Hex | Dez | ASCII | |-------|-----|-----|-------| | `1000 1001` | `89` | 137 | ✗ (> 127) | | `0101 0000` | `50` | 80 | **P** | | `0100 1110` | `4E` | 78 | **N** | | `0100 0111` | `47` | 71 | **G** | → **PNG**-Signatur! (Das `89` markiert: "Ich bin binär, kein Text!") --- ![bg fit](./assets/hex-code-hidden.png) --- ![bg fit](./assets/hex-code.png) --- ![bg fit](./assets/8bit-P-character.png) --- # Magic Numbers **Dateityp-Identifikation durch erste Bytes** | Format | Magic Number (Hex) | Lesbar? | |--------|-------------------|---------| | PNG | `89 50 4E 47` | ✗ P N G | | JPEG | `FF D8 FF` | ✗ ✗ ✗ | | PDF | `25 50 44 46` | % P D F ✓ | | ZIP | `50 4B 03 04` | P K ✗ ✗ | **Wichtig:** ASCII = nur 0-127! Werte darüber (z.B. `89` = 137) sind **nicht druckbar** (non-printable). *Hex-Editoren zeigen dafür `.` oder `ÿ` als Platzhalter.* --- # Dateneinheiten | Einheit | Bytes | Potenz | Beispiel | |---------|------:|:------:|----------| | **Byte** | 1 | 10⁰ | Farbwerte eines Pixels | | **Kilobyte (KB)** | 1.000 | 10³ | Kleiner Programmcode | | **Megabyte (MB)** | 1 Million | 10⁶ | Textdokument | | **Gigabyte (GB)** | 1 Milliarde | 10⁹ | Kinofilm in FullHD | | **Terabyte (TB)** | 1 Billion | 10¹² | ~12h Video in 4K | | **Petabyte (PB)** | 1 Billiarde | 10¹⁵ | Netflix-Gesamtarchiv | | **Exabyte (EB)** | 1 Trillion | 10¹⁸ | Alle E-Mails weltweit/Tag | | **Zettabyte (ZB)** | 1 Trilliarde | 10²¹ | Internet-Traffic 2016 | --- # Dateneinheiten – Vertiefung Zwei konkurrierende Standards existieren seit der IEC-Normierung 1998: | Präfix | SI (Dezimal) | IEC (Binär) | Differenz | |--------|--------------|-------------|-----------| | Kilo | 1.000 (10³) | 1.024 (2¹⁰) KiB | 2,4% | | Mega | 1.000.000 (10⁶) | 1.048.576 MiB | 4,9% | | Giga | 10⁹ | 2³⁰ GiB | 7,4% | | Tera | 10¹² | 2⁴⁰ TiB | 10% | **Warum der Unterschied wächst:** (2¹⁰)ⁿ ÷ (10³)ⁿ = 1,024ⁿ. Bei Terabyte sind es bereits 10% Abweichung. **Festplatten-Marketing:** Hersteller nutzen SI (dezimal), Betriebssysteme zeigen IEC (binär). Eine „1 TB"-Festplatte zeigt daher nur 931 GiB an – technisch korrekt, aber verwirrend. **Historischer Kontext:** RAM wurde immer binär gemessen (2ⁿ Adressen), Festplatten ursprünglich dezimal (physikalische Geometrie). Die IEC führte 1998 KiB/MiB/GiB ein – diese Notation setzt sich langsam durch. --- # Datenwachstum der Menschheit | Jahr | Datenmenge | Kontext | |------|------------|---------| | **100.000 v. Chr.** | 0 | Erste Menschen, nur Sprache | | **3.000 v. Chr.** | ~wenige KB | Keilschrift, Hieroglyphen | | **1450** | ~wenige GB | Gutenberg, Buchdruck | | **1986** | **2,6 EB** | 99% analog (Bücher, Vinyl, VHS) | | **2007** | **295 EB** | 94% digital | | **2025** | **181 ZB** | 90% unstrukturiert | --- # Der digitale Wendepunkt | Jahr | Analog | Digital | Digital-Anteil | |------|--------|---------|----------------| | **1986** | 2,6 EB | 0,02 EB | **1%** | | **2002** | — | — | **50%** (Wendepunkt) | | **2007** | 18 EB | 277 EB | **94%** | **Perspektive:** - 1986: "Petabyte" war ein theoretisches Konzept - 2025: ~181 Zettabyte jährlich produziert **Magnetband lebt:** LTO-Tapes bleiben günstigstes Archivmedium (AWS Glacier, Film-Archive, Rechenzentren) --- # Digitaler Wendepunkt – Vertiefung Die Studie von Hilbert & López (Science, 2011) analysierte 60 Speichertechnologien von 1986–2007. Der Wendepunkt 2002 markiert den Moment, ab dem mehr Information digital als analog existierte. **Was 1986 „analog" bedeutete:** - Bücher, Zeitungen, Magazine: ~8 EB - Vinyl-Schallplatten, Musikkassetten: ~12 EB - VHS-Kassetten, Filmrollen: ~60 EB **Warum analog stagnierte:** Physische Medien haben Kapazitätsgrenzen. Eine VHS speichert 10 GB; eine Blu-ray (2006) bereits 50 GB auf kleinerer Fläche. **LTO-Magnetband überlebt** trotz „alter" Technologie: | Medium | Kosten/TB | Lebensdauer | Energiebedarf | |--------|-----------|-------------|---------------| | SSD | ~50 € | 5–10 Jahre | Dauerstrom | | HDD | ~15 € | 3–5 Jahre aktiv | Dauerstrom | | LTO-9 | ~5 € | 30+ Jahre | Nur beim Zugriff | AWS Glacier, Google Coldline und Film-Archive nutzen LTO – langsamer Zugriff, aber unschlagbar günstig und langlebig. --- ![bg fit](./assets/2011-hilbert.png) --- # 181 Zettabyte – Was bedeutet das? **2025:** Welt erzeugt **181 ZB** pro Jahr - **2,5 Quintillionen Bytes** täglich - **29 Terabyte** pro Sekunde - **90%** davon: unstrukturiert (Videos, Bilder, Audio) - **70%** davon: von NutzerInnen generiert **Zum Vergleich:** - 1 ZB = 250 Milliarden DVDs - 181 ZB = Jeder Mensch erzeugt ~23 TB/Jahr --- ![bg fit](./assets/growth of big data.png) --- # AI-generierte Inhalte 2025 **Wie viel Content ist heute synthetisch?** | Bereich | AI-Anteil | |---------|-----------| | **Neue Webseiten** | ~74% enthalten AI-Content | | **Web-Text gesamt** | ~30-40% AI-generiert | | **Neue Artikel** | ~52% von AI geschrieben | | **Social-Media-Bilder** | ~71% AI-generiert | **Prognose 2026:** 90% des Online-Contents synthetisch --- # Teil 2: Die MP3-Revolution ## Psychoakustik & Audio-Kompression --- ![bg](./assets/cassette-ipod.png) --- # Analoge Medien ### Distribution: physisch (Kauf, Verleih, Kopie) * **Text** - Bücher, Zeitungen, Zeitschriften, Lochkarten * **Bild** - Fotografie (Negativ, Dia, Polaroid), Mikrofilm * **Audio:** - Schallplatte (Vinyl, Schellack), Tonband, Musikkassette * **Video:** - Film (35mm, Super 8), VHS, Betamax --- # Analoge Medien – Vertiefung Analoge Speicherung codiert Information als **kontinuierliche physikalische Größe**: Rillentiefe (Vinyl), Magnetfeldstärke (Tonband), Silberkorn-Dichte (Film). Es gibt keine diskreten Stufen – theoretisch unendliche Auflösung, praktisch begrenzt durch Rauschen. **Generationsverlust** entsteht, weil jede Kopie neues Rauschen addiert: - Schallplatte → Kassette: Frequenzgang leidet, Rauschen steigt - VHS → VHS: Farbsättigung sinkt, Schärfe nimmt ab - 3. Generation: oft unbrauchbar | Medium | Typische Auflösung | Dynamik | |--------|-------------------|---------| | Vinyl (audiophil) | ~20–20.000 Hz | ~70 dB | | Tonband (Studio) | ~30–15.000 Hz | ~55 dB | | 35mm Film | ~4K-äquivalent | ~13 Blendenstufen | **Paradox der Analogtechnik:** Das Original ist einzigartig und unersetzlich – aber genau deshalb anfällig. Jedes Abspielen einer Schallplatte trägt mikroskopisch Material ab; jeder Filmdurchlauf riskiert Kratzer. --- # Analoge Medien: Vor- und Nachteile | Vorteile | Nachteile | |----------|-----------| | Kein Abspielgerät nötig (Buch, Foto) | Qualitätsverlust bei jeder Kopie | | Haptisches Erlebnis | Physischer Verschleiß | | Unabhängig von Strom/Internet | Begrenzte Haltbarkeit | | Keine Formatkonvertierung | Platzbedarf bei Lagerung | | Eindeutiges Original | Aufwendige Durchsuchbarkeit | --- # Von Analog zu Digital: Die Kopier-Revolution **Das Problem analoger Kopien:** Kassette → Kassette → Kassette = immer schlechter **Was Digital anders macht:** - **Identische Kopien** – kein Qualitätsverlust, nie - **Einfache Massenproduktion** – Copy & Paste - **Perfekte Archivierung** – Bits verändern sich nicht **Daher: "Raubkopien"** Der Begriff entstand, weil digitale Kopien *tatsächlich identisch* mit dem Original waren – nicht wie bei Kassetten eine schlechtere Version. Quelle: [c64-wiki.de/wiki/Raubkopie](https://www.c64-wiki.de/wiki/Raubkopie) --- # Digitale Medien ### Distribution: Datenträger (CD, USB), Download, Streaming, P2P * **Text** - E-Book (PDF, EPUB), Dokumente (TXT, DOCX) * **Bild** - Digitalfoto (JPEG, PNG, RAW, WebP, GIF) * **Audio** - Audiodatei (MP3, FLAC, WAV, AAC, OGG) * **Video** - Videodatei (MP4, MKV, AVI, WebM) --- # Digitale Medien – Vertiefung Digitale Speicherung quantisiert kontinuierliche Signale in diskrete Werte. Der **Quantisierungsfehler** (Differenz zum Original) ist der Preis der Digitalisierung – aber einmal digitalisiert, bleibt die Information exakt. **Bit-identische Kopien** revolutionierten die Medienindustrie: - Keine Qualitätskette mehr: 1000. Kopie = 1. Kopie = Original - Kosten pro Kopie: praktisch null (nur Speicherplatz) - Perfekte Archivierung: Bits altern nicht (nur der Datenträger) | Aspekt | Analog | Digital | |--------|--------|---------| | Kopiervorgang | Physikalischer Prozess | Bit-Kopie | | Qualität pro Generation | Verschlechtert | Identisch | | Fehlerkorrektur | Unmöglich | Möglich (ECC, RAID) | | Formatmigration | Verlust | Verlustfrei möglich | **Die Kehrseite:** Digitale Obsoleszenz. Ein DOCX von 2025 ist in 50 Jahren womöglich unlesbar – während ein Buch von 1525 heute noch lesbar ist. Offene Formate (PDF/A, FLAC, PNG) mildern dieses Risiko. --- # Digitale Speichermedien * **Optische Speicher** - CD, DVD, Blu-ray * **Magnetische Speicher** - Festplatte (HDD), Magnetband (LTO) * **Flash-Speicher** - SSD, USB-Stick, SD-Karte * **Cloud-Speicher** - Dropbox, Google Drive, iCloud, AWS S3 --- # Digitale Speichermedien – Vertiefung Jede Technologie hat physikalische Vor- und Nachteile: **Optisch (CD/DVD/Blu-ray):** Laser liest Pits (Vertiefungen) und Lands (Erhöhungen). Robust gegen Magnetfelder, aber empfindlich gegenüber Kratzern und UV-Licht. M-DISC verspricht 1000 Jahre – unter Laborbedingungen. **Magnetisch (HDD/LTO):** Magnetisierte Bereiche auf rotierenden Platten oder Band. HDDs haben bewegliche Teile (Verschleiß); LTO-Bänder sind passiv und extrem langlebig, aber sequentieller Zugriff. **Flash (SSD/USB/SD):** Elektronen in Floating Gates speichern Bits. Keine beweglichen Teile, aber begrenzte Schreibzyklen (TLC: ~3.000, SLC: ~100.000). Ohne Strom verlieren Zellen nach Jahren ihre Ladung. | Szenario | Empfehlung | Grund | |----------|------------|-------| | Betriebssystem | NVMe SSD | Geschwindigkeit | | Videoarchiv | HDD | Kapazität/Preis | | Langzeitarchiv | LTO + M-DISC | Lebensdauer | | Austausch | USB/SD | Portabilität | **Cloud** ist physisch HDD/SSD/LTO in Rechenzentren – kein eigenes Medium, sondern Zugriffsmethode. --- # Das Speicherproblem der Digitalisierung **Ziel: Analoge Schallwelle möglichst originalgetreu rekonstruieren** *CD-Qualität (1982): 44.100 Hz × 16 Bit × 2 Kanäle = 10,584 MB/Minute* | Inhalt | Größe | Problem (1990er) | |--------|-------|------------------| | 1 Song (4 Min) | ~42 MB | Ausreichend Speicher | | 1 Album (60 Min) | ~635 MB | Gesamte Festplatte | --- ![bg cover](./assets/spectogram-chet-baker.png) --- # Die Abtastrate (Sample Rate) **Analog → Digital ≙ Kontinuierlich → Diskret** ``` Analog (Vinyl): Digital (CD): ~~~~~~~~~~~~~~~ • • • • • • • • Kontinuierliche 44.100 Messpunkte Wellenform pro Sekunde ``` **Nyquist-Theorem:** > Um eine Frequenz zu rekonstruieren, braucht man mindestens **2× so viele Samples**. 44.100 Hz ÷ 2 = **22.050 Hz** max. darstellbare Frequenz (Mensch hört: ~20 Hz bis ~20.000 Hz → passt!) --- # Die Bittiefe (Bit Depth) **Wie genau messen wir jeden Punkt?** | Bittiefe | Stufen | Dynamikumfang | |----------|--------|---------------| | 8 Bit | 256 | ~48 dB | | 16 Bit (CD) | 65.536 | ~96 dB | | 24 Bit (Studio) | 16.777.216 | ~144 dB | **16 Bit = 2¹⁶ = 65.536 Lautstärkestufen** (von absoluter Stille bis maximaler Lautstärke) --- # Abtastrate (Sample Rate) × Bittiefe (Bit Depth) **Zwei Dimensionen der Digitalisierung:** | Dimension | Was bedeutet es? | CD-Qualität | |-----------|------------------|-------------| | **Abtastrate** (Sample Rate) | Messungen pro Sekunde (horizontal) | 44.100 Hz | | **Bittiefe** (Bit Depth) | Genauigkeit pro Messung (vertikal) | 16 Bit | **44.100 Hz × 16 Bit** × 2 Kanäle = 10,584 MB/Minute --- # Kompression ## Weniger Daten, gleiche(?) Information --- # Wo liegt der Hebel für Kompression? **CD-Qualität:** 44.100 Hz × 16 Bit × 2 Kanäle = **10,6 MB/Min** **MP3 (128 kbps):** = **~1 MB/Min** (Faktor 10!) **Container-Parameter (das Raster):** | Parameter | Reduzieren → | Konsequenz | |-----------|--------------|------------| | Abtastrate | Weniger Messpunkte/Sek | Max. Frequenz sinkt | | Bittiefe | Weniger Lautstärkestufen | Mehr Rauschen | | Kanäle | Mono statt Stereo | Kein Raumklang | --- # Psychoakustik: Der MP3-Trick **Inhalt (was durchs Raster geht):** | Methode | Reduzieren → | Konsequenz | |---------|--------------|------------| | Psychoakustik | Unhörbare Frequenzen | Kaum wahrnehmbar | → **MP3 nutzt hauptsächlich Psychoakustik** → Container bleibt ähnlich, Inhalt wird "ausgedünnt" --- # Die Geburt der MP3 **1982:** Universität Erlangen-Nürnberg Karlheinz Brandenburg, Diplom-Ingenieur **1987:** Fraunhofer IIS entwickelt MPEG-1 Audio Layer III **1988:** Patentanmeldung **1992:** Erste Software-Implementierung **1995:** .mp3 Dateiendung offiziell --- ![bg right:40%](./assets/karlheinz-brandenburg.jpg) # Karlheinz Brandenburg **"Vater der MP3"** - Diplom-Ingenieur, Universität Erlangen-Nürnberg - Fraunhofer IIS (Institut für Integrierte Schaltungen) - Forschung ab 1982, Patent 1988 --- ![bg right:50%](./assets/suzanne-vega.jpg) # Suzanne Vega **"Tom's Diner" (1987)** - Der erste Song, der als MP3 kodiert wurde - A cappella (keine Instrumente) - Klare, hohe Frequenzen - Perfekter Stresstest für Kompression - Brandenburg hörte "Tom's Diner" über 10.000 Mal --- # Wie funktioniert MP3? Ein Zusammenspiel aus vielen Faktoren: * **1. Frequenz-Analyse (FFT)** Audio → Frequenzspektrum * **2. Psychoakustisches Modell** Welche Töne hört Mensch nicht? * **3. Quantisierung** Unwichtige Frequenzen reduzieren * **4. Huffman-Coding** Lossless-Kompression der Restdaten --- # Bitrate: Der Qualitäts-Knopf | Bitrate | Qualität | Kompression | |---------|----------|-------------| | **128 kbps** | Hörbar schlechter | ~11x | | **192 kbps** | Akzeptabel | ~7x | | **256 kbps** | Gut | ~5,5x | | **320 kbps** | "CD-Qualität" | ~4,4x | **Original CD:** 1.411 kbps (unkomprimiert) --- # Der Patentkrieg **1990er:** Fraunhofer + Thomson halten MP3-Patente **Lizenzgebühren:** - $0,75 pro Decoder - $2,50 pro Encoder **Problem:** Napster (1999) → unkontrollierte Verbreitung **2017:** Patente laufen aus → MP3 ist frei --- ![bg right:50% fit](./assets/napster-2001.png) # Napster (1999) **P2P-Filesharing für MP3s** - Shawn Fanning, 19 Jahre alt - 80 Millionen User in 2 Jahren - Musikindustrie verklagt (2001) - Pandora's Box: Nicht mehr aufzuhalten --- ![bg right:40% contain](./assets/bittorrent.png) # Napster & Musikindustrie **1999:** Napster startet **2001:** 80 Millionen User **Musikindustrie:** - CDs kosten $15-20 - MP3s gratis (illegal, aber yolo) - Einzelne Songs statt Alben **2001:** Napster wird verklagt und schließt **Aber:** Pandora's Box offen → LimeWire, Kazaa, BitTorrent, später Spotify --- # Kulturelle Revolution **MP3 veränderte:** ✓ Musik wurde portabel (Walkman → iPod) ✓ Alben wurden irrelevant (Playlists) ✓ Musikkonsum explodierte (kostenlos/billig) ✓ KünstlerInnen verloren Kontrolle **Aber auch:** ❌ KünstlerInnen verdienen weniger pro Stream ❌ Audio-Qualität sank (Loudness War) ❌ Physische Medien starben --- # Fragen & Diskussion **Kontakt:** lb-czechowski@hdm-stuttgart.de **Folien:** Online verfügbar unter https://librete.ch/hdm/223015b --- # Lizenz & Attribution Diese Präsentation ist lizenziert unter **Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)** - Erlaubt Teilen & Anpassen mit Namensnennung - Adaptionen müssen unter gleicher Lizenz geteilt werden Vollständige Lizenz: https://creativecommons.org/licenses/by-sa/4.0/ --- # Selbstlernen: Audio-Spektrogram **Aufgabe (30 Min):** - Live Spektrogram untersuchen https://borismus.github.io/spectrogram/ - Mit Effekten experimentieren https://audiomass.co/ - Spektrogramme vergleichen Audacity (kostenloser Download nötig) [https://manual.audacityteam.org/man/spectrogram_view.html](https://manual.audacityteam.org/man/spectrogram_view.html) --- ![bg contain right:22%](./assets/qr/hexed-it.png) # Selbstlernen: HEX Files 1. Drei Dateien ohne Dateiendung: `hex1` `hex2` `hex3` 3. Lies erste 16 Bytes aus und identifiziere Dateiformat (Magic Number) 5. *Optional: Datei umbenennen und korrekte Dateiendung anhängen (bspw. `.jpg`)* **Tools:** - Hex-Editor: [hexed.it](https://hexed.it) - Magic Numbers: [en.wikipedia.org/wiki/List_of_file_signatures](https://en.wikipedia.org/wiki/List_of_file_signatures)