uni/slides/223015b/01-grundlagen-text-audio.md

---
marp: true
theme: gaia
paginate: true
backgroundColor: #fff
header: "Dateiformate, Schnittstellen, Speichermedien & Distributionswege (223015b)"
footer: "Michael Czechowski – HdM Stuttgart – SoSe 2026"
title: Dateiformate, Schnittstellen, Speichermedien & Distributionswege
---

<style>
:root {
  --color-foreground: #1a1a2e;
  --color-highlight: #1e5f8a;
  --color-dimmed: #4a4a6a;
}
section.invert {
  --color-foreground: #fff;
}
section {
  font-size: 1.7rem;
}
h1 {
  color: #1e5f8a;
}
section.invert h1 {
  color: #fff;
}
h2 {
  color: #1f2937;
}
pre {
  background: #0f0f23;
  color: #5fb3e4;
  border-radius: 8px;
  border-left: 3px solid #1e5f8a;
}
pre code {
  background: transparent;
  color: inherit;
}
code {
  background: #1a1a2e;
  color: #5fb3e4;
  padding: 0.15em 0.4em;
  border-radius: 4px;
}
a {
  color: var(--color-highlight);
}
section.klausur {
  background: repeating-linear-gradient(
    135deg,
    #e3f2fd,
    #e3f2fd 40px,
    #fff 40px,
    #fff 80px
  ) !important;
}
@media print {
  section.klausur {
    background: #e3f2fd !important;
  }
}
section.aufgabe {
  background: #e3f2fd !important;
}
section.aufgabe footer {
  display: none;
}
section.erklaerung :not(header),
section.erklaerung :not(footer)
{
  font-size: 1.1rem;
}
@media print {
  section.erklaerung {
    background: #e3f2fd !important;
  }
}
section.erklaerung h1 {
  font-size: 1.5rem;
  color: #1e5f8a;
  margin-bottom: 0.3rem;
}
section.erklaerung ul,
section.erklaerung ol {
  font-size: 1.0rem;
  line-height: 1.4;
}
section.erklaerung p {
  font-size: 1.0rem;
  line-height: 1.4;
}
section.erklaerung table {
  font-size: 0.9rem;
}
</style>

<!-- _class: invert -->
<!-- _header: '' -->
<!-- _backgroundColor: #000 -->

![bg cover opacity:0.2](./assets/radek-grzybowski-eBRTYyjwpRY-unsplash.jpg)

# Dateiformate, Schnittstellen, Speichermedien & Distributionswege

**223015b** · Modul "Technik 1" · 1. Semester
Digital- und Medienwirtschaft
Hochschule der Medien Stuttgart

[https://librete.ch/hdm/223015b/](https://librete.ch/hdm/223015b/)

---

![bg fit](./assets/qrcode-1.svg)

---

<!-- _class: lead -->

# Teil 1: Einführung
## Grundlagen, Text & Audio

---

<!-- _class: lead -->

# Was sind Daten?

---


# Datenwachstum der Menschheit

| Jahr | Datenmenge | Kontext |
|------|------------|---------|
| **100.000 v. u. Z.** | 0 | Erste Menschen, nur Sprache |
| **3.000 v. u. Z.** | ~wenige KB | Keilschrift, Hieroglyphen |
| **1450** | ~wenige GB | Gutenberg, Buchdruck |
| **1986** | **2,6 EB** | 99% analog (Bücher, Vinyl, VHS) |
| **2007** | **295 EB** | 94% digital |
| **~2025** | **~175–181 ZB** | Prognose (IDC DataSphere Forecast, 2021) |

<!--
- Exponentielles Wachstum: Verdopplung alle ~2 Jahre
- 1986: Letzte Ära mit analoger Dominanz
- 2002: Wendepunkt — erstmals mehr digital als analog (Hilbert & López, Science 332, 2011)
- 2007: 94% digital (ebd.)
- ~175–181 ZB für 2025: IDC-Prognose von 2021, keine gemessene Zahl
-->

---


# Der digitale Wendepunkt

| Jahr | Analog | Digital | Digital-Anteil |
|------|--------|---------|----------------|
| **1986** | 2,6 EB | 0,02 EB | **1%** |
| **2002** | — | — | **50%** (Wendepunkt) |
| **2007** | 18 EB | 277 EB | **94%** |

**Perspektive:**
- 1986: "Petabyte" war ein theoretisches Konzept
- Magnetband lebt: LTO-Tapes bleiben günstigstes Archivmedium (AWS Glacier, Film-Archive, Rechenzentren)

<!--
KLAUSURRELEVANT:
- Wendepunkt 2002
- Speichereinheiten (KB→MB→GB→TB→PB→EB→ZB)
- Magnetband als Archivmedium

QUELLE: Hilbert & López (2011): "The World's Technological Capacity to Store, Communicate, and Compute Information", Science 332(6025), 60–65. DOI: 10.1126/science.1200970

METHODIK: 60 analoge + digitale Technologien untersucht (1986–2007)

ANALOG damals: Bücher, Zeitungen, Vinyl, VHS, Filmrollen, Fotos
DIGITAL damals: Festplatten, CDs, DVDs, frühe Flash-Speicher

LTO-9 (2021): 18 TB pro Band, ~5€/TB für Cold Storage
SSD: ~50€/TB, HDD: ~15€/TB, LTO: ~5€/TB
-->

---

<!-- _class: erklaerung -->
<!-- _header: '' -->
<!-- _footer: '' -->

# Digitaler Wendepunkt – Vertiefung

Die Studie von Hilbert & López (Science 332, 2011) analysierte 60 Speichertechnologien von 1986–2007. Der Wendepunkt 2002 markiert den Moment, ab dem mehr Information digital als analog existierte.

**Was 1986 „analog" bedeutete:**
- Bücher, Zeitungen, Magazine: ~8 EB
- Vinyl-Schallplatten, Musikkassetten: ~12 EB
- VHS-Kassetten, Filmrollen: ~60 EB

**Warum analog stagnierte:** Physische Medien haben Kapazitätsgrenzen. Eine VHS speichert ~10 GB; eine Blu-ray (2006) bereits 50 GB auf kleinerer Fläche.

**LTO-Magnetband überlebt** trotz „alter" Technologie:
| Medium | Kosten/TB | Lebensdauer | Energiebedarf |
|--------|-----------|-------------|---------------|
| SSD | ~50 € | 5–10 Jahre | Dauerstrom |
| HDD | ~15 € | 3–5 Jahre aktiv | Dauerstrom |
| LTO-9 | ~5 € | 30+ Jahre | Nur beim Zugriff |

AWS Glacier, Google Coldline und Film-Archive nutzen LTO — langsamer Zugriff, aber unschlagbar günstig und langlebig.

---

<!-- _header: '' -->
<!-- _footer: '' -->

![bg fit](./assets/2011-hilbert.png)

---

# 181 Zettabyte – Was bedeutet das?

**Prognose 2025:** Welt erzeugt ca. **175–181 ZB** pro Jahr

- **1 ZB** = 250 Milliarden DVDs
- **29 Terabyte** pro Sekunde (Hochrechnung)

**Zum Vergleich:**
- 2007: 295 Exabyte (Hilbert & López, Science 2011)
- 2020: ~64 Zettabyte (IDC)
- ~2025: ~175–181 ZB (IDC DataSphere Forecast, Prognose von 2021)

<!--
- Quelle: IDC Global DataSphere Forecast 2021–2025 — Prognose, keine gemessene Zahl
- Tatsächlich gemessen 2024: ~149 ZB (IDC)
- IoT-Geräte allein: prognostiziert ~73 ZB in 2025 (IDC)
- Prognose 2028: ~394 ZB (IDC)
-->

---

# Was sind (digitale) Daten?

* **Text** — Artikel, Gesetzestext, Hausarbeit → `.txt` `.docx` `.pdf`
* **Bild** — Foto, Screenshot, 3D-Rendering, Illustration → `.jpg` `.png` `.svg`
* **Audio** — Song, Podcast, Sprachmemo → `.mp3` `.wav` `.flac`
* **Video** — Reel, Film, Stream → `.mp4` `.mov` `.mkv`

<!--
- "Ein Dateiformate sticht hier heraus ... .txt"
- Hilbert & López (Science 332, 2011): 60 Technologien untersucht, 1986–2007
- Wendepunkt 2002: erstmals mehr digital als analog gespeichert
- 2007: 94% aller gespeicherten Information bereits digital
- IDC DataSphere Forecast (2021): Prognose ~181 ZB produziert/repliziert für 2025
-->
---

# Was sind (digitale) Daten?

- **Text** — Artikel, Gesetzestext, Hausarbeit → `.txt` `.docx` `.pdf`
- **Bild** — Foto, Screenshot, 3D-Rendering, Illustration → `.jpg` `.png` `.svg`
- **Audio** — Song, Podcast, Sprachmemo → `.mp3` `.wav` `.flac`
- **Video** — Reel, Film, Stream → `.mp4` `.mov` `.mkv`

**Am Ende alles nur Nullen und Einsen**

<!--
- Hilbert & López (Science 332, 2011): 60 Technologien untersucht, 1986–2007
- Wendepunkt 2002: erstmals mehr digital als analog gespeichert
- 2007: 94% aller gespeicherten Information bereits digital
- IDC DataSphere Forecast (2021): Prognose ~181 ZB produziert/repliziert für 2025
-->


---

<!-- _header: '' -->
<!-- _footer: '' -->

# Bandbreite: Was bedeuten 150 Mbps?


---

<!-- _header: '' -->
<!-- _footer: '' -->

# Bandbreite: Was bedeuten 150 Mbps?

**150Mbps** = **150 Mbit/s**


---

<!-- _header: '' -->
<!-- _footer: '' -->
<!-- _class: 'klausur' -->

# Bandbreite: Was bedeuten 150 mbps?

**150Mbps** = **150 Mbit/s** ≠ ~~**150 MB/s**~~

Wenn **8 bit (b) = 1 Byte (B)**

dann **150 Mbit/s ÷ 8** = **18,75 MB/s**

| Bandbreite | MB/s | 1 GB Film |
|---------|-----:|----------:|
| 16 Mbit/s (ADSL) | 2 MB/s | ~8 Min |
| 50 Mbit/s (ADSL) | 6,25 MB/s | ~2,7 Min |
| 150 Mbit/s (ADSL) | 18,75 MB/s | ~54 Sek |
| 1 Gbit/s (Glasfaser) | 125 MB/s | ~8 Sek |

<!--
- Internetanbieter werben in Mbit/s, Dateien werden in MByte angegeben
- Formel: Mbit/s ÷ 8 = MB/s
- 100 Mbit/s verfügbar für >93% der deutschen Haushalte (Bundesnetzagentur, Breitbandatlas, Stand Ende 2023)
- Gigabitversorgung (alle Technologien) Ende 2024: ~78% der Haushalte (Bundesnetzagentur, Dez. 2024)
-->

---

<!-- _class: lead -->

# Wie viele Megabyte können bei einer Bandbreite von 250 Mbit/s pro Minute heruntergeladen werden?

* A) 31,25 MB
* B) 1,875 GB = 1.875 MB
* B) 187,5 MB
* C) 250 MB

<!--

250 Megabit/s / 8 Bit * 60 = 31,25 MB/s * 60 = 1875 MB/Minute = ~ 2GB pro Minute

-->

---

# Upload: Der stille Flaschenhals

**ADSL = Asymmetric Digital Subscriber Line**

| Bandbreite | Download | Upload |
|---------|----------:|-------:|
| 16 Mbit/s DSL | 16 Mbit/s | 1 Mbit/s |
| 50 Mbit/s DSL | 50 Mbit/s | 10 Mbit/s |
| 150 Mbit/s DSL | 150 Mbit/s | 40 Mbit/s |
| Glasfaser (FTTH) | 1 Gbit/s | 1 Gbit/s |

**50 MB Upload bei 10 Mbit/s = ~40 Sekunden**

<!--
- ADSL (Asymmetric Digital Subscriber Line, ITU = International Telecommunication Union, Norm G.992.1, 1999): Upload bewusst begrenzt — Annahme war, Nutzer konsumieren mehr als sie produzieren
- FTTH = Fiber To The Home (Glasfaser bis in die Wohnung)
- Glasfaser (FTTH) symmetrisch: Upload = Download
- FTTH-Verfügbarkeit Deutschland Ende 2024: ~40% der Haushalte (Bundesnetzagentur, Breitbandatlas)
- EU-Schnitt FTTH 2024: ~56% (FTTH Council Europe)
-->

---

<!-- _class: lead -->

# Analog vs. Digital

---

![bg fit right:40%](./assets/druckwelle.png)

# Schall ist eine Druckwelle

* Lautsprecher drückt Luft → Luftmoleküle schwingen
* Die Welle breitet sich aus — kontinuierlich, ohne Stufen
* Vakuum: Keine Schallübertragung möglich (kein Medium)

<!--
- Schall = Druckschwankungen in Luft, kein Lufttransport sondern Druckvariation
- Kontinuierlich = unendlich viele Zwischenwerte, keine Stufen
- Vinyl hat keine Abtastrate — analoge Speicherung kennt keine Diskretisierung
- Rillengeometrie: die Tiefe und Kurve der Rille entspricht direkt der Amplitude der Schallwelle
-->

---


![bg fit right:40%](./assets/druckwelle.png)

# Schall ist eine Druckwelle

- Lautsprecher drückt Luft → Luftmoleküle schwingen
- Die Welle breitet sich aus — kontinuierlich, ohne Stufen
- Vakuum: Keine Schallübertragung möglich (kein Medium)

**Vinyl:** Die Rille *ist* die Schallwelle — physische Kopie der Druckschwankung in Rillengeometrie

---

![bg fit right:35%](./assets/samplerate.webp)

# Abtastung (Sampling)

**Problem:** Eine kontinuierliche Welle lässt sich nicht direkt als Zahl speichern

**Lösung:** Wir messen sie in regelmäßigen Abständen

* 44.100 Messungen *pro Sekunde* = **Abtastrate** (Sample Rate)
* Einheit: Hz (Hertz) = *pro Sekunde*
* Nyquist-Theorem: min. 2× höchste darzustellende Frequenz
  → 44.100 ÷ 2 = 22.050 Hz
  (Mensch hört ~20–20 kHz)

<!--
- Nyquist-Shannon-Abtasttheorem (1928/1949): Harry Nyquist (Bell Labs), Claude Shannon (Bell Labs)
- 44.100 Hz: Kompromiss aus Nyquist-Limit + Kompatibilität mit Videoequipment der frühen 1980er (NTSC = National Television System Committee / PAL = Phase Alternating Line — die damaligen Fernsehstandards in USA bzw. Europa)
- Hz = Hertz: Einheit für Frequenz, benannt nach Heinrich Hertz (1857–1894), 1 Hz = 1 Schwingung pro Sekunde
-->

---

![bg fit right:35%](./assets/samplerate.webp)

# Das digitale Ergebnis

Jede Messung = ein Zahlenwert

**Wie genau ist jede Messung? → Bittiefe (Bit Depth)**

| Bittiefe | Stufen | Dynamikumfang |
|----------|-------:|---------------|
| 8 Bit | 256 | ~48 dB |
| 16 Bit (CD) | 65.536 | ~96 dB |
| 24 Bit (Studio) | 16.777.216 | ~144 dB |

**Ergebnis:** Eine Datei aus Zahlen

<!--
- Dynamikumfang Formel: ~6 dB pro Bit
- 16 Bit reicht für menschliches Hören unter realen Bedingungen (~80–90 dB)
- 24 Bit im Studio: mehr Headroom für Bearbeitung, kein perzipieller Mehrwert für Endnutzer (Meyer & Moran, JAES 2007)
- dB = Dezibel: logarithmische Einheit für Lautstärke
-->

---

![bg fit right:35%](./assets/samplerate.webp)

# Zurück zu Analog

Beim Abspielen läuft der Prozess rückwärts:

* Zahlen → **DAC** (Digital-Analog-Converter)
* DAC → elektrische Spannung
* Spannung → Lautsprechermembran schwingt
* Membran → Luft schwingt
* Luft → Druckwelle → Ohr

<!--
- DAC = Digital-Analog-Converter (Deutsch: Digital-Analog-Wandler)
- Jedes Abspielgerät enthält einen DAC: Smartphone, Laptop, HiFi-Verstärker
- Die Rekonstruktion ist keine identische Kopie der Originalwelle — Nyquist-Theorem definiert die theoretische Grenze
- Hochwertige DACs sind ein eigenes Produktsegment (HiFi, Profi-Audio)
-->

---

![bg fit right:35%](./assets/samplerate.webp)

# Zurück zu Analog

Beim Abspielen läuft der Prozess rückwärts:

- Zahlen → **DAC** (Digital-Analog-Converter)
- DAC → elektrische Spannung
- Spannung → Lautsprechermembran schwingt
- Membran → Luft schwingt
- Luft → Druckwelle → Ohr

**Was wir hören ist wieder analog**

---

<!-- _class: lead -->

# Das Problem der Datengröße

---


<!-- _class: lead -->

# Das Problem der Datengröße

## oder knappen Speichers

---

<!-- _header: '' -->
<!-- _footer: '' -->

![bg fit](./assets/compact-disc-cd.jpg)

---

![bg right:40%](./assets/IMG_3617.jpg)

# Ein konkretes Beispiel

**Eine Minute Musik in CD-Qualität:**

**44.100 Messungen** (pro Sekunde)

---

![bg right:40%](./assets/IMG_3617.jpg)

# Ein konkretes Beispiel

**Eine Minute Musik in CD-Qualität:**

**44.100 Messungen** (pro Sekunde)
× **16 Bit** (pro Messung)

---

![bg right:40%](./assets/IMG_3617.jpg)

# Ein konkretes Beispiel

**Eine Minute Musik in CD-Qualität:**

**44.100 Messungen** (pro Sekunde)
× **16 Bit** (pro Messung)
× **2 Kanäle** (Stereo)

---

![bg right:40%](./assets/IMG_3617.jpg)

# Ein konkretes Beispiel

**Eine Minute Musik in CD-Qualität:**

**44.100 Messungen** (pro Sekunde)
× **16 Bit** (pro Messung)
× **2 Kanäle** (Stereo)
× **60 Sekunden**

= **10,6 MB pro Minute**

<!--
BEGRIFFE:
- 44.100 Messungen/Sekunde = Abtastrate (Sample Rate): Wie oft pro Sekunde wird die Schallwelle gemessen/abgetastet. Einheit: Hz (Hertz). 44.100 Hz = 44,1 kHz.
- 16 Bit pro Messung = Bittiefe (Bit Depth): Wie fein wird jede einzelne Messung aufgelöst. 16 Bit = 2¹⁶ = 65.536 mögliche Lautstärkestufen.
- 2 Kanäle (Stereo): Links und rechts getrennt gespeichert. Mono = 1 Kanal, Stereo = 2 Kanäle.

RECHNUNG:
44.100 × 16 × 2 = 1.411.200 Bit/Sekunde = 176.400 Byte/Sekunde ≈ 10,3 MB/Minute

- CD (1982, Sony/Philips): erstes massenmarktfähiges digitales Distributionsmedium für unkomprimiertes PCM-Audio
- PCM (Pulse-Code Modulation) existierte bereits vorher: NHK (Nippon Hōsō Kyōkai = japanische öffentlich-rechtliche Rundfunkanstalt)-Forschung ab 1960er, digitale Studiogeräte ab 1970er
- Die CD war nicht das erste digitale Audio — aber das erste das in Konsumentenhänden landete
-->

---

![bg right:40%](./assets/IMG_3617.jpg)

# Ein konkretes Beispiel

**Eine Minute Musik in CD-Qualität:**

**44.100 Messungen** (pro Sekunde)
× **16 Bit** (pro Messung)
× **2 Kanäle** (Stereo)
× **60 Sekunden**

= **10,6 MB pro Minute**
= **10.600.000 Byte pro Minute**

---


![bg right:40%](./assets/IMG_3617.jpg)

# Ein konkretes Beispiel

**Eine Minute Musik in CD-Qualität:**

**44.100 Messungen** (pro Sekunde)
× **16 Bit** (pro Messung)
× **2 Kanäle** (Stereo)
× **60 Sekunden**

= **10,6 MB pro Minute**
= **10.600.000 Byte pro Minute**
= **84.800.000 bit pro Minute**

---

<!-- _class: erklaerung

# CD-Audio – Vertiefung

Die CD (1982) war nicht das erste digitale Audiomedium — PCM-Aufnahmen existierten seit den späten 1960ern in Tonstudios (u.a. NHK, Nippon Columbia). Die CD war das erste **massenmarktfähige** digitale Distributionsmedium für unkomprimiertes Audio in Konsumentenhänden.

**Warum 44.100 Hz?**
Kombination aus Nyquist-Limit (2× 20 kHz = 40 kHz Minimum) und Kompatibilität mit Videobandgeräten, die in frühen digitalen Tonstudios als Speichermedium genutzt wurden. NTSC: 3 Samples × 245 Zeilen × 60 Felder = 44.100. PAL: 3 Samples × 294 Zeilen × 50 Felder = 44.100.

**Warum 16 Bit?**
96 dB Dynamikumfang übersteigt den des menschlichen Gehörs unter realen Hörbedingungen (~80–90 dB). Kompromiss zwischen Qualität und Speicherbedarf auf der physischen Disc.

---
-->
![bg right:40%](./assets/IMG_3617.jpg)

# Das Problem skaliert

| Inhalt | Unkomprimiert |
|--------|-------------:|
| 1 Song (4 Min) | ~42 MB |
| 1 Album (60 Min) | ~635 MB |
| 10.000 Songs | ~420 GB |

**Kontext 1990er:**
- Übliche Festplattengröße: 100–500 MB
- 56 kbit/s Modem → Einfache Songs laden Stunden

<!--
- Ein Album hätte eine komplette Festplatte gefüllt
- 56k-Modem: theoretisch 56 kbit/s = 7 KB/s → 42 MB Song = ~100 Minuten Download
- Erstes kommerziell erhältliches 1-GB-Laufwerk: IBM 3380 (1980), Größe eines Kühlschranks, ~$40.000
- Consumer-Festplatten 1990: Seagate ST-251 (40 MB), ~$200
-->

---

![bg right:32% contain](./assets/kubrick.jpg)

# Video eskaliert

**Eine Minute 4K-Video (unkomprimiert):**

**3840 × 2160 Pixel** (Auflösung pro Bild)
× **3 Byte** (pro Pixel – RGB)
× **30 Bilder** (pro Sekunde)
× **60 Sekunden**

= **~45 GB pro Minute**

Kinofilm in üblicher Länge (~120min) über **5 TB (Terabyte)**

<!--
- Netflix, YouTube, Streaming — nichts davon wäre ohne Kompression möglich
- Blu-ray (2006): max. 50 GB Kapazität — reicht nicht einmal für 2 Minuten unkomprimiertes 4K
- Tatsächliche 4K-Blu-ray nutzt H.265 (HEVC): ~75–100 Mbit/s → ~2h Film passt auf eine Disc
-->

---

![bg right:40%](./assets/artemis.jpg)

# Artemis II orbitiert

| | Apollo (1969) | Artemis II (2026) |
|---|---|---|
| Bandbreite | ~50 kbit/s | 260 Mbit/s |
| Video | SW, ~320 Zeilen | HD live, 4K gespeichert |
| Codec | analog | H.265 (HEVC) |

260.000.000 Bit/s
÷ 8 (Bit pro Byte) = 32,5 MB/s
× 60 Sekunden = **1,95 GB pro Minute**

*Apollo: 50 kbit/s = 0,375 MB/min*

<!--
- Übertragung per Infrarot-Laser: O2O (Orion Artemis II Optical Communications)
- MAScOT-Terminal: entwickelt von MIT Lincoln Lab
- 32 Kameras an Bord (Nikon D5/Z9, GoPros, Redwire 4K-Festkameras)
- ZCube-Encoder kodiert H.265 an Bord
- Bandbreite geteilt mit Telemetrie und Voice — live daher "nur" HD, 4K kommt auf CompactFlash-Karten nach Splashdown
- Latenz Mond ↔ Erde: ~1,3 Sekunden (384.400 km)
- Apollo: S-Band Radio, Artemis II: Infrarot-Laser
-->

---

# Kompressionsraten in der Praxis

| Medium | Unkomprimiert | Komprimiert | Faktor |
|--------|-------------:|------------:|-------:|
| 1 Song (4 Min) | ~42 MB | ~4 MB (MP3 128) | ~10× |
| 1 Foto (12 MP) | ~36 MB | ~3 MB (JPEG) | ~12× |
| 1 Min 4K-Video | ~45 GB | ~375 MB (H.264) | ~120× |

<!--
- Diese Faktoren sind keine Ausnahmen, sondern die Norm
- Ohne Kompression: kein Streaming, keine Smartphones, keine sozialen Medien
- Die Frage ist nicht ob, sondern wie komprimiert wird
-->

---

<!-- _class: lead -->

# Zwei Arten der Datenkompression


---

<!-- _class: lead -->

# Zwei Arten von Datenkompressionsalgorithmen

---

<!--
Was ist überhaupt KOMPRESSION?

- Luftdruck in Auto/Fahrradreifen
- LNG Flüssiggas
- Tripsdrill, Disneyland
- Oper/Theater/Telenovela
- Cola Sirup für den Sodastream
-->

---

# Verlustfreie Kompression (Lossless)

**Prinzip:** Redundanz entfernen

<!--
- Run-Length Encoding (RLE): einfachste Form der verlustfreien Kompression
- Prinzip: Muster erkennen, kompakter darstellen
- Gut bei strukturierten Daten (Text, einfache Grafiken)
- Schlecht bei "chaotischen" Daten (Fotos, Audio) — dort kaum Wiederholungen
-->

---

# Verlustfreie Kompression (Lossless)

**Prinzip:** Redundanz entfernen

Beispiel **Lauflängenkodierung** (Run-Length-Encoding – RLE):
```
Original:    AAAAABBBCCCCCCCC (16 Zeichen)
Komprimiert: 5A3B8C            (6 Zeichen)
```

→ Komprimiert 62% kleiner und **100% wiederherstellbar**

<!--
- Run-Length Encoding (RLE): einfachste Form der verlustfreien Kompression
- Prinzip: Muster erkennen, kompakter darstellen
- Gut bei strukturierten Daten (Text, einfache Grafiken)
- Schlecht bei "chaotischen" Daten (Fotos, Audio) — dort kaum Wiederholungen
-->

---

# Verlustfreie Kompression (Lossless)

**Prinzip:** Redundanz entfernen

Beispiel **Lauflängenkodierung** (Run-Length-Encoding – RLE):
```
Original:    AAAAABBBCCCCCCCC (16 Zeichen)
Komprimiert: 5A3B8C            (6 Zeichen)
```

→ Komprimiert 62% kleiner und **100% wiederherstellbar**

**Anwendung:**
* ZIP-Archive, PNG-Bilder, FLAC-Audiodateien, RAW-Dateien, Programmcode

<!--
- Run-Length Encoding (RLE): einfachste Form der verlustfreien Kompression
- Prinzip: Muster erkennen, kompakter darstellen
- Gut bei strukturierten Daten (Text, einfache Grafiken)
- Schlecht bei "chaotischen" Daten (Fotos, Audio) — dort kaum Wiederholungen
-->

---

# Verlustbehaftete Kompression (Lossy)

**Prinzip:** Irrelevanz entfernen → *Wozu Daten speichern, die niemand wahrnimmt?*

---

# Verlustbehaftete Kompression (Lossy)

**Prinzip:** Irrelevanz entfernen → *Wozu Daten speichern, die niemand wahrnimmt?*

**Originaldatei nicht wiederherstellbar (!)**

**Die Frage:** Was nimmt ein Mensch eigentlich (nicht oder sehr schlecht) wahr?

* Das Ohr hört nicht alle Frequenzen (hohe und tiefe Töne) gleich gut
* Laute Töne überdecken leise Töne (Maskierung)
* Das Auge sieht nicht alle Farbnuancen gleich scharf
* Luminanz (Helligkeit/Dunkelheit) besser erkennen als Chrominanz (Farbunterschiede/Farbigkeit)
* und Vieles mehr

<!--
- Zentrale Idee hinter MP3, JPEG, H.264
- Nicht die Daten selbst reduzieren — das wäre bloßer Qualitätsverlust
- Sondern gezielt das entfernen, was Menschen nicht wahrnehmen
- Psychoakustik (Audio) / Psychovisualität (Bild) als wissenschaftliche Grundlage
-->

---

<!-- _class: klausur -->
<!-- _header: '' -->
<!-- _footer: '' -->
<!-- _backgroundColor: #e3f2fd -->

# Verlustfrei vs. Verlustbehaftet

| | Verlustfrei (Lossless) | Verlustbehaftet (Lossy) |
|---|---|---|
| **Prinzip** | **Redundanz** entfernen | **Irrelevanz** entfernen |
| **Reversibel** | Ja | Nein (Information unwiederbringlich verloren) |
| **Reduktion** | 30–50% | 80–99% |
| **Formate** | ZIP, PNG, FLAC, GIF, ... | JPEG, MP3, H.264/H.265, ... |

**Faustregel:**
- Medien für EndnutzerInnen (Ton, Bild, Film) → Lossy oft akzeptabel
- Quellmaterial, Code, Archive (RAW) → Lossless nötig

<!--
REDUNDANZ: Wiederholende Muster kompakter darstellen (z.B. "AAAA" → "4×A")
IRRELEVANZ: Für Menschen nicht wahrnehmbar (Psychoakustik, Psychovisuell)

KLAUSURRELEVANT:
- Verlustfrei = Original 1:1 wiederherstellbar
- Verlustbehaftet = Information geht verloren, aber kaum wahrnehmbar
- Redundanz vs. Irrelevanz ist der Kernunterschied
-->

<!--
---

 _class: erklaerung

# Kompression – Vertiefung

Claude Shannon definierte 1948 die **Entropie** als theoretische Untergrenze der Kompression. Ein Text mit gleichmäßiger Zeichenverteilung hat hohe Entropie (schwer komprimierbar); repetitive Texte haben niedrige Entropie.

**Verlustfreie Kompression** erreicht diese Grenze durch:
- **Statistische Kodierung:** Huffman, Arithmetic Coding
- **Wörterbuch-Methoden:** LZ77, LZ78, DEFLATE (ZIP, PNG, TAR)
- Originalzustand ist exakt rekonstruierbar

**Verlustbehaftete Kompression** unterschreitet die Grenze, indem sie menschliche Wahrnehmungsgrenzen ausnutzt:

| Sinneskanal | Psychophysisches Modell | Ausnutzung |
|-------------|------------------------|------------|
| Gehör | Maskierungseffekte, Hörschwelle | MP3: Töne unter Maskierungsschwelle weglassen |
| Sehen | Farbauflösung, Kontrastempfindlichkeit | JPEG: Chroma-Subsampling, hohe Frequenzen verwerfen |

**Shannon-Limit:** Verlustfreie Kompression ist durch Entropie begrenzt; Verlustbehaftete Kompression kann beliebig weit gehen — auf Kosten der Qualität.

ABKÜRZUNGEN:
- LZ77 = Lempel-Ziv 1977 — Sliding-Window: sucht Wiederholungen in einem Fenster der letzten Bytes, ersetzt durch Rückverweise (Offset + Länge)
- LZ78 = Lempel-Ziv 1978 — baut explizites Wörterbuch auf: neue Muster bekommen Index, Wiederholungen werden durch Index ersetzt
- DEFLATE = Kombination LZ77 + Huffman-Coding; verwendet in ZIP, PNG, gzip
- TAR = Tape ARchive — kein Kompressionsformat, sondern Archivformat. Kompression durch Kombination: .tar.gz (gzip), .tar.bz2 (bzip2), .tar.xz (LZMA)
- ZIP = Archivformat mit eingebauter DEFLATE-Kompression (Phil Katz, 1989)
- PNG = Portable Network Graphics — nutzt DEFLATE für verlustfreie Bildkompression

STATISTISCHE KODIERUNG:
- Huffman-Coding: Häufige Zeichen → kurze Bitfolgen, seltene Zeichen → lange Bitfolgen
- Arithmetic Coding: Kodiert gesamte Nachricht als einzelne Zahl zwischen 0 und 1. Effizienter als Huffman, rechenintensiver

ENTROPIE (Shannon, 1948):
- Maß für den Informationsgehalt: Wie "überraschend" ist jedes Zeichen?
- Hohe Entropie = schwer komprimierbar (verschlüsselte Daten, Rauschen)
- Niedrige Entropie = gut komprimierbar ("AAAAAAA", natürliche Sprache)
- Theoretisches Minimum: kein Algorithmus kann unter die Entropie-Grenze kommen

PRAXISBEISPIEL:
- ZIP einer .txt-Datei: ~60–70% kleiner (Text hat niedrige Entropie)
- ZIP einer .jpg-Datei: kaum kleiner (JPEG hat Entropie schon ausgereizt)
-->

---

<!-- _class: lead -->

# Die Grundbausteine
## Bits, Bytes und ihre Darstellung

---

<!-- _header: '' -->
<!-- _footer: '' -->

![bg](./assets/lightbulb-onoff.png)

<!--
Bit = Binary Digit
Demonstration: Glühbirne AN/AUS = 1 Bit
-->

---

<!-- _header: '' -->
<!-- _footer: '' -->

![bg](./assets/morpheus.jpg)


---

# Das bit

### Kleinste *logische* Informationseinheit

* **0 oder 1**
* AN oder AUS
* Strom fließt oder nicht
* Schwarz oder Weiß
* Richtig oder Falsch
* Take the red pill or blue pill

<!--
- BIT = Binary Digit (Binärziffer) — Begriff geprägt von John W. Tukey, 1947; popularisiert durch Claude Shannon, 1948
- Shannon begründete die Informationstheorie (Bell Labs)
- Warum binär? Elektronische Schaltungen haben physikalisch stabile 2 Zustände: Strom/kein Strom
- Transistoren in modernen CPUs: Apple M4 ~28 Milliarden Transistoren, schalten Milliarden Mal pro Sekunde
-->

---

# Das Byte

### Die kleinste *adressierbare* Informationseinheit

<!--
BYTE = Wortspiel aus "Bit" + "Bite" (Bissen) — ein "Bissen" Information
Begriff geprägt von Werner Buchholz (IBM), 1956, während der Entwicklung des IBM 7030 Stretch
Schreibweise mit "y" statt "i": bewusste Änderung zur Vermeidung von Verwechslung mit "Bit"
-->

---

# Das Byte

### Die kleinste *adressierbare* Informationseinheit

### 8 bit = 1 Byte


```
0 0 1 0 1 0 1 0                                                                              = 42
```

<!--
binary 00101010 = decimal 42

Rätsel: "Wenn sich das Wachstum einer Seerose auf einem Teich jeden Tag verdoppelt · und nach *zehn Tagen* der ganze Teich bedeckt ist, wann ist er zur Hälfte zugewachsen?"
-->

---

# Das Byte

### Die kleinste *adressierbare* Informationseinheit

### 8 bit = 1 Byte


```
0 0 0 0 0 0 0 0                                                                               = 0
0 0 0 0 0 0 0 1                                                                               = 1
0 0 0 0 0 0 1 0                                                                               = 2
0 0 0 0 0 0 1 1                                                                               = 3
0 0 0 0 0 1 0 0                                                                               = 4

0 1 0 0 0 0 0 0                                                                               = 64

0 1 1 1 1 1 1 1                                                                               = 127

1 1 1 1 1 1 1 1                                                                               = ?
```

<!--
- 1964: IBM System/360 setzte den 8-Bit-Byte-Standard — vorher: 6-Bit und 7-Bit-Systeme im Einsatz
- ASCII (1963) brauchte 7 Bit für 128 Zeichen
- 8 Bit = praktisch für Hardware (Zweierpotenz: 2³ = 8)
- 8 Bit = 2 Hexadezimalziffern (elegante Darstellung)
- Kleinste adressierbare Einheit im Speicher: Prozessor kann nicht einzelne Bits direkt ansprechen, immer Bytes

1 Bit = 2 Zustände
2 Bit = 4 Zustände
3 Bit = 8 Zustände
4 Bit = 16 Zustände
5 Bit = 32 Zustände
6 Bit = 64 Zustände
7 Bit = 128 Zustände
8 Bit = 256 Zustände
-->

---

# Das Byte

### Die kleinste *adressierbare* Informationseinheit

### 8 bit = 1 Byte


```
0 0 0 0 0 0 0 0                                                                               = 0
0 0 0 0 0 0 0 1                                                                               = 1
0 0 0 0 0 0 1 0                                                                               = 2
0 0 0 0 0 0 1 1                                                                               = 3
0 0 0 0 0 1 0 0                                                                               = 4

0 1 0 0 0 0 0 0                                                                               = 64
0 1 1 1 1 1 1 1                                                                               = 127
1 1 1 1 1 1 1 1                                                                               = ?
```

2 * 2 * 2 * 2 * 2 * 2 * 2 * 2 = 2⁸ = **256 mögliche Zustände**

---

<!-- _header: '' -->
<!-- _footer: '' -->

»256 Shades of Gray«

![bg fit](./assets/grayscale-gradient.png)

<!--
256 Graustufen: 0 = Schwarz, 255 = Weiß
-->

---

# Was kann man mit 256 Zuständen machen?

* **256 Zeichen** (Buchstaben, Zahlen, Symbole)
* **256 Helligkeit bzw. Luminanz** (0 = Schwarz/Dunkel, 255 = Weiß/Hell)
* **256 Lautstärkestufen**
* **Zahlen 0–255** (oder –128 bis +127)

<!--
- 256 = die "magische Zahl" bei 8 Bit
- Für Farbbilder: 3 Bytes pro Pixel (R, G, B)
- Jeder Kanal 0–255 → 256³ = 16.777.216 Farben ("True Color")
- Das menschliche Auge kann ca. 10 Millionen Farben unterscheiden (Schnapf et al., J. Neuroscience 1987)
- 24 Bit reicht für fotorealistische Bilder
-->

---

<!-- _header: '' -->
<!-- _footer: '' -->

![bg fit](./assets/rgb-color-model.png)

<!--
Welche Farben für ein volles Spektrum bieten sich nach unserer gelernten Sparsamkeit hier am besten an?

1. CMYK (Cyan, Magenta, Yellow, Key/Black)
2. RGB (Red, Green, Blue)
-->

---

<!-- _header: '' -->
<!-- _footer: '' -->

![bg fit](./assets/rgb-color-model-with-title.png)

<!--
RGB = Additive Farbmischung (Bildschirme)
Sog. RGB Tuple (geordnete endliche Liste)
-->

---

![bg right:50%](./assets/addaptive-substractive-colors.jpg)

# Farben: RGB-Modell

**1 Pixel = 3 Byte**

- **Rot:** 0–255
- **Grün:** 0–255
- **Blau:** 0–255

**Beispiele:**
`FF 00 00` = Rot
`00 FF 00` = Grün
`00 00 FF` = Blau
`00 00 00` = Schwarz
`FF FF FF` = Weiß

<!--
- sRGB = Standard RGB (IEC = International Electrotechnical Commission, Norm 61966-2-1, 1999)
- CMYK = Cyan, Magenta, Yellow, Key (Black) — subtraktive Farbmischung (Druck)
- Hex-Notation: FF = 255 in Dezimal
- CSS-Farben nutzen Hex: #FF0000 = Rot
-->

---

# Das Problem: Sprachen

**Die Welt hat mehr als 256 Zeichen (!)**

- Englisches Alphabet: 52 (A–Z, a–z)
- + Ziffern: 10 (0–9)
- + Sonderzeichen: ~30

**≈ 90 Zeichen passen problemlos in 1 Byte**

**Jedoch ohne** ä, ö, ü, ß, é, à, ç, α, β, 中, 日, 🌸

<!--
- ASCII (1963): 7 Bit = 128 Zeichen (nur Englisch)
- ISO-8859-1 (Latin-1, 1987): 8 Bit = 256 Zeichen (Westeuropa)
- Chaos der 1980/90er: Verschiedene inkompatible Standards für verschiedene Sprachen
- Windows-1252 vs. ISO-8859-1: ähnlich, aber nicht identisch — Ursache unzähliger Encoding-Bugs
-->

---

# Unicode: Ein Standard für alle

**Unicode (1991):** Jedes Schriftsystem der Welt

**>150.000 Zeichen:**
- Latein, Kyrillisch, Arabisch, Chinesisch, Japanisch...
- Mathematische Symbole, Emoji, historische Schriften

**UTF-8:** Variable Länge (1–4 Byte pro Zeichen)
- **Zeichen 0–127: identisch mit ASCII** (Abwärtskompatibilität!)
- 1.112.064 gültige Codepunkte
- Umlaute: 2 Byte · CJK: 3 Byte · Emoji: 4 Byte

<!--
- Unicode Consortium: Non-Profit, gegründet 1991
- Unicode 16.0 (2024): 154.998 Zeichen
- UTF-8 = Unicode Transformation Format, 8-bit (Ken Thompson & Rob Pike, 1992)
- Die ersten 128 Zeichen in UTF-8 sind exakt ASCII — Grund warum ASCII nie verschwinden wird
- UTF-8 ist seit 2008 das häufigste Encoding im Web (W3Techs)
-->

---

# Beispiel: Byte zählen

**Text:** `"Hello·🌸·こんにちは·(Kon-ni-chi-wa)"`

| Zeichen | Byte |
|---------|-------|
| `Hello·` | 6 × 1 = **6 Byte** (ASCII) |
| `🌸` | **4 Byte** (Emoji) |
| `·` | **1 Byte** |
| `こんにちは` | 5 × 3 = **15 Byte** (Hiragana) |
| `·(Kon-ni-chi-wa)` | **16 Byte** (ASCII) |

**Gesamt: 42 Byte** für 29 sichtbare Zeichen

<!--
- ASCII (Hello, Klammern) = 1 Byte pro Zeichen
- Emoji 🌸 (Cherry Blossom U+1F338) = 4 Bytes
- Hiragana こんにちは = 3 Byte pro Zeichen (U+3040–309F)
- は wird hier "wa" ausgesprochen (Partikel), nicht "ha"
-->

---

<!-- _class: lead -->

# Hexadezimal
## Die Sprache der Datei-Analyse

---

# Hexadezimal: Lesbarkeit

**Für den Menschen ungeeignet:**
`01010000 01001110 01000111`

**Hexadezimal (Base 16):**
`50 4E 47`

`5 = 0101` `0 = 0000` = 5 * 16 + 0 = 80
`4 = 0100` `E = 1110` = 4 * 16 + ? = ?
`4 = 0100` `7 = 0111` = ?

**Jede Hex-Ziffer = 4 Bits (ein "Nibble")**
0–9, A–F (10=A, 11=B, ..., 15=F)

<!--
- Dezimalsystem passt unelegant ins binäre System: 0–15 (1111) braucht 1–2 Dezimalziffern, immer 1 Hex-Ziffer
- Hexadezimal (16 = 2⁴) passt perfekt: 4 Bits = 1 Hex-Ziffer, 8 Bits = 2 Hex-Ziffern
- "Nibble" = 4 Bits = halbes Byte (Wortspiel: nibble = knabbern, byte = beißen)
- ASCII geht nur bis 127 — Werte 128–255 sind nicht im ASCII-Raum
-->

---

<!-- _class: lead -->

# ASCII
## One *Zeichensatz* to rule them all

<!--
WARUM 7 BIT STATT 8?
- 1963: Fernschreiber (Teletype) arbeiteten mit 7-Bit-Codes
- Das 8. Bit diente der Paritätsprüfung (Fehlererkennung bei Übertragung)
- Speicher war kostspielig: jedes eingesparte Bit zählte
- 128 Zeichen galten als ausreichend für den englischsprachigen Raum

KULTURHISTORISCHER KONTEXT:
- "American Standard Code for Information Interchange" (1963)
- Entwickelt für US-amerikanische Bedürfnisse
- Keine Unterstützung für: Umlaute (ä, ö, ü), ß, diakritische Zeichen (é, ñ, ç)
- Nicht-lateinische Schriftsysteme nicht berücksichtigt
- Führte zu zahlreichen inkompatiblen Erweiterungen (ISO-8859-1, Windows-1252, etc.)

WARUM NOCH HEUTE RELEVANT?
- UTF-8 vollständig ASCII-kompatibel (Zeichen 0–127 identisch)
- Internetprotokolle basieren auf ASCII: HTTP-Header, SMTP, URLs
- Programmiersprachen: Schlüsselwörter und Syntax sind ASCII
- Ein 60 Jahre alter Standard, der durch Kompatibilitätszwänge fortbesteht

HISTORISCHE RANDNOTIZ:
- Das @-Zeichen wurde nachträglich aufgenommen
- Heute unverzichtbar für E-Mail-Adressen weltweit
-->

---

<!-- _header: '' -->
<!-- _footer: '' -->

![bg fit](./assets/ascii-table-colored.png)

<!--
US-ASCII (1967) Code Chart
- 7 Bit = 128 Zeichen
- Erste 32: Steuerzeichen (nicht druckbar)
- Zeichen 32–126: Druckbar (Buchstaben, Ziffern, Satzzeichen)
- Keine Umlaute, kein ñ, kein é
-->

---

![bg right:40%](./assets/matrix-code.png)

# WTF!?

```
89 50 4E 47 0D 0A 1A 0A
00 00 00 0D 49 48 44 52
00 00 01 90 00 00 01 2C
```

---

![bg right:30%](./assets/matrix-code.png)

# What the HEX-Code

```
89 50 4E 47 ...
```

| Binär | Hex | Dez | ASCII |
|-------|-----|-----|-------|
| `1000 1001` | `89` | 137 | ✗ (> 127) |
| `0101 0000` | `50` | 80 | **P** |
| `0100 1110` | `4E` | 78 | **N** |
| `0100 0111` | `47` | 71 | **G** |

→ `89` übersteigt den ASCII-Raum und markiert eine Binärdatei

<!--
- Hex = 2 Ziffern = 1 Byte = 8 Bit
- 89 hex = 8×16 + 9 = 137 dezimal
- ASCII geht nur bis 127 — 137 ist nicht druckbar
- 50, 4E, 47 = P, N, G in ASCII
-->

---

<!-- _header: '' -->
<!-- _footer: '' -->
<!-- _backgroundColor: #000 -->

![bg fit](./assets/hex-code-hidden.png)

---

<!-- _header: '' -->
<!-- _footer: '' -->
<!-- _backgroundColor: #000 -->

![bg fit](./assets/hex-code.png)

<!--
- Erste Bytes: 89 50 4E 47 = PNG-Signatur
- 89: non-printable character (außerhalb ASCII)
- 50: P
- 4E: N
- 47: G
- IHDR = Image Header (Breite, Höhe, Farbtiefe)
- Tool: HxD (Windows), Hex Fiend (Mac), xxd (Linux)
-->

---

<!-- _header: '' -->
<!-- _footer: '' -->

![bg fit](./assets/8bit-P-character.png)

---

# Magic Numbers

**Dateityp-Identifikation durch erste Bytes**

| Format | Magic Number (Hex) | Lesbar? |
|--------|-------------------|---------|
| PNG | `89 50 4E 47` | ✗ P N G |
| JPEG | `FF D8 FF` | ✗ ✗ ✗ |
| PDF | `25 50 44 46` | % P D F ✓ |
| ZIP | `50 4B 03 04` | P K ✗ ✗ |

**Wichtig:** ASCII = nur 0–127! Werte darüber (z.B. `89` = 137) sind **nicht druckbar** (non-printable). *Hex-Editoren zeigen dafür `.` oder `ÿ` als Platzhalter.*

<!--
- PNG nutzt absichtlich 89 (= 137 dezimal): markiert Datei eindeutig als Binär, nicht Text
- Erkennt kaputte Übertragungen (alte Systeme schnitten Bit 7 ab)
- "PK" bei ZIP = Phil Katz (Erfinder von PKZip, 1989)
- DOCX, XLSX, PPTX, ODT = alles ZIP-Archive mit XML-Inhalt
- Dateien OHNE Magic Number: TXT, HTML, CSS, JSON, XML — reiner Text, kein binäres Format
- Sicherheit: virus.exe → bild.jpg umbenennen täuscht nur Menschen; "file" (Linux) liest Magic Number
-->

---

<!-- _class: klausur -->
<!-- _header: '' -->
<!-- _footer: '' -->
<!-- _backgroundColor: #e3f2fd -->

# Dateneinheiten

| Einheit | Bytes | Potenz | Beispiel |
|---------|------:|:------:|----------|
| **Byte** | 1 | 10⁰ | Farbwert eines Pixels |
| **Kilobyte (KB)** | 1.000 | 10³ | Kleiner Programmcode |
| **Megabyte (MB)** | 1 Million | 10⁶ | Textdokument |
| **Gigabyte (GB)** | 1 Milliarde | 10⁹ | Kinofilm in FullHD |
| **Terabyte (TB)** | 1 Billion | 10¹² | ~12h Video in 4K |
| **Petabyte (PB)** | 1 Billiarde | 10¹⁵ | Netflix-Gesamtarchiv |
| **Exabyte (EB)** | 1 Trillion | 10¹⁸ | Alle E-Mails weltweit/Tag |
| **Zettabyte (ZB)** | 1 Trilliarde | 10²¹ | Globale Datenmenge 2025 |

<!--
- SI-Präfixe (Dezimal): 1 KB = 1.000 Bytes
- Binär (IEC): 1 KiB = 1.024 Bytes (Kibibyte)
- Windows zeigt oft binär, sagt aber "KB" — Verwirrung!
- 1 TB Festplatte = ~931 GiB nutzbar

Eselsbrücke: "Kilo Mega Giga Tera Peta Exa Zetta Yotta"
→ "Komm Mit Großem Tee, Peter Exte Zettelt Yachten"
-->


---

<!-- _header: '' -->
<!-- _footer: '' -->

![bg fit](./assets/growth-of-big-data.png)

<!--
Quelle: Floridi, L.: The Fourth Revolution
-->

---

# AI-generierte Inhalte 2025

**Wie viel Content ist heute synthetisch?**

| Bereich | AI-Anteil |
|---------|-----------|
| **Neue Webseiten** | ~74% enthalten AI-Content |
| **Web-Text gesamt** | ~30–40% AI-generiert |
| **Neue Artikel** | ~52% von AI geschrieben |
| **Social-Media-Bilder** | ~71% AI-generiert |

**Prognose 2026:** 90% des Online-Contents synthetisch

<!--
- Quellen: Ahrefs 2025, arXiv, Europol-Report
- "Synthetic Media" = AI-generiert oder -manipuliert
- Schwer zu messen, da Menschen + AI zusammenarbeiten
- Model Collapse: AI trainiert auf AI-Output → Qualitätsverlust (Shumailov et al., Nature 2024)
-->

---

<!-- _class: lead -->

# Teil 2: Die MP3-Revolution
## Psychoakustik & Audio-Kompression

---

<!-- _header: '' -->
<!-- _footer: '' -->

![bg](./assets/cassette-ipod.png)

---

<!-- _class: klausur -->
<!-- _header: '' -->
<!-- _footer: '' -->
<!-- _backgroundColor: #e3f2fd -->

# Analoge Medien
### Distribution: physisch (Kauf, Verleih, Kopie)

* **Text**
    - Bücher, Zeitungen, Zeitschriften, Lochkarten
* **Bild**
    - Fotografie (Negativ, Dia, Polaroid), Mikrofilm
* **Audio:**
    - Schallplatte (Vinyl, Schellack), Tonband, Musikkassette
* **Video:**
    - Film (35mm, Super 8), VHS, Betamax

---

<!-- _class: erklaerung -->
<!-- _header: '' -->
<!-- _footer: '' -->

# Analoge Medien – Vertiefung

Analoge Speicherung codiert Information als **kontinuierliche physikalische Größe**: Rillentiefe (Vinyl), Magnetfeldstärke (Tonband), Silberkorn-Dichte (Film). Es gibt keine diskreten Stufen — theoretisch unendliche Auflösung, praktisch begrenzt durch Rauschen.

**Generationsverlust** entsteht, weil jede Kopie neues Rauschen addiert:
- Schallplatte → Kassette: Frequenzgang leidet, Rauschen steigt
- VHS → VHS: Farbsättigung sinkt, Schärfe nimmt ab
- 3. Generation: oft unbrauchbar

| Medium | Typische Auflösung | Dynamik |
|--------|-------------------|---------|
| Vinyl (audiophil) | ~20–20.000 Hz | ~70 dB |
| Tonband (Studio) | ~30–15.000 Hz | ~55 dB |
| 35mm Film | ~4K-äquivalent | ~13 Blendenstufen |

**Paradox der Analogtechnik:** Das Original ist einzigartig und unersetzlich — aber genau deshalb anfällig. Jedes Abspielen einer Schallplatte trägt mikroskopisch Material ab; jeder Filmdurchlauf riskiert Kratzer.

---

# Analoge Medien: Vor- und Nachteile

| Vorteile | Nachteile |
|----------|-----------|
| Kein Abspielgerät nötig (Buch, Foto) | Qualitätsverlust bei jeder Kopie |
| Haptisches Erlebnis | Physischer Verschleiß |
| Unabhängig von Strom/Internet | Begrenzte Haltbarkeit |
| Keine Formatkonvertierung | Platzbedarf bei Lagerung |
| Eindeutiges Original | Aufwendige Durchsuchbarkeit |

<!--
GENERATIONSVERLUST:
- Kassette → Kassette: jede Kopie schlechter
- VHS → VHS: Rauschen nimmt zu
- Schallplatte: Jedes Abspielen = minimaler Verschleiß

Digitale Kopie = bit-identisch mit Original (kein Unterschied)
-->

---

# Von Analog zu Digital: Die Kopier-Revolution

**Das Problem analoger Kopien:**
Kassette → Kassette → Kassette = immer schlechter

**Was Digital anders macht:**
* **Identische Kopien** — kein Qualitätsverlust, nie
* **Einfache Massenproduktion** — Copy & Paste
* **Perfekte Archivierung** — Bits verändern sich nicht

**Daher: "Raubkopien"**
Der Begriff entstand, weil digitale Kopien *tatsächlich identisch* mit dem Original waren — nicht wie bei Kassetten eine schlechtere Version.

<small>Quelle: [c64-wiki.de/wiki/Raubkopie](https://www.c64-wiki.de/wiki/Raubkopie)</small>

<!--
- Analog: Kopie war immer erkennbar schlechter
- Digital: Kopie = Original (bit-identisch)
- Gerade die Perfektion wurde zum "Problem" der Musikindustrie
-->

---

<!-- _class: klausur -->
<!-- _header: '' -->
<!-- _footer: '' -->
<!-- _backgroundColor: #e3f2fd -->

# Digitale Medien
### Distribution: Datenträger (CD, USB), Download, Streaming, P2P

* **Text**
    - E-Book (PDF, EPUB), Dokumente (TXT, DOCX)
* **Bild**
    - Digitalfoto (JPEG, PNG, RAW, WebP, GIF)
* **Audio**
    - Audiodatei (MP3, FLAC, WAV, AAC, OGG)
* **Video**
    - Videodatei (MP4, MKV, AVI, WebM)

---

<!-- _class: erklaerung -->
<!-- _header: '' -->
<!-- _footer: '' -->

# Digitale Medien – Vertiefung

Digitale Speicherung quantisiert kontinuierliche Signale in diskrete Werte. Der **Quantisierungsfehler** (Differenz zum Original) ist der Preis der Digitalisierung — aber einmal digitalisiert, bleibt die Information exakt.

**Bit-identische Kopien** revolutionierten die Medienindustrie:
- Keine Qualitätskette mehr: 1000. Kopie = 1. Kopie = Original
- Kosten pro Kopie: praktisch null (nur Speicherplatz)
- Perfekte Archivierung: Bits altern nicht (nur der Datenträger)

| Aspekt | Analog | Digital |
|--------|--------|---------|
| Kopiervorgang | Physikalischer Prozess | Bit-Kopie |
| Qualität pro Generation | Verschlechtert | Identisch |
| Fehlerkorrektur | Unmöglich | Möglich (ECC, RAID) |
| Formatmigration | Verlust | Verlustfrei möglich |

**Die Kehrseite:** Digitale Obsoleszenz. Ein DOCX von 2025 ist in 50 Jahren womöglich unlesbar — während ein Buch von 1525 heute noch lesbar ist. Offene Formate (PDF/A, FLAC, PNG) mildern dieses Risiko.

---

<!-- _class: klausur -->
<!-- _header: '' -->
<!-- _footer: '' -->
<!-- _backgroundColor: #e3f2fd -->

# Digitale Speichermedien

* **Optische Speicher**
    - CD, DVD, Blu-ray
* **Magnetische Speicher**
    - Festplatte (HDD), Magnetband (LTO)
* **Flash-Speicher**
    - SSD, USB-Stick, SD-Karte
* **Cloud-Speicher**
    - Dropbox, Google Drive, iCloud, AWS S3

---

<!-- _class: erklaerung -->
<!-- _header: '' -->
<!-- _footer: '' -->

# Digitale Speichermedien – Vertiefung

Jede Technologie hat physikalische Vor- und Nachteile:

**Optisch (CD/DVD/Blu-ray):** Laser liest Pits (Vertiefungen) und Lands (Erhöhungen). Robust gegen Magnetfelder, aber empfindlich gegenüber Kratzern und UV-Licht. M-DISC verspricht 1000 Jahre — unter Laborbedingungen.

**Magnetisch (HDD/LTO):** Magnetisierte Bereiche auf rotierenden Platten oder Band. HDDs haben bewegliche Teile (Verschleiß); LTO-Bänder sind passiv und extrem langlebig, aber sequentieller Zugriff.

**Flash (SSD/USB/SD):** Elektronen in Floating Gates speichern Bits. Keine beweglichen Teile, aber begrenzte Schreibzyklen (TLC: ~3.000, SLC: ~100.000). Ohne Strom verlieren Zellen nach Jahren ihre Ladung.

| Szenario | Empfehlung | Grund |
|----------|------------|-------|
| Betriebssystem | NVMe SSD | Geschwindigkeit |
| Videoarchiv | HDD | Kapazität/Preis |
| Langzeitarchiv | LTO + M-DISC | Lebensdauer |
| Austausch | USB/SD | Portabilität |

**Cloud** ist physisch HDD/SSD/LTO in Rechenzentren — kein eigenes Medium, sondern Zugriffsmethode.

---

# Das Speicherproblem der Digitalisierung

**Ziel: Analoge Schallwelle möglichst originalgetreu rekonstruieren**

*CD-Qualität (1982): 44.100 Hz × 16 Bit × 2 Kanäle = 10,584 MB/Minute*

| Inhalt | Größe | Problem (1990er) |
|--------|-------|------------------|
| 1 Song (4 Min) | ~42 MB | Ausreichend Speicher |
| 1 Album (60 Min) | ~635 MB | Gesamte Festplatte |

<!--
CD-QUALITÄT:
- 44.100 Hz = Sample Rate (Abtastrate): 44.100 Messungen pro Sekunde
- 16 Bit = Bit Depth: 65.536 mögliche Lautstärkestufen, ~96 dB Dynamikumfang
- 2 Kanäle = Stereo (links + rechts)

RECHNUNG:
44.100 × 16 × 2 = 1.411.200 Bit/Sekunde = 176.400 Byte/Sekunde ≈ 172 KB/s ≈ 10,3 MB/Minute

- Consumer-Festplatten 1990: 40–500 MB
- 56k-Modem: 7 KB/s → 42 MB Song ≈ 100 Minuten Download
-->

---

<!-- _header: '' -->
<!-- _footer: '' -->

![bg cover](./assets/spectogram-chet-baker.png)

<!--
"Wenn CDs eine Sample Rate von 44kHz haben, was fällt dann hier auf?"

Fangfrage: "Wie hoch ist die Sample Rate von Vinyls?" -> Vinyl has no sample rate. It's analog!
-->

---

# Die Abtastrate (Sample Rate)
**Analog → Digital ≙ Kontinuierlich → Diskret**

**Nyquist-Theorem:**

> Um eine Frequenz zu rekonstruieren, braucht man mindestens **2× so viele Samples**.
44.100 Hz ÷ 2 = **22.050 Hz** max. darstellbare Frequenz
(Mensch hört: ~20 Hz bis ~20.000 Hz → passt!)

<!--
- Nyquist-Shannon-Abtasttheorem: Harry Nyquist (1928), Claude Shannon (1949)
- Vinyl: Rille = physische Kopie der Welle, "unendliche Auflösung" in der Theorie
- Vinyl praktisch begrenzt durch: Rauschen, Kratzer, Nadelmasse, Rillengeometrie
- Warum genau 44.100 Hz: Nyquist + Kompatibilität mit PAL/NTSC-Videogeräten der frühen 1980er
-->

---

# Die Bittiefe (Bit Depth)

**Wie genau messen wir jeden Punkt?**

| Bittiefe | Stufen | Dynamikumfang |
|----------|--------|---------------|
| 8 Bit | 256 | ~48 dB |
| 16 Bit (CD) | 65.536 | ~96 dB |
| 24 Bit (Studio) | 16.777.216 | ~144 dB |

**16 Bit = 2¹⁶ = 65.536 Lautstärkestufen**
(von absoluter Stille bis maximaler Lautstärke)

<!--
- Dynamikumfang Formel: ~6 dB pro Bit
- 16 Bit reicht für menschliches Hören unter realen Bedingungen
- 24 Bit im Studio: mehr Headroom für Bearbeitung, kein perzipieller Mehrwert für Endnutzer (Meyer & Moran, JAES 2007)
-->

---

# Abtastrate (Sample Rate) × Bittiefe (Bit Depth)

**Zwei Dimensionen der Digitalisierung:**

| Dimension | Was bedeutet es? | CD-Qualität |
|-----------|------------------|-------------|
| **Abtastrate** (Sample Rate) | Messungen pro Sekunde (horizontal) | 44.100 Hz |
| **Bittiefe** (Bit Depth) | Genauigkeit pro Messung (vertikal) | 16 Bit |

**44.100 Hz × 16 Bit** × 2 Kanäle = 10,584 MB/Minute

<!--
- Horizontal (Abtastrate): welche Frequenzen erfassbar sind
- Vertikal (Bittiefe): Dynamikumfang (leise bis laut)
-->

---

<!-- _class: lead -->

# Kompression
## Weniger Daten, gleiche(?) Information

---

# Wo liegt der Hebel für Kompression?

**CD-Qualität:** 44.100 Hz × 16 Bit × 2 Kanäle = **10,6 MB/Min**
**MP3 (128 kbps):** = **~1 MB/Min** (Faktor 10!)

**Container-Parameter (das Raster):**

| Parameter | Reduzieren → | Konsequenz |
|-----------|--------------|------------|
| Abtastrate | Weniger Messpunkte/Sek | Max. Frequenz sinkt |
| Bittiefe | Weniger Lautstärkestufen | Mehr Rauschen |
| Kanäle | Mono statt Stereo | Kein Raumklang |

<!--
- Container-Parameter bestimmen das "Raster"
- Reduzierung = harter Schnitt auf technischer Ebene
- Abtastrate 22 kHz → alles über 11 kHz physisch unmöglich zu speichern
-->

---

# Psychoakustik: Der MP3-Trick

**Inhalt (was durchs Raster geht):**

| Methode | Reduzieren → | Konsequenz |
|---------|--------------|------------|
| Psychoakustik | Unhörbare Frequenzen | Kaum wahrnehmbar |

→ **MP3 nutzt hauptsächlich Psychoakustik**
→ Container bleibt ähnlich, Inhalt wird "ausgedünnt"

<!--
- Der Container (44.1 kHz, 16 Bit, Stereo) kann gleich bleiben
- Inhalt wird "ausgedünnt" — nur was hörbar ist, bleibt
- MASKIERUNG:
  - Frequenzmaskierung: Lauter Ton bei 1 kHz überdeckt leise Töne bei 1.1 kHz
  - Zeitliche Maskierung: Kurz vor/nach lautem Ton hören wir leise Töne nicht (~200ms)
  - Absolute Hörschwelle: sehr leise Töne generell unhörbar
-->

---

# Die Geburt der MP3

**1982:** Universität Erlangen-Nürnberg
Karlheinz Brandenburg, Diplom-Ingenieur

**1987:** Fraunhofer IIS entwickelt MPEG-1 Audio Layer III

**1988:** Patentanmeldung

**1992:** Erste Software-Implementierung

**1995:** .mp3 Dateiendung offiziell

<!--
- MPEG = Moving Picture Experts Group
- Layer III = Dritte Verfeinerungsstufe
- Forschung dauerte 10 Jahre
- Patent lief 2017 aus
-->

---

![bg right:40%](./assets/karlheinz-brandenburg.jpg)

# Karlheinz Brandenburg

**"Vater der MP3"**

- Diplom-Ingenieur, Universität Erlangen-Nürnberg
- Fraunhofer IIS (Institut für Integrierte Schaltungen)
- Forschung ab 1982, Patent 1988

<!--
- Fraunhofer IIS Erlangen
- Forschung dauerte über 10 Jahre
- Perfektionist: Jeder Hörtest musste bestehen
-->

---

![bg right:50%](./assets/suzanne-vega.jpg)

# Suzanne Vega

**"Tom's Diner" (1987)**

- Der erste Song, der als MP3 kodiert wurde
- A cappella (keine Instrumente)
- Klare, hohe Frequenzen
- Perfekter Stresstest für Kompression
- Brandenburg hörte "Tom's Diner" über 10.000 Mal

<!--
- A cappella = einfacher zu analysieren (nur Stimme)
- Hohe Frequenzen = Herausforderung für Kompression
- Brandenburg hörte den Song über 10.000 Mal
-->

---

# Wie funktioniert MP3?

Ein Zusammenspiel aus vielen Faktoren:

* **1. Frequenz-Analyse (FFT)**
  Audio → Frequenzspektrum

* **2. Psychoakustisches Modell**
  Welche Töne hört Mensch nicht?

* **3. Quantisierung**
  Unwichtige Frequenzen reduzieren

* **4. Huffman-Coding**
  Lossless-Kompression der Restdaten

<!--
1. FFT (Fast Fourier Transform): Wandelt Schallwellen in Frequenzen um — wie ein Prisma Licht in Farben zerlegt
2. Psychoakustisches Modell: Maskierungseffekte, hohe/tiefe Frequenzen werden schlechter wahrgenommen
3. Quantisierung: Unwichtige Frequenzen "grob" gespeichert, wichtige bleiben genau — hier passiert der Datenverlust
4. Huffman-Coding: Häufige Muster = kurze Codes, seltene = lange Codes — finaler verlustfreier Boost
-->

---

# Bitrate: Der Qualitäts-Knopf

| Bitrate | Qualität | Kompression |
|---------|----------|-------------|
| **128 kbps** | Hörbar schlechter | ~11x |
| **192 kbps** | Akzeptabel | ~7x |
| **256 kbps** | Gut | ~5,5x |
| **320 kbps** | "CD-Qualität" | ~4,4x |

**Original CD:** 1.411 kbps (unkomprimiert)

<!--
- kbps = Kilobit pro Sekunde
- 128 kbps = Standard Napster-Ära
- 320 kbps = Maximum für MP3
- Diminishing Returns ab 256 kbps
-->

---

# Der Patentkrieg

**1990er:** Fraunhofer + Thomson halten MP3-Patente

**Lizenzgebühren:**
- $0,75 pro Decoder
- $2,50 pro Encoder

**Problem:** Napster (1999) → unkontrollierte Verbreitung

**2017:** Patente laufen aus → MP3 ist frei

<!--
- Fraunhofer verklagte Winamp und andere Tools
- Millionen nutzten unlizenzierte Software
- 2017: Fraunhofer selbst erklärte MP3 für "veraltet" (AAC besser)
-->

---

![bg right:50% fit](./assets/napster-2001.png)

# Napster (1999)

**P2P-Filesharing für MP3s**

- Shawn Fanning, 19 Jahre alt
- 80 Millionen User in 2 Jahren
- Musikindustrie verklagt (2001)
- Pandora's Box: Nicht mehr aufzuhalten

<!--
- P2P = Peer-to-Peer
- RIAA verklagte Napster, Schließung 2001
- LimeWire, Kazaa, BitTorrent folgten
-->

---

![bg right:40% contain](./assets/bittorrent.png)

# Napster & Musikindustrie

**1999:** Napster startet
**2001:** 80 Millionen User

**Musikindustrie:**
- CDs kosten $15–20
- MP3s gratis (illegal, aber yolo)
- Einzelne Songs statt Alben

**2001:** Napster wird verklagt und schließt

**Aber:** Pandora's Box offen
→ LimeWire, Kazaa, BitTorrent, später Spotify

<!--
- RIAA = Recording Industry Association of America
- iPod (2001): "1.000 songs in your pocket"
- iTunes Store (2003): Legale Alternative
- Spotify (2008): Streaming-Ära beginnt
-->

---

# Kulturelle Revolution

**MP3 veränderte:**

✓ Musik wurde portabel (Walkman → iPod)
✓ Alben wurden irrelevant (Playlists)
✓ Musikkonsum explodierte (kostenlos/billig)
✓ KünstlerInnen verloren Kontrolle

**Aber auch:**
❌ KünstlerInnen verdienen weniger pro Stream
❌ Audio-Qualität sank (Loudness War)
❌ Physische Medien starben

<!--
- Walkman (1979): Kassetten
- Discman (1984): CDs
- iPod (2001): MP3s
- Spotify (2008): Streaming
- Loudness War: Alles wird lauter gemastert, Dynamik geht verloren
- Vinyl-Revival: 2020er Gegenbewegung — RIAA 2023: Vinyl-Umsatz übersteigt erstmals seit 1987 CD-Umsatz
-->

---

<!-- _class: lead -->

# Fragen & Diskussion

**Kontakt:** lb-czechowski@hdm-stuttgart.de
**Folien:** Online verfügbar unter https://librete.ch/hdm/223015b

---

# Lizenz & Attribution

Diese Präsentation ist lizenziert unter **Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)**

- Erlaubt Teilen & Anpassen mit Namensnennung
- Adaptionen müssen unter gleicher Lizenz geteilt werden

Vollständige Lizenz: https://creativecommons.org/licenses/by-sa/4.0/

---

<!-- _header: '' -->
<!-- _footer: '' -->

# Selbstlernen: Audio-Spektrogramm

**Aufgabe (30 Min):**

- Live Spektrogramm untersuchen https://borismus.github.io/spectrogram/
- Mit Effekten experimentieren https://audiomass.co/
- Spektrogramme vergleichen Audacity (kostenloser Download nötig) [https://manual.audacityteam.org/man/spectrogram_view.html](https://manual.audacityteam.org/man/spectrogram_view.html)

<!--
- Audacity: FOSS Audio-Editor (audacityteam.org)
- Export: Datei → Exportieren → MP3 → Bitrate wählen
- Spektrogramm-Ansicht: Auf Track-Name klicken → "Spektrogramm"
- Hohe Frequenzen (oben im Bild) verschwinden bei niedriger Bitrate
- Alternative: Spek (spek.cc) — reiner Spektrogramm-Viewer
-->

---

<!-- _header: '' -->
<!-- _footer: '' -->

![bg contain right:22%](./assets/qr/hexed-it.png)

# Selbstlernen: HEX Files

1. Drei Dateien ohne Dateiendung:
   <a href="../materials/wtf1"/>`hex1`</a>  <a href="../materials/wtf2"/>`hex2`</a>  <a href="../materials/wtf3"/>`hex3`</a>
3. Lies erste 16 Bytes aus und identifiziere Dateiformat (Magic Number)
5. *Optional: Datei umbenennen und korrekte Dateiendung anhängen (bspw. `.jpg`)*

**Tools:**
- Hex-Editor: [hexed.it](https://hexed.it)
- Magic Numbers: [en.wikipedia.org/wiki/List_of_file_signatures](https://en.wikipedia.org/wiki/List_of_file_signatures)

<!--
- wtf1: Plaintext (keine Magic Number)
- wtf2: PNG (89 50 4E 47)
- wtf3: JPEG (FF D8 FF)
- Gruppenarbeit: 3-4 Personen
- Ziel: Hex-Dump lesen lernen, Dateiformate verstehen
-->