Files
uni/slides/223015b/01-grundlagen-text-audio.md
Michael Czechowski 81156284ac update 223015b chapter 1: new slides, speaker notes, abbreviation fixes
- add download/upload speed slides with ADSL/FTTH context
- add quiz slide (250 Mbit/s → MB/min)
- add analog vs. digital and sampling slides
- add cd-audio vertiefung (erklaerung slide)
- expand "was sind daten?" with content
- expand speaker notes with sources and terminology (DE/EN)
- resolve all abbreviations in speaker notes: FTTH, ITU, NTSC, PAL, NHK, IEC
- fix typo: "eie" → "eine" binärdatei
- fix spelling: "spektrogram" → "spektrogramm"
- update zettabyte example and 181 ZB as projection not fact
2026-04-16 18:10:00 +02:00

50 KiB
Raw Blame History

marp, theme, paginate, backgroundColor, header, footer, title
marp theme paginate backgroundColor header footer title
true gaia true Dateiformate, Schnittstellen, Speichermedien & Distributionswege (223015b) Michael Czechowski HdM Stuttgart SoSe 2026 Dateiformate, Schnittstellen, Speichermedien & Distributionswege
<style> :root { --color-foreground: #1a1a2e; --color-highlight: #1e5f8a; --color-dimmed: #4a4a6a; } section.invert { --color-foreground: #fff; } section { font-size: 1.7rem; } h1 { color: #1e5f8a; } section.invert h1 { color: #fff; } h2 { color: #1f2937; } pre { background: #0f0f23; color: #5fb3e4; border-radius: 8px; border-left: 3px solid #1e5f8a; } pre code { background: transparent; color: inherit; } code { background: #1a1a2e; color: #5fb3e4; padding: 0.15em 0.4em; border-radius: 4px; } a { color: var(--color-highlight); } section.klausur { background: repeating-linear-gradient( 135deg, #e3f2fd, #e3f2fd 40px, #fff 40px, #fff 80px ) !important; } @media print { section.klausur { background: #e3f2fd !important; } } section.aufgabe { background: #e3f2fd !important; } section.aufgabe footer { display: none; } section.erklaerung :not(header), section.erklaerung :not(footer) { font-size: 1.1rem; } @media print { section.erklaerung { background: #e3f2fd !important; } } section.erklaerung h1 { font-size: 1.5rem; color: #1e5f8a; margin-bottom: 0.3rem; } section.erklaerung ul, section.erklaerung ol { font-size: 1.0rem; line-height: 1.4; } section.erklaerung p { font-size: 1.0rem; line-height: 1.4; } section.erklaerung table { font-size: 0.9rem; } </style>

bg cover opacity:0.2

Dateiformate, Schnittstellen, Speichermedien & Distributionswege

223015b · Modul "Technik 1" · 1. Semester Digital- und Medienwirtschaft Hochschule der Medien Stuttgart

https://librete.ch/hdm/223015b/


bg fit


Teil 1: Einführung

Grundlagen, Text & Audio


Was sind Daten?


Was sind (digitale) Daten?

  • Text — Artikel, Gesetzestext, Chat → .txt .docx .pdf
  • Bild — Foto, Screenshot, Logo → .jpg .png .svg
  • Audio — Song, Podcast, Sprachmemo → .mp3 .wav .flac
  • Video — Reel, Film, Stream → .mp4 .mov .mkv

Was sind (digitale) Daten?

  • Text — Artikel, Gesetzestext, Chat → .txt .docx .pdf
  • Bild — Foto, Screenshot, Logo → .jpg .png .svg
  • Audio — Song, Podcast, Sprachmemo → .mp3 .wav .flac
  • Video — Reel, Film, Stream → .mp4 .mov .mkv

Alles davon: Am Ende nur Nullen und Einsen


Download: Was bedeuten 150 Mbit/s?

1 Byte = 8 Bit → MB/s = Mbit/s ÷ 8

Vertrag MB/s 1 GB Film
16 Mbit/s (ADSL) 2 MB/s ~8 Min
50 Mbit/s (ADSL) 6,25 MB/s ~2,7 Min
150 Mbit/s (ADSL) 18,75 MB/s ~54 Sek
1 Gbit/s (Glasfaser) 125 MB/s ~8 Sek

Wie viele Megabyte können bei einer 250 Mbit/s Leitung pro Minute herunterladen werden?

  • A) 1,8 GB
  • B) 31,25 MB
  • C) 1.875 MB
  • D) 250 MB

Upload: Der stille Flaschenhals

ADSL = Asymmetric Digital Subscriber Line

Vertrag Download Upload
16 Mbit/s DSL 16 Mbit/s 1 Mbit/s
50 Mbit/s DSL 50 Mbit/s 10 Mbit/s
150 Mbit/s DSL 150 Mbit/s 40 Mbit/s
Glasfaser (FTTH) 1 Gbit/s 1 Gbit/s

50 MB Upload bei 10 Mbit/s = ~40 Sekunden


Analog vs. Digital


Analog vs. Digital

Analog: kontinuierlich — unendlich viele Zwischenwerte Digital: diskret — endlich viele Stufen

Analog (Vinyl): Die Rille ist die Schallwelle — physische Kopie in Geometrie Digital (CD): 44.100 Messpunkte pro Sekunde — Annäherung an die Welle


Sampling: Die Digitalisierung des Klangs

Ziel: Analoge Schallwelle möglichst originalgetreu rekonstruieren

Zwei Dimensionen:

Dimension Bedeutung CD-Standard
Abtastrate (Sample Rate) Messpunkte pro Sekunde 44.100 Hz
Bittiefe (Bit Depth) Genauigkeit pro Messung 16 Bit

Nyquist-Theorem: Abtastrate muss mindestens 2× die höchste darzustellende Frequenz betragen → 44.100 Hz ÷ 2 = 22.050 Hz (Mensch hört ~20 Hz20.000 Hz)


Das Problem der Datengröße


bg fit


bg right:40%

Ein konkretes Beispiel

Eine Minute Musik in CD-Qualität:

44.100 Messungen/Sekunde × 16 Bit pro Messung × 2 Kanäle (Stereo) × 60 Sekunden

= 10,6 MB pro Minute


CD-Audio Vertiefung

Die CD (1982) war nicht das erste digitale Audiomedium — PCM-Aufnahmen existierten seit den späten 1960ern in Tonstudios (u.a. NHK, Nippon Columbia). Die CD war das erste massenmarktfähige digitale Distributionsmedium für unkomprimiertes Audio in Konsumentenhänden.

Warum 44.100 Hz? Kombination aus Nyquist-Limit (2× 20 kHz = 40 kHz Minimum) und Kompatibilität mit Videobandgeräten, die in frühen digitalen Tonstudios als Speichermedium genutzt wurden. NTSC: 3 Samples × 245 Zeilen × 60 Felder = 44.100. PAL: 3 Samples × 294 Zeilen × 50 Felder = 44.100.

Warum 16 Bit? 96 dB Dynamikumfang übersteigt den des menschlichen Gehörs unter realen Hörbedingungen (~8090 dB). Kompromiss zwischen Qualität und Speicherbedarf auf der physischen Disc.


bg right:40%

Das Problem skaliert

Inhalt Unkomprimiert
1 Song (4 Min) ~42 MB
1 Album (60 Min) ~635 MB
10.000 Songs ~420 GB

Kontext 1990er:

  • Festplatte: 100500 MB
  • 56 kbit/s Model → Einfache Songs laden Stunden

bg right:32% contain

Video eskaliert

Eine Minute 4K-Video (unkomprimiert):

3840 × 2160 Pixel × 3 Byte pro Pixel (RGB) × 30 Bilder pro Sekunde × 60 Sekunden

= ~45 GB pro Minute

Ein 2-Stunden-Film: über 5 Terabyte


bg right:40%

Artemis II orbitiert

Apollo (1969) Artemis II (2026)
Bandbreite ~50 kbit/s 260 Mbit/s
Video SW, ~320 Zeilen HD live, 4K gespeichert
Codec analog H.265 (HEVC)

260.000.000 Bit/s ÷ 8 (Bit pro Byte) = 32,5 MB/s × 60 Sekunden = 1,95 GB pro Minute

Apollo: 50 kbit/s = 0,375 MB/min


Kompressionsraten in der Praxis

Medium Unkomprimiert Komprimiert Faktor
1 Song (4 Min) ~42 MB ~4 MB (MP3 128) ~10×
1 Foto (12 MP) ~36 MB ~3 MB (JPEG) ~12×
1 Min 4K-Video ~45 GB ~375 MB (H.264) ~120×

Zwei Arten der Kompression


Verlustfreie Kompression (Lossless)

Prinzip: Redundanz entfernen

Beispiel Lauflängenkodierung (Run-Length-Encoding):

Original:    AAAAABBBCCCCCCCC (16 Zeichen)
Komprimiert: 5A3B8C            (6 Zeichen)

→ 62% kleiner, 100% wiederherstellbar

Anwendung:

  • ZIP-Archive, PNG-Bilder, FLAC-Audiodateien, RAW-Dateien, Programmcode

Verlustbehaftete Kompression (Lossy)

Prinzip: Irrelevanz entfernen → Warum Daten speichern, die niemand wahrnimmt?


Verlustbehaftete Kompression (Lossy)

Prinzip: Irrelevanz entfernen → Warum Daten speichern, die niemand wahrnimmt?

Die Frage: Was nimmt ein Mensch eigentlich (nicht oder sehr schlecht) wahr?

  • Das Ohr hört nicht alle Frequenzen (hohe und tiefe Töne) gleich gut
  • Das Auge sieht nicht alle Farbnuancen gleich scharf
  • Laute Töne überdecken leise Töne (Maskierung)
  • Luminanz (Helligkeit/Dunkelheit) besser erkennen als Chrominanz (Farbunterschiede)
  • und Vieles mehr

Verlustfrei vs. Verlustbehaftet

Verlustfrei (Lossless) Verlustbehaftet (Lossy)
Prinzip Redundanz entfernen Irrelevanz entfernen
Reversibel Ja Nein (Information unwiederbringlich verloren)
Reduktion 3050% 8099%
Formate ZIP, PNG, FLAC, GIF JPEG, MP3, H.264/H.265

Faustregel:

  • Medien für EndnutzerInnen (Ton, Bild, Film) → Lossy oft akzeptabel
  • Quellmaterial, Code, Archive (RAW) → Lossless nötig

Kompression Vertiefung

Claude Shannon definierte 1948 die Entropie als theoretische Untergrenze der Kompression. Ein Text mit gleichmäßiger Zeichenverteilung hat hohe Entropie (schwer komprimierbar); repetitive Texte haben niedrige Entropie.

Verlustfreie Kompression erreicht diese Grenze durch:

  • Statistische Kodierung: Huffman, Arithmetic Coding
  • Wörterbuch-Methoden: LZ77, LZ78, DEFLATE (ZIP, PNG, TAR)
  • Originalzustand ist exakt rekonstruierbar

Verlustbehaftete Kompression unterschreitet die Grenze, indem sie menschliche Wahrnehmungsgrenzen ausnutzt:

Sinneskanal Psychophysisches Modell Ausnutzung
Gehör Maskierungseffekte, Hörschwelle MP3: Töne unter Maskierungsschwelle weglassen
Sehen Farbauflösung, Kontrastempfindlichkeit JPEG: Chroma-Subsampling, hohe Frequenzen verwerfen

Shannon-Limit: Verlustfreie Kompression ist durch Entropie begrenzt; Verlustbehaftete Kompression kann beliebig weit gehen — auf Kosten der Qualität.


  • Alltagsbeispiele für Kompression sammeln
  • Wie sieht Kompression aus, wenn man es visualisieren würde? Eine Maske, hinter der nichts zu sehen ist?


Die Grundbausteine

Bits, Bytes und ihre Darstellung


bg


Das Bit

Kleinste Informationseinheit

  • 0 oder 1
  • AN oder AUS
  • Strom fließt oder nicht
  • Schwarz oder Weiß
  • Richtig oder Falsch

Das Byte


Das Byte

1 Byte = 8 Bits

0 0 1 0 1 0 1 0

Das Byte

1 Byte = 8 Bits

0 0 1 0 1 0 1 0

Das Byte als Dezimalzahl

1 Byte (1B) = 8 Bits (8b)

0 0 0 0 0 0 0 0   ->   0
0 0 0 0 0 0 0 1   ->   1
0 0 0 0 0 0 1 0   ->   2
0 0 0 0 0 0 1 1   ->   3
0 0 0 0 0 1 0 0   ->   4
0 1 0 0 0 0 0 0   ->   64
0 1 1 1 1 1 1 1   ->   127
1 1 1 1 1 1 1 1   ->   ?


»256 Shades of Gray«

bg fit


Was kann man mit 256 Zuständen machen?

  • 256 Zeichen (Buchstaben, Zahlen, Symbole)
  • 256 Helligkeit bzw. Luminanz (0 = Schwarz/Dunkel, 255 = Weiß/Hell)
  • 256 Lautstärkestufen
  • Zahlen 0255 (oder 128 bis +127)

bg fit


bg fit


bg right:50%

Farben: RGB-Modell

1 Pixel = 3 Bytes

  • Rot: 0255
  • Grün: 0255
  • Blau: 0255

Beispiele: FF 00 00 = Rot 00 FF 00 = Grün 00 00 FF = Blau 00 00 00 = Schwarz FF FF FF = Weiß


Das Problem: Sprachen

Die Welt hat mehr als 256 Zeichen!

  • Englisches Alphabet: 52 (AZ, az)
    • Ziffern: 10 (09)
    • Sonderzeichen: ~30

≈ 90 Zeichen passen problemlos in 1 Byte

Jedoch ohne ä, ö, ü, ß, é, à, ç, α, β, 中, 日, 🌸


Unicode: Ein Standard für alle

Unicode (1991): Jedes Schriftsystem der Welt

>150.000 Zeichen:

  • Latein, Kyrillisch, Arabisch, Chinesisch, Japanisch...
  • Mathematische Symbole, Emoji, historische Schriften

UTF-8: Variable Länge (14 Bytes pro Zeichen)

  • Zeichen 0127: identisch mit ASCII (Abwärtskompatibilität!)
  • 1.112.064 gültige Codepunkte
  • Umlaute: 2 Bytes · CJK: 3 Bytes · Emoji: 4 Bytes

Beispiel: Bytes zählen

Text: "Hello·🌸·こんにちは·(Kon-ni-chi-wa)"

Zeichen Bytes
Hello· 6 × 1 = 6 Bytes (ASCII)
🌸 4 Bytes (Emoji)
· 1 Byte
こんにちは 5 × 3 = 15 Bytes (Hiragana)
·(Kon-ni-chi-wa) 16 Bytes (ASCII)

Gesamt: 42 Bytes für 29 sichtbare Zeichen


Hexadezimal

Die Sprache der Datei-Analyse


Hexadezimal: Lesbarkeit

Für den Menschen ungeeignet: 01010000 01001110 01000111

Hexadezimal (Base 16): 50 4E 47 (= "PNG" in ASCII)

Jede Hex-Ziffer = 4 Bits (ein "Nibble") 09, AF (10=A, 11=B, ..., 15=F)

5 = 0101 0 = 0000 4 = 0100 E = 1110 4 = 0100 7 = 0111

ASCII Tabelle (0127): https://www.asciitable.com


bg fit


ASCII

One Zeichensatz to rule them all


bg fit


bg right:40%

WTF!?

89 50 4E 47 0D 0A 1A 0A
00 00 00 0D 49 48 44 52
00 00 01 90 00 00 01 2C

bg right:30%

What the HEX-Code

89 50 4E 47 ...
Binär Hex Dez ASCII
1000 1001 89 137 ✗ (> 127)
0101 0000 50 80 P
0100 1110 4E 78 N
0100 0111 47 71 G

89 übersteigt den ASCII-Raum und markiert eine Binärdatei


bg fit


bg fit


bg fit


Magic Numbers

Dateityp-Identifikation durch erste Bytes

Format Magic Number (Hex) Lesbar?
PNG 89 50 4E 47 ✗ P N G
JPEG FF D8 FF ✗ ✗ ✗
PDF 25 50 44 46 % P D F ✓
ZIP 50 4B 03 04 P K ✗ ✗

Wichtig: ASCII = nur 0127! Werte darüber (z.B. 89 = 137) sind nicht druckbar (non-printable). Hex-Editoren zeigen dafür . oder ÿ als Platzhalter.


Dateneinheiten

Einheit Bytes Potenz Beispiel
Byte 1 10⁰ Farbwert eines Pixels
Kilobyte (KB) 1.000 10³ Kleiner Programmcode
Megabyte (MB) 1 Million 10⁶ Textdokument
Gigabyte (GB) 1 Milliarde 10⁹ Kinofilm in FullHD
Terabyte (TB) 1 Billion 10¹² ~12h Video in 4K
Petabyte (PB) 1 Billiarde 10¹⁵ Netflix-Gesamtarchiv
Exabyte (EB) 1 Trillion 10¹⁸ Alle E-Mails weltweit/Tag
Zettabyte (ZB) 1 Trilliarde 10²¹ Globale Datenmenge 2025

Dateneinheiten Vertiefung

Zwei konkurrierende Standards existieren seit der IEC-Normierung 1998:

Präfix SI (Dezimal) IEC (Binär) Differenz
Kilo 1.000 (10³) 1.024 (2¹⁰) KiB 2,4%
Mega 1.000.000 (10⁶) 1.048.576 MiB 4,9%
Giga 10⁹ 2³⁰ GiB 7,4%
Tera 10¹² 2⁴⁰ TiB 10%

Warum der Unterschied wächst: (2¹⁰)ⁿ ÷ (10³)ⁿ = 1,024ⁿ. Bei Terabyte sind es bereits 10% Abweichung.

Festplatten-Marketing: Hersteller nutzen SI (dezimal), Betriebssysteme zeigen IEC (binär). Eine „1 TB"-Festplatte zeigt daher nur 931 GiB an — technisch korrekt, aber verwirrend.

Historischer Kontext: RAM wurde immer binär gemessen (2ⁿ Adressen), Festplatten ursprünglich dezimal (physikalische Geometrie). Die IEC führte 1998 KiB/MiB/GiB ein — diese Notation setzt sich langsam durch.


Datenwachstum der Menschheit

Jahr Datenmenge Kontext
100.000 v. Chr. 0 Erste Menschen, nur Sprache
3.000 v. Chr. ~wenige KB Keilschrift, Hieroglyphen
1450 ~wenige GB Gutenberg, Buchdruck
1986 2,6 EB 99% analog (Bücher, Vinyl, VHS)
2007 295 EB 94% digital
~2025 ~175181 ZB Prognose (IDC DataSphere Forecast, 2021)

Der digitale Wendepunkt

Jahr Analog Digital Digital-Anteil
1986 2,6 EB 0,02 EB 1%
2002 50% (Wendepunkt)
2007 18 EB 277 EB 94%

Perspektive:

  • 1986: "Petabyte" war ein theoretisches Konzept
  • Magnetband lebt: LTO-Tapes bleiben günstigstes Archivmedium (AWS Glacier, Film-Archive, Rechenzentren)

Digitaler Wendepunkt Vertiefung

Die Studie von Hilbert & López (Science 332, 2011) analysierte 60 Speichertechnologien von 19862007. Der Wendepunkt 2002 markiert den Moment, ab dem mehr Information digital als analog existierte.

Was 1986 „analog" bedeutete:

  • Bücher, Zeitungen, Magazine: ~8 EB
  • Vinyl-Schallplatten, Musikkassetten: ~12 EB
  • VHS-Kassetten, Filmrollen: ~60 EB

Warum analog stagnierte: Physische Medien haben Kapazitätsgrenzen. Eine VHS speichert ~10 GB; eine Blu-ray (2006) bereits 50 GB auf kleinerer Fläche.

LTO-Magnetband überlebt trotz „alter" Technologie:

Medium Kosten/TB Lebensdauer Energiebedarf
SSD ~50 € 510 Jahre Dauerstrom
HDD ~15 € 35 Jahre aktiv Dauerstrom
LTO-9 ~5 € 30+ Jahre Nur beim Zugriff

AWS Glacier, Google Coldline und Film-Archive nutzen LTO — langsamer Zugriff, aber unschlagbar günstig und langlebig.


bg fit


181 Zettabyte Was bedeutet das?

Prognose 2025: Welt erzeugt ca. 175181 ZB pro Jahr

  • 1 ZB = 250 Milliarden DVDs
  • 29 Terabyte pro Sekunde (Hochrechnung)

Zum Vergleich:

  • 2007: 295 Exabyte (Hilbert & López, Science 2011)
  • 2020: ~64 Zettabyte (IDC)
  • ~2025: ~175181 ZB (IDC DataSphere Forecast, Prognose von 2021)

bg fit


AI-generierte Inhalte 2025

Wie viel Content ist heute synthetisch?

Bereich AI-Anteil
Neue Webseiten ~74% enthalten AI-Content
Web-Text gesamt ~3040% AI-generiert
Neue Artikel ~52% von AI geschrieben
Social-Media-Bilder ~71% AI-generiert

Prognose 2026: 90% des Online-Contents synthetisch


Teil 2: Die MP3-Revolution

Psychoakustik & Audio-Kompression


bg


Analoge Medien

Distribution: physisch (Kauf, Verleih, Kopie)

  • Text
    • Bücher, Zeitungen, Zeitschriften, Lochkarten
  • Bild
    • Fotografie (Negativ, Dia, Polaroid), Mikrofilm
  • Audio:
    • Schallplatte (Vinyl, Schellack), Tonband, Musikkassette
  • Video:
    • Film (35mm, Super 8), VHS, Betamax

Analoge Medien Vertiefung

Analoge Speicherung codiert Information als kontinuierliche physikalische Größe: Rillentiefe (Vinyl), Magnetfeldstärke (Tonband), Silberkorn-Dichte (Film). Es gibt keine diskreten Stufen — theoretisch unendliche Auflösung, praktisch begrenzt durch Rauschen.

Generationsverlust entsteht, weil jede Kopie neues Rauschen addiert:

  • Schallplatte → Kassette: Frequenzgang leidet, Rauschen steigt
  • VHS → VHS: Farbsättigung sinkt, Schärfe nimmt ab
    1. Generation: oft unbrauchbar
Medium Typische Auflösung Dynamik
Vinyl (audiophil) ~2020.000 Hz ~70 dB
Tonband (Studio) ~3015.000 Hz ~55 dB
35mm Film ~4K-äquivalent ~13 Blendenstufen

Paradox der Analogtechnik: Das Original ist einzigartig und unersetzlich — aber genau deshalb anfällig. Jedes Abspielen einer Schallplatte trägt mikroskopisch Material ab; jeder Filmdurchlauf riskiert Kratzer.


Analoge Medien: Vor- und Nachteile

Vorteile Nachteile
Kein Abspielgerät nötig (Buch, Foto) Qualitätsverlust bei jeder Kopie
Haptisches Erlebnis Physischer Verschleiß
Unabhängig von Strom/Internet Begrenzte Haltbarkeit
Keine Formatkonvertierung Platzbedarf bei Lagerung
Eindeutiges Original Aufwendige Durchsuchbarkeit

Von Analog zu Digital: Die Kopier-Revolution

Das Problem analoger Kopien: Kassette → Kassette → Kassette = immer schlechter

Was Digital anders macht:

  • Identische Kopien — kein Qualitätsverlust, nie
  • Einfache Massenproduktion — Copy & Paste
  • Perfekte Archivierung — Bits verändern sich nicht

Daher: "Raubkopien" Der Begriff entstand, weil digitale Kopien tatsächlich identisch mit dem Original waren — nicht wie bei Kassetten eine schlechtere Version.

Quelle: c64-wiki.de/wiki/Raubkopie


Digitale Medien

Distribution: Datenträger (CD, USB), Download, Streaming, P2P

  • Text
    • E-Book (PDF, EPUB), Dokumente (TXT, DOCX)
  • Bild
    • Digitalfoto (JPEG, PNG, RAW, WebP, GIF)
  • Audio
    • Audiodatei (MP3, FLAC, WAV, AAC, OGG)
  • Video
    • Videodatei (MP4, MKV, AVI, WebM)

Digitale Medien Vertiefung

Digitale Speicherung quantisiert kontinuierliche Signale in diskrete Werte. Der Quantisierungsfehler (Differenz zum Original) ist der Preis der Digitalisierung — aber einmal digitalisiert, bleibt die Information exakt.

Bit-identische Kopien revolutionierten die Medienindustrie:

  • Keine Qualitätskette mehr: 1000. Kopie = 1. Kopie = Original
  • Kosten pro Kopie: praktisch null (nur Speicherplatz)
  • Perfekte Archivierung: Bits altern nicht (nur der Datenträger)
Aspekt Analog Digital
Kopiervorgang Physikalischer Prozess Bit-Kopie
Qualität pro Generation Verschlechtert Identisch
Fehlerkorrektur Unmöglich Möglich (ECC, RAID)
Formatmigration Verlust Verlustfrei möglich

Die Kehrseite: Digitale Obsoleszenz. Ein DOCX von 2025 ist in 50 Jahren womöglich unlesbar — während ein Buch von 1525 heute noch lesbar ist. Offene Formate (PDF/A, FLAC, PNG) mildern dieses Risiko.


Digitale Speichermedien

  • Optische Speicher
    • CD, DVD, Blu-ray
  • Magnetische Speicher
    • Festplatte (HDD), Magnetband (LTO)
  • Flash-Speicher
    • SSD, USB-Stick, SD-Karte
  • Cloud-Speicher
    • Dropbox, Google Drive, iCloud, AWS S3

Digitale Speichermedien Vertiefung

Jede Technologie hat physikalische Vor- und Nachteile:

Optisch (CD/DVD/Blu-ray): Laser liest Pits (Vertiefungen) und Lands (Erhöhungen). Robust gegen Magnetfelder, aber empfindlich gegenüber Kratzern und UV-Licht. M-DISC verspricht 1000 Jahre — unter Laborbedingungen.

Magnetisch (HDD/LTO): Magnetisierte Bereiche auf rotierenden Platten oder Band. HDDs haben bewegliche Teile (Verschleiß); LTO-Bänder sind passiv und extrem langlebig, aber sequentieller Zugriff.

Flash (SSD/USB/SD): Elektronen in Floating Gates speichern Bits. Keine beweglichen Teile, aber begrenzte Schreibzyklen (TLC: ~3.000, SLC: ~100.000). Ohne Strom verlieren Zellen nach Jahren ihre Ladung.

Szenario Empfehlung Grund
Betriebssystem NVMe SSD Geschwindigkeit
Videoarchiv HDD Kapazität/Preis
Langzeitarchiv LTO + M-DISC Lebensdauer
Austausch USB/SD Portabilität

Cloud ist physisch HDD/SSD/LTO in Rechenzentren — kein eigenes Medium, sondern Zugriffsmethode.


Das Speicherproblem der Digitalisierung

Ziel: Analoge Schallwelle möglichst originalgetreu rekonstruieren

CD-Qualität (1982): 44.100 Hz × 16 Bit × 2 Kanäle = 10,584 MB/Minute

Inhalt Größe Problem (1990er)
1 Song (4 Min) ~42 MB Ausreichend Speicher
1 Album (60 Min) ~635 MB Gesamte Festplatte

bg cover


Die Abtastrate (Sample Rate)

Analog → Digital ≙ Kontinuierlich → Diskret

Nyquist-Theorem:

Um eine Frequenz zu rekonstruieren, braucht man mindestens 2× so viele Samples. 44.100 Hz ÷ 2 = 22.050 Hz max. darstellbare Frequenz (Mensch hört: ~20 Hz bis ~20.000 Hz → passt!)


Die Bittiefe (Bit Depth)

Wie genau messen wir jeden Punkt?

Bittiefe Stufen Dynamikumfang
8 Bit 256 ~48 dB
16 Bit (CD) 65.536 ~96 dB
24 Bit (Studio) 16.777.216 ~144 dB

16 Bit = 2¹⁶ = 65.536 Lautstärkestufen (von absoluter Stille bis maximaler Lautstärke)


Abtastrate (Sample Rate) × Bittiefe (Bit Depth)

Zwei Dimensionen der Digitalisierung:

Dimension Was bedeutet es? CD-Qualität
Abtastrate (Sample Rate) Messungen pro Sekunde (horizontal) 44.100 Hz
Bittiefe (Bit Depth) Genauigkeit pro Messung (vertikal) 16 Bit

44.100 Hz × 16 Bit × 2 Kanäle = 10,584 MB/Minute


Kompression

Weniger Daten, gleiche(?) Information


Wo liegt der Hebel für Kompression?

CD-Qualität: 44.100 Hz × 16 Bit × 2 Kanäle = 10,6 MB/Min MP3 (128 kbps): = ~1 MB/Min (Faktor 10!)

Container-Parameter (das Raster):

Parameter Reduzieren → Konsequenz
Abtastrate Weniger Messpunkte/Sek Max. Frequenz sinkt
Bittiefe Weniger Lautstärkestufen Mehr Rauschen
Kanäle Mono statt Stereo Kein Raumklang

Psychoakustik: Der MP3-Trick

Inhalt (was durchs Raster geht):

Methode Reduzieren → Konsequenz
Psychoakustik Unhörbare Frequenzen Kaum wahrnehmbar

MP3 nutzt hauptsächlich Psychoakustik → Container bleibt ähnlich, Inhalt wird "ausgedünnt"


Die Geburt der MP3

1982: Universität Erlangen-Nürnberg Karlheinz Brandenburg, Diplom-Ingenieur

1987: Fraunhofer IIS entwickelt MPEG-1 Audio Layer III

1988: Patentanmeldung

1992: Erste Software-Implementierung

1995: .mp3 Dateiendung offiziell


bg right:40%

Karlheinz Brandenburg

"Vater der MP3"

  • Diplom-Ingenieur, Universität Erlangen-Nürnberg
  • Fraunhofer IIS (Institut für Integrierte Schaltungen)
  • Forschung ab 1982, Patent 1988

bg right:50%

Suzanne Vega

"Tom's Diner" (1987)

  • Der erste Song, der als MP3 kodiert wurde
  • A cappella (keine Instrumente)
  • Klare, hohe Frequenzen
  • Perfekter Stresstest für Kompression
  • Brandenburg hörte "Tom's Diner" über 10.000 Mal

Wie funktioniert MP3?

Ein Zusammenspiel aus vielen Faktoren:

  • 1. Frequenz-Analyse (FFT) Audio → Frequenzspektrum

  • 2. Psychoakustisches Modell Welche Töne hört Mensch nicht?

  • 3. Quantisierung Unwichtige Frequenzen reduzieren

  • 4. Huffman-Coding Lossless-Kompression der Restdaten


Bitrate: Der Qualitäts-Knopf

Bitrate Qualität Kompression
128 kbps Hörbar schlechter ~11x
192 kbps Akzeptabel ~7x
256 kbps Gut ~5,5x
320 kbps "CD-Qualität" ~4,4x

Original CD: 1.411 kbps (unkomprimiert)


Der Patentkrieg

1990er: Fraunhofer + Thomson halten MP3-Patente

Lizenzgebühren:

  • $0,75 pro Decoder
  • $2,50 pro Encoder

Problem: Napster (1999) → unkontrollierte Verbreitung

2017: Patente laufen aus → MP3 ist frei


bg right:50% fit

Napster (1999)

P2P-Filesharing für MP3s

  • Shawn Fanning, 19 Jahre alt
  • 80 Millionen User in 2 Jahren
  • Musikindustrie verklagt (2001)
  • Pandora's Box: Nicht mehr aufzuhalten

bg right:40% contain

Napster & Musikindustrie

1999: Napster startet 2001: 80 Millionen User

Musikindustrie:

  • CDs kosten $1520
  • MP3s gratis (illegal, aber yolo)
  • Einzelne Songs statt Alben

2001: Napster wird verklagt und schließt

Aber: Pandora's Box offen → LimeWire, Kazaa, BitTorrent, später Spotify


Kulturelle Revolution

MP3 veränderte:

✓ Musik wurde portabel (Walkman → iPod) ✓ Alben wurden irrelevant (Playlists) ✓ Musikkonsum explodierte (kostenlos/billig) ✓ KünstlerInnen verloren Kontrolle

Aber auch: KünstlerInnen verdienen weniger pro Stream Audio-Qualität sank (Loudness War) Physische Medien starben


Fragen & Diskussion

Kontakt: lb-czechowski@hdm-stuttgart.de Folien: Online verfügbar unter https://librete.ch/hdm/223015b


Lizenz & Attribution

Diese Präsentation ist lizenziert unter Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)

  • Erlaubt Teilen & Anpassen mit Namensnennung
  • Adaptionen müssen unter gleicher Lizenz geteilt werden

Vollständige Lizenz: https://creativecommons.org/licenses/by-sa/4.0/


Selbstlernen: Audio-Spektrogramm

Aufgabe (30 Min):


bg contain right:22%

Selbstlernen: HEX Files

  1. Drei Dateien ohne Dateiendung: hex1 hex2 hex3
  2. Lies erste 16 Bytes aus und identifiziere Dateiformat (Magic Number)
  3. Optional: Datei umbenennen und korrekte Dateiendung anhängen (bspw. .jpg)

Tools: