Files
uni/courses/223015b/slides/2025-12-19-termin-1-grundlagen-text-audio.md
Michael Czechowski 1b9b2f315a add slide content improvements and dev server setup
223015b:
- add WTF hex code explanation slide (89=137 decimal, PNG signature)
- add ASCII lead slide with historical context
- remove Hilbert-Studie reference from title

223015c termin 2:
- add OSI layer 5 (session) and layer 6 (presentation) slides
- add URL/domain anatomy slide
- mark HTTP/S section as klausur
- improve status codes formatting with client/server examples
- add CRUD column to HTTP methods table

infrastructure:
- add dev-server.sh for multi-course development
- update generate-index.sh with course-specific colors
- add QR codes for slide URLs
2025-12-30 16:24:44 +01:00

30 KiB
Raw Blame History

marp, theme, paginate, backgroundColor, header, footer, title
marp theme paginate backgroundColor header footer title
true gaia true Dateiformate, Schnittstellen, Speichermedien & Distributionswege Michael Czechowski HdM Stuttgart WS 2025/26 Dateiformate, Schnittstellen, Speichermedien & Distributionswege
<style> :root { --color-foreground: #1a1a2e; --color-highlight: #5da9e9; --color-dimmed: #4a4a6a; } section.invert { --color-foreground: #fff; } section { font-size: 1.7rem; } h2 { color: var(--color-highlight); } pre { background: #0f0f23; color: #5da9e9; border-radius: 8px; border-left: 3px solid #5da9e9; } pre code { background: transparent; color: inherit; } code { background: #1a1a2e; color: #5da9e9; padding: 0.15em 0.4em; border-radius: 4px; } a { color: var(--color-highlight); } section.klausur { background: #e3f2fd !important; } section.klausur footer { display: none; } </style>

bg fit opacity:0.4

Dateiformate, Schnittstellen, Speichermedien & Distributionswege

223015b · Modul "Technik 1" · 1. Semester Digital- und Medienwirtschaft Hochschule der Medien Stuttgart

Wintersemester 2025/26

https://librete.ch/hdm/223015b/


bg fit


Termin 1 19.12.2025

Grundlagen, Text & Audio


bg right:40%

WTF!?

89 50 4E 47 0D 0A 1A 0A
00 00 00 0D 49 48 44 52
00 00 01 90 00 00 01 2C

bg right:40%

WTF!? Auflösung

89 50 4E 47 ...
Hex Dezimal ASCII
89 137 ✗ (> 127, nicht druckbar)
50 80 P
4E 78 N
47 71 G

PNG-Signatur! (Das 89 markiert: "Ich bin binär, kein Text!")


bg


Das Bit

Kleinste Informationseinheit

  • 0 oder 1
  • AN oder AUS
  • Strom fließt oder nicht

Das Byte


Das Byte

1 Byte = 8 Bits

0 1 0 0 1 1 0 1

Das Byte

1 Byte = 8 Bits

0 1 0 0 1 1 0 1

2⁸ = 256 Möglichkeiten (0-255)


Dateneinheiten

Einheit Bytes Bits Potenz
1 Byte 1 8 10⁰
1 Kilobyte (KB) 1.000 8.000 10³
1 Megabyte (MB) 1.000.000 8 Mio. 10⁶
1 Gigabyte (GB) 1 Mrd. 8 Mrd. 10⁹
1 Terabyte (TB) 1 Bio. 8 Bio. 10¹²

Dateneinheiten (Fortsetzung)

Einheit Bytes Potenz Beispiel
1 Petabyte (PB) 10¹⁵ 1.000 TB Netflix-Gesamtarchiv
1 Exabyte (EB) 10¹⁸ 1.000 PB Alle E-Mails weltweit/Tag
1 Zettabyte (ZB) 10²¹ 1.000 EB Internet-Traffic 2016
1 Yottabyte (YB) 10²⁴ 1.000 ZB Noch nie erreicht

Datenwachstum der Menschheit

Jahr Datenmenge Kontext
100.000 v. Chr. 0 Erste Menschen, nur Sprache
3.000 v. Chr. ~wenige KB Keilschrift, Hieroglyphen
1450 ~wenige GB Gutenberg, Buchdruck
1986 2,6 EB 99% analog (Bücher, Vinyl, VHS)
2007 295 EB 94% digital
2025 181 ZB 90% unstrukturiert

Der digitale Wendepunkt

Jahr Analog Digital Digital-Anteil
1986 2,6 EB 0,02 EB 1%
2002 50% (Wendepunkt)
2007 18 EB 277 EB 94%

Perspektive:

  • 1986: "Petabyte" war ein theoretisches Konzept
  • 2025: ~181 Zettabyte jährlich produziert

Magnetband lebt: LTO-Tapes bleiben günstigstes Archivmedium (AWS Glacier, Film-Archive, Rechenzentren)


181 Zettabyte Was bedeutet das?

2025: Welt erzeugt 181 ZB pro Jahr

  • 2,5 Quintillionen Bytes täglich
  • 29 Terabyte pro Sekunde
  • 90% davon: unstrukturiert (Videos, Bilder, Audio)
  • 70% davon: von Nutzern generiert

Zum Vergleich:

  • 1 ZB = 250 Milliarden DVDs
  • 181 ZB = Jeder Mensch erzeugt ~23 TB/Jahr

AI-generierte Inhalte 2025

Wie viel Content ist heute synthetisch?

Bereich AI-Anteil
Neue Webseiten ~74% enthalten AI-Content
Web-Text gesamt ~30-40% AI-generiert
Neue Artikel ~52% von AI geschrieben
Social-Media-Bilder ~71% AI-generiert

Prognose 2026: 90% des Online-Contents synthetisch


ASCII

Ein Zeichensatz to rule them all


bg fit


»256 Shades of Gray«

bg fit


Was kann man mit 256 Zuständen machen?

  • 256 Zeichen (Buchstaben, Zahlen, Symbole)

  • 256 Helligkeit bzw. Luminanz (0 = Schwarz/Dunkel, 255 = Weiß/Hell)

  • 256 Lautstärkestufen

  • Zahlen 0-255 (oder -128 bis +127)

  • Fällt Euch noch mehr ein?


bg fit


bg fit


bg right:50%

Farben: RGB-Modell

1 Pixel = 3 Bytes

  • Rot: 0-255
  • Grün: 0-255
  • Blau: 0-255

Beispiele: FF 00 00 = Rot | 00 FF 00 = Grün 00 00 00 = Schwarz | FF FF FF = Weiß


bg fit


Das Problem: Sprachen

Die Welt hat mehr als 256 Zeichen!

  • Englisches Alphabet: 52 (A-Z, a-z)
    • Ziffern: 10 (0-9)
    • Sonderzeichen: ~30

≈ 90 Zeichen → passt in 1 Byte

Aber: ä, ö, ü, ß, é, à, ç, α, β, 中, 日, 😀

1 Byte reicht nicht!


Unicode: Ein Standard für alle

Unicode (1991): Jedes Schriftsystem der Welt

>150.000 Zeichen:

  • Latein, Kyrillisch, Arabisch, Chinesisch, Japanisch...
  • Mathematische Symbole, Emoji, historische Schriften
  • UTF-8: Variable Länge (1-4 Bytes pro Zeichen)

Beispiel: Bytes zählen

Text: "Why the heck braucht 💩 4 Bytes?!"

W h y   → je 1 Byte (4 Bytes)
t h e   → je 1 Byte (4 Bytes)
h e c k → je 1 Byte (4 Bytes)
        → 1 Byte (Leerzeichen)
b r a u c h t → je 1 Byte (7 Bytes)
        → 1 Byte
💩      → 4 Bytes! (0xF0 9F 92 A9)
        → 1 Byte
4   B y t e s ? ! → je 1 Byte (9 Bytes)

Gesamt: 37 Bytes


Hexadezimal: Lesbarkeit

Binär ist unleserlich: 01001101 01010000 00110011

Hexadezimal (Base 16): 4D 50 33 (= "MP3" in ASCII)

Jede Hex-Ziffer = 4 Bits (ein "Nibble") 0-9, A-F (10=A, 11=B, ..., 15=F)

ASCII Tabelle (0-127): https://www.asciitable.com


bg fit


bg fit


bg fit


Magic Numbers

Dateityp-Identifikation durch erste Bytes

Format Magic Number (Hex) Lesbar?
PNG 89 50 4E 47 ✗ P N G
JPEG FF D8 FF ✗ ✗ ✗
PDF 25 50 44 46 % P D F ✓
ZIP 50 4B 03 04 P K ✗ ✗

Wichtig: ASCII = nur 0-127! Werte darüber (z.B. 89 = 137) sind nicht druckbar (non-printable). Hex-Editoren zeigen dafür . oder ÿ als Platzhalter.


Hands-On: WTF Files

Aufgabe (30 Min):

  1. Drei Dateien ohne Extension: wtf1, wtf2, wtf3 → Download: materials/ Ordner
  2. Öffne im Hex-Editor
  3. Lies erste 16 Bytes
  4. Identifiziere Format (Magic Number)
  5. Benenne um und öffne

Tools: hexed.it (online), HxD, Hex Fiend, Bless


Teil 2: Die MP3-Revolution

Psychoakustik & Audio-Kompression


bg


Das Problem (1990)

1 Minute CD-Audio:

  • Sample Rate: 44.100 Hz
  • Bit Depth: 16 Bit
  • Stereo: 2 Kanäle

Rechnung: 44.100 × 16 × 2 = 1.411.200 Bits/Sekunde ≈ 10,6 MB/Minute635 MB für 60-Min-Album

1990: Festplatten hatten 100-500 MB!


bg cover


Was ist Sample Rate?

Analog → Digital ≙ Kontinuierlich → Diskret

      Analog (Vinyl):          Digital (CD):
      ~~~~~~~~~~~~~~~          • • • • • • • •
      Kontinuierliche          44.100 Messpunkte
      Wellenform               pro Sekunde

Nyquist-Theorem:

Um eine Frequenz zu rekonstruieren, braucht man mindestens 2× so viele Samples. 44.100 Hz ÷ 2 = 22.050 Hz max. darstellbare Frequenz (Mensch hört: ~20 Hz bis ~20.000 Hz → passt!)


Sample Rate vs. Bit Depth

Zwei Dimensionen der Digitalisierung:

Dimension Was bedeutet es? CD-Qualität
Sample Rate Messungen pro Sekunde (horizontal) 44.100 Hz
Bit Depth Genauigkeit pro Messung (vertikal) 16 Bit

16 Bit = 2¹⁶ = 65.536 Lautstärkestufen (von absoluter Stille bis maximaler Lautstärke)


bg fit


Kompression: Zwei Philosophien

Lossless Lossy
Prinzip Redundanz entfernen Irrelevanz entfernen
Reversibel Ja (bitgenau) Nein
Kompression 30-50% 80-99%
Algorithmen RLE, Huffman, LZW, DEFLATE DCT, Psychoakustik

Lossless: ZIP, PNG, FLAC, GIF Lossy: JPEG, MP3, AAC, H.264, H.265, AV1

Entscheidung: Archiv/Code → Lossless, Medien → Lossy


Lossless: Run-Length Encoding

Lauflängenkodierung

Original:

AAAAABBBCCCCCCCC

Komprimiert:

5A 3B 8C

Ersparnis: 16 → 6 Zeichen (62% Reduktion)


Lossy: Der Trick

Kernidee: Wirf weg, was der Mensch eh nicht wahrnimmt

JPEG: Schwächen des Auges

  • Helligkeit besser als Farbe wahrgenommen
  • Große Flächen besser als feine Details
  • → Psychovisuell

Lossy: Der Trick

Kernidee: Wirf weg, was der Mensch eh nicht wahrnimmt

JPEG: Schwächen des Auges

  • Helligkeit besser als Farbe wahrgenommen
  • Große Flächen besser als feine Details
  • → Psychovisuell

MP3: Schwächen des Ohrs

  • Mittlere Frequenzen besser als hohe/tiefe
  • Laute Töne "maskieren" leise Töne
  • → Psychoakustik

bg right:40%

Karlheinz Brandenburg

"Vater der MP3"

  • Diplom-Ingenieur, Universität Erlangen-Nürnberg
  • Fraunhofer IIS (Institut für Integrierte Schaltungen)
  • Forschung ab 1982, Patent 1988
  • Hörte "Tom's Diner" über 10.000 Mal

Die Geburt der MP3

1982: Universität Erlangen-Nürnberg Karlheinz Brandenburg, Diplom-Ingenieur

1987: Fraunhofer IIS entwickelt MPEG-1 Audio Layer III

1988: Patentanmeldung

1992: Erste Software-Implementierung

1995: .mp3 Dateiendung offiziell


bg right:50%

Suzanne Vega

"Tom's Diner" (1987)

  • A cappella (keine Instrumente)
  • Klare, hohe Frequenzen
  • Perfekter Stresstest für Kompression
  • Der erste Song, der als MP3 kodiert wurde

"Tom's Diner"

Warum dieser Song?

  • A cappella (keine Instrumente)
  • Suzanne Vegas Stimme ist "schwierig"
  • Klare, hohe Frequenzen → Stresstest

If I could code Suzanne Vega's voice well, I could code anything. — Karlheinz Brandenburg


Wie funktioniert MP3?

Ein Zusammenspiel aus vielen Faktoren:

  • 1. Frequenz-Analyse (FFT) Audio → Frequenzspektrum

  • 2. Psychoakustisches Modell Welche Töne hört Mensch nicht?

  • 3. Quantisierung Unwichtige Frequenzen reduzieren

  • 4. Huffman-Coding Lossless-Kompression der Restdaten


Bitrate: Der Qualitäts-Knopf

Bitrate Qualität Kompression
128 kbps Hörbar schlechter ~11x
192 kbps Akzeptabel ~7x
256 kbps Gut ~5,5x
320 kbps "CD-Qualität" ~4,4x

Original CD: 1.411 kbps (unkomprimiert)


bg fit


Der Patentkrieg

1990er: Fraunhofer + Thomson halten MP3-Patente

Lizenzgebühren:

  • $0,75 pro Decoder
  • $2,50 pro Encoder

Problem: Napster (1999) → unkontrollierte Verbreitung

2017: Patente laufen aus → MP3 ist frei


bg right:50% fit

Napster (1999)

P2P-Filesharing für MP3s

  • Shawn Fanning, 19 Jahre alt
  • 80 Millionen User in 2 Jahren
  • Musikindustrie verklagt (2001)
  • Pandora's Box: Nicht mehr aufzuhalten

Napster & Musikindustrie

1999: Napster startet 2001: 80 Millionen User

Musikindustrie:

  • CDs kosten $15-20
  • MP3s gratis (illegal, aber egal)
  • Einzelne Songs statt Alben

2001: Napster verklagt, geschlossen

Aber: Pandora's Box offen → LimeWire, Kazaa, BitTorrent, später Spotify


Kulturelle Revolution

MP3 veränderte:

✓ Musik wurde portabel (Walkman → iPod) ✓ Alben wurden irrelevant (Playlists) ✓ Musikkonsum explodierte (kostenlos/billig) ✓ Künstler verloren Kontrolle

Aber auch: Künstler verdienen weniger pro Stream Audio-Qualität sank (Loudness War) Physische Medien starben


Hands-On: MP3 sezieren

Aufgabe (30 Min):

  1. Lade Lied runter (eigenes oder CC)
  2. Konvertiere in verschiedene Bitraten:
    • 320 kbps, 128 kbps, 64 kbps
  3. Tool: Audacity (kostenlos)
  4. Höre Unterschiede (Kopfhörer!)
  5. Vergleiche Dateigrößen

Spektrogramm: Klick auf Track-Name → Spektrogramm https://manual.audacityteam.org/man/spectrogram_view.html


Fragen & Diskussion

Kontakt: mail@librete.ch Folien: Online verfügbar unter https://librete.ch/hdm/223015b


Lizenz & Attribution

Diese Präsentation ist lizenziert unter Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)

  • Erlaubt Teilen & Anpassen mit Namensnennung
  • Adaptionen müssen unter gleicher Lizenz geteilt werden

Vollständige Lizenz: https://creativecommons.org/licenses/by-sa/4.0/