Daniela Wurhofer und Ismail Karagöz MP3 Das Audioformat Daniela Wurhofer und Ismail Karagöz
Übersicht Einführung Aufbau Kompression & Codierung
Einführung Was ist MP3? Abkürzung für Motion Picture Experts Group, Audio Layer-3. Audiocodierungsverfahren; Audiodaten werden bis auf ein Zwölftel ihrer Größe komprimiert, ohne hörbare Qualitätsverluste. Klangqualität Modus Bitrate Kompressionsrate Telefon mono 8 KBit/s 96:1 besser als KW-Radio 16 KBit/s 48:1 MW-Radio 32 KBit/s 24:1 ähnlich UKW-Radio stereo 56 KBit/s 26 bis 24:1 annähernd CD 96 KBit/s 16:1 CD-Qualität 112 bis 128 KBit/s 14 bis 12:1 [Die Qualitätsstufen von MP3 im Vergleich]
Einführung Die Geschichte von MP3 ab 1987 Verfahren am Fraunhofer-Institut IIS-A (Institut Integrierte Schaltungen) in Erlangen entwickelt. 1989 Patent in Deutschland angemeldet und erteilt. 1992 von der ISO (International Standards Organisation) akzeptiert und in die Spezifikation der MPEG integriert. [Das Fraunhofer-Institut]
Aufbau Die Struktur eines MP3s MP3s werden in kleinere Einheiten, die als Frames bezeichnet werden geteilt. Jeder Frame besteht aus einem Header und den Daten. Am Anfang oder Ende des MP3s können im so genannten ID3-Tag Informationen zur Musikdatei angegeben werden.
Aufbau Der Header
Aufbau Struktur des Headers Headerlänge: 32 Bit Pos. Aufgabe Länge Frame-Sync 11 B MPEG Audioversion (MPEG-1, 2, etc.) 2 C MPEG Layer (Layer I, II, III, etc.) D Protection (wenn aktiv: Checksumme nach Header) 1 E Bitrate-Index 4 F Frequenz der Samplingrate (44.1kHz, etc.) G Padding Bit (kompensiert unvollständige Belegung) H Private Bit (Applikations-spezifische Trigger) I Channelmode (Stereo, Joint-Stereo) J Mode-Extension (bei Verwendung von Joint Stereo) K Copyright L Original ("0", wenn Kopie, "1" wenn Orignial) M Emphasis (veraltet) Struktur des Headers Headerlänge: 32 Bit
Kompression & Codierung Psychoakustisches Modell Huffman-Codierung
Kompression & Codierung Kompressionsarten Verlustlose Kompression = 100%ige Rekonstruktion der Daten (ZIP-Verfahren) Verlustbehaftete Kompression = Verminderung der Qualität akzeptabel (Bild- & Audiodaten) MP3 ist verlustbehaftet
Kompression & Codierung Arbeitsschritte beim Codierungsvorgang Einteilung der Datei in kleinere Einheiten (Frames zu 26ms) Analyse der „spektralen Energieverteilung“ Maximale Bitanzahl/Frame aufgrund der Encoding Bitrate berechnen. Komprimierung des Bitstreams mittels Huffman-Coding (verlustfrei). Ausgabe der Daten in Frames (Header vorangestellt).
Kompression & Codierung Psychoakustisches Modell Herausfilterung der nicht wahrnehmbaren Daten Frequenzen unter 20Hz und über 16Khz.
Kompression & Codierung Psychoakustisches Modell
Kompression & Codierung Psychoakustisches Modell – Maskierung Simultanes Masking: Unvermögen des Gehörs, 2 gleichzeitig auftretende, ähnliche Frequenzen auseinander zu halten Wegfilterung einer Frequenz bei Kompression Temporales Masking 2 Töne die kurz aufeinander folgen, wird nur der lautere wahrgenommen Wegfilterung des leiseren Tones
Kompression & Codierung Psychoakustisches Modell – Joint Stereo Tiefe Töne werden nicht Stereo, sondern Mono encodiert geringere Bitrate benötigt
Kompression & Codierung Huffman Codierung Verlustloses Kompressionsverfahren Gesamtgrösse der Datei nochmals um 20% verringert
Kompression & Codierung Huffman Codierung Analyse von relativen Häufigkeiten Variable Codewortlänge Symbole mit höherem Vorkommen – kürzere Codeworte Kompressionsrate
Kompression & Codierung Huffman Codierung & MP3 Masking: Polyphone Elemente (viele Töne gleichzeitig und überlagert) werden komprimiert Abschnitte, in denen der Klang konstant bleibt – relativ große Redundanz Huffmancoding
Kompression & Codierung Struktur der MPEG Kompression Unterteilung des gesamten Signals in Subbänder (= Zeit-Frequenz-Zuordnung) Implementierung des Psychoakust. Modells Fast-Fourier-Transformation (FFT) eingesetzt
Kompression & Codierung Struktur der MPEG Kompression Quantifizierung und Encodierung jedes einzelnen Samples in den Subbändern Endgültige Erzeugung der komprimierten Datei – digitalisierte Audiodaten in einzelne Frames unterteilt
Kompression & Codierung Erweiterung bei MP3: Weiterer Filter kommt zum Einsatz: Discrete Consine Transform Filter (DCTF) bessere Performance und mehr Zuverlässigkeit Der 4. Phase (Vorbereitung der Frames) ist ein komplexer Algorithmus hinzugefügt Variation der Framegrösse, Reserve Bit
ENDE