Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Quellencodierung NTM, 2006/05, 9.3 Quellencodierung, Rur, 1 Referenzen [1]Proakis, Salehi, „Grundlagen der Kommunikationstechnik“, Pearson, 2004. [2]D.

Ähnliche Präsentationen


Präsentation zum Thema: "Quellencodierung NTM, 2006/05, 9.3 Quellencodierung, Rur, 1 Referenzen [1]Proakis, Salehi, „Grundlagen der Kommunikationstechnik“, Pearson, 2004. [2]D."—  Präsentation transkript:

1 Quellencodierung NTM, 2006/05, 9.3 Quellencodierung, Rur, 1 Referenzen [1]Proakis, Salehi, „Grundlagen der Kommunikationstechnik“, Pearson, 2004. [2]D. Salomon, „Data Compression“, Springer, 2004. [3]D. Pan, „A Tutorial on MPEG/Audio Compression“, 1995. [4] http://www.iis.fraunhofer.de/amm/techinf/layer3/http://www.iis.fraunhofer.de/amm/techinf/layer3/ Verlustlose Quellenkomprimierung (Redundanz-Reduktion) ursprüngliche Daten können exakt rekonstruiert werden Statistische Kompressionsmethoden wie z.B. Huffman-Coding Wörterbuch-basierende Kompression (LZW-Coding): z.B. winzip Verlustbehaftete Quellenkomprimierung (Irrelevanz-Reduktion) nur für Senke (z.B. Ohr) relevante Information wird übertragen Kompressionsrate bzw. Wiedergabequalität oft wählbar Beispiele: (LPC-) Vocoder, MPEG/Audio und JPEG, MPEG

2 Quellencodierungstheorem NTM, 2006/05, 9.3 Quellencodierung, Rur, 2 diskrete Quelle X[0], X[1], X[2],... mit H bit / Symbol Information Voraussetzung Quellencodierungstheorem (Shannon, 1948) Die Quelle kann verlustlos codiert werden, solange die Coderate R ≥ H. Umgekehrt, wenn R < H, kann die Quelle auf keinen Fall verlustlos codiert werden. Quelle ohne Gedächtnis (DMS): H = H(X) Quelle mit Gedächtnis: Entropierate H = lim n->∞ H(X[0],...,X[n-1]) / n Das Theorem gibt Bedingungen für die Existenz von Quellencodes an. Es liefert aber keine Algorithmen.

3 Huffman-Codierung Grundidee Häufig vorkommende Blöcke werden mit kurzen Codeworten codiert. Problem mit Codeworten variabler Länge: Synchronisation! man bevorzugt präfixfreie Quellencodes Kein Codewort ist ein Präfix (Vorsilbe) eines anderen Codeworts. eindeutig und sofort (ohne Verzögerung) decodierbar Beispiel Der Code { [0], [10], [110], [1110], [1111] } ist präfixfrei. Detektion Codewortende, wenn „0“ kommt oder nach vier „1“ Huffman-Codes sind optimal haben minimale mittlere Codewortlänge unter allen präfixfreien Codes Huffman Encoder Blöcke fester Länge Codeworte variabler Länge NTM, 2006/05, 9.3 Quellencodierung, Rur, 3

4 Huffman-Algorithmus 1. Symbole nach Wahrscheinlichkeiten ordnen und Knoten eines Baums zuweisen 2.zwei Symbole mit kleinster Wahrscheinlichkeit in neuem Symbol zu- sammenfassen, neuer Knoten hat Summe der Wahrscheinlichkeiten 3.wenn nur noch 2 Symbole bzw. Knoten übrig bleiben, 4. sonst 2. 4.von der Wurzel aus bei jeder Verzweigung nach oben eine „0“ und nach unten eine „1“ eintragen (auch umgekehrt möglich) Beispiel: DMS mit H(X) = 2 bit / Symbol, Alphabet A = {A,B,C,D,E} 0A1/2 100B1/8 101C1/8 110D1/8 111E1/8 1/4 1/2 1 0 1 Wurzel R = E[L] = (1/2)·1+4·(1/8)·3 = 2 bit / Symbol Code ist optimal! D. Huffman (1952) NTM, 2006/05, 9.3 Quellencodierung, Rur, 4

5 Huffman-Codierung (2) Rate bzw. mittlere Codewortlänge L(x): Länge des dem Symbolwert x zugeordneten Codeworts Codierung von n Symbolen einer DMSH(X) ≤ R < H(X) + 1/n gilt auch für Quellen mit Gedächtnis, wenn H die Entropierate darstellt => R -> H(X) von oben, Gleichheit wenn P X (x m )=2 -α M-wertige Huffman-Codes => Algorithmus einfach erweiterbar Nachteile 1.Huffman-Codes hängen stark von der Quellenstatistik ab 2.Quellenstatistik muss im voraus bekannt sein (ev. zuerst „messen“) 3.Komplexität wächst exponentiell mit der Blocklänge n NTM, 2006/05, 9.3 Quellencodierung, Rur, 5

6 JPEG Gemeinsames Standardisierungsprojekt von CCITT und ISO JPEG steht für Joint Photographic Experts Group Start 1987, erster Draft-Standard 1991, heute weit verbreitet verlustbehaftetes Kompressionsverfahren für natürliche Bilder für Grafiken usw. PNG-Bilddatenkompression vorteilhafter Wichtigste Schritte 1.Transformation Farbbilder RGB => Luminanz / Chrominanz Auge ist viel empfindlicher auf kleine Helligkeitsunterschiede (Luminanz) als auf kleine Farbunterschiede (Chrominanz) Vorbereitung für Datenkompression, kein Informationsverlust 2.Downsampling der beiden Chrominanz-Komponenten Reduktion 2 Chrominanz-Komponenten um Faktor 2 oder 4 NTM, 2006/05, 9.3 Quellencodierung, Rur, 6

7 JPEG 3.Pixel-Gruppierung Farbkomponenten in 8x8 Blöcke Ausnützung der horizontalen und vertikalen Korrelation Blöcke werden separat komprimiert (Schwachstelle!) 4.Diskrete Cosinus Transformation (8x8 DCT) Transformation in den Frequenzbereich Vorbereitung für Datenkompression DC und 3-4 tieffrequente AC-Werte enthalten „Bildinformation“ 5.Individuelle Quantisierung einzelner Frequenzkomponenten Prinzip: Frequenzkomponenten mit viel bzw. wenig Bildinformation werden fein bzw. grob quantisiert 6.Entropy-Coding der quantisierten Frequenzkomponenten verlustlos, Kombination von RLE und Huffman 7.Addition von Header und JPEG-Parameter NTM, 2006/05, 9.3 Quellencodierung, Rur, 7

8 JPEG Blockverarbeitung 2D- DCTQuantizer Entropy Encoder Compressed Data 8x8 Blöcke 2D- IDCTDequantizer Entropy Decoder rekonstruierte Blöcke NTM, 2006/05, 9.3 Quellencodierung, Rur, 8

9 24 Bit / Pixel Originalbild mit True Color Auflösung. 1.5 - 2.0 Bit / Pixel (Kompressionsfaktor 12... 16) Normalerweise nicht vom Original unterscheidbar. Genügt den höchsten professionellen Anforderungen. 0.75 - 1.5 Bit / Pixel (Kompressionsfaktor 16... 32) Exzellente Qualität. Genügt den meisten Anforderungen. 0.5 - 0.75 Bit / Pixel (Kompressionsfactor 32... 48) Gute bis sehr gute Qualität. Genügend für viele Anwendungen. 0.25 - 0.5 Bit / Pixel (Kompressionsfaktor 48... 96) Bescheidene bis gute Qualität. Genügend für gewisse Anwendungen. JPEG - Kompressionsfaktor und Bildqualität NTM, 2006/05, 9.3 Quellencodierung, Rur, 9

10 Audiokompression Schritte der Digitalisierung Abtastung: verlustlos wenn Rate f s [Sps] > 2 x Signalbandbreite Quantisierung: verlustbehaftet, ca. 6 dB SNR pro Bit Auflösung Referenz-Datenraten PCM-Telefonie: 8 kSps x 8 Bit/S = 64 kb/s 300-3100 Hz für Sprachverständlichkeit ausreichend CD-Audio: 2 x 44.1 kSps x 16 Bit/S ≈ 1.4 Mb/s (netto, Stereo) 20-20‘000 Hz und 90 dB Dynamik, Ziel klangtreue Wiedergabe Kompressionsfaktoren (LPC)-Vocoder: typ. Datenreduktion 1:5 => 13 kb/s (GSM-Qualität) MP3: typ. Datenreduktion 1:10…12 => 128…112 kb/s NTM, 2006/05, 9.3 Quellencodierung, Rur, 10

11 Übersicht LPC-Sprachkompression Approximation Entstehungsprozess des Sprachsignals Modellierung menschlicher Vokaltrakt (à priori Wissen) Kompression durch Übertragung Filterparameter, benutzte Quelle, Pitch-Frequenz, Lautstärke GSM-Vocoder: 13 kb/s Rausch- generator Puls- generator Allpol- Filter Parameter Approximation 10-20 ms Sprachburst Pitchfrequenz NTM, 2006/05, 9.3 Quellencodierung, Rur, 11

12 MPEG / Audio MPEG: Motion Pictures Experts Group Audio- und Videokompression im Auftrag ISO und IEC MPEG Audio Standard umfasst 3 Layers hierarchische Kompressionsmethoden jeder Layer ohne Video für Audiokompression verwendbar auch in DAB, DVB und DRM eingesetzt Arbeiten dauerten von 1988 bis 1992 Layer 3 am bekanntesten (MP3) beste Kompression, aber am kompliziertesten Typische Datenreduktion bzw. Datenrate (Stereo) (Quelle: [4]) Layer 1: typ. Datenreduktion 1:4 => 384 kb/s Layer 2: typ. Datenreduktion 1:6…8 => 256…192 kb/s Layer 3: typ. Datenreduktion 1:10…12 => 128…112 kb/s kleinere Datenraten bei kleinerer Audiobandbreite NTM, 2006/05, 9.3 Quellencodierung, Rur, 12

13 Ruhehörschwelle und Lautstärkeempfindung stark frequenzabhängig im Bereich 20-20‘000 Hz max. Empfindlichkeit im Bereich 2-4 kHz Frequenz-Maskierung leise Töne in der Nähe eines dominanten Tons werden „verdeckt“ Maskierungseffekt hängt von der Frequenz ab 27 kritische Bänder identifiziert (0-50 Hz, …, 15375-20250 Hz) Zeitliche Maskierung kurzzeitige Empfindlichkeitsreduktion nach prägnantem Hörereignis 10ms wenig empfindlich, ab 200ms wieder voll empfindlich f Mithörschwelle unhörbare Töne hörbare Töne Menschliches Hörsystem NTM, 2006/05, 9.3 Quellencodierung, Rur, 13

14 MPEG-Audiokompression Filterbank psychoakust. Modell Quantisierer Codierer Grundstruktur (MUSICAM: masking pattern universal subband integrated coding and multiplexing) Multiplexer Coder berechnet für jedes Teilband Mithörschwelle + Quantisierungsstufenhöhe Layer 1 (mono) 32 Teilbänder je mit einer Abtastfrequenz von 48/32 kHz = 1.5 kHz 12 Samples werden zu einem Block von 8ms Dauer zusammengefasst Header 12 Bit Sync 20 Bit Info Kanalcode (16 Bit, optional) Bit- Zuweisung 4 Bit/Band Skalen- faktoren 6 Bit/Band 32x12 Samples je mit 0…15 Bit 3216128192 NTM, 2006/05, 9.3 Quellencodierung, Rur, 14

15 576 Teilbänder (polyphase + MDCT) Huffmann-Coding (häufige kleine Werte => kürzere Codeworte) nichtlinear Quelle: [4] MP3 NTM, 2006/05, 9.3 Quellencodierung, Rur, 15


Herunterladen ppt "Quellencodierung NTM, 2006/05, 9.3 Quellencodierung, Rur, 1 Referenzen [1]Proakis, Salehi, „Grundlagen der Kommunikationstechnik“, Pearson, 2004. [2]D."

Ähnliche Präsentationen


Google-Anzeigen