Quellencodierung NTM, 2006/05, 9.3 Quellencodierung, Rur, 1 Referenzen [1]Proakis, Salehi, „Grundlagen der Kommunikationstechnik“, Pearson, 2004. [2]D.

Slides:

Advertisements

Ähnliche Präsentationen

Audio & Videoformate Max Rennhofer.

Advertisements

Digitales Fernsehen und PC

Dateiformate Tobias Rolle IT takes more than systems …

christiane, steffen und stephan

Audioformate in der Unterhaltungselektronik

Digitale Audioformate

Dr. Monique Jucquois-Delpierre

2.1 Kodierung von Zeichen 2.2 Kodierung von Zahlen

Kompressionsverfahren für Texte

Kompressionsverfahren (für Texte)

Grundlagen Videokompression

Huffmans Kompressionsverfahren

Mathematische Grundlagen der Video – Kompression

Algorithmen und Komplexität

Grafikkomprimierung Andreas Pretzsch.

Multimediatechnik / Audio Dipl. -Ing. Oliver Lietz

Audio-Kompression MPEG Audio MPEG Moving Pictures Experts Group

Medien- Technik Datei-Formate: TIFF Tagged Image File Format.tif.tiff.

Audio-Kompression: MPEG

Huffman Entropie-Codierung Codierung mit variabler Länge

Digital Audio Medientyp digital audio representation

Digital Audio Medientyp digital audio representation

Wie funktionniert das Musikklauen denn im Detail?

Videokonferenzsysteme

Aufbau einer Digitalkamera

Gierige Methoden "kurzsichtig handeln, langfristig gewinnen"

BILDFORMATE von Margarita Isjurowa.

Computational Thinking Online Algorithmen [Was ist es wert, die Zukunft zu kennen?] Kurt Mehlhorn Konstantinos Panagiotou.

Mp3 Geschichte Verfahren Codecs (Vor- und Nachteile)

Effiziente Algorithmen

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Hartmut Klauck Universität Frankfurt SS

Information und Kommunikation

Information und Kommunikation

Java, Java, Java R. Morelli

MATHEMATIK UND AKUSTISCHE SIGNALVERARBEITUNG

Multiraten-Systeme Referenzen Taktratenänderungen sind in der DSV

Analog-Digital Umsetzer NI USB 6009 Blockschaltbild

Daniela Wurhofer und Ismail Karagöz

Rechnersysteme Marcel Waldvogel. Marcel Waldvogel, IBM Zurich Research Laboratory, Universität Konstanz, , 2  Wer bin ich?  Die Vorlesung.

VTK-Filter für effizientes netzwerkbasiertes Rendern inkl. Interaktionsmöglichkeit.

Kap Multimedia.

Theorie Praktische Beispiele

Audiowandlung und Formate

JPEG Joint Photographic Experts Group Thomas Leinmüller

Dateiformate in der Bildbearbeitung

Kompressionsverfahren

Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde III: Bildverarbeitung III Köln 2. Dezember.

Wichtige Transformationen

Medizinischen Physik V1: Signalaufnahme und Fourieranalyse

Quantisierung Seminar Multimediadatenformate Oliver Richter.

Ein Referat von Robert Becker

Analog-Digital-Wandler

DU 00/ 1 Videokonferenz VIDEOKONFERENZ Dr. Erwin Bratengeyer.

und Informationen über den Scanner

Florian Hutter & Nicole Waibel

Sükün_Karatas Grundlagen der Codes Sükün_Karatas 3aFD.

JPEG Ingo Kregel Layout: R G B Lila: Blau:

X. Übungsblatt – Aufgabe X a)Erstellen Sie den Huffman-Codierungsbaum für die folgende Zeichenkette: ABRAKADABRASIMSALABIM Vorgehensweise: 1.Tabelle mit.

Image compression Seminar : Bildverarbeitung und Computer Vision

Programmiersprachen II Fortsetzung Datenstrukturen Balancierte Bäume 3 Prof. Dr. Reiner Güttler Fachbereich GIS HTW.

Random Access: Einleitung TDMA-, FDMA- oder CDMA-Mehrfachzugriffssysteme Benutzertrennung über die Zeit, die Frequenz oder über Codes Random Access Systeme.

Quellencodierung NTM, 2006/05, 9.3 Quellencodierung, Rur, 1 Referenzen [1]Proakis, Salehi, „Grundlagen der Kommunikationstechnik“, Pearson, [2]D.

Kapitel 7.12 OFDM-Modulation

Faltungscodes Vorteile

THz Physik: Grundlagen und Anwendungen

Systeme II 2. Die physikalische Schicht Christian Schindelhauer Technische Fakultät Rechnernetze und Telematik Albert-Ludwigs-Universität Freiburg Version.

Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.

Digitales Video I ● Wie wird Video am Computer codiert? ● Bilder – Auflösung – Speicherung am Computer ● Bewegte Bilder – Interlacing – Kompression / Codec.

1 Standards zur Kompression von Videodaten. 2 Rahmenbedingungen Eigenschaften des menschlichen Auges: Fließende Bewegung ab ca. 20 Bilder/s Flimmerverschmelzungsfrequenz.

Präsentation transkript:

Quellencodierung NTM, 2006/05, 9.3 Quellencodierung, Rur, 1 Referenzen [1]Proakis, Salehi, „Grundlagen der Kommunikationstechnik“, Pearson, [2]D. Salomon, „Data Compression“, Springer, [3]D. Pan, „A Tutorial on MPEG/Audio Compression“, [4] Verlustlose Quellenkomprimierung (Redundanz-Reduktion) ursprüngliche Daten können exakt rekonstruiert werden Statistische Kompressionsmethoden wie z.B. Huffman-Coding Wörterbuch-basierende Kompression (LZW-Coding): z.B. winzip Verlustbehaftete Quellenkomprimierung (Irrelevanz-Reduktion) nur für Senke (z.B. Ohr) relevante Information wird übertragen Kompressionsrate bzw. Wiedergabequalität oft wählbar Beispiele: (LPC-) Vocoder, MPEG/Audio und JPEG, MPEG

Quellencodierungstheorem NTM, 2006/05, 9.3 Quellencodierung, Rur, 2 diskrete Quelle X[0], X[1], X[2],... mit H bit / Symbol Information Voraussetzung Quellencodierungstheorem (Shannon, 1948) Die Quelle kann verlustlos codiert werden, solange die Coderate R ≥ H. Umgekehrt, wenn R < H, kann die Quelle auf keinen Fall verlustlos codiert werden. Quelle ohne Gedächtnis (DMS): H = H(X) Quelle mit Gedächtnis: Entropierate H = lim n->∞ H(X[0],...,X[n-1]) / n Das Theorem gibt Bedingungen für die Existenz von Quellencodes an. Es liefert aber keine Algorithmen.

Huffman-Codierung Grundidee Häufig vorkommende Blöcke werden mit kurzen Codeworten codiert. Problem mit Codeworten variabler Länge: Synchronisation! man bevorzugt präfixfreie Quellencodes Kein Codewort ist ein Präfix (Vorsilbe) eines anderen Codeworts. eindeutig und sofort (ohne Verzögerung) decodierbar Beispiel Der Code { [0], [10], [110], [1110], [1111] } ist präfixfrei. Detektion Codewortende, wenn „0“ kommt oder nach vier „1“ Huffman-Codes sind optimal haben minimale mittlere Codewortlänge unter allen präfixfreien Codes Huffman Encoder Blöcke fester Länge Codeworte variabler Länge NTM, 2006/05, 9.3 Quellencodierung, Rur, 3

Huffman-Algorithmus 1. Symbole nach Wahrscheinlichkeiten ordnen und Knoten eines Baums zuweisen 2.zwei Symbole mit kleinster Wahrscheinlichkeit in neuem Symbol zu- sammenfassen, neuer Knoten hat Summe der Wahrscheinlichkeiten 3.wenn nur noch 2 Symbole bzw. Knoten übrig bleiben, 4. sonst 2. 4.von der Wurzel aus bei jeder Verzweigung nach oben eine „0“ und nach unten eine „1“ eintragen (auch umgekehrt möglich) Beispiel: DMS mit H(X) = 2 bit / Symbol, Alphabet A = {A,B,C,D,E} 0A1/2 100B1/8 101C1/8 110D1/8 111E1/8 1/4 1/ Wurzel R = E[L] = (1/2)·1+4·(1/8)·3 = 2 bit / Symbol Code ist optimal! D. Huffman (1952) NTM, 2006/05, 9.3 Quellencodierung, Rur, 4

Huffman-Codierung (2) Rate bzw. mittlere Codewortlänge L(x): Länge des dem Symbolwert x zugeordneten Codeworts Codierung von n Symbolen einer DMSH(X) ≤ R < H(X) + 1/n gilt auch für Quellen mit Gedächtnis, wenn H die Entropierate darstellt => R -> H(X) von oben, Gleichheit wenn P X (x m )=2 -α M-wertige Huffman-Codes => Algorithmus einfach erweiterbar Nachteile 1.Huffman-Codes hängen stark von der Quellenstatistik ab 2.Quellenstatistik muss im voraus bekannt sein (ev. zuerst „messen“) 3.Komplexität wächst exponentiell mit der Blocklänge n NTM, 2006/05, 9.3 Quellencodierung, Rur, 5

JPEG Gemeinsames Standardisierungsprojekt von CCITT und ISO JPEG steht für Joint Photographic Experts Group Start 1987, erster Draft-Standard 1991, heute weit verbreitet verlustbehaftetes Kompressionsverfahren für natürliche Bilder für Grafiken usw. PNG-Bilddatenkompression vorteilhafter Wichtigste Schritte 1.Transformation Farbbilder RGB => Luminanz / Chrominanz Auge ist viel empfindlicher auf kleine Helligkeitsunterschiede (Luminanz) als auf kleine Farbunterschiede (Chrominanz) Vorbereitung für Datenkompression, kein Informationsverlust 2.Downsampling der beiden Chrominanz-Komponenten Reduktion 2 Chrominanz-Komponenten um Faktor 2 oder 4 NTM, 2006/05, 9.3 Quellencodierung, Rur, 6

JPEG 3.Pixel-Gruppierung Farbkomponenten in 8x8 Blöcke Ausnützung der horizontalen und vertikalen Korrelation Blöcke werden separat komprimiert (Schwachstelle!) 4.Diskrete Cosinus Transformation (8x8 DCT) Transformation in den Frequenzbereich Vorbereitung für Datenkompression DC und 3-4 tieffrequente AC-Werte enthalten „Bildinformation“ 5.Individuelle Quantisierung einzelner Frequenzkomponenten Prinzip: Frequenzkomponenten mit viel bzw. wenig Bildinformation werden fein bzw. grob quantisiert 6.Entropy-Coding der quantisierten Frequenzkomponenten verlustlos, Kombination von RLE und Huffman 7.Addition von Header und JPEG-Parameter NTM, 2006/05, 9.3 Quellencodierung, Rur, 7

JPEG Blockverarbeitung 2D- DCTQuantizer Entropy Encoder Compressed Data 8x8 Blöcke 2D- IDCTDequantizer Entropy Decoder rekonstruierte Blöcke NTM, 2006/05, 9.3 Quellencodierung, Rur, 8

24 Bit / Pixel Originalbild mit True Color Auflösung Bit / Pixel (Kompressionsfaktor ) Normalerweise nicht vom Original unterscheidbar. Genügt den höchsten professionellen Anforderungen Bit / Pixel (Kompressionsfaktor ) Exzellente Qualität. Genügt den meisten Anforderungen Bit / Pixel (Kompressionsfactor ) Gute bis sehr gute Qualität. Genügend für viele Anwendungen Bit / Pixel (Kompressionsfaktor ) Bescheidene bis gute Qualität. Genügend für gewisse Anwendungen. JPEG - Kompressionsfaktor und Bildqualität NTM, 2006/05, 9.3 Quellencodierung, Rur, 9

Audiokompression Schritte der Digitalisierung Abtastung: verlustlos wenn Rate f s [Sps] > 2 x Signalbandbreite Quantisierung: verlustbehaftet, ca. 6 dB SNR pro Bit Auflösung Referenz-Datenraten PCM-Telefonie: 8 kSps x 8 Bit/S = 64 kb/s Hz für Sprachverständlichkeit ausreichend CD-Audio: 2 x 44.1 kSps x 16 Bit/S ≈ 1.4 Mb/s (netto, Stereo) 20-20‘000 Hz und 90 dB Dynamik, Ziel klangtreue Wiedergabe Kompressionsfaktoren (LPC)-Vocoder: typ. Datenreduktion 1:5 => 13 kb/s (GSM-Qualität) MP3: typ. Datenreduktion 1:10…12 => 128…112 kb/s NTM, 2006/05, 9.3 Quellencodierung, Rur, 10

Übersicht LPC-Sprachkompression Approximation Entstehungsprozess des Sprachsignals Modellierung menschlicher Vokaltrakt (à priori Wissen) Kompression durch Übertragung Filterparameter, benutzte Quelle, Pitch-Frequenz, Lautstärke GSM-Vocoder: 13 kb/s Rausch- generator Puls- generator Allpol- Filter Parameter Approximation ms Sprachburst Pitchfrequenz NTM, 2006/05, 9.3 Quellencodierung, Rur, 11

MPEG / Audio MPEG: Motion Pictures Experts Group Audio- und Videokompression im Auftrag ISO und IEC MPEG Audio Standard umfasst 3 Layers hierarchische Kompressionsmethoden jeder Layer ohne Video für Audiokompression verwendbar auch in DAB, DVB und DRM eingesetzt Arbeiten dauerten von 1988 bis 1992 Layer 3 am bekanntesten (MP3) beste Kompression, aber am kompliziertesten Typische Datenreduktion bzw. Datenrate (Stereo) (Quelle: [4]) Layer 1: typ. Datenreduktion 1:4 => 384 kb/s Layer 2: typ. Datenreduktion 1:6…8 => 256…192 kb/s Layer 3: typ. Datenreduktion 1:10…12 => 128…112 kb/s kleinere Datenraten bei kleinerer Audiobandbreite NTM, 2006/05, 9.3 Quellencodierung, Rur, 12

Ruhehörschwelle und Lautstärkeempfindung stark frequenzabhängig im Bereich 20-20‘000 Hz max. Empfindlichkeit im Bereich 2-4 kHz Frequenz-Maskierung leise Töne in der Nähe eines dominanten Tons werden „verdeckt“ Maskierungseffekt hängt von der Frequenz ab 27 kritische Bänder identifiziert (0-50 Hz, …, Hz) Zeitliche Maskierung kurzzeitige Empfindlichkeitsreduktion nach prägnantem Hörereignis 10ms wenig empfindlich, ab 200ms wieder voll empfindlich f Mithörschwelle unhörbare Töne hörbare Töne Menschliches Hörsystem NTM, 2006/05, 9.3 Quellencodierung, Rur, 13

MPEG-Audiokompression Filterbank psychoakust. Modell Quantisierer Codierer Grundstruktur (MUSICAM: masking pattern universal subband integrated coding and multiplexing) Multiplexer Coder berechnet für jedes Teilband Mithörschwelle + Quantisierungsstufenhöhe Layer 1 (mono) 32 Teilbänder je mit einer Abtastfrequenz von 48/32 kHz = 1.5 kHz 12 Samples werden zu einem Block von 8ms Dauer zusammengefasst Header 12 Bit Sync 20 Bit Info Kanalcode (16 Bit, optional) Bit- Zuweisung 4 Bit/Band Skalen- faktoren 6 Bit/Band 32x12 Samples je mit 0…15 Bit NTM, 2006/05, 9.3 Quellencodierung, Rur, 14

576 Teilbänder (polyphase + MDCT) Huffmann-Coding (häufige kleine Werte => kürzere Codeworte) nichtlinear Quelle: [4] MP3 NTM, 2006/05, 9.3 Quellencodierung, Rur, 15