“But life is short and information endless...” Aldous Huxley

Slides:



Advertisements
Ähnliche Präsentationen
Inhalt Bildparameter Bildquellen Bildgröße/Bildformat Bildauflösung Farbtiefe Farbmodus Scannen Monitor Dateiformat Bildausschnitt Tonwertkorrektur.
Advertisements

Datenkompressionsverfahren für mobile Endgeräte
christiane, steffen und stephan
6. Digitale Datendarstellung
Information - syntaktisch
Übung 2.1 Information Wieviele Fragen benötigen Sie beim „Zahlenraten“
Dr. Monique Jucquois-Delpierre
Bilder und Rasterdaten
2.1 Kodierung von Zeichen 2.2 Kodierung von Zahlen
Arithmetische Kodierung
Kompressionsverfahren für Texte
WS Algorithmentheorie 02 - Polynomprodukt und Fast Fourier Transformation Prof. Dr. Th. Ottmann.
Kompressionsverfahren (für Texte)
Predictability and redundancy of natural images Daniel Kersten Referentin: Anna-Lena Richter.
Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.
Mathematische Grundlagen der Video – Kompression
Datenmanagement in Sensornetzen PRESTO - Feedback gesteuertes Datenmanagement - SS 2007 Sören Wenzlaff.
Grafikkomprimierung Andreas Pretzsch.
Embedded Systems Ausgewählte Themen (ES-M) Beuth-Hochschule WS 2010 Oliver Lietz Dipl.-Ing. Digitale Videotechnik.
PowerPoint-Folien zur 5. Vorlesung „Evolutionsstrategie II“
Peter Brichzin, Gymnasium Ottobrunn – Bausteine zur Medienkompetenz
Bildtransformationen
Medien- Technik Datei-Formate: TIFF Tagged Image File Format.tif.tiff.
Huffman Entropie-Codierung Codierung mit variabler Länge
Komprimierung PCM-Daten
Dateiformate .jpeg Verlustbehaftete Kompression.
AWA 2007 Natur und Umwelt Natürlich Leben
20:00.
PlakaDiva 2014 – Anmeldeformular Digital Out of Home Bitte machen Sie auf der folgenden Seite alle Angaben in Zusammenhang mit der von Ihnen eingereichten.
Videokonferenzsysteme
DivX3 IT Referat DIVX 3.
FHP - Fachbereich Bauingenieurwesen
BILDFORMATE von Margarita Isjurowa.
Information und Kommunikation
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Information und Kommunikation
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Java, Java, Java R. Morelli
Theorie Praktische Beispiele
Daniela Wurhofer und Ismail Karagöz
Theorie Praktische Beispiele
Symmetrische Blockchiffren DES – der Data Encryption Standard
Digitale Bilder Advanced IT Basics
PlakaDiva 2014 – Anmeldeformular Mediastrategie Out of Home Bitte machen Sie auf der folgenden Seite alle Angaben in Zusammenhang mit der von Ihnen eingereichten.
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
Praxismodul 7 Agenda für heute, 15. Juni, 2006 Dateiformate
Kompressionsprinzipien bei digitalen Bildern
PlakaDiva 2014 – Anmeldeformular Kreation Out of Home Bitte machen Sie auf der folgenden Seite alle Angaben in Zusammenhang mit der von Ihnen eingereichten.
Fourier-Analyse und technologische Anwendungen
Rechnersysteme Marcel Waldvogel. Marcel Waldvogel, IBM Zurich Research Laboratory, Universität Konstanz, , 2  Wer bin ich?  Die Vorlesung.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation III Vorlesung 1 WS 2001/02 Punkt-in-Landkarte I (Streifenkarte)
VTK-Filter für effizientes netzwerkbasiertes Rendern inkl. Interaktionsmöglichkeit.
Videoformate ... gibt es nicht?! Gute Quellen:
Theorie Praktische Beispiele
System zur Videokompression Simone Buzzi Simon Häne Giuseppe Schiavello.
Teilnahmeformular Beste Innovative Nutzung Out of Home.
Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde IV: Bildverarbeitung IV Köln 15. Januar 2015.
Kompressionsverfahren
Teilnahmeformular Beste Kreation Out of Home. Teilnahmeformular Beste Kreation Out of Home Allgemeine Infos In der Kategorie Beste Kreation OOH geht es.
Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde III: Bildverarbeitung III Köln 2. Dezember.
Quantisierung Seminar Multimediadatenformate Oliver Richter.
Ein Referat von Robert Becker
Information - syntaktisch
Hausaufgabe und Bildformate
Image compression Seminar : Bildverarbeitung und Computer Vision
Quellencodierung NTM, 2006/05, 9.3 Quellencodierung, Rur, 1 Referenzen [1]Proakis, Salehi, „Grundlagen der Kommunikationstechnik“, Pearson, [2]D.
Faltungscodes Vorteile
Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.
Digitales Video I ● Wie wird Video am Computer codiert? ● Bilder – Auflösung – Speicherung am Computer ● Bewegte Bilder – Interlacing – Kompression / Codec.
1 Standards zur Kompression von Videodaten. 2 Rahmenbedingungen Eigenschaften des menschlichen Auges: Fließende Bewegung ab ca. 20 Bilder/s Flimmerverschmelzungsfrequenz.
 Präsentation transkript:

“But life is short and information endless...” Aldous Huxley Kompression “But life is short and information endless...” Aldous Huxley

Überblick Einführung & Grundlagen Dekorrelation Quantisierung DCT (JPEG) DWT (JPEG2000) Quantisierung Entropiekodierung Huffman Run Length Encoding Arithmetische Codes Bitplane Coding Predictive Coding Fraktale Kompression Videokompression

Einführung Rasterung und Abtastung einer Intensitätsfunktion von Licht erzeugt große Datenmengen → hohe Anforderungen an die Datenspeicherung Datenübertragung Wunsch nach kompakterer Darstellung/ Repräsentation digitaler Bilder und Videos

Einführung Multimedia Data Grösse/Dauer Bits/Pixel bzw. Bits/Sample Unkomprimierte Größe (in bytes) Übertragungs-bandbreite (in bits) 1 Seite Text A4 variable Auflösung 4-8 kB 32-64 kbit/Seite Telefon (Sprachqualität) 10 sec 8 bps 80 kB 64 kbit/s Graustufenbild 512x512 262 kB 2.1 Mbit/Bild Farbbild 24 bpp 786 kB 6.29 Mbit/Bild Medizinische Bilddaten 2048x2048 12 bpp 5.16 MB 41.3 Mbit/Bild 7.2 Megapixel Bild 3000x2400 20.59 MB 165 MBit/Bild SD-Video (PAL Auflösung) 720x576, 1 min, 25 FPS 933.12 MB (1 min.) 124.42 Mbit/s HD-Video 1920x1080 (interlaced) 9.33 GB (1 min.) 1.24 GBit/s

Einführung Problemstellungen: Elimination von Redundanz Reduktion der Daten zur Repräsentation einer gegebenen Menge an visueller Information Elimination von Redundanz Algorithmische Transformation in einen statistisch unkorrellierten Datensatz und anschließender Kodierung Reduktion von Information, die für eine bestimmte Anwendung nicht interessant ist Elimination von Irrelevanz Verringerung der Genauigkeit der Darstellung

Grundlagen Information: Reduktion von Unsicherheit (Claude Shannon) Die minimale Anzahl an ja/nein Fragen um eine Information eindeutig zu bestimmen Informationsgehalt einer Information mit der Auftrittswahrscheinlichkeit p

Grundlagen Shannon Entropie: Maß zur statistischen Bestimmung des Informationsgehaltes einer Informationsquelle erlaubt die Bestimmung der minimalen Länge einer kodierten “Nachricht” Entropie einer Quelle dessen Alphabet aus den Symbolen i mit Auftrittswahrscheinlichkeit pi besteht Annahme: Statistische Unabhängigkeit der Symbole

Grundlagen Daten Mittel zur Darstellung von Information Folgen von 0 und 1 Existenz mehrerer verschiedener Datendarstellungen für dieselbe Information Teile der Daten enthalten keine Information Datenredundanz

Kompression Modell Klassifikation Verlustlose Kompression Verlustbehaftete Kompression Kompression Originaldaten Komprimierte Daten Rekonstruktion Dekompression

Rate-Distortion-Theory: Rate Datenrate Kompressionsrate Redundanz (nBits-Source: Quell-Wortlänge , nBits-Code: Kodierungs-Wortlänge)

Rate-Distortion-Theory: Distortion Größe des „Fehlers“ der durch die Kompression entstanden ist Äussert sich in Form von Kompressionsartefakten Gemessen durch Vergleich einer Rekonstruktion mit dem Original durch eine Metrik Typische Metrik: Mean Squared Error (MSE) Abgeleitete Qualitätsmetrik: Peak Signal to Noise Ratio (PSNR) Faustregel: 1 bpp mehr an Datenrate 6dB mehr an Qualität

Rate-Distortion-Theory: R/D - Kurve

Redundanzen Kodierungen Nachbarschaftsbeziehungen räumlich zeitlich (Video)

Nachbarschaftsbeziehungen Histogramm Histogramm

Psychovisuelle Eindrücke Wahrnehmungsmodell des Menschen → z.B. Farbauflösung des menschlichen Auges Abhängig von der Anwendung

Psychovisuelle Eindrücke 16 Graustufen mit Improved Gray-Scale Quantization (IGS) 256 Graustufen 16 Graustufen (normal)

Kompressionspipeline Ratenallozierung Originaldaten Farbtrafo Dekorrelations Transformation Quantisierung Entropie Kodierung Komprimierte Daten Rekonstruktion Inverse Farbtrafo Inverse Dekorrelations Transformation Dequantisierung Entropie Dekodierung Dekompression

Farbtransformation RGB YCbCr Effekte: Dekorrelation Anpassung an Psychovisuelle Eindrücke Gröbere Darstellung der Farbkanäle Subsampling in JPEG

Dekorrelation: Wahl der Transformation Fourier Discrete Cosine Transform (JPEG) Walsh-Hadamard Discrete Wavelet Transform (JPEG 2000)

Dekorrelation: DCT in JPEG Pseudofrequenzdarstellung Exzellente Datendekorrelation Energie im Direct Current Koeffizient konzentriert Alternating Current Koeffizienten üblicherweise klein Koeffizienten enthalten keine Ortsinformation Aufteilung in Blöcke erforderlich Effiziente SW, beschleunigte HW

Dekorrelation: DCT in JPEG Differenzsignal

Dekorrelation: DCT in JPEG

Dekorrelation: DWT in JPEG2000 (Kontinuierliche) Wavelet-Transformation: mit „Mutter“-Wavelet: Verwandt mit Fourier-Transformation, aber mit lokalem Support durch „Fensterung“! Beispiele für Mutter-Wavelets

Dekorrelation: DWT in JPEG2000 Diskrete Wavelet-Transformation kann als „Multi-skalenfilter“ implementiert werden → Diskretisierung der Parameter a und b! 2. Iteration … Originalbild 1. Iteration

Dekorrelation: DWT in JPEG2000

Dekorrelation: DWT in JPEG2000

DWT vs. DCT

Quantisierung Quantisierung: Abbildung einer wertkontinuierlichen Quelle in eine wertdiskrete Quelle Dequantisierung:Rekonstruktion der wertkontinuierlichen Quelle aus einer wertdiskreten Quelle Reduktion von Irrelevanz (Verlustbehaftet!)

Quantisierung: Schwellwert-Kodierung Standard-Basis (Ortsbereich) Transformation Rücktransformation 691 636 543 203 301 429 161 211 12 63 95 81 106 94 17 -39 -7 -26 -4 29 5 7 -8 -1 -0 1 8 6 -6 -9 3 14 -2 -3 4 -11 2 691 636 543 203 301 429 161 211 63 95 81 106 94 -39 -26 29 Transformierte Basis („Frequenzbereich“) Quantisierung → resultierender Fehler im Ortsbereich: ~37.4

Quantisierung in JPEG Standard-Basis (Ortsbereich) 10 15 25 66 51 37 82 100 19 28 67 52 39 83 101 35 72 58 45 88 105 130 119 111 142 156 79 54 94 114 103 127 89 76 Transformation Rücktransformation 691 636 543 203 301 429 161 211 12 63 95 81 106 94 17 -39 -7 -26 -4 29 5 7 -8 -1 -0 1 8 6 -6 -9 3 14 -2 -3 4 -11 2 69 42 22 3 6 12 2 1 -1 690 630 550 198 306 444 164 200 15 57 84 67 104 78 -28 Quantisierung Dequantisierung Transformierte Basis („Frequenzbereich“)

Quantisierung in JPEG © Girod – Video and Image Compression

Quantisierung in JPEG © Girod – Video and Image Compression

Quantisierung in JPEG Original 142738 byte 75% 8065 byte 25% 3815 byte 100% 31810 byte 50% 5640 byte 10% 2334 byte 1% 1310 byte

Entropiekodierung Variable-Length Coding Bit-Plane Coding Huffman Code Arithmetischer Code Bit-Plane Coding Bit-Plane Slicing / Run-Length Coding Predictive Coding

Entropiekodierung: Huffman Code Codewörter variabler Länge (ganzzahlige Anzahl von Bits) Repräsentation von Zeichen mit größerer Wahrscheinlichkeit durch kürzere Codewörter Codierung durch Erzeugen eines Huffman-Codebaumes Präfix-Eigenschaft eindeutige Dekodierung Anwendung in JPEG

Entropiekodierung: Variable Length Coding

Entropiekodierung: Huffman Code 0.36 0.36 0.12 0.22 0.10 0.08 0.06 a6,a7 a0 a1 a2 a3 a4 a5 0.36 0.12 0.22 0.10 0.08 a5,a6,a7 a0 a1 a2 a3 a4 0.36 0.18 0.22 0.12 a3,a4 a5,a6,a7 a0 a1 a2 a2,a5,a6,a7 0.60 0.40 a0,a2,a5,a6,a7 a1,a3,a4 0.24 0.36 a0 0.22 0.18 a3,a4 a1 a0 0.22 a1 0.12 a2 0.10 a3 0.08 a4 0.06 a5 0.04 a6 0.02 a7

Entropiekodierung: Huffman Code 0.36 0.36 0.36 0.36 0.36 0.40 0.60 a3,a0,a4,a0,a2 1100011100010 a7 a3 a5 a4 a6 a0 a1 a2 00 10 010 011 110 111 0111 0110 01110 01111 00 11 10 010 011 00 01 10 11 1 00 01 0.22 0.22 0.22 0.22 0.24 0.36 0.40 1 0.12 0.12 0.12 0.18 0.22 0.24 0.10 0.10 0.12 0.12 0.18 0.08 0.08 0.10 0.12 0.06 0.06 0.08 0.04 0.06 0.02 aufwendige Konstruktion !

Entropiekodierung: Arithmetischer Code Codierung der gesamten Nachricht als ein Codewort keine Diskrepanz zwischen Codewortlänge und Informationsgehalt Repräsentation eines Codewortes durch ein Intervall reeller Zahlen zwischen 0.0 und 1.0 Codierung durch sukzessive Verkleinerung des Intervalls Anwendung eines binären adaptiven arithmetischen Coders (MQ-Coder) in JPEG2000

Entropiekodierung: Arithmetischer Code a7 a3 a5 a4 a6 a0 a1 a2 0.7 0.736 0.758 0.77 0.78 0.788 0.794 0.8 a7 a3 a5 a4 a6 a0 a1 a2 0.7 0.71296 0.72088 0.7252 0.7288 0.73168 0.73384 0.736 a7 a3 a5 a4 a6 a0 a1 a2 0.7288 0.7298368 0.7304704 0.730816 0.731104 0.7313344 0.7315072 0.73168 a7 a3 a5 a4 a6 a0 a1 a2 0.7288 0.729173248 0.729401344 0.72952576 0.72962944 0.729712384 0.729774592 0.7298368 a0 0.36 a1 0.58 a2 0.7295 0.70 a3 0.80 a4 a5 0.88 a6 0.94 a7 1 a3 a0 a4 a0 a2

Entropiekodierung: Run-Length Coding Binärbild Kodierung Ausnutzung der Redundanz benachbarter Pixel 3 4 2 1 6 24 bit 20 bit 18 bit 3 2 1 2 Bit Code 3 Bit Code 3 4 2 1 6

Entropiekodierung: Bit-Plane Coding Bit-Plane Slicing

Entropiekodierung: Bit-Plane Coding 1 → 0000 2 → 0001 3 → 0010 4 → 0011 … Bit-Plane Slicing: Binäre Kodierung

Entropiekodierung: Bit-Plane Coding 1 → 0000 2 → 0001 3 → 0011 4 → 0010 5 → 0110 … Bit-Plane Slicing: Gray Code

Entropiekodierung: Bit-Plane Coding Graycode Graycode

Entropiekodierung: Bit-Plane Coding in JPEG2000 (EBCOT) Binäre adaptive arithmetische Kodierung (MQ-Coder) DWT+ Quantisierung Berechnung von Datenrate / Distortion Sortierung nach Rate/Distortion Verhältnis Komprimierter Datenstrom

Entropiekodierung: Bit-Plane Coding in JPEG2000 (EBCOT) Embedded Block Coding with Optimal Truncation A posteriori Ratenallozierung Implizierte Quantisierung durch Weglassen von einzelnen Bitplanes Abbruch des Kodierens/Dekodierens an einem beliebigen Zeitpunkt: Optimale Beschreibung des Bildes für gegebene Datenrate Ideal für Progressive Decoding (z.B. Erzeugung von Thumbnails)

Entropiekodierung: Predictive Coding + Symbol Encoder Compressed Image Image _ Nearest Integer Predictor + Compressed Image Symbol Decoder Image + Predictor

Entropiekodierung: Predictive Coding

Weitere Lempel-Ziv-Welch-Algorithmus (LZW) GIF,TIFF, … “Online”-Codebucherstellung Kombination von Variable Length und Run-Length Coding Löschen niederwertiger Bits beim Bit-plane coding

Fraktale Kompression Nutzung von Redundanz in Bildern durch Selbstähnlichkeit Fraktale - Selbstähnliche Geometrische Figuren: … und in der Natur Künstlich erzeugt …

Fraktale Kompression Prinzip Kodierung: (1) Modelliere das Bild als Resultat eines iterativen Kopiervorgangs (= iteriertes Funktionensystem)

Fraktale Kompression Prinzip Kodierung: (2) Ermittle die Parameter der Kopiermaschine. Suche für alle Blöcke in Domain den best-passenden Block in Range, unter Nutzung erlaubter Transformationen (z.B. Rotation, Helligkeitsanpassung, Spiegelung, …)

Fraktale Kompression Das komprimierte Bild besteht nur aus den Parametern der in der Kodierung gefundenen Transformationen Dekodierung: Kopiere wiederholt ein Ausgangsbild mit der Kopiermaschine

Fraktale Kompression

Fraktale Kompression vs JPEG Fraktal Komprimiert (72:1) JPEG Komprimiert (71:1)

Fraktale Kompression Weitere Varianten: Quadtree-Zerlegung, … Hohe Kompressionsraten erzielbar (bis zu 1000:1) Asymmetrisches Verfahren: Kodierung wesentlich aufwendiger als Dekodierung Dekodierung vom Ausgangsbild abhängig Fractal Image Format (FIF) Keine Durchsetzung am Markt, u.a. wegen Patentschutz und mangelnder Verbreitung im Internet Moderne verwandte Verfahren: Bild-Interpolation (Up-scaling)

Video Folge von Einzelbilder PAL-Format 240 MBit/s oder 30 MByte/s 720x576 Pixel - 24 Bit Farbtiefe 25 Bildern pro Sekunde Y (Helligkeitsinformation), Cb (blau-gelb-Balance) und Cr (rot-grün-Balance) YCbCr 4:2:2 240 MBit/s oder 30 MByte/s drastische Reduzierung der Datenmenge notwendig

Einzelbildkompression JPEG/JPEG2000 für jedes Bild? JPEG-Video, Motion-JPEG, Moving JPEG JPEG 2000 – Part 3: Motion JPEG 2000 (Digitales Kino) Kompressionsraten bis zu 1:20 Kompression / Dekompression mit gleichem Zeitaufwand Zugriff auf jedes Einzelbild unmittelbar möglich

Kompression von Bildgruppen Intraframekompression Einzelbildkompression (räumlichen Redundanz) Interframekompression Kompression durch Vergleich aufeinanderfolgender Bilder (zeitlichen Redundanz) Gruppenaufteilung (Group of Pictures – GOP) Gruppen von Bildern, die zusammenhängend komprimiert werden

Bildgruppen Intrapicture (I-Bild) Predicted picture (P-Bild) komprimiert / dekomprimiert wie einzelnes Standbild Referenz für nachfolgende P-Bilder sowie vorhergehende und nachfolgende B-Bilder Predicted picture (P-Bild) Interframe-Kodierung mit Bezug auf vorhergehendes I-Bild bzw. P-Bild (Referenzbild) Speicherung des Verschiebungsvektor eines Bildbereiches Bidirectional picture (B-Bild) Bezug auf vorhergehendes und nachfolgendes Bild Idee: Bewegliche Bildteile verdecken Hintergrund (in I-Bild zu finden) oder geben ihn frei (in P-Bild zu finden)

B-Frames Bilder können durch vorausgegangene und nachfolgende Frames geschätzt werden. Beispiel: In Frame n+1 kann das schwarze Objekt nicht aus Frame n, aber aus Frame n+2 geschätzt werden (wegen Verdeckung). … … Frame n Frame n+1 Frame n+2

B-Frame Kodierung

Videokompression Transformationskodierung Bewegungskompensation

Beispiel MPEG2 Datenrate von 2 bis 6 MBit üblich GOP = 12 Bilder Standardformat bei DVD, DVB Kompressionsrate bis zu 1:60 Nachfolger ist MPEG4 + H.264 (HDTV) Erweiterung von MPEG2, u.a. mit Objektkodierung, Zerlegung des Bildes in Szenenelemente, …