Präsentation herunterladen
Veröffentlicht von:Baldhild Schiele Geändert vor über 10 Jahren
1
“But life is short and information endless...” Aldous Huxley
Kompression “But life is short and information endless...” Aldous Huxley
2
Überblick Einführung & Grundlagen Dekorrelation Quantisierung
DCT (JPEG) DWT (JPEG2000) Quantisierung Entropiekodierung Huffman Run Length Encoding Arithmetische Codes Bitplane Coding Predictive Coding Fraktale Kompression Videokompression
3
Einführung Rasterung und Abtastung einer Intensitätsfunktion von Licht erzeugt große Datenmengen → hohe Anforderungen an die Datenspeicherung Datenübertragung Wunsch nach kompakterer Darstellung/ Repräsentation digitaler Bilder und Videos
4
Einführung Multimedia Data Grösse/Dauer Bits/Pixel bzw. Bits/Sample
Unkomprimierte Größe (in bytes) Übertragungs-bandbreite (in bits) 1 Seite Text A4 variable Auflösung 4-8 kB 32-64 kbit/Seite Telefon (Sprachqualität) 10 sec 8 bps 80 kB 64 kbit/s Graustufenbild 512x512 262 kB 2.1 Mbit/Bild Farbbild 24 bpp 786 kB 6.29 Mbit/Bild Medizinische Bilddaten 2048x2048 12 bpp 5.16 MB 41.3 Mbit/Bild 7.2 Megapixel Bild 3000x2400 20.59 MB 165 MBit/Bild SD-Video (PAL Auflösung) 720x576, 1 min, 25 FPS MB (1 min.) Mbit/s HD-Video 1920x1080 (interlaced) 9.33 GB (1 min.) 1.24 GBit/s
5
Einführung Problemstellungen: Elimination von Redundanz
Reduktion der Daten zur Repräsentation einer gegebenen Menge an visueller Information Elimination von Redundanz Algorithmische Transformation in einen statistisch unkorrellierten Datensatz und anschließender Kodierung Reduktion von Information, die für eine bestimmte Anwendung nicht interessant ist Elimination von Irrelevanz Verringerung der Genauigkeit der Darstellung
6
Grundlagen Information: Reduktion von Unsicherheit (Claude Shannon)
Die minimale Anzahl an ja/nein Fragen um eine Information eindeutig zu bestimmen Informationsgehalt einer Information mit der Auftrittswahrscheinlichkeit p
7
Grundlagen Shannon Entropie:
Maß zur statistischen Bestimmung des Informationsgehaltes einer Informationsquelle erlaubt die Bestimmung der minimalen Länge einer kodierten “Nachricht” Entropie einer Quelle dessen Alphabet aus den Symbolen i mit Auftrittswahrscheinlichkeit pi besteht Annahme: Statistische Unabhängigkeit der Symbole
8
Grundlagen Daten Mittel zur Darstellung von Information
Folgen von 0 und 1 Existenz mehrerer verschiedener Datendarstellungen für dieselbe Information Teile der Daten enthalten keine Information Datenredundanz
9
Kompression Modell Klassifikation Verlustlose Kompression
Verlustbehaftete Kompression Kompression Originaldaten Komprimierte Daten Rekonstruktion Dekompression
10
Rate-Distortion-Theory: Rate
Datenrate Kompressionsrate Redundanz (nBits-Source: Quell-Wortlänge , nBits-Code: Kodierungs-Wortlänge)
11
Rate-Distortion-Theory: Distortion
Größe des „Fehlers“ der durch die Kompression entstanden ist Äussert sich in Form von Kompressionsartefakten Gemessen durch Vergleich einer Rekonstruktion mit dem Original durch eine Metrik Typische Metrik: Mean Squared Error (MSE) Abgeleitete Qualitätsmetrik: Peak Signal to Noise Ratio (PSNR) Faustregel: 1 bpp mehr an Datenrate 6dB mehr an Qualität
12
Rate-Distortion-Theory: R/D - Kurve
13
Redundanzen Kodierungen Nachbarschaftsbeziehungen räumlich
zeitlich (Video)
14
Nachbarschaftsbeziehungen
Histogramm Histogramm
15
Psychovisuelle Eindrücke
Wahrnehmungsmodell des Menschen → z.B. Farbauflösung des menschlichen Auges Abhängig von der Anwendung
16
Psychovisuelle Eindrücke
16 Graustufen mit Improved Gray-Scale Quantization (IGS) 256 Graustufen 16 Graustufen (normal)
17
Kompressionspipeline
Ratenallozierung Originaldaten Farbtrafo Dekorrelations Transformation Quantisierung Entropie Kodierung Komprimierte Daten Rekonstruktion Inverse Farbtrafo Inverse Dekorrelations Transformation Dequantisierung Entropie Dekodierung Dekompression
18
Farbtransformation RGB YCbCr Effekte: Dekorrelation
Anpassung an Psychovisuelle Eindrücke Gröbere Darstellung der Farbkanäle Subsampling in JPEG
19
Dekorrelation: Wahl der Transformation
Fourier Discrete Cosine Transform (JPEG) Walsh-Hadamard Discrete Wavelet Transform (JPEG 2000)
20
Dekorrelation: DCT in JPEG
Pseudofrequenzdarstellung Exzellente Datendekorrelation Energie im Direct Current Koeffizient konzentriert Alternating Current Koeffizienten üblicherweise klein Koeffizienten enthalten keine Ortsinformation Aufteilung in Blöcke erforderlich Effiziente SW, beschleunigte HW
21
Dekorrelation: DCT in JPEG
Differenzsignal
22
Dekorrelation: DCT in JPEG
23
Dekorrelation: DWT in JPEG2000
(Kontinuierliche) Wavelet-Transformation: mit „Mutter“-Wavelet: Verwandt mit Fourier-Transformation, aber mit lokalem Support durch „Fensterung“! Beispiele für Mutter-Wavelets
24
Dekorrelation: DWT in JPEG2000
Diskrete Wavelet-Transformation kann als „Multi-skalenfilter“ implementiert werden → Diskretisierung der Parameter a und b! 2. Iteration … Originalbild 1. Iteration
25
Dekorrelation: DWT in JPEG2000
26
Dekorrelation: DWT in JPEG2000
27
DWT vs. DCT
28
Quantisierung Quantisierung: Abbildung einer wertkontinuierlichen Quelle in eine wertdiskrete Quelle Dequantisierung:Rekonstruktion der wertkontinuierlichen Quelle aus einer wertdiskreten Quelle Reduktion von Irrelevanz (Verlustbehaftet!)
29
Quantisierung: Schwellwert-Kodierung
Standard-Basis (Ortsbereich) Transformation Rücktransformation 691 636 543 203 301 429 161 211 12 63 95 81 106 94 17 -39 -7 -26 -4 29 5 7 -8 -1 -0 1 8 6 -6 -9 3 14 -2 -3 4 -11 2 691 636 543 203 301 429 161 211 63 95 81 106 94 -39 -26 29 Transformierte Basis („Frequenzbereich“) Quantisierung → resultierender Fehler im Ortsbereich: ~37.4
30
Quantisierung in JPEG Standard-Basis (Ortsbereich)
10 15 25 66 51 37 82 100 19 28 67 52 39 83 101 35 72 58 45 88 105 130 119 111 142 156 79 54 94 114 103 127 89 76 Transformation Rücktransformation 691 636 543 203 301 429 161 211 12 63 95 81 106 94 17 -39 -7 -26 -4 29 5 7 -8 -1 -0 1 8 6 -6 -9 3 14 -2 -3 4 -11 2 69 42 22 3 6 12 2 1 -1 690 630 550 198 306 444 164 200 15 57 84 67 104 78 -28 Quantisierung Dequantisierung Transformierte Basis („Frequenzbereich“)
31
Quantisierung in JPEG © Girod – Video and Image Compression
32
Quantisierung in JPEG © Girod – Video and Image Compression
33
Quantisierung in JPEG Original 142738 byte 75% 8065 byte 25% 3815 byte
100% 31810 byte 50% 5640 byte 10% 2334 byte 1% 1310 byte
34
Entropiekodierung Variable-Length Coding Bit-Plane Coding
Huffman Code Arithmetischer Code Bit-Plane Coding Bit-Plane Slicing / Run-Length Coding Predictive Coding
35
Entropiekodierung: Huffman Code
Codewörter variabler Länge (ganzzahlige Anzahl von Bits) Repräsentation von Zeichen mit größerer Wahrscheinlichkeit durch kürzere Codewörter Codierung durch Erzeugen eines Huffman-Codebaumes Präfix-Eigenschaft eindeutige Dekodierung Anwendung in JPEG
36
Entropiekodierung: Variable Length Coding
37
Entropiekodierung: Huffman Code
0.36 0.36 0.12 0.22 0.10 0.08 0.06 a6,a7 a0 a1 a2 a3 a4 a5 0.36 0.12 0.22 0.10 0.08 a5,a6,a7 a0 a1 a2 a3 a4 0.36 0.18 0.22 0.12 a3,a4 a5,a6,a7 a0 a1 a2 a2,a5,a6,a7 0.60 0.40 a0,a2,a5,a6,a7 a1,a3,a4 0.24 0.36 a0 0.22 0.18 a3,a4 a1 a0 0.22 a1 0.12 a2 0.10 a3 0.08 a4 0.06 a5 0.04 a6 0.02 a7
38
Entropiekodierung: Huffman Code
0.36 0.36 0.36 0.36 0.36 0.40 0.60 a3,a0,a4,a0,a2 a7 a3 a5 a4 a6 a0 a1 a2 00 10 010 011 110 111 0111 0110 01110 01111 00 11 10 010 011 00 01 10 11 1 00 01 0.22 0.22 0.22 0.22 0.24 0.36 0.40 1 0.12 0.12 0.12 0.18 0.22 0.24 0.10 0.10 0.12 0.12 0.18 0.08 0.08 0.10 0.12 0.06 0.06 0.08 0.04 0.06 0.02 aufwendige Konstruktion !
39
Entropiekodierung: Arithmetischer Code
Codierung der gesamten Nachricht als ein Codewort keine Diskrepanz zwischen Codewortlänge und Informationsgehalt Repräsentation eines Codewortes durch ein Intervall reeller Zahlen zwischen 0.0 und 1.0 Codierung durch sukzessive Verkleinerung des Intervalls Anwendung eines binären adaptiven arithmetischen Coders (MQ-Coder) in JPEG2000
40
Entropiekodierung: Arithmetischer Code
a7 a3 a5 a4 a6 a0 a1 a2 0.7 0.736 0.758 0.77 0.78 0.788 0.794 0.8 a7 a3 a5 a4 a6 a0 a1 a2 0.7 0.7252 0.7288 0.736 a7 a3 a5 a4 a6 a0 a1 a2 0.7288 a7 a3 a5 a4 a6 a0 a1 a2 0.7288 a0 0.36 a1 0.58 a2 0.7295 0.70 a3 0.80 a4 a5 0.88 a6 0.94 a7 1 a3 a0 a4 a0 a2
41
Entropiekodierung: Run-Length Coding
Binärbild Kodierung Ausnutzung der Redundanz benachbarter Pixel 3 4 2 1 6 24 bit 20 bit 18 bit 3 2 1 2 Bit Code 3 Bit Code 3 4 2 1 6
42
Entropiekodierung: Bit-Plane Coding
Bit-Plane Slicing
43
Entropiekodierung: Bit-Plane Coding
1 → → → → 0011 … Bit-Plane Slicing: Binäre Kodierung
44
Entropiekodierung: Bit-Plane Coding
1 → → → → → 0110 … Bit-Plane Slicing: Gray Code
45
Entropiekodierung: Bit-Plane Coding
Graycode Graycode
46
Entropiekodierung: Bit-Plane Coding in JPEG2000 (EBCOT)
Binäre adaptive arithmetische Kodierung (MQ-Coder) DWT+ Quantisierung Berechnung von Datenrate / Distortion Sortierung nach Rate/Distortion Verhältnis Komprimierter Datenstrom
47
Entropiekodierung: Bit-Plane Coding in JPEG2000 (EBCOT)
Embedded Block Coding with Optimal Truncation A posteriori Ratenallozierung Implizierte Quantisierung durch Weglassen von einzelnen Bitplanes Abbruch des Kodierens/Dekodierens an einem beliebigen Zeitpunkt: Optimale Beschreibung des Bildes für gegebene Datenrate Ideal für Progressive Decoding (z.B. Erzeugung von Thumbnails)
48
Entropiekodierung: Predictive Coding
+ Symbol Encoder Compressed Image Image _ Nearest Integer Predictor + Compressed Image Symbol Decoder Image + Predictor
49
Entropiekodierung: Predictive Coding
50
Weitere Lempel-Ziv-Welch-Algorithmus (LZW)
GIF,TIFF, … “Online”-Codebucherstellung Kombination von Variable Length und Run-Length Coding Löschen niederwertiger Bits beim Bit-plane coding
51
Fraktale Kompression Nutzung von Redundanz in Bildern durch Selbstähnlichkeit Fraktale - Selbstähnliche Geometrische Figuren: … und in der Natur Künstlich erzeugt …
52
Fraktale Kompression Prinzip Kodierung: (1) Modelliere das Bild als Resultat eines iterativen Kopiervorgangs (= iteriertes Funktionensystem)
53
Fraktale Kompression Prinzip Kodierung: (2) Ermittle die Parameter der Kopiermaschine. Suche für alle Blöcke in Domain den best-passenden Block in Range, unter Nutzung erlaubter Transformationen (z.B. Rotation, Helligkeitsanpassung, Spiegelung, …)
54
Fraktale Kompression Das komprimierte Bild besteht nur aus den Parametern der in der Kodierung gefundenen Transformationen Dekodierung: Kopiere wiederholt ein Ausgangsbild mit der Kopiermaschine
55
Fraktale Kompression
56
Fraktale Kompression vs JPEG
Fraktal Komprimiert (72:1) JPEG Komprimiert (71:1)
57
Fraktale Kompression Weitere Varianten: Quadtree-Zerlegung, …
Hohe Kompressionsraten erzielbar (bis zu 1000:1) Asymmetrisches Verfahren: Kodierung wesentlich aufwendiger als Dekodierung Dekodierung vom Ausgangsbild abhängig Fractal Image Format (FIF) Keine Durchsetzung am Markt, u.a. wegen Patentschutz und mangelnder Verbreitung im Internet Moderne verwandte Verfahren: Bild-Interpolation (Up-scaling)
58
Video Folge von Einzelbilder PAL-Format 240 MBit/s oder 30 MByte/s
720x576 Pixel - 24 Bit Farbtiefe 25 Bildern pro Sekunde Y (Helligkeitsinformation), Cb (blau-gelb-Balance) und Cr (rot-grün-Balance) YCbCr 4:2:2 240 MBit/s oder 30 MByte/s drastische Reduzierung der Datenmenge notwendig
59
Einzelbildkompression
JPEG/JPEG2000 für jedes Bild? JPEG-Video, Motion-JPEG, Moving JPEG JPEG 2000 – Part 3: Motion JPEG 2000 (Digitales Kino) Kompressionsraten bis zu 1:20 Kompression / Dekompression mit gleichem Zeitaufwand Zugriff auf jedes Einzelbild unmittelbar möglich
60
Kompression von Bildgruppen
Intraframekompression Einzelbildkompression (räumlichen Redundanz) Interframekompression Kompression durch Vergleich aufeinanderfolgender Bilder (zeitlichen Redundanz) Gruppenaufteilung (Group of Pictures – GOP) Gruppen von Bildern, die zusammenhängend komprimiert werden
61
Bildgruppen Intrapicture (I-Bild) Predicted picture (P-Bild)
komprimiert / dekomprimiert wie einzelnes Standbild Referenz für nachfolgende P-Bilder sowie vorhergehende und nachfolgende B-Bilder Predicted picture (P-Bild) Interframe-Kodierung mit Bezug auf vorhergehendes I-Bild bzw. P-Bild (Referenzbild) Speicherung des Verschiebungsvektor eines Bildbereiches Bidirectional picture (B-Bild) Bezug auf vorhergehendes und nachfolgendes Bild Idee: Bewegliche Bildteile verdecken Hintergrund (in I-Bild zu finden) oder geben ihn frei (in P-Bild zu finden)
62
B-Frames Bilder können durch vorausgegangene und nachfolgende Frames geschätzt werden. Beispiel: In Frame n+1 kann das schwarze Objekt nicht aus Frame n, aber aus Frame n+2 geschätzt werden (wegen Verdeckung). … … Frame n Frame n+1 Frame n+2
63
B-Frame Kodierung
64
Videokompression Transformationskodierung Bewegungskompensation
65
Beispiel MPEG2 Datenrate von 2 bis 6 MBit üblich GOP = 12 Bilder
Standardformat bei DVD, DVB Kompressionsrate bis zu 1:60 Nachfolger ist MPEG4 + H.264 (HDTV) Erweiterung von MPEG2, u.a. mit Objektkodierung, Zerlegung des Bildes in Szenenelemente, …
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.