Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

“But life is short and information endless...” Aldous Huxley

Ähnliche Präsentationen


Präsentation zum Thema: "“But life is short and information endless...” Aldous Huxley"—  Präsentation transkript:

1 “But life is short and information endless...” Aldous Huxley
Kompression “But life is short and information endless...” Aldous Huxley

2 Überblick Einführung & Grundlagen Dekorrelation Quantisierung
DCT (JPEG) DWT (JPEG2000) Quantisierung Entropiekodierung Huffman Run Length Encoding Arithmetische Codes Bitplane Coding Predictive Coding Fraktale Kompression Videokompression

3 Einführung Rasterung und Abtastung einer Intensitätsfunktion von Licht erzeugt große Datenmengen → hohe Anforderungen an die Datenspeicherung Datenübertragung Wunsch nach kompakterer Darstellung/ Repräsentation digitaler Bilder und Videos

4 Einführung Multimedia Data Grösse/Dauer Bits/Pixel bzw. Bits/Sample
Unkomprimierte Größe (in bytes) Übertragungs-bandbreite (in bits) 1 Seite Text A4 variable Auflösung 4-8 kB 32-64 kbit/Seite Telefon (Sprachqualität) 10 sec 8 bps 80 kB 64 kbit/s Graustufenbild 512x512 262 kB 2.1 Mbit/Bild Farbbild 24 bpp 786 kB 6.29 Mbit/Bild Medizinische Bilddaten 2048x2048 12 bpp 5.16 MB 41.3 Mbit/Bild 7.2 Megapixel Bild 3000x2400 20.59 MB 165 MBit/Bild SD-Video (PAL Auflösung) 720x576, 1 min, 25 FPS MB (1 min.) Mbit/s HD-Video 1920x1080 (interlaced) 9.33 GB (1 min.) 1.24 GBit/s

5 Einführung Problemstellungen: Elimination von Redundanz
Reduktion der Daten zur Repräsentation einer gegebenen Menge an visueller Information Elimination von Redundanz Algorithmische Transformation in einen statistisch unkorrellierten Datensatz und anschließender Kodierung Reduktion von Information, die für eine bestimmte Anwendung nicht interessant ist Elimination von Irrelevanz Verringerung der Genauigkeit der Darstellung

6 Grundlagen Information: Reduktion von Unsicherheit (Claude Shannon)
Die minimale Anzahl an ja/nein Fragen um eine Information eindeutig zu bestimmen Informationsgehalt einer Information mit der Auftrittswahrscheinlichkeit p

7 Grundlagen Shannon Entropie:
Maß zur statistischen Bestimmung des Informationsgehaltes einer Informationsquelle erlaubt die Bestimmung der minimalen Länge einer kodierten “Nachricht” Entropie einer Quelle dessen Alphabet aus den Symbolen i mit Auftrittswahrscheinlichkeit pi besteht Annahme: Statistische Unabhängigkeit der Symbole

8 Grundlagen Daten Mittel zur Darstellung von Information
Folgen von 0 und 1 Existenz mehrerer verschiedener Datendarstellungen für dieselbe Information Teile der Daten enthalten keine Information Datenredundanz

9 Kompression Modell Klassifikation Verlustlose Kompression
Verlustbehaftete Kompression Kompression Originaldaten Komprimierte Daten Rekonstruktion Dekompression

10 Rate-Distortion-Theory: Rate
Datenrate Kompressionsrate Redundanz (nBits-Source: Quell-Wortlänge , nBits-Code: Kodierungs-Wortlänge)

11 Rate-Distortion-Theory: Distortion
Größe des „Fehlers“ der durch die Kompression entstanden ist Äussert sich in Form von Kompressionsartefakten Gemessen durch Vergleich einer Rekonstruktion mit dem Original durch eine Metrik Typische Metrik: Mean Squared Error (MSE) Abgeleitete Qualitätsmetrik: Peak Signal to Noise Ratio (PSNR) Faustregel: 1 bpp mehr an Datenrate 6dB mehr an Qualität

12 Rate-Distortion-Theory: R/D - Kurve

13 Redundanzen Kodierungen Nachbarschaftsbeziehungen räumlich
zeitlich (Video)

14 Nachbarschaftsbeziehungen
Histogramm Histogramm

15 Psychovisuelle Eindrücke
Wahrnehmungsmodell des Menschen → z.B. Farbauflösung des menschlichen Auges Abhängig von der Anwendung

16 Psychovisuelle Eindrücke
16 Graustufen mit Improved Gray-Scale Quantization (IGS) 256 Graustufen 16 Graustufen (normal)

17 Kompressionspipeline
Ratenallozierung Originaldaten Farbtrafo Dekorrelations Transformation Quantisierung Entropie Kodierung Komprimierte Daten Rekonstruktion Inverse Farbtrafo Inverse Dekorrelations Transformation Dequantisierung Entropie Dekodierung Dekompression

18 Farbtransformation RGB YCbCr Effekte: Dekorrelation
Anpassung an Psychovisuelle Eindrücke Gröbere Darstellung der Farbkanäle Subsampling in JPEG

19 Dekorrelation: Wahl der Transformation
Fourier Discrete Cosine Transform (JPEG) Walsh-Hadamard Discrete Wavelet Transform (JPEG 2000)

20 Dekorrelation: DCT in JPEG
Pseudofrequenzdarstellung Exzellente Datendekorrelation Energie im Direct Current Koeffizient konzentriert Alternating Current Koeffizienten üblicherweise klein Koeffizienten enthalten keine Ortsinformation Aufteilung in Blöcke erforderlich Effiziente SW, beschleunigte HW

21 Dekorrelation: DCT in JPEG
Differenzsignal

22 Dekorrelation: DCT in JPEG

23 Dekorrelation: DWT in JPEG2000
(Kontinuierliche) Wavelet-Transformation: mit „Mutter“-Wavelet: Verwandt mit Fourier-Transformation, aber mit lokalem Support durch „Fensterung“! Beispiele für Mutter-Wavelets

24 Dekorrelation: DWT in JPEG2000
Diskrete Wavelet-Transformation kann als „Multi-skalenfilter“ implementiert werden → Diskretisierung der Parameter a und b! 2. Iteration Originalbild 1. Iteration

25 Dekorrelation: DWT in JPEG2000

26 Dekorrelation: DWT in JPEG2000

27 DWT vs. DCT

28 Quantisierung Quantisierung: Abbildung einer wertkontinuierlichen Quelle in eine wertdiskrete Quelle Dequantisierung:Rekonstruktion der wertkontinuierlichen Quelle aus einer wertdiskreten Quelle Reduktion von Irrelevanz (Verlustbehaftet!)

29 Quantisierung: Schwellwert-Kodierung
Standard-Basis (Ortsbereich) Transformation Rücktransformation 691 636 543 203 301 429 161 211 12 63 95 81 106 94 17 -39 -7 -26 -4 29 5 7 -8 -1 -0 1 8 6 -6 -9 3 14 -2 -3 4 -11 2 691 636 543 203 301 429 161 211 63 95 81 106 94 -39 -26 29 Transformierte Basis („Frequenzbereich“) Quantisierung → resultierender Fehler im Ortsbereich: ~37.4

30 Quantisierung in JPEG Standard-Basis (Ortsbereich)
10 15 25 66 51 37 82 100 19 28 67 52 39 83 101 35 72 58 45 88 105 130 119 111 142 156 79 54 94 114 103 127 89 76 Transformation Rücktransformation 691 636 543 203 301 429 161 211 12 63 95 81 106 94 17 -39 -7 -26 -4 29 5 7 -8 -1 -0 1 8 6 -6 -9 3 14 -2 -3 4 -11 2 69 42 22 3 6 12 2 1 -1 690 630 550 198 306 444 164 200 15 57 84 67 104 78 -28 Quantisierung Dequantisierung Transformierte Basis („Frequenzbereich“)

31 Quantisierung in JPEG © Girod – Video and Image Compression

32 Quantisierung in JPEG © Girod – Video and Image Compression

33 Quantisierung in JPEG Original 142738 byte 75% 8065 byte 25% 3815 byte
100% 31810 byte 50% 5640 byte 10% 2334 byte 1% 1310 byte

34 Entropiekodierung Variable-Length Coding Bit-Plane Coding
Huffman Code Arithmetischer Code Bit-Plane Coding Bit-Plane Slicing / Run-Length Coding Predictive Coding

35 Entropiekodierung: Huffman Code
Codewörter variabler Länge (ganzzahlige Anzahl von Bits) Repräsentation von Zeichen mit größerer Wahrscheinlichkeit durch kürzere Codewörter Codierung durch Erzeugen eines Huffman-Codebaumes Präfix-Eigenschaft eindeutige Dekodierung Anwendung in JPEG

36 Entropiekodierung: Variable Length Coding

37 Entropiekodierung: Huffman Code
0.36 0.36 0.12 0.22 0.10 0.08 0.06 a6,a7 a0 a1 a2 a3 a4 a5 0.36 0.12 0.22 0.10 0.08 a5,a6,a7 a0 a1 a2 a3 a4 0.36 0.18 0.22 0.12 a3,a4 a5,a6,a7 a0 a1 a2 a2,a5,a6,a7 0.60 0.40 a0,a2,a5,a6,a7 a1,a3,a4 0.24 0.36 a0 0.22 0.18 a3,a4 a1 a0 0.22 a1 0.12 a2 0.10 a3 0.08 a4 0.06 a5 0.04 a6 0.02 a7

38 Entropiekodierung: Huffman Code
0.36 0.36 0.36 0.36 0.36 0.40 0.60 a3,a0,a4,a0,a2 a7 a3 a5 a4 a6 a0 a1 a2 00 10 010 011 110 111 0111 0110 01110 01111 00 11 10 010 011 00 01 10 11 1 00 01 0.22 0.22 0.22 0.22 0.24 0.36 0.40 1 0.12 0.12 0.12 0.18 0.22 0.24 0.10 0.10 0.12 0.12 0.18 0.08 0.08 0.10 0.12 0.06 0.06 0.08 0.04 0.06 0.02 aufwendige Konstruktion !

39 Entropiekodierung: Arithmetischer Code
Codierung der gesamten Nachricht als ein Codewort keine Diskrepanz zwischen Codewortlänge und Informationsgehalt Repräsentation eines Codewortes durch ein Intervall reeller Zahlen zwischen 0.0 und 1.0 Codierung durch sukzessive Verkleinerung des Intervalls Anwendung eines binären adaptiven arithmetischen Coders (MQ-Coder) in JPEG2000

40 Entropiekodierung: Arithmetischer Code
a7 a3 a5 a4 a6 a0 a1 a2 0.7 0.736 0.758 0.77 0.78 0.788 0.794 0.8 a7 a3 a5 a4 a6 a0 a1 a2 0.7 0.7252 0.7288 0.736 a7 a3 a5 a4 a6 a0 a1 a2 0.7288 a7 a3 a5 a4 a6 a0 a1 a2 0.7288 a0 0.36 a1 0.58 a2 0.7295 0.70 a3 0.80 a4 a5 0.88 a6 0.94 a7 1 a3 a0 a4 a0 a2

41 Entropiekodierung: Run-Length Coding
Binärbild Kodierung Ausnutzung der Redundanz benachbarter Pixel 3 4 2 1 6 24 bit 20 bit 18 bit 3 2 1 2 Bit Code 3 Bit Code 3 4 2 1 6

42 Entropiekodierung: Bit-Plane Coding
Bit-Plane Slicing

43 Entropiekodierung: Bit-Plane Coding
1 → → → → 0011 … Bit-Plane Slicing: Binäre Kodierung

44 Entropiekodierung: Bit-Plane Coding
1 → → → → → 0110 … Bit-Plane Slicing: Gray Code

45 Entropiekodierung: Bit-Plane Coding
Graycode Graycode

46 Entropiekodierung: Bit-Plane Coding in JPEG2000 (EBCOT)
Binäre adaptive arithmetische Kodierung (MQ-Coder) DWT+ Quantisierung Berechnung von Datenrate / Distortion Sortierung nach Rate/Distortion Verhältnis Komprimierter Datenstrom

47 Entropiekodierung: Bit-Plane Coding in JPEG2000 (EBCOT)
Embedded Block Coding with Optimal Truncation A posteriori Ratenallozierung Implizierte Quantisierung durch Weglassen von einzelnen Bitplanes Abbruch des Kodierens/Dekodierens an einem beliebigen Zeitpunkt: Optimale Beschreibung des Bildes für gegebene Datenrate Ideal für Progressive Decoding (z.B. Erzeugung von Thumbnails)

48 Entropiekodierung: Predictive Coding
+ Symbol Encoder Compressed Image Image _ Nearest Integer Predictor + Compressed Image Symbol Decoder Image + Predictor

49 Entropiekodierung: Predictive Coding

50 Weitere Lempel-Ziv-Welch-Algorithmus (LZW)
GIF,TIFF, … “Online”-Codebucherstellung Kombination von Variable Length und Run-Length Coding Löschen niederwertiger Bits beim Bit-plane coding

51 Fraktale Kompression Nutzung von Redundanz in Bildern durch Selbstähnlichkeit Fraktale - Selbstähnliche Geometrische Figuren: … und in der Natur Künstlich erzeugt …

52 Fraktale Kompression Prinzip Kodierung: (1) Modelliere das Bild als Resultat eines iterativen Kopiervorgangs (= iteriertes Funktionensystem)

53 Fraktale Kompression Prinzip Kodierung: (2) Ermittle die Parameter der Kopiermaschine. Suche für alle Blöcke in Domain den best-passenden Block in Range, unter Nutzung erlaubter Transformationen (z.B. Rotation, Helligkeitsanpassung, Spiegelung, …)

54 Fraktale Kompression Das komprimierte Bild besteht nur aus den Parametern der in der Kodierung gefundenen Transformationen Dekodierung: Kopiere wiederholt ein Ausgangsbild mit der Kopiermaschine

55 Fraktale Kompression

56 Fraktale Kompression vs JPEG
Fraktal Komprimiert (72:1) JPEG Komprimiert (71:1)

57 Fraktale Kompression Weitere Varianten: Quadtree-Zerlegung, …
Hohe Kompressionsraten erzielbar (bis zu 1000:1) Asymmetrisches Verfahren: Kodierung wesentlich aufwendiger als Dekodierung Dekodierung vom Ausgangsbild abhängig Fractal Image Format (FIF) Keine Durchsetzung am Markt, u.a. wegen Patentschutz und mangelnder Verbreitung im Internet Moderne verwandte Verfahren: Bild-Interpolation (Up-scaling)

58 Video Folge von Einzelbilder PAL-Format 240 MBit/s oder 30 MByte/s
720x576 Pixel - 24 Bit Farbtiefe 25 Bildern pro Sekunde Y (Helligkeitsinformation), Cb (blau-gelb-Balance) und Cr (rot-grün-Balance) YCbCr 4:2:2 240 MBit/s oder 30 MByte/s drastische Reduzierung der Datenmenge notwendig

59 Einzelbildkompression
JPEG/JPEG2000 für jedes Bild? JPEG-Video, Motion-JPEG, Moving JPEG JPEG 2000 – Part 3: Motion JPEG 2000 (Digitales Kino) Kompressionsraten bis zu 1:20 Kompression / Dekompression mit gleichem Zeitaufwand Zugriff auf jedes Einzelbild unmittelbar möglich

60 Kompression von Bildgruppen
Intraframekompression Einzelbildkompression (räumlichen Redundanz) Interframekompression Kompression durch Vergleich aufeinanderfolgender Bilder (zeitlichen Redundanz) Gruppenaufteilung (Group of Pictures – GOP) Gruppen von Bildern, die zusammenhängend komprimiert werden

61 Bildgruppen Intrapicture (I-Bild) Predicted picture (P-Bild)
komprimiert / dekomprimiert wie einzelnes Standbild Referenz für nachfolgende P-Bilder sowie vorhergehende und nachfolgende B-Bilder Predicted picture (P-Bild) Interframe-Kodierung mit Bezug auf vorhergehendes I-Bild bzw. P-Bild (Referenzbild) Speicherung des Verschiebungsvektor eines Bildbereiches Bidirectional picture (B-Bild) Bezug auf vorhergehendes und nachfolgendes Bild Idee: Bewegliche Bildteile verdecken Hintergrund (in I-Bild zu finden) oder geben ihn frei (in P-Bild zu finden)

62 B-Frames Bilder können durch vorausgegangene und nachfolgende Frames geschätzt werden. Beispiel: In Frame n+1 kann das schwarze Objekt nicht aus Frame n, aber aus Frame n+2 geschätzt werden (wegen Verdeckung). Frame n Frame n+1 Frame n+2

63 B-Frame Kodierung

64 Videokompression Transformationskodierung Bewegungskompensation

65 Beispiel MPEG2 Datenrate von 2 bis 6 MBit üblich GOP = 12 Bilder
Standardformat bei DVD, DVB Kompressionsrate bis zu 1:60 Nachfolger ist MPEG4 + H.264 (HDTV) Erweiterung von MPEG2, u.a. mit Objektkodierung, Zerlegung des Bildes in Szenenelemente, …


Herunterladen ppt "“But life is short and information endless...” Aldous Huxley"

Ähnliche Präsentationen


Google-Anzeigen