Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

JPEG Ingo Kregel Layout: R G B Lila: 99 41 49 Blau: 0 48 94.

Ähnliche Präsentationen


Präsentation zum Thema: "JPEG Ingo Kregel Layout: R G B Lila: 99 41 49 Blau: 0 48 94."—  Präsentation transkript:

1 JPEG Ingo Kregel Layout: R G B Lila: Blau:

2 Gliederung Einleitung und Überblick Visuelle Wahrnehmung und Farbräume
Angewandte Komprimierungsverfahren Die JPEG-Modi Ausblick

3 Einleitung JPEG: Joint Photographic Experts Group
Zusammenschluss von Gruppen der ISO – International Organization for Standardization ITU-T – International Telegraph and Telephone Consultative Committee Erstes Ziel: Kompressionsverfahren für ISDN-Kanäle

4 Einleitung Ausschreibung eines Wettbewerbs Anforderungen:
Parametrisierbarkeit der Qualität Unterstützung verschiedenster Farbräume, Bildgrößen und Inhalte Annehmbare Komplexität in Bezug auf Implementierung und Ausführung Sequenzielle, progressive, verlustlose und hierarchische Modi Gewinner der Ausschreibung: Die Diskrete Kosinustransformation (DCT)

5 Einleitung 1992: Veröffentlichung des JPEG-Standards Heute:
“Information technology – Digital compression and coding of continuous-tone still images: Requirements and guidelines” ISO/IEC CCITT (ITU-T) Recommendation T.81 Heute: Verbreitetstes Grafikformatik der Welt Verwendung im prof. Layoutbereich, Speicherung medizinischer Daten, digitaler Videotechnik (MPEG), WWW… Aus 12 eingereichten Methoden

6 Ordnungsrahmen

7 Ordnungsrahmen

8 Gliederung Einleitung und Überblick Visuelle Wahrnehmung und Farbräume
Komprimierungsverfahren Die JPEG-Modi Fazit & Ausblick

9 Visuelle Wahrnehmung des Menschen
Bildkompression auch im menschlichen Gehirn Bsp.: Verhältnis von Rezeptoren zu Nervenfasern im Auge 80:1 Optische Täuschungen: Illusion über Farben, geometrische Formen, Bewegungen… Ruhende Bilder erhalten höhere Auflösung als bewegte Helligkeitsunterschiede werden stärker wahrgenommen als Farbunterschiede Forschungsfeld der Wahrnehmungspsychologie, Psychophysik

10 Ordnungsrahmen

11 RGB Rot, Grün, Blau Entspricht der Technik in Farbmonitoren
8 Bit: 0-255 Hexadezimal: 00-ff Bildquelle: Wikipedia

12 YCbCr Ursprung: Umstieg von S/W auf Farbfernsehen Wikipedia-Zitat:
„Diese Darstellung verwendet die Besonderheit des Auges, für grünes Licht besonders empfindlich zu sein. Daher steckt die meiste Information über den Grünanteil (und damit indirekt für dessen Komplementärfarbe Violett) in der Grundhelligkeit Y und man braucht daneben nur noch die Abweichungen beim Rot/Türkis- oder Blau/Gelb-Anteil darzustellen. „

13 Y Cb Cr YCbCr + Wikipedia-Zitat:
„Danach werden diese Werte mit einer bestimmten Auflösung digitalisiert und mit einem Offset versehen, woraus die YCbCr-Werte folgen. Der Offset ist deswegen notwendig, da vor allem bei digitalen Videodaten bestimmte Werte wie 0 und 255 für spezielle Steueraufgaben (Synchronisation) reserviert sind und nicht als Helligkeits- bzw. Farbwert im Datenstrom vorkommen dürfen. Die Werte im Bereich „Reserve oben“ bzw. „Reserve unten“ geben Bereiche an die für die Übersteuerung der Videosignale reserviert sind und normalerweise nicht verwendet werden sollten. „ +

14 Tiefpassfilterung „Chroma Subsampling“ Unterabtastung der Chrominanzen
Ausnutzung der visuellen Wahrnehmung des Menschen Datenreduktion: 4:4:4 24 Bit volle Informationsdichte 4:2:2 16 Bit Halbierung der Chrominanzen (horizontal) 4:2:0 12 Bit Horizontale und Vertikale Halbierung der Chrom. 4:2:2 Helligkeit nicht gespart, Machsche Bänder, Helligkeitsunterschiede stark sichtbar Tiefpassfilterung: „Als Tiefpass bezeichnet man in der Elektronik Filter, die Signalanteile mit Frequenzen unterhalb ihrer Grenzfrequenz annähernd ungeschwächt passieren lassen, Anteile mit hohen Frequenzen dagegen abschwächen. „ (Wikipedia)

15 Gliederung Einleitung und Überblick Visuelle Wahrnehmung und Farbräume
Angewandte Komprimierungsverfahren Die JPEG-Modi Fazit und Ausblick

16 Gliederung – Kapitel 3 Die Diskrete Kosinus-Transformation (DCT)
Quantisierung Prädiktion Lauflängenkodierung (RLC) Entropiekodierung Huffman-Kodierung Arithmetische Kodierung

17 Diskrete Kosinus-Transformation
1972 Ahmed, Natarajan und Rao Weiterentwicklung der Fourier-Transformation Aufgrund ihrer guten Kompressionseigenschaften in meisten verlustbehafteten Verfahren zur Bild- und Videokompression eingesetzt Vorbereitung: Aufteilen der Grafik in 8x8-Blöcke Farbige Grafiken entsprechen mehrstufiger Verarbeitung von Graustufenbildern

18 Diskrete Kosinus-Transformation
Berechnungsvorschriften:

19 Diskrete Kosinus-Transformation
Vollständiges Beispiel:

20 Diskrete Kosinus-Transformation
Ausschnitt 1: Koeffizient bei (0; 0)

21 Diskrete Kosinus-Transformation
Ausschnitt 2: Koeffizient bei (1; 1) +

22 Diskrete Kosinus-Transformation
Vollständiges Beispiel:

23 Quantisierung Division der Bildwerte durch Quantisierungsmatrix
Aufstellen solcher Matrizen nach Versuchsreihen Quantisierungswerte unterschiedlich optimal, je nach Anwendungsgebiet und Grafikeigenschaften Genutzte Q-Matrix wird in JPEG-Datei mit gespeichert

24 Quantisierung Komprimierung: Rekonstruktion:
Quantisierung ist die Hauptursache für Qualitätsverluste der DCT-basierten Verfahren

25 Quantisierung Zusammenhang:

26 Quantisierung Vergleich von Original- und rekonstruierten Werten:

27 Prädiktion Unterschiedliche Behandlung der Komponenten jedes 8x8-Blocks DC – Direct Current AC – Alternating Current

28 Prädiktion DC: Speicherung Mittelwerts des gesamten 8x8-Blocks
Ableitung dieses Koeffizienten aus dem Vorgängerblock Speicherung der Differenz, statt absoluten Werts „Üblicherweise werden die Abstände in verschiedene Größenkategorien unterteilt, die in Form von Tabellen im Bild mitgespeichert werden, damit sie im Dekodierungsprozess korrekt zurückübersetzt werden können. „

29 Lauflängenkodierung Effektiv für Symbolfolgen mit häufigen Wiederholungen Ziel: Ersetzen von Wiederholungen durch Tokens Ein Token besteht aus 3 Elementen: ESC Escape-Zeichen r Lauflänge s Zu ersetzendes Symbol Effizient daher erst ab Folge von 4 Symbolen

30 Lauflängenkodierung Beispiel: Symbolfolge: 15400000013
Ersetzen der Nullen durch ein Token Escape-Zeichen hier: $ Länge: 6 Ersetztes Symbol: 0 Token: 154$6013

31 Lauflängenkodierung Anwendung in JPEG:
Überführen der DCT-Matrix in eine eindimensionale Symbolfolge durch Zickzack-Abtastung

32 Lauflängenkodierung Günstige Eigenschaften quantisierter Matrizen:

33 Entropiekodierung Entropie (Informationstheorie):
„Mittlere Informationsdichte“ Entropiekodierung ist verlustfrei! Optimierung des Speicherplatzes einer gegebenen Symbolfolge Reduktion der zu speichernden Symbole ist Aufgabe vorhergehender Komprimierungsmethoden

34 Gliederung Einleitung und Überblick Visuelle Wahrnehmung und Farbräume
Komprimierungsverfahren Die JPEG-Modi Sequenziell vs. Progressiv Hierarchisch Baseline-Kodierung und Erweiterungen Verlustfreie Kompression Rekonstruktion Fazit & Ausblick

35 Sequenzielle Verarbeitung
Nur ein Durchlauf Jeder 8x8-Block nacheinander Es wird nur exakt der Speicher benötigt, den das Bild auch einnimmt Simple Vorgehensweise  Schlanke Implementierung und geringe Ausführungszeit

36 Progressive Verarbeitung
Unter Umständen sind andere Eigenschaften von größerem Vorteil Übertragung der Information in mehreren Schritten Erster Durchlauf: sehr grobe Auflösung Verfeinerung des Ergebnisses bei weiteren Durchläufen durch zusätzliche Koeffizienten

37 Progressive Verarbeitung
2 Unterarten der progressiven Kodierung: Spektrale Selektion: Tieffrequente Koeffizienten werden vor höherfrequenten Koeffizienten übertragen Schrittweise Verfeinerung: Senden der oberen Bits, bevor die niedrigeren Bits das Bild vervollständigen Vorteile dieser Verarbeitungsweise: Bei geringer Bandbreite für den Empfang Vorschaumöglichkeit  Betrachter kann das Laden abbrechen Geringere Auflösung kann ggf. genügen

38 Hierarchische Verarbeitung
Sonderform des progressiven Verfahrens Aufbau der Grafik in mehreren Ebenen Erste Ebene erzeugt mehrfach unterabgetastetes, unscharfes Bild Aufwärtstasten auf weitere Ebenen  Hochrechnen auf größere Auflösung Werte der Hochrechnung dienen als Prognosewerte nach dem Prädiktionsverfahren Verfahren bei niedrigen Bitraten gut geeignet, Mehraufwand bei höheren Bitraten bis zu 33%

39 Hierarchische Verarbeitung
Schema:

40 Baseline-Standard & Erweiterungen
Baseline-Standard: Mindestbedingungen Diskrete Kosinustransformation, ausschließlich sequenziell 8 Bit pro Bildpunkt Nur Huffman-Kodierung nutzbar Maximal 2 Tabellen für Kodierung der AC- und DC-Koeffizienten Erweiterter Standard: Progressive und sequenzielle Speicherung möglich Auch 12 Bit Entscheidung zwischen Arithmetischer Kodierung und Huffman Maximal 4 Tabellen für Kodierung der AC- und DC-Koeffizienten

41 Verlustfreie Kompression
Unterschiede: Wahl der Bildauflösung von 2-16 Bit Verzicht auf DCT und Quantisierung Ausschließliche Nutzung der Prädiktion

42 Verlustfreie Kompression

43 Verlustfreie Kompression
Nicht Schwerpunkt der Entwicklungsarbeit Durchschnittlich komplexe farbige Grafiken: 50% Kompression 1994 JPEG-LS-Standard: Speziell verlustfreie Kodierung Bessere Ergebnisse als integrierte Modi in JPEG oder JPEG2000

44 Rekonstruktion

45 Gliederung Einleitung und Überblick Visuelle Wahrnehmung und Farbräume
Angewandte Komprimierungsverfahren Die JPEG-Modi Ausblick

46 Ausblick: JPEG2000 2000: ISO 15444, Nachfolger des JPEG-Standards
Waveletbasierte Transformation Flexibler Zugriff: Änderungen ohne Rekompression Entnahme von Ausschnitten oder geringerer Auflösung aus einer Datei möglich Verbreitung bisher aufgrund der Zufriedenheit mit JPEG gering JPEG-LS-Standard oder PNG-Format für bestimmte Grafiken effizienter

47 Literatur Literatur: Eric Hamilton: JPEG File Interchange Format, Version 1.02, World Wide Web Consortium (W3C), 1995. Rainer Röhler: Sehen und Erkennen - Psychophysik des Gesichtssinnes, 1. Auflage, Springer-Verlag, 1995. Tilo Strutz: Bilddatenkompression, 3. Auflage, Vieweg-Verlag, 2005. Gregory K. Wallace: The JPEG Still Picture Compression Standard, überarbeitete Version des Artikels vom April 1991, IEEE Transactions on Consumer Electronics, Dez

48 BACKUP

49 Machsche Bänder Bildquelle: Rainer Röhler: Sehen und Erkennen - Psychophysik des Gesichtssinnes

50 YUV Abb. zu einigen beispielhaften Luminanzwerten: Bildquelle:
Johns Hopkins Association for Computing Machinery

51 YUV Umrechnung aus dem RGB-Modell: Wertebereich:

52 YCbCr Phase-Alternation-Line-System (PAL)
Übergang vom Schwarz-Weiß- zum Farbfernsehen, Abwärtskompatibilität gewünscht Entwicklung des YUV-Modells Trennung von Helligkeit und Farbe

53 Weitere Informationen zu YCbCr
Bildquelle:  Couleur.org +

54 YCbCr Umrechnung aus dem RGB-Modell: Wertebereich: +
Videotechnik: Reservierung von 0 und 255 für Steueraufgaben (Synchronisation) Weiterer reservierter Bereich: Übersteuerung der Videosignale Wikipedia-Zitat: „Danach werden diese Werte mit einer bestimmten Auflösung digitalisiert und mit einem Offset versehen, woraus die YCbCr-Werte folgen. Der Offset ist deswegen notwendig, da vor allem bei digitalen Videodaten bestimmte Werte wie 0 und 255 für spezielle Steueraufgaben (Synchronisation) reserviert sind und nicht als Helligkeits- bzw. Farbwert im Datenstrom vorkommen dürfen. Die Werte im Bereich „Reserve oben“ bzw. „Reserve unten“ geben Bereiche an die für die Übersteuerung der Videosignale reserviert sind und normalerweise nicht verwendet werden sollten. „ +

55 Weitere Informationen zu YCbCr
RGB YCbCr 16, 16, 16 16, 128, 128 0, 0, 0 0, 128, 128 255, 172, 255 255, 255, 255 199, 0, 235 0, 255, 255 0, 83, 0 53, 255, 17 255, 0, 0 0, 255, 0 182, 13, 30 199, 0, 0 0, 36, 235 0, 0, 255 255, 128, 128 RGB-YCbCr-Umwandlungsgenerator: YCbCr zu RGB RGB zu YCbCr -

56 YCbCr Umstieg auf digitales Fernsehen Wikipedia-Zitat:
„Diese Darstellung verwendet die Besonderheit des Auges, für grünes Licht besonders empfindlich zu sein. Daher steckt die meiste Information über den Grünanteil (und damit indirekt für dessen Komplementärfarbe Violett) in der Grundhelligkeit Y und man braucht daneben nur noch die Abweichungen beim Rot/Türkis- oder Blau/Gelb-Anteil darzustellen. „

57 YCbCr Umstieg auf digitales Fernsehen Wikipedia-Zitat:
„Diese Darstellung verwendet die Besonderheit des Auges, für grünes Licht besonders empfindlich zu sein. Daher steckt die meiste Information über den Grünanteil (und damit indirekt für dessen Komplementärfarbe Violett) in der Grundhelligkeit Y und man braucht daneben nur noch die Abweichungen beim Rot/Türkis- oder Blau/Gelb-Anteil darzustellen. „

58 Quantisierung Empfehlung für Quantisierungs-Matrizen aus dem JPEG-Standard: Luminanz Chrominanz

59 Quantisierung Beispiel einer Quantisierung und Wiederherstellung:

60 Entropiekodierung Erster Schritt: Ermittlung der Auftrittshäufigkeit jedes Symbols Zeichen mit hoher Häufigkeit erhalten eine kurze Bitkodierung und umgekehrt Historisches Beispiel: Morse-Code Bildquelle:

61 Huffman-Kodierung 1952 David Huffman
Verbesserung des Shannon-Fano-Verfahrens Beispiel: Alphabet: Wahrscheinlichkeiten:

62 Huffman-Kodierung

63 Huffman-Kodierung

64 Huffman-Kodierung B A C D

65 Arithmetische Kodierung
Im Gegensatz zu Huffman Suche nach optimalem Codewort für gesamte Symbolfolge Darstellung des Codewortes als reelle Zahl [0; 1) Sukzessive Verkleinerung dieses Intervalls Beispiel mit gleiche Ausgangsdaten: Alphabet: Wahrscheinlichkeiten:

66 Arithmetische Kodierung

67 Arithmetische Kodierung
Kodierung der Symbolfolge BACD durch binären Wert aus dem Intervall

68 Vergleich beider Entropiekodierungen
Effektivitätsvorteil der A.K.: Sie besitzt nicht die untere Grenze von 1 Bit pro Symbol, da sie die gesamte Folge kodiert Daher: Bessere Annäherung an Signalentropie Nachteile: Speicherung des Signalwortes für Computer aufwändig Übertragung der Symbole kann erst erfolgen, wenn gesamtes Signal dekodiert wurde „In der Praxis wurden mittlerweile Algorithmen entwickelt, die diese Probleme umgehen können, beispielsweise durch eine hinreichende Annäherung mit ganzen Zahlen als Intervallgrenzen. Auch Lösungsvorschläge zur schrittweisen Übertragung der Code-Informationen könnten die Arithmetische Kodierung für ein zukünftiges Datenformat attraktiv machen. „ (Seminararbeit)

69 Weitere Informationen zu DCT
Bildquelle: -


Herunterladen ppt "JPEG Ingo Kregel Layout: R G B Lila: 99 41 49 Blau: 0 48 94."

Ähnliche Präsentationen


Google-Anzeigen