Huffman Entropie-Codierung Codierung mit variabler Länge

Slides:



Advertisements
Ähnliche Präsentationen
Randomisierte Algorithmen Präfix Suche und Konsistentes Hashing
Advertisements

Algorithm Engineering
Motivation Bisher: Codes mit möglichst kurzer Codelänge.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (26-Graphenalgorithmen: Wiederholung und Übung) Prof. Th. Ottmann.
Das LCA – Problem in Suffixbäumen
B-Bäume.
Kapitel 6: Klassifizierung von Sortiertechniken
Information - syntaktisch
Greedy-Algorithmus Greedy-Algorithmen sind mit dem dynamischen Programmieren verwandt, jedoch einfacher. Die Grundsituation ist dieselbe: Es geht um ein.
11. Datenkomprimierung Bei den meisten bisher betrachteten Algorithmen wurde vor allem das Ziel verfolgt, möglichst wenig Zeit aufzuwenden, und erst in.
Übung 2.1 Information Wieviele Fragen benötigen Sie beim „Zahlenraten“
Friedhelm Meyer auf der Heide 1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität Universelle Turingmaschinen Eine universelle Turingmaschine.
Knotentheorie Vorlesung WS 2003/04 Prof. Dr. Dörte Haftendorn Universität Lüneburg.
Baumstrukturen Richard Göbel.
2.1 Kodierung von Zeichen 2.2 Kodierung von Zahlen
Konstruktion von Suffix Bäumen
Suche in Texten: Suffix-Bäume
Kompressionsverfahren für Texte
Kompressionsverfahren (für Texte)
Konstruktion von Suffix Bäumen
WS Prof. Dr. Th. Ottmann Algorithmentheorie 09 - Suche in Texten Suffix –Tree –Konstruktion Ukkonen Algorithmus.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (17 – Bäume: Grundlagen und natürliche Suchbäume) Prof. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen 09 - Weitere Sortierverfahren Heapsort-Nachtrag Prof. Th. Ottmann.
Algorithmen und Datenstrukturen
WS Prof. Dr. Th. Ottmann Algorithmentheorie 09 - Suche in Texten Suffix - Bäume.
EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido
EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido
EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido
EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido
EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido
Huffmans Kompressionsverfahren
Kap. 6.2 Binäre B-Bäume Ullmann: (2, 3) - Bäume
Christian Schindelhauer
Kompressionsverfahren für Audio
Videotechnik.
Medien- Technik Millennium Edition Buch Zeitschrift Plakat Prospekt Schallplatte Kassette CD Hörfunk Film Video Fernsehen Animation Multimedia Internet.
Medien- Technik Datei-Formate: TIFF Tagged Image File Format.tif.tiff.
Audio-Kompression: MPEG
O Digitale Schriften Schööön ! Rasterschriften Umriss-Schriften
Mikrofon Wandlertechnik: Dynamisches M. Bändchen-M.
Digital Audio Medientyp digital audio representation
Grafikkarten Makroaufnahme Monitor mit Ordner-Icon
Dateiformate .jpeg Verlustbehaftete Kompression.
Datenformate: Text und Bild
Barcodes und QR Codes Universität zu Köln
2. Die rekursive Datenstruktur Baum 2
Gierige Methoden "kurzsichtig handeln, langfristig gewinnen"
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation I Vorlesung 11 WS 2000/2001 Gerhard Gröger Einführung in ArcInfo 8 -
Information und Kommunikation
Information und Kommunikation
Christian Scheideler Institut für Informatik Universität Paderborn
Animation von Dijkstra
Algorithmus von Dijkstra. 0 Algorithmus von Dijkstra s Priority Queue PQ: Knoten, Priorität Weglänge Kandidatenmenge.
Animation von Dijkstra
Java, Java, Java R. Morelli
Jamshid Azizi: Folie Isomorphietest Jamshid Azizi
Informatik Datenstruktur Graph 3.3 Durchlaufen von Graphen
Christian Schindelhauer Wintersemester 2006/07 5. Vorlesung
Christian Schindelhauer Wintersemester 2006/07 6. Vorlesung
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Informatik III Christian Schindelhauer Wintersemester.
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Informatik III Christian Schindelhauer Wintersemester.
B A Materialien für den Technik-Unterricht Bereich: Steuerungstechnik
Dr.-Ing. R. Marklein - GET I - WS 06/07 - V Grundlagen der Elektrotechnik I (GET I) Vorlesung am Fr. 08:30-10:00 Uhr; R (Hörsaal)
Codierung Teil 1 Datenkomprimierung Teil 2 Kanalcodierung.
Information - syntaktisch
Algorithmen und Datenstrukturen Prof. Dr. Ralf Möller Universität zu Lübeck Institut für Informationssysteme Stefan Werner (Übungen) sowie viele Tutoren.
Programmiersprachen II Vorbesprechung Klausur Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Programmiersprachen II Fortsetzung Datenstrukturen Balancierte Bäume 3 Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Huffman – Kodierbaum zur Textkompression
Der Dijkstra-Algorithmus
 Präsentation transkript:

Huffman Entropie-Codierung Codierung mit variabler Länge Statistisches Verfahren: Prinzip: Häufig vorkommende Zeichen durch kurze Bitfolgen darstellen

Präfix-Codes Telefon-Nummern und Vorwahlen sind Präfix-Codes 0261 Koblenz/Rhein Es gibt keine Vorwahlen 02610..., 02611.., 02612,.. Große Orte haben kurze Vorwahlen, kleine längere 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 Koblenz/Rhein

Präfix-Codes Telefon-Nummern und Vorwahlen sind Präfix-Codes 110 Notruf Es gibt keine Rufnummern 110... 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 Fano-Bedingung: Wenn kein Codewort Präfix eines anderen Codewortes ist,dann ist jede codierte Zeichenfolge decodierbar. Polizei

Binäre Präfixcodes Zeichenfolge 1 abacabaca besteht aus 1 1 1 5 a 1 1 abacabaca Codes 1 besteht aus 1 1 1 1 5 a 1 2 b 00 2 c 01 00 01 00 01 Konkatenation der Kantenmarkierungen von der Wurzel bis in die Blätter liefert Präfixcodes ! Oder so ... Codierung für abacabaca 1001011001011 Ist das die kürzeste Präfixfolge ?

Huffman-Algorithmus Input: Zeichenfolge aus einem Alphabet Output: Binärer Baum, Knotenmarkierung=Häufigkeiten, Kantenmarkierungen 0,1 Start: Zähle die Häufigkeit jedes Zeichens im Text, erzeuge für jedes Zeichen einen Knoten markiert mit der Häufigkeit Wiederhole, bis es keinen Knoten gibt, zu dem keine Kante führt: Wähle 2 Knoten, zu denen keine Kante hinführt, mit kleinster Häufigkeit. Erzeuge neuen Knoten mit der Summe der Häufigkeiten der gewählten Knoten. Ziehe zwei Kanten von dem neuen Knoten zu den gewählten. Markiere die zwei von einem Knoten ausgehenden Kanten unterschiedlich mit 0 und 1.

Huffman-Code „Meerrettich“ 1 1 1 1 2 2 3 M i c h r t e 1. Zeichen nach Häufigkeit aufsteigend sortieren Knoten mit der Summe der Häufigkeiten markieren 2 2 4 2. Knoten mit geringster Häufigkeit erhalten gemeinsame Wurzel 7 4 11

Huffman-Code „Meerrettich“ 1 1 1 1 2 2 3 M i c h r t e 1 1 1 2 2 4 1 1 7 4 Kanten markieren 1 11

Huffman-Code „Meerrettich“ 1 1 1 1 2 2 3 M i c h r t e e 00 1 1 1 t 2 2 4 r 1 1 7 h 4 c 1 i 11 M

Huffman-Code „Meerrettich“ 1 1 1 1 2 2 3 M i c h r t e e 00 1 1 1 t 010 2 2 4 r 011 1 1 7 h 100 4 c 101 1 i 110 11 M 111

Meerrettich 111 00 00 011 011 00 010 010 110 101 100

Vorlesung „Medientechnik WS 1999/2000“ Dr. Manfred Jackel Studiengang Computervisualistik Institut für Informatik Universität Koblenz-Landau Rheinau 1 56075 Koblenz © Manfred Jackel E-Mail: jkl@uni-koblenz.de WWW: www.uni-koblenz.de/~jkl mtech.uni-koblenz.de Literatur zu diesem Kapitel: Sedgewick: Algorithmen Hyperlinks zu diesem Kapitel Grafik-Quellen