Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Huffman – Kodierbaum zur Textkompression

Ähnliche Präsentationen


Präsentation zum Thema: "Huffman – Kodierbaum zur Textkompression"—  Präsentation transkript:

1 Huffman – Kodierbaum zur Textkompression
LK Informatik Huffman – Kodierbaum zur Textkompression

2 Huffman Baum LK Informatik Textkompression
ASCII-Darstellung: Jedes Zeichen 1 Byte Unicode-Darstellung: Jedes Zeichen 2 Byte Speicherbedarf proportional zur Textlänge 1 Taschenbuch (300 Seiten à 45 Zeilen à 60 Zeichen): = 300*45*60 = Byte ≈ 791 KB Kompaktere Speicherung erwünscht. Idee 1: häufig vorkommende Wörter durch Sondercode ersetzen z.B. BEGIN → £ ; END → ¥ usw. Idee 2: häufig vorkommende Buchstaben durch kürzeren Code, seltene durch längeren Code darstellen z.B. e → 10 ; x → usw.

3 Huffman Baum LK Informatik Das Morsealphabet
Jeder Buchstabe wird durch eine Folge von '·' und '-' dargestellt. Häufig vorkommende Zeichen haben eine kurze Darstellung z.B. : e = · Seltene Zeichen werden durch lange Kombinationen dargestellt: z.B. : y = -·-- Problem: Wie erkennt man das Ende eines Zeichens ? Lösung 1: Spezielles Zeichen für Zeichenende z.B. : Ende = Pause Lösung 2: Verwendung eines Präfix-Codes kein Code ist Anfang eines anderen Codes

4 Huffman Baum LK Informatik Präfix - Code
Jeder Code ist eindeutig aus einem Strom von Codierungen wiederherstellbar. Dies geht dann, wenn kein Code Anfang eines anderen Codes ist. Beispiel: Wie erkennt man das Ende eines Zeichens ? Die Folge lässt sich ohne weitere Hilfen aus der Codetabelle zurückübersetzen. W A S S E R

5 Huffman Baum LK Informatik Erzeugung eines Präfix-Codes nach Huffman
Als Beispiel sollen die Buchstaben e, b, c, d, f, a kodiert werden. Die Häufigkeit der Buchstaben ist willkürlich angenommen. Die Reihenfolge ist hier zum Zeichnen günstig gewählt E B C D F A 0,4 0,05 0,04 0,15 0,16 0,2

6 Huffman Baum LK Informatik Erzeugung eines Präfix-Codes nach Huffman
Prinzip: Die jeweils kleinsten Einheiten werden zu einem Baum vereinigt. 1,00 0,60 0,24 0,09 0,36 E B C D F A 0,4 0,05 0,04 0,15 0,16 0,2

7 Huffman Baum LK Informatik Huffman-Baum → Huffman-Code
Linke Zweige = 1 Rechte Zweige = 0 1,00 1 E 0,60 0,4 0,24 0,36 0,09 D F A 0,15 0,16 0,2 B C 0,05 0,04


Herunterladen ppt "Huffman – Kodierbaum zur Textkompression"

Ähnliche Präsentationen


Google-Anzeigen