Datenkompression mit der Burrows-Wheeler-Transformation (BWT)

Slides:



Advertisements
Ähnliche Präsentationen
Verschachtelte Schleifen
Advertisements

Rencontres de Moriond Dominik Elsässer Universität Würzburg Dominik Elsässer Universität Würzburg Rencontres de Moriond Indirect Signatures.
Intelligente Dateisysteme Einführende Bemerkungen Manfred Thaller, Universität zu Köln Köln 17. Oktober 2013.
Prof. Dr.-Ing. habil. B. Steinbach - Informatik / Softwaretechnologie und Programmierungstechnik - Institut für Informatik Verteilte Software - Java -
Rethinking Linguistic Relativity John A. Lucy. Gliederung Einführung in das Problem Kritik an bisherigen Untersuchungen der Anthropologen Psycholinguisten.
Binäre Bäume Richard Göbel.
Using TopReX 4.23 – study in HEPG/generator level- by Adonis Papaikonomou for the KA-Top-Meeting 10/23/07 MC production ttop6x (anoTop central sample)
Using TopReX 4.23 – study in HEPG/generator level- by Adonis Papaikonomou for the KA-Top-Meeting 09/25/07 Simulating Problems found in Gen6 simulation.
Using TopReX 4.23 – study in HEPG/generator level- by Adonis Papaikonomou for the KA-Top-Meeting 10/02/07 Simulating Problems found in Gen6 simulation.
Using TopReX 4.23 – study in HEPG/generator level- by Adonis Papaikonomou for the KA-Top-Meeting 10/09/07 Simulating Problems found in Gen6 simulation.
FOR Anweisung.
DO...WHILE Anweisung.
Kompressionsverfahren für Texte
Modulare Programmierung
Gaußscher Algorithmus
Audio-Kompression MPEG Audio MPEG Moving Pictures Experts Group
FH-Hof Sortieren mit Binären Bäumen Richard Göbel.
Hallo/Hi – inf. , (Hello/Hi) Grüß Gott (AUT)/Guten Tag (DE) – f
Adjektive Endungen von Frau Templeton.
Was passt zusammen? Wie sagt man das auf Deutsch?
Direct Objects What are they?. Noun is the subject of the sentence der, die and das are the same –Der Hund ist laut. –Wo ist der Hund? –Das Auto ist laut.
Kapitel 4: Die Schule Deutsch 1
Meine Schulfächer.
Microsoft Dynamics NAV 2009
Die Zählschleife int s = 0 for (int k=1; k
You need to use your mouse to see this presentation © Heidi Behrens.
You need to use your mouse to see this presentation © Heidi Behrens.
You need to use your mouse to see this presentation.
You need to use your mouse to see this presentation © Heidi Behrens.
The passive shifts the emphasis from the subject To the Object Of a sentence.
Mein Alltag 1) Ich verlasse das Haus 2) Ich esse Toast/Müsli
DEUTSCHLAND UND DIE MEDIEN
Algorithm Engineering Schnelles Sortieren Stefan Edelkamp.
Sprechen Deutsch 1 – Seite 25 #15 #1-4 Then have each student say their phone number while the other students write them down.
Virtual Earth Visualisierung von Geodaten Daniel Walzenbach, Microsoft Deutschland GmbH
Einführung in das Wissenschaftliche Arbeiten Andreas Hechenblaickner Programmiersprache Eiffel
Image Processing and Analysis Introduction. How do we see things ?
Premium AEROTEC S.R.L., Brasov Plant Noul spatiu de joaca tematic al Parcului Central Brasov construit de Premium AEROTEC cu sustinerea Primariei Brasov.
© All rights reserved. Zend Technologies, Inc. Jenseits von var_dump(): Debugging in ZF Jan Burkl System Engineer.
Demonstration of Performance of CASCOT 5.0
You need to use your mouse to see this presentation.
You need to use your mouse to see this presentation © Heidi Behrens.
Graphen (1) 1 Helmut Schauer Educational Engineering Lab
You need to use your mouse to see this presentation
You need to use your mouse to see this presentation
AVL-Trees (according to Adelson-Velskii & Landis, 1962) In normal search trees, the complexity of find, insert and delete operations in search.
Bildbearbeitung Einführung. Allgemeines Internet-Browser können nur wenige Bildformate: gif, jpg, png Bilder im Internet müssen schnell angezeigt werden.
Launch ON Global.vi System ID object name classname Services to suscribe Observer Control Ref vi-path Service name Step 1 : Objects register to the Global.vi´s,
Software Prefetching Reduzierung der Miss-Rate Erfordert Prefetch-Instruktionen –Nicht blockierend –Erzeugen keine Ausnahmen Nicht blockierende Caches.
You need to use your mouse to see this presentation
Im Restaurant Zeus war ich eines Abends mit Freunden zum Essen. I was in the restaurant Zeus one evening with friends to eat. Wir haben uns unterhalten.
Kleidung Projekt For this project you will critique 4 or 5 outfits as worn by “celebrities”. You may not write anything on the slide except for maybe a.
Der formelle Imperativ – the Imperative
2004 is speeding by 2004 geht schnell vorbei. Now we need to prepare to face 2005 Jetzt müssen wir uns vorbereiten um 2005 ins Auge zu sehen.
QUIZZ to keep to receive to need to buy to give (present) to sell
You need to use your mouse to see this presentation.
You need to use your mouse to see this presentation.
Berking, C; Hauschild, A; Kölbl, O; Mast, G; Gutzmer, R Basal Cell Carcinoma—Treatments for the Commonest Skin Cancer Dtsch Arztebl Int 2014; 111(22):
MODAL VERBS Used with an infinitive. Können – to be able to (can) ich kann er kann sie kann es kanndu kannst man kannihr könnt wir können sie können Sie.
Was hast du gemacht? Objektiv; To talk about places to stay
Englisch Grundlagen, Modal Verbs
Frage des Tages Bin ich froh, wenn ich heute Abend ___ Hause bin!
Frage des Tages Bitte legen ...
MONTESSORI- METHOD FOR DOGS
Raphael Fischer Informatik II - Übung 03 Raphael Fischer
Telekom Deutschland GmbH, Zentrum Wohnungswirtschaft: Vertriebschancen im Blick mit SAP® Hybris® Cloud for Sales Unternehmen Telekom Deutschland GmbH,
Übungen: Mustererzeugen Januar 19 Grundkurs Informatik.
Enhancement Request Use Plane References in Sketch-Mode as Centerlines Ebenenereferenzen als Mittellinen im Skizzierer nutzbar machen Pro/Engineer Part.
Arrays of Objects, a 3 part process
Heapsort-Algorithmus
 Präsentation transkript:

Datenkompression mit der Burrows-Wheeler-Transformation (BWT) Andreas Junghans, IM2

Inhalt Verfahren zur Datenkompression Die Burrows-Wheeler-Transformation (BWT) Datenkompression mit der BWT Implementierung Zusammenfassung und Ausblick

Verfahren zur Datenkompression verlustfrei und verlustbehaftet Wörterbücher und Statistiken Wörterbücher: schnell Statistiken: gute Kompression BWT BWT

Verfahren zur Datenkompression adaptiv und statisch Ströme und Blöcke Code-Tabelle/Wörterbuch 0010110101011010 0010110101011010 0010110101011010 0010 1101 0101 1010

Die Burrows-Wheeler-Transformation BWT = Vorsortierung (reversible Transformation) verlustfrei statistisch adaptiv oder statisch blockorientiert (ab 100 KB) Geschwindigkeit vergleichbar Wörterbüchern Effizienz vergleichbar Statistiken

Die Burrows-Wheeler-Transformation Vorwärtstransformation HelloCello ooHCeellll

Die Burrows-Wheeler-Transformation Rücktransformation

Die Burrows-Wheeler-Transformation Eigenschaften Gruppen gleicher Zeichen wenige, kurze Unterbrechungen a: rray swap(pStart a: rray localIndex = a: rray * (n a: rray (i.e. the posit a: rray (needed for rec a: rray (which must be A: rray = new byte[1]; a: rray and outputs the a: rray for * sortin a: rray must not be ide a: rray of <code>int</c a: rray of MTF codes

Datenkompression mit der BWT Ablauf BWT MTF RLE + Huffman / AC MTF: Move-To-Front-Coding („Nach-vorne-Codierung“) RLE: Run-Length-Encoding (Lauflängen-Codierung) AC: Arithmetische Codierung

Datenkompression mit der BWT MTF: Move-To-Front-Coding „A“ „A“ „B“ 1 1 1 1 1 „A“ ... ... ... ... 65 „A“ 65 „@“ 65 „@“ 65 „?“ „AAB“ 66 „B“ 66 „B“ 66 „B“ 66 „@“ 65, 0, 66 67 „C“ 67 „C“ 67 „C“ 67 „C“ ... ... ... ... 255 255 255 255 255 255 255 255

Datenkompression mit der BWT MTF: Move-To-Front-Coding

Implementierung Speicher sparen (800 GB vs. 4,4 MB) Effiziente Sortierung RLE vor BWT (Rekursionstiefe!) Huffman mit Codes für 0-Reihen Effizienzvergleich Datei Original WinZip bzip2 Eigenbau SRC-124.pdf 107.864 87.628 (81%) 89.355 (83%) 90.898 (84%) opngl32p.cpp 873.331 76.600 (9%) 52.221 (6%) 57.510 (7%) powerpnt.exe 4.247.604 2.151.382 (51%) 2.030.911 (48%) 2.132.403 (50%)

Zusammenfassung und Ausblick BWT ist Vorsortierung von Daten Ergebnis läßt sich meist sehr gut komprimieren Einsatz von RLE und statistischen Verfahren Andere Kompressionsmöglichkeiten? Andere Transformationen? Verlustbehaftete Kompression?