Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.

Slides:

Advertisements

Ähnliche Präsentationen

Objektbewegungsdetektion in Bildfolgen

Advertisements

Schnelle Matrizenoperationen von Christian Büttner

Fakultät für Elektrotechnik und Informationstechnik Fachbereich Elektronische Schaltungen und Systeme Technische Universität Ilmenau Jet-Extraktion für.

7. Natürliche Binärbäume

3. Kapitel: Komplexität und Komplexitätsklassen

R. Der - Vorlesung Algorithmen und Datenstrukturen (Magister)

Genetische Algorithmen für die Variogrammanpassung

Modellierung und Schätzung von Variogrammen

Seminar „Extrapolationsmethoden für zufällige Felder“

Theorie psychometrischer Tests, III

Numerik partieller Differentialgleichungen

Formale Sprachen – Mächtigkeit von Maschinenmodellen

Forschungsstatistik II

Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.

Philosophie der Logik nach Frege I

Vorlesung Informatik 2 Algorithmen und Datenstrukturen Halbzeit: Was haben wir bisher gelernt? Prof. Th. Ottmann.

Erkennung von Gesichtsausdrücken anhand von Bildbewegungen (Irfan Essa & Alex Pentland) Hauptseminar Smart Environments Joachim Biggel

§14 Basis und Dimension (14.1) Definition: V sei wieder ein K-Vektorraum. Eine Menge B von Vektoren aus V heißt Basis von V, wenn B ist Erzeugendensystem.

§14 Basis und Dimension  (14.1) Definition: V sei wieder ein K-Vektorraum. Eine Menge B von Vektoren aus V heißt Basis von V, wenn B ist Erzeugendensystem.

Tutorium Willkommen zurück, in der wunderbaren Welt der Statistik Teil II.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

Generalisierte additive Modelle

Betreuer: Christian Fleck

Multikollinearität Wann spricht man von Multikollinearität?

Seminar Stringtheorie und Geometrische Methoden der Physik

Variationsformalismus für das freie Teilchen

Datenverteilung in Ad-hoc Netzen 1/24 Adaptive Datenverteilung in mobilen Ad-hoc Netzen unter Verwendung des Area Graph basierten Bewegungsmodells S. Bittner,

Computergrafik – Inhalt Achtung! Kapitel ist relevant für CG-2!

Effiziente Algorithmen

Ausgleichungsrechnung I

EXCEL PROFESSIONAL KURS

Ausgleichungsrechnung II

Regionalisierte Variablen und Kriging

Quantenchemische Grundlagen (I)

Effiziente Algorithmen

Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/

Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/ /23.1.

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Hartmut Klauck Universität Frankfurt SS

Information und Kommunikation Hartmut Klauck Universität Frankfurt SS

Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/

Information und Kommunikation Hartmut Klauck Universität Frankfurt SS

§23 Basiswechsel und allgemeine lineare Gruppe

Versuch zur Messung der Geschwindigkeit

Kapitel 10 Multikollinearität

Wahrscheinlichkeitsrechnung

Fragen und Einwände hinsichtlich der Möglichkeit einer Schöpfungsforschung Thomas Waschke

Multivariate Statistische Verfahren

ENDLICHE KÖRPER RSA – VERFAHREN.

Klassifikation und Regression mittels neuronaler Netze

1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Informatik III Christian Schindelhauer Wintersemester.

Vom graphischen Differenzieren

SS 2009Maschinelles Lernen und Neural Computation 133 Kapitel 7: Ensemble Methoden.

Wann ist eine Funktion (über den natürlichen Zahlen) berechenbar?

Der A*-Algorithmus.

Deterministische Verfahren

Institut für Informationssysteme Technische Universität Braunschweig Institut für Informationssysteme Technische Universität Braunschweig Verdrängung von.

Testtheorie (Vorlesung 13: ) Wiederholung: Richtigstellung

THz Physik: Grundlagen und Anwendungen

PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.

 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.

Igor Vaynerman ISMOD-V ÜbungSS061 ISMOD-V Übung 3 Igor Vaynerman 8 Juni 2006.

Nicht-negative Matrix Faktorisierung (nMF) Seminar „Sparse Coding“ Autor: Christian Sier.

Aufgabenstellung  gegeben ist die zeitliche Entwicklung der global gemittelten bodennahen Temperatur im Zeitraum (Dateiname= ytemp2m.obs, ascii-

Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.

Präsentation transkript:

Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer

Gliederung 1.Natürliche Videos 1.1 Eigenschaften natürlicher Videos 1.2 Formales Modell 2.Spärliche Kodierung von Videos natürlicher Szenen 2.1 Zielsetzung 2.2 Durchführung 2.3 Ergebnisse 3.Zeitliche Kohärenz 3.1 Zielsetzung 3.2 Durchführung 3.3 Ergebnisse 4.Zusammenfassung

Gliederung 1.Natürliche Videos 1.1 Eigenschaften natürlicher Videos 1.2 Formales Modell 2.Spärliche Kodierung von Videos natürlicher Szenen 2.1 Zielsetzung 2.2 Durchführung 2.3 Ergebnisse 3.Zeitliche Kohärenz 3.1 Zielsetzung 3.2 Durchführung 3.3 Ergebnisse 4.Zusammenfassung

1 Eigenschaften natürlicher Videos Was unterscheidet ein zufällig generiertes Video von einem „natürlichen“?

1 Eigenschaften natürlicher Videos Was unterscheidet ein zufällig generiertes Video von einem „natürlichen“? Starke Korrelation naher Bildpunkten (sowohl räumlich als auch zeitlich) Ecken und Kanten Skaleninvarianz klare Bewegungen Koeffizienten der fouriertransformierten Bilder fallen mit der Frequenz f etwa um den Faktor 1/f (siehe auch Dong/Atick 95) Pixel unabhängig voneinander keine Ecken und Kanten Intensitäten gleichverteilt Keine Zusammenhang zwischen aufeinander folgenden Bildern

1 Eigenschaften natürlicher Videos Was unterscheidet ein zufällig generiertes Video von einem „natürlichen“?  natürliche Videos stellen nur einen winzigen Anteil aller möglichen Videos dar!  natürliche Videos lassen sich durch relativ wenige Merkmale beschreiben nächster Schritt: Modell zur Beschreibung von Videos

Gliederung 1.Natürliche Videos 1.1 Eigenschaften natürlicher Videos 1.2 Formales Modell 2.Spärliche Kodierung von Videos natürlicher Szenen 2.1 Zielsetzung 2.2 Durchführung 2.3 Ergebnisse 3.Zeitliche Kohärenz 3.1 Zielsetzung 3.2 Durchführung 3.3 Ergebnisse 4.Zusammenfassung

Ein Video ist eine Funktion, die jedem Rasterpunkt (x,y) in Anhängigkeit von der Zeit t einen Farbwert zuweist. 1.2 Formales Modell Darstellung des Videos durch lineare Überlagerung von Basisfunktionen Dielassen sich auch als Basisvideos auffassenDiesind zeitlich verschiebbar!

1.2 Formales Modell Beispiel: 2 Basisfunktionen:

1.2 Formales Modell Bemerkungen: N Basisfunktionen linear unabhängig gewählt:  eindeutig bestimmt  jedes Video lässt sich verlustfrei darstellen (N = Anzahl der Videodimension) Linear abhängige Basisfunktionen möglich  Code sogar mehr als vollständig (over – complete)  mehrere Darstellungen für ein Bild möglich  Konsequenzen?

Gliederung 1.Natürliche Videos 1.1 Eigenschaften natürlicher Videos 1.2 Formales Modell 2.Spärliche Kodierung von Videos natürlicher Szenen 2.1 Zielsetzung 2.2 Durchführung 2.3 Ergebnisse 3.Zeitliche Kohärenz 3.1 Zielsetzung 3.2 Durchführung 3.3 Ergebnisse 4.Zusammenfassung

Gesucht: Satz von wenigen Basisfunktionen der zu einer spärlichen und dekorrelierten Verteilung der führt Ideale Wahrscheinlichkeitsdichte der 2.1 Zielsetzung einziges Maximum um 0 dort stark zugespitzt nach außen schnell abfallend

2.1 Zielsetzung Wie messen wir ob die Verteilung der spärlich ist? Verschiedene Maße: Verwenden hier: und

2.1 Zielsetzung Warum spärlich und dekorreliert? - Merkmale werden explizit codiert  das heißt die Aktivierung einer Basisfunktion ist äquivalent mit der Existenz eines Merkmales im Video  ein Video entspricht Menge von unabhängigen Ereignissen - effiziente Kodierung - Kompression - ansonsten intuitive aber willkürliche Forderung

2.1 Zielsetzung Führt zu Optimierungsproblem: Wie lösen wir dieses Problem?

Gliederung 1.Natürliche Videos 1.1 Eigenschaften natürlicher Videos 1.2 Formales Modell 2.Spärliche Kodierung von Videos natürlicher Szenen 2.1 Zielsetzung 2.2 Durchführung 2.3 Ergebnisse 3.Zeitliche Kohärenz 3.1 Zielsetzung 3.2 Durchführung 3.3 Ergebnisse 4.Zusammenfassung

2.2 Durchführung Optimierung von E mit Gradientenabstieg

2.2 Durchführung Skizzierung der Optimierung:

Anwendung auf Videos der Größe 8x8x64 (ausgeschnitten aus natürlichen Videos) zufällig initialisiert verschiedene Preprocessing - Schritte 2.2 Durchführung Rechenzeit im Stundenbereich

Gliederung 1.Natürliche Videos 1.1 Eigenschaften natürlicher Videos 1.2 Formales Modell 2.Spärliche Kodierung von Videos natürlicher Szenen 2.1 Zielsetzung 2.2 Durchführung 2.3 Ergebnisse 3.Zeitliche Kohärenz 3.1 Zielsetzung 3.2 Durchführung 3.3 Ergebnisse 4.Zusammenfassung

2.3 Ergebnisse Funktioniert das Verfahren? Trainings- muster Generiert durch Ergebnis einzelne Pixeleinzelne Gitter einzelne Gaborfunktionen

2.3 Ergebnisse Was passiert bei Anwendung auf reale Daten?

2.3 Ergebnisse Nochmal im Überblick:

Die Ergebnisse sind robust 2.3 Ergebnisse Eigenschaften der erhaltenen Basisfunktionen? Die Basisfunktionen sind: lokal ausgeprägt (räumlich und zeitlich) orientiert bandbeschränkt Einzelbilder ähneln rezeptiven Felder der einfachen Zellen

2.3 Ergebnisse Fehler zwischen Original und rekonstruierten Video klein Sind die Ergebnisse zumindest sinnvoll? Originalvideo Rekonstruiertes Video

2.3 Ergebnisse Zeit Koeffizient - Nummer Standardbasis gelernte Basis Ist die Verteilung denn auch spärlich? JA  Ziel erreicht!

Orientierung der Funktionen gleichverteilt Mehr „langsame“ Funktionen als Schnelle 2.3 Ergebnisse Weitere Eigenschaften:

2.3 Ergebnisse niedrige räumliche Frequenz  hohe Geschwindigkeit hohe räumliche Frequenz  geringe Geschwindigkeit Weitere Eigenschaften:

3.1 Zielstellung Spärlichkeit – Ist das Alles? Eigenschaften der Rezeptiven Felder lassen sich durch Spärlichkeitsprinzip erklären. Forderung nach Spärlichkeit mehr oder weniger willkürlich. Gibt es eine Alternative?

Gliederung 1.Natürliche Videos 1.1 Eigenschaften natürlicher Videos 1.2 Formales Modell 2.Spärliche Kodierung von Videos natürlicher Szenen 2.1 Zielsetzung 2.2 Durchführung 2.3 Ergebnisse 3.Zeitliche Kohärenz 3.1 Zielsetzung 3.2 Durchführung 3.3 Ergebnisse 4.Zusammenfassung

3.1 Zielstellung Prinzip der Zeitlichen Kohärenz Was ist das???  Repräsentation von aufeinander folgenden Bildern soll möglichst ähnlich sein  Basisfunktionen sind nur noch Bilder Ähnlichkeit messen:

3.1 Zielstellung Weitere „technische“ Forderungen: (Beschränkung der Gewichte) (damit die Basisfunktionen linear unabhängig werden)

Gliederung 1.Natürliche Videos 1.1 Eigenschaften natürlicher Videos 1.2 Formales Modell 2.Spärliche Kodierung von Videos natürlicher Szenen 2.1 Zielsetzung 2.2 Durchführung 2.3 Ergebnisse 3.Zeitliche Kohärenz 3.1 Zielsetzung 3.2 Durchführung 3.3 Ergebnisse 4.Zusammenfassung

3.2 Durchführung Durchführung erfolgt mit einem speziellen Gradientenverfahren Anwendung auf Bilder mit Größe von 11x11 mit Videolängen von 192 Sekunden Preprocessing: - Subtraktion des Mittelwertes - Normalisierung - zeitliche Dekorrelation

Gliederung 1.Natürliche Videos 1.1 Eigenschaften natürlicher Videos 1.2 Formales Modell 2.Spärliche Kodierung von Videos natürlicher Szenen 2.1 Zielsetzung 2.2 Durchführung 2.3 Ergebnisse 3.Zeitliche Kohärenz 3.1 Zielsetzung 3.2 Durchführung 3.3 Ergebnisse 4.Zusammenfassung

2.3 Ergebnisse ähnliche Ergebnisse wie zum Beispiel bei der Verwendung der ICA erhalten. Gemeinsamkeiten: -Verteilung der Orientierung -räumliche Frequenz Unterschiede: -Größenspektrum ist breiter  Zeitliche Kohärenz ist ein alternatives Modell zu Sparse Coding

Gliederung 1.Natürliche Videos 1.1 Eigenschaften natürlicher Videos 1.2 Formales Modell 2.Spärliche Kodierung von Videos natürlicher Szenen 2.1 Zielsetzung 2.2 Durchführung 2.3 Ergebnisse 3.Zeitliche Kohärenz 3.1 Zielsetzung 3.2 Durchführung 3.3 Ergebnisse 4.Zusammenfassung

4 Zusammenfassung Sparse Coding: - natürliche Videos lassen sich durch relativ wenige Merkmale beschreiben. - suchen nach effizienten Code  Ansatz Spärlichkeit - Berechnung mit Gradientenabstiegsverfahren - Als Ergebnisse erhält man Basisfunktionen, die - rezeptiven Feldern der einfachen Zellen ähneln - gleichverteilte Orientierung aufweisen - bandbeschränkt sind - lokal ausgeprägt sind Alternative: explizite Forderung nach zeitlicher Kohärenz  liefert sehr ähnliche Ergebnisse