Algorithmische Geometrie

Slides:



Advertisements
Ähnliche Präsentationen
Kohonennetze für Information Retrieval mit User Feedback
Advertisements

Inhalt Saarbrücken,.
Wissensanalyse von Aufgaben mit TKS Eine Methode zur Problemlösung
TECHNISCHE UNIVERSITÄT DARMSTADT Naive Bayes for Ranking
Binnendifferenzierung im Mathematik-Unterricht der SEK II
Anwendungsverteilung und räumliche Ausdehnung
Genetische Algorithmen
Genetische Algorithmen
Formale Sprachen – Mächtigkeit von Maschinenmodellen
Datenbanken vs. Markup Manfred Thaller WS 2009/2010 Humanities Computing Linda Scholz.
Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.
Nicht-Lineare Regression
Datenbankentwurf mit Hilfe des ER-Modells entwickeln
Indoor Navigation Performance Analysis
Demoprogramm: Clustering Eine graphische Demonstration verschiedener Clusteringalgorithmen anhand des Clusterings von Punkten im zweidimensionalen Raum.
Numerische Klassifikation TWINSPAN
By Monika Krolak & Christian Meschke
Thorsten Jost INF-M2 – AW1 – Sommersemester Mai 2008
Algorithmen zur Unterstützung von Immersive Gaming
Special Effects Realistischeres Rendern einer Scene.
Tabellenkalkulationssysteme
Kennlinie Lichtregelung in JavaNNS Version 1.1
Seminar: Informationstechnik in der Medizin Universität Dortmund Skin Detection Fakultät für Elektrotechnik und Informationstechnik Lehrstuhl für Kommunikationstechnik.
Entitäten Extraktion Einführung
Scanner.
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Self Organizing Tree Algorithm
Multiplayer & MMO Games
DataMining Von Daten zu Informationen und Wissen
Effiziente Algorithmen
Ändern von Merkmalen Geometrie Topologie Attribute.
Computergraphische Visualisierungs- verfahren für 3D-Stadtmodelle
Effiziente Algorithmen
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Geometrie : Rekonstruktion
Automatische Texterkennung
3. Juni 2003Moritz Petersen Minimales Markup und Templates zur Erstellung von strukturierten Texten Ein Zwischenbericht zur Diplomarbeit.
Statistik als Powerpoint-Graph
Wunsch Werkzeug Aufgabe & Modell Vorgehen Resultat Zukunft Machine Learning zur Steigerung der Usability Steigerung der Usability.
Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.
Zentrale Leistungsüberprüfungen
Informatik Datenstruktur Graph 3.3 Durchlaufen von Graphen
SOTA Andrej Gisbrecht
Lernen durch Vergleiche
Peer-to-Peer-Netzwerke
Analyse der Laufzeit von Algorithmen
ANN - Simulator Rainer Trummer Ferdinand Schober Christian Spielberger.
ULG Library and Information Studies 2010/11, I2 Johanna Dusek.
The PicSOM Retrieval System 1 Christian Steinberg.
- Studienarbeit - Entwurf und Umsetzung von kombinierten Anfragen für die Ähnlichkeitssuche auf digitalen Bilder auf der Basis von Regionen und Features.
Karten II Darstellung kontinuierlicher Phänomene
Gliederung der Vorlesung
Institut für Informationssysteme Technische Universität Braunschweig Institut für Informationssysteme Technische Universität Braunschweig Verdrängung von.
EIN NEUES ENSEMBLE- KLASSIFIKATIONSVERFAHREN Tim Schneider Rotation Forest.
CL Tree MW 31.1 Business Intelligence Wintersemester 2015 / 2016 Stanislav Prokupetz.
PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.
Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.
- Seite 1 TIME INTELLIGENCE ® by Titel.
Rechen- und Kommunikationszentrum (RZ) Selektionsstrategien auf Graphstrukturen Sven Porsche Seminarvorträge Aachen.
Clusteranalyse Wege und Arten Entstanden im Rahmen der Seminararbeit für WS09/10 Betreuer: Prof. Jobst Hoffmann Dr. Tim Hiddemann Aachen, Januar 2010.
Emanuel Mistretta Lukas Schönbächler
Darstellung kontinuierlicher Phänomene
Mathematik, 5. Jahrgangsstufe, Geometrie, R. Schwarz, StD
 Präsentation transkript:

Algorithmische Geometrie Zeichenerkennung Algorithmische Geometrie Leonid Zavodnik, 2014

Gliederung Was ist die Zeichenerkennung Anwendungen Schwierigkeiten Techniken der Erkennung Alternativen Leonid Zavodnik, 2014

Was ist Zeichenerkennung Leonid Zavodnik, 2014

Was ist Zeichenerkennung Klassifizierung des Eingangssymbols gemäß einer vorbestimmten Klasse Leonid Zavodnik, 2014

Anwendungen Digitalisierung von Büchern und Dokumenten Automatische Überprüfung von Klausuren Erkennung von Autokennzeichen Verkehrszeichenerkennung Chipkartenverarbeitungssystemen Adressen und Postleitzahl Erkennung Leonid Zavodnik, 2014

Schwierigkeiten Ähnliche Symbolen können in Größe, Form und Stil variieren Verschiedene Verzerrungen Keine klaren und strengen Zeichenbildungsregeln Leonid Zavodnik, 2014

Techniken Online Offline Direction Based, k-NN Classifier Clustering K-means, Hierarchical, SOM, EM Feature Extraction Projection, Zoning, Border Transition, Graph Matching Pattern Matching Directional Artificial Neural Network BPNN, RBFNN, Parallel BPNN Leonid Zavodnik, 2014

Online-Methoden Leonid Zavodnik, 2014

Direction Based Algorithm Zeichen durch einen regulären Ausdruck modellieren Bewegungsrichtungen beschreiben 3 Leonid Zavodnik, 2014

Direction Based Algorithm 𝑟.𝑒 𝑢 λ 𝑟𝑑𝑙𝑟𝑑𝑙(𝑢|λ) Leonid Zavodnik, 2014

K-NN Classifier and DTW-Based Dissimilarity Measure Unähnlichkeit bewerten Alle Striche vergleichen Abstaende messen «nächste-Nachbarn Regel» benutzen Beste Probe auswählen Leonid Zavodnik, 2014

Offline-Erkennung Leonid Zavodnik, 2014

Clustering Trennung der Daten in Gruppen Homogenität innerhalb der Cluster Daten sind sehr ähnlich in demselben Cluster Heterogenität zwischen den Cluster Daten von unterschiedlichen Clustern haben maximale Unterschiede Leonid Zavodnik, 2014

K-Means-Algorithm Am häufigsten verwendeten Techniken zur Gruppierung von Objekten Optimiert die quadratischen Abweichungen von einem Mittelwert Nur mit numerischen Attributen verwendet werden Leonid Zavodnik, 2014

K-Means-Algorithm Clusterzentren werden zufällig gewählt Leonid Zavodnik, 2014

K-Means-Algorithm Alle andere Punkte werden jeweils dem Cluster mit dem nächsten Clusterzentrum zugeordnet Leonid Zavodnik, 2014

K-Means-Algorithm Die Zentren der Cluster werden neu berechnet Leonid Zavodnik, 2014

K-Means-Algorithm Wiederholen alle Schritte Leonid Zavodnik, 2014

K-Means-Algorithm Nachteile Ergebnis anhängig von den anfänglichen Clusterzentren Laufzeit 1 Iteration 𝑂 𝐶𝑙𝑢𝑠𝑡𝑒𝑟 ∗𝐴𝑡𝑡𝑟𝑖𝑏𝑢𝑡𝑒 ∗ 𝑃𝑢𝑛𝑘𝑡𝑒 Anzahl der Cluster muss im Voraus bekannt sein Leonid Zavodnik, 2014

Hierarchische Algorithmen Divisiven Agglomerativen Leonid Zavodnik, 2014

Hierarchische Algorithmen Vorteile Flexibilität durch Verwendung komplexer Distanzmaße Keine eigenen Parameter Ergebnis als Cluster- Hierarchie Nachteile Analyseaufwand Laufzeit-Komplexität Divisiv: 𝑂( 2 𝑛 ) Agglomerativ: 𝑂( 𝑛 3 ) Leonid Zavodnik, 2014

Hierarchische Algorithmen Eingabe Ergebnis Leonid Zavodnik, 2014

Self Organizing Map (SOM) Algorithm Flexibel, stark und parallelisierbar Bilderkennung, Signalverarbeitung, Visualisierung Struktur 2 Schichten: Input und Mapping, vollständig verbunden Jeder Mapping knoten initialisiert mit zufälligen Zahlen Lernen Der Unterschied zwischen Input-knoten und Mapping-knoten wird in einem Adaptionsschritt verringert Alle benachbarten Knoten proportional adaptiert Leonid Zavodnik, 2014

Self Organizing Map (SOM) Algorithm Ergebnis: räumliche Anordnung der Eingangsdaten, bei den ähnlichen Regionen gruppiert Leonid Zavodnik, 2014

Expectation Maximization Algorithm 2 Schritte Expectation-Schritt die Punkte werden besser zugeordnet Maximization-Schritt das Modell wird so verändert, dass es besser zu den Daten passt Leonid Zavodnik, 2014

Expectation Maximization Algorithm Leonid Zavodnik, 2014

Feature Extraction Extraktion der wichtige Merkmale Seitenverhältnis Prozentuale Anzahl der Pixel Anzahl der Striche Durchschnittliche Entfernung von der Mitte Symmetrie bezüglich der Koordinatenachsen Mehr Kontrolle über die Merkmale Entwicklungzeit wächst Leonid Zavodnik, 2014

g Projection Method Schwarzen Pixel auf Achsen projizieren Feature: die Anzahl der Pixel g Leonid Zavodnik, 2014

g Zoning Symbol in kleine Fragmente teilen Feature: Anzahl (Durschnitt) der Pixel in jedem Fragment g Leonid Zavodnik, 2014

Border Transition Technique (BTT) Symbol in vier Quadranten teilen Feature: Anzahl der zero‑to‑one transitions in jedem Quadrant g Leonid Zavodnik, 2014

3 Graph Matching Method End point verbindet nur ein Pixel Curve point verbindet zwei Pixel Branch point verbindet drei oder mehr Pixel 3 Leonid Zavodnik, 2014

Pattern Matching Zeichen durch die Analyse von Form und der Vergleich der Merkmale identifiziert Photometric pattern matching Arbeitet mit Bild als eine Matrix von Intensitätswerten oder Funktionen Geometric pattern matching Arbeitet mit der Geometrie des Objekts Leonid Zavodnik, 2014

Pattern Matching Hohe Bearbeitungsgeschwindigkeit Unwirksam, wenn es Verzerrungen der Schrift, Schiefe, Streckungen, unnötige Verbindungen oder zerrissene Striche gibt Vorgehensweise Symbol auf eine normierte Größe bringen In Blöcke gruppiert (z.B. 8x8), um die Anzahl der Merkmale zu reduzieren Die Kanten mit Lowpassfiltering und Downsampling glätten Die Merkmale vergleichen Leonid Zavodnik, 2014

Patternerkennung A 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 Leonid Zavodnik, 2014

Patternerkennung Mitte der Matrix finden Radius berechnen Durch die Anzahl der Spuren teilen Sektoren bestimmen Trek-Sector Matrix generieren Anzahl von „1“ auf jedem Schnittpunkt des Sektors und der Spur zählen Die resultierende Matrix mit Vorlagen aus der Datenbank vergleichen 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 Leonid Zavodnik, 2014

Artificial Neural Network Lernfähig, flexibel Niedrige Reaktionszeit Hohe Geschwindigkeit Für Echtzeitsysteme gut geeignet Verbindungen mit «Gewichte» Zusammenhänge zwischen Eingängen und Ausgängen Korrekte Ergebnis bei unvollständigen (verzerrten) Daten Leonid Zavodnik, 2014

Alternative OCR Ungenauigkeit >30% reCAPTCHA für Digitalisierung der Bücher 1 000 000 Wörter pro Tag 2 500 000 Bücher pro Jahr 2009 - Google gekauft Für Googlemaps benutzt http://www.ted.com/talks/luis_von_ahn_ma ssive_scale_online_collaboration Leonid Zavodnik, 2014

Quellen Suruchi G. Dedgaonkar, Anjali A. Chandavale, Ashok M. Sapkal: Survey of Methods for Character Recognition, S. 180-189, ISSN: 2277-3754 http://ijeit.com/vol 1/Issue 5/IJEIT1412201205_36.pdf (17.06.2014) Faisal Mohammad, Jyoti Anarase, Milan Shingote, Pratik Ghanwat: Optical Character Recognition Implementation Using Pattern Matching, S. 2089, ISSN: 0975-9646 http://www.ijcsit.com/docs/Volume 5/vol5issue02/ijcsit20140502254.pdf (17.06.2014) http://de.wikipedia.org/wiki/K-Means-Algorithmus (17.06.2014) http://de.wikipedia.org/wiki/EM-Algorithmus (17.06.2014) http://de.wikipedia.org/wiki/Selbstorganisierende_Karte (17.06.2014) Leonid Zavodnik, 2014