Algorithmische Geometrie Zeichenerkennung Algorithmische Geometrie Leonid Zavodnik, 2014
Gliederung Was ist die Zeichenerkennung Anwendungen Schwierigkeiten Techniken der Erkennung Alternativen Leonid Zavodnik, 2014
Was ist Zeichenerkennung Leonid Zavodnik, 2014
Was ist Zeichenerkennung Klassifizierung des Eingangssymbols gemäß einer vorbestimmten Klasse Leonid Zavodnik, 2014
Anwendungen Digitalisierung von Büchern und Dokumenten Automatische Überprüfung von Klausuren Erkennung von Autokennzeichen Verkehrszeichenerkennung Chipkartenverarbeitungssystemen Adressen und Postleitzahl Erkennung Leonid Zavodnik, 2014
Schwierigkeiten Ähnliche Symbolen können in Größe, Form und Stil variieren Verschiedene Verzerrungen Keine klaren und strengen Zeichenbildungsregeln Leonid Zavodnik, 2014
Techniken Online Offline Direction Based, k-NN Classifier Clustering K-means, Hierarchical, SOM, EM Feature Extraction Projection, Zoning, Border Transition, Graph Matching Pattern Matching Directional Artificial Neural Network BPNN, RBFNN, Parallel BPNN Leonid Zavodnik, 2014
Online-Methoden Leonid Zavodnik, 2014
Direction Based Algorithm Zeichen durch einen regulären Ausdruck modellieren Bewegungsrichtungen beschreiben 3 Leonid Zavodnik, 2014
Direction Based Algorithm 𝑟.𝑒 𝑢 λ 𝑟𝑑𝑙𝑟𝑑𝑙(𝑢|λ) Leonid Zavodnik, 2014
K-NN Classifier and DTW-Based Dissimilarity Measure Unähnlichkeit bewerten Alle Striche vergleichen Abstaende messen «nächste-Nachbarn Regel» benutzen Beste Probe auswählen Leonid Zavodnik, 2014
Offline-Erkennung Leonid Zavodnik, 2014
Clustering Trennung der Daten in Gruppen Homogenität innerhalb der Cluster Daten sind sehr ähnlich in demselben Cluster Heterogenität zwischen den Cluster Daten von unterschiedlichen Clustern haben maximale Unterschiede Leonid Zavodnik, 2014
K-Means-Algorithm Am häufigsten verwendeten Techniken zur Gruppierung von Objekten Optimiert die quadratischen Abweichungen von einem Mittelwert Nur mit numerischen Attributen verwendet werden Leonid Zavodnik, 2014
K-Means-Algorithm Clusterzentren werden zufällig gewählt Leonid Zavodnik, 2014
K-Means-Algorithm Alle andere Punkte werden jeweils dem Cluster mit dem nächsten Clusterzentrum zugeordnet Leonid Zavodnik, 2014
K-Means-Algorithm Die Zentren der Cluster werden neu berechnet Leonid Zavodnik, 2014
K-Means-Algorithm Wiederholen alle Schritte Leonid Zavodnik, 2014
K-Means-Algorithm Nachteile Ergebnis anhängig von den anfänglichen Clusterzentren Laufzeit 1 Iteration 𝑂 𝐶𝑙𝑢𝑠𝑡𝑒𝑟 ∗𝐴𝑡𝑡𝑟𝑖𝑏𝑢𝑡𝑒 ∗ 𝑃𝑢𝑛𝑘𝑡𝑒 Anzahl der Cluster muss im Voraus bekannt sein Leonid Zavodnik, 2014
Hierarchische Algorithmen Divisiven Agglomerativen Leonid Zavodnik, 2014
Hierarchische Algorithmen Vorteile Flexibilität durch Verwendung komplexer Distanzmaße Keine eigenen Parameter Ergebnis als Cluster- Hierarchie Nachteile Analyseaufwand Laufzeit-Komplexität Divisiv: 𝑂( 2 𝑛 ) Agglomerativ: 𝑂( 𝑛 3 ) Leonid Zavodnik, 2014
Hierarchische Algorithmen Eingabe Ergebnis Leonid Zavodnik, 2014
Self Organizing Map (SOM) Algorithm Flexibel, stark und parallelisierbar Bilderkennung, Signalverarbeitung, Visualisierung Struktur 2 Schichten: Input und Mapping, vollständig verbunden Jeder Mapping knoten initialisiert mit zufälligen Zahlen Lernen Der Unterschied zwischen Input-knoten und Mapping-knoten wird in einem Adaptionsschritt verringert Alle benachbarten Knoten proportional adaptiert Leonid Zavodnik, 2014
Self Organizing Map (SOM) Algorithm Ergebnis: räumliche Anordnung der Eingangsdaten, bei den ähnlichen Regionen gruppiert Leonid Zavodnik, 2014
Expectation Maximization Algorithm 2 Schritte Expectation-Schritt die Punkte werden besser zugeordnet Maximization-Schritt das Modell wird so verändert, dass es besser zu den Daten passt Leonid Zavodnik, 2014
Expectation Maximization Algorithm Leonid Zavodnik, 2014
Feature Extraction Extraktion der wichtige Merkmale Seitenverhältnis Prozentuale Anzahl der Pixel Anzahl der Striche Durchschnittliche Entfernung von der Mitte Symmetrie bezüglich der Koordinatenachsen Mehr Kontrolle über die Merkmale Entwicklungzeit wächst Leonid Zavodnik, 2014
g Projection Method Schwarzen Pixel auf Achsen projizieren Feature: die Anzahl der Pixel g Leonid Zavodnik, 2014
g Zoning Symbol in kleine Fragmente teilen Feature: Anzahl (Durschnitt) der Pixel in jedem Fragment g Leonid Zavodnik, 2014
Border Transition Technique (BTT) Symbol in vier Quadranten teilen Feature: Anzahl der zero‑to‑one transitions in jedem Quadrant g Leonid Zavodnik, 2014
3 Graph Matching Method End point verbindet nur ein Pixel Curve point verbindet zwei Pixel Branch point verbindet drei oder mehr Pixel 3 Leonid Zavodnik, 2014
Pattern Matching Zeichen durch die Analyse von Form und der Vergleich der Merkmale identifiziert Photometric pattern matching Arbeitet mit Bild als eine Matrix von Intensitätswerten oder Funktionen Geometric pattern matching Arbeitet mit der Geometrie des Objekts Leonid Zavodnik, 2014
Pattern Matching Hohe Bearbeitungsgeschwindigkeit Unwirksam, wenn es Verzerrungen der Schrift, Schiefe, Streckungen, unnötige Verbindungen oder zerrissene Striche gibt Vorgehensweise Symbol auf eine normierte Größe bringen In Blöcke gruppiert (z.B. 8x8), um die Anzahl der Merkmale zu reduzieren Die Kanten mit Lowpassfiltering und Downsampling glätten Die Merkmale vergleichen Leonid Zavodnik, 2014
Patternerkennung A 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 Leonid Zavodnik, 2014
Patternerkennung Mitte der Matrix finden Radius berechnen Durch die Anzahl der Spuren teilen Sektoren bestimmen Trek-Sector Matrix generieren Anzahl von „1“ auf jedem Schnittpunkt des Sektors und der Spur zählen Die resultierende Matrix mit Vorlagen aus der Datenbank vergleichen 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 Leonid Zavodnik, 2014
Artificial Neural Network Lernfähig, flexibel Niedrige Reaktionszeit Hohe Geschwindigkeit Für Echtzeitsysteme gut geeignet Verbindungen mit «Gewichte» Zusammenhänge zwischen Eingängen und Ausgängen Korrekte Ergebnis bei unvollständigen (verzerrten) Daten Leonid Zavodnik, 2014
Alternative OCR Ungenauigkeit >30% reCAPTCHA für Digitalisierung der Bücher 1 000 000 Wörter pro Tag 2 500 000 Bücher pro Jahr 2009 - Google gekauft Für Googlemaps benutzt http://www.ted.com/talks/luis_von_ahn_ma ssive_scale_online_collaboration Leonid Zavodnik, 2014
Quellen Suruchi G. Dedgaonkar, Anjali A. Chandavale, Ashok M. Sapkal: Survey of Methods for Character Recognition, S. 180-189, ISSN: 2277-3754 http://ijeit.com/vol 1/Issue 5/IJEIT1412201205_36.pdf (17.06.2014) Faisal Mohammad, Jyoti Anarase, Milan Shingote, Pratik Ghanwat: Optical Character Recognition Implementation Using Pattern Matching, S. 2089, ISSN: 0975-9646 http://www.ijcsit.com/docs/Volume 5/vol5issue02/ijcsit20140502254.pdf (17.06.2014) http://de.wikipedia.org/wiki/K-Means-Algorithmus (17.06.2014) http://de.wikipedia.org/wiki/EM-Algorithmus (17.06.2014) http://de.wikipedia.org/wiki/Selbstorganisierende_Karte (17.06.2014) Leonid Zavodnik, 2014