Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
1
Algorithmische Geometrie
Zeichenerkennung Algorithmische Geometrie Leonid Zavodnik, 2014
2
Gliederung Was ist die Zeichenerkennung Anwendungen Schwierigkeiten
Techniken der Erkennung Alternativen Leonid Zavodnik, 2014
3
Was ist Zeichenerkennung
Leonid Zavodnik, 2014
4
Was ist Zeichenerkennung
Klassifizierung des Eingangssymbols gemäß einer vorbestimmten Klasse Leonid Zavodnik, 2014
5
Anwendungen Digitalisierung von Büchern und Dokumenten
Automatische Überprüfung von Klausuren Erkennung von Autokennzeichen Verkehrszeichenerkennung Chipkartenverarbeitungssystemen Adressen und Postleitzahl Erkennung Leonid Zavodnik, 2014
6
Schwierigkeiten Ähnliche Symbolen können in Größe, Form und Stil variieren Verschiedene Verzerrungen Keine klaren und strengen Zeichenbildungsregeln Leonid Zavodnik, 2014
7
Techniken Online Offline Direction Based, k-NN Classifier Clustering
K-means, Hierarchical, SOM, EM Feature Extraction Projection, Zoning, Border Transition, Graph Matching Pattern Matching Directional Artificial Neural Network BPNN, RBFNN, Parallel BPNN Leonid Zavodnik, 2014
8
Online-Methoden Leonid Zavodnik, 2014
9
Direction Based Algorithm
Zeichen durch einen regulären Ausdruck modellieren Bewegungsrichtungen beschreiben 3 Leonid Zavodnik, 2014
10
Direction Based Algorithm
𝑟.𝑒 𝑢 λ 𝑟𝑑𝑙𝑟𝑑𝑙(𝑢|λ) Leonid Zavodnik, 2014
11
K-NN Classifier and DTW-Based Dissimilarity Measure
Unähnlichkeit bewerten Alle Striche vergleichen Abstaende messen «nächste-Nachbarn Regel» benutzen Beste Probe auswählen Leonid Zavodnik, 2014
12
Offline-Erkennung Leonid Zavodnik, 2014
13
Clustering Trennung der Daten in Gruppen
Homogenität innerhalb der Cluster Daten sind sehr ähnlich in demselben Cluster Heterogenität zwischen den Cluster Daten von unterschiedlichen Clustern haben maximale Unterschiede Leonid Zavodnik, 2014
14
K-Means-Algorithm Am häufigsten verwendeten Techniken zur Gruppierung von Objekten Optimiert die quadratischen Abweichungen von einem Mittelwert Nur mit numerischen Attributen verwendet werden Leonid Zavodnik, 2014
15
K-Means-Algorithm Clusterzentren werden zufällig gewählt
Leonid Zavodnik, 2014
16
K-Means-Algorithm Alle andere Punkte werden jeweils dem Cluster mit dem nächsten Clusterzentrum zugeordnet Leonid Zavodnik, 2014
17
K-Means-Algorithm Die Zentren der Cluster werden neu berechnet
Leonid Zavodnik, 2014
18
K-Means-Algorithm Wiederholen alle Schritte Leonid Zavodnik, 2014
19
K-Means-Algorithm Nachteile
Ergebnis anhängig von den anfänglichen Clusterzentren Laufzeit 1 Iteration 𝑂 𝐶𝑙𝑢𝑠𝑡𝑒𝑟 ∗𝐴𝑡𝑡𝑟𝑖𝑏𝑢𝑡𝑒 ∗ 𝑃𝑢𝑛𝑘𝑡𝑒 Anzahl der Cluster muss im Voraus bekannt sein Leonid Zavodnik, 2014
20
Hierarchische Algorithmen
Divisiven Agglomerativen Leonid Zavodnik, 2014
21
Hierarchische Algorithmen
Vorteile Flexibilität durch Verwendung komplexer Distanzmaße Keine eigenen Parameter Ergebnis als Cluster- Hierarchie Nachteile Analyseaufwand Laufzeit-Komplexität Divisiv: 𝑂( 2 𝑛 ) Agglomerativ: 𝑂( 𝑛 3 ) Leonid Zavodnik, 2014
22
Hierarchische Algorithmen
Eingabe Ergebnis Leonid Zavodnik, 2014
23
Self Organizing Map (SOM) Algorithm
Flexibel, stark und parallelisierbar Bilderkennung, Signalverarbeitung, Visualisierung Struktur 2 Schichten: Input und Mapping, vollständig verbunden Jeder Mapping knoten initialisiert mit zufälligen Zahlen Lernen Der Unterschied zwischen Input-knoten und Mapping-knoten wird in einem Adaptionsschritt verringert Alle benachbarten Knoten proportional adaptiert Leonid Zavodnik, 2014
24
Self Organizing Map (SOM) Algorithm
Ergebnis: räumliche Anordnung der Eingangsdaten, bei den ähnlichen Regionen gruppiert Leonid Zavodnik, 2014
25
Expectation Maximization Algorithm
2 Schritte Expectation-Schritt die Punkte werden besser zugeordnet Maximization-Schritt das Modell wird so verändert, dass es besser zu den Daten passt Leonid Zavodnik, 2014
26
Expectation Maximization Algorithm
Leonid Zavodnik, 2014
27
Feature Extraction Extraktion der wichtige Merkmale
Seitenverhältnis Prozentuale Anzahl der Pixel Anzahl der Striche Durchschnittliche Entfernung von der Mitte Symmetrie bezüglich der Koordinatenachsen Mehr Kontrolle über die Merkmale Entwicklungzeit wächst Leonid Zavodnik, 2014
28
g Projection Method Schwarzen Pixel auf Achsen projizieren
Feature: die Anzahl der Pixel g Leonid Zavodnik, 2014
29
g Zoning Symbol in kleine Fragmente teilen
Feature: Anzahl (Durschnitt) der Pixel in jedem Fragment g Leonid Zavodnik, 2014
30
Border Transition Technique (BTT)
Symbol in vier Quadranten teilen Feature: Anzahl der zero‑to‑one transitions in jedem Quadrant g Leonid Zavodnik, 2014
31
3 Graph Matching Method End point verbindet nur ein Pixel
Curve point verbindet zwei Pixel Branch point verbindet drei oder mehr Pixel 3 Leonid Zavodnik, 2014
32
Pattern Matching Zeichen durch die Analyse von Form und der Vergleich der Merkmale identifiziert Photometric pattern matching Arbeitet mit Bild als eine Matrix von Intensitätswerten oder Funktionen Geometric pattern matching Arbeitet mit der Geometrie des Objekts Leonid Zavodnik, 2014
33
Pattern Matching Hohe Bearbeitungsgeschwindigkeit
Unwirksam, wenn es Verzerrungen der Schrift, Schiefe, Streckungen, unnötige Verbindungen oder zerrissene Striche gibt Vorgehensweise Symbol auf eine normierte Größe bringen In Blöcke gruppiert (z.B. 8x8), um die Anzahl der Merkmale zu reduzieren Die Kanten mit Lowpassfiltering und Downsampling glätten Die Merkmale vergleichen Leonid Zavodnik, 2014
34
Patternerkennung A Leonid Zavodnik, 2014
35
Patternerkennung Mitte der Matrix finden Radius berechnen
Durch die Anzahl der Spuren teilen Sektoren bestimmen Trek-Sector Matrix generieren Anzahl von „1“ auf jedem Schnittpunkt des Sektors und der Spur zählen Die resultierende Matrix mit Vorlagen aus der Datenbank vergleichen Leonid Zavodnik, 2014
36
Artificial Neural Network
Lernfähig, flexibel Niedrige Reaktionszeit Hohe Geschwindigkeit Für Echtzeitsysteme gut geeignet Verbindungen mit «Gewichte» Zusammenhänge zwischen Eingängen und Ausgängen Korrekte Ergebnis bei unvollständigen (verzerrten) Daten Leonid Zavodnik, 2014
37
Alternative OCR Ungenauigkeit >30%
reCAPTCHA für Digitalisierung der Bücher Wörter pro Tag Bücher pro Jahr 2009 - Google gekauft Für Googlemaps benutzt ssive_scale_online_collaboration Leonid Zavodnik, 2014
38
Quellen Suruchi G. Dedgaonkar, Anjali A. Chandavale, Ashok M. Sapkal:
Survey of Methods for Character Recognition, S , ISSN: 1/Issue 5/IJEIT _36.pdf ( ) Faisal Mohammad, Jyoti Anarase, Milan Shingote, Pratik Ghanwat: Optical Character Recognition Implementation Using Pattern Matching, S. 2089, ISSN: 5/vol5issue02/ijcsit pdf ( ) ( ) ( ) ( ) Leonid Zavodnik, 2014
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.