Algorithmische Geometrie

Slides:

Advertisements

Ähnliche Präsentationen

Kohonennetze für Information Retrieval mit User Feedback

Advertisements

Inhalt Saarbrücken,.

Wissensanalyse von Aufgaben mit TKS Eine Methode zur Problemlösung

TECHNISCHE UNIVERSITÄT DARMSTADT Naive Bayes for Ranking

Binnendifferenzierung im Mathematik-Unterricht der SEK II

Anwendungsverteilung und räumliche Ausdehnung

Genetische Algorithmen

Genetische Algorithmen

Formale Sprachen – Mächtigkeit von Maschinenmodellen

Datenbanken vs. Markup Manfred Thaller WS 2009/2010 Humanities Computing Linda Scholz.

Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.

Nicht-Lineare Regression

Datenbankentwurf mit Hilfe des ER-Modells entwickeln

Indoor Navigation Performance Analysis

Demoprogramm: Clustering Eine graphische Demonstration verschiedener Clusteringalgorithmen anhand des Clusterings von Punkten im zweidimensionalen Raum.

Numerische Klassifikation TWINSPAN

By Monika Krolak & Christian Meschke

Thorsten Jost INF-M2 – AW1 – Sommersemester Mai 2008

Algorithmen zur Unterstützung von Immersive Gaming

Special Effects Realistischeres Rendern einer Scene.

Tabellenkalkulationssysteme

Kennlinie Lichtregelung in JavaNNS Version 1.1

Seminar: Informationstechnik in der Medizin Universität Dortmund Skin Detection Fakultät für Elektrotechnik und Informationstechnik Lehrstuhl für Kommunikationstechnik.

Entitäten Extraktion Einführung

Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/

Self Organizing Tree Algorithm

Multiplayer & MMO Games

DataMining Von Daten zu Informationen und Wissen

Effiziente Algorithmen

Ändern von Merkmalen Geometrie Topologie Attribute.

Computergraphische Visualisierungs- verfahren für 3D-Stadtmodelle

Effiziente Algorithmen

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Effiziente Algorithmen

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Geometrie : Rekonstruktion

Automatische Texterkennung

3. Juni 2003Moritz Petersen Minimales Markup und Templates zur Erstellung von strukturierten Texten Ein Zwischenbericht zur Diplomarbeit.

Statistik als Powerpoint-Graph

Wunsch Werkzeug Aufgabe & Modell Vorgehen Resultat Zukunft Machine Learning zur Steigerung der Usability Steigerung der Usability.

Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.

Zentrale Leistungsüberprüfungen

Informatik Datenstruktur Graph 3.3 Durchlaufen von Graphen

SOTA Andrej Gisbrecht

Lernen durch Vergleiche

Peer-to-Peer-Netzwerke

Analyse der Laufzeit von Algorithmen

ANN - Simulator Rainer Trummer Ferdinand Schober Christian Spielberger.

ULG Library and Information Studies 2010/11, I2 Johanna Dusek.

The PicSOM Retrieval System 1 Christian Steinberg.

- Studienarbeit - Entwurf und Umsetzung von kombinierten Anfragen für die Ähnlichkeitssuche auf digitalen Bilder auf der Basis von Regionen und Features.

Karten II Darstellung kontinuierlicher Phänomene

Gliederung der Vorlesung

Institut für Informationssysteme Technische Universität Braunschweig Institut für Informationssysteme Technische Universität Braunschweig Verdrängung von.

EIN NEUES ENSEMBLE- KLASSIFIKATIONSVERFAHREN Tim Schneider Rotation Forest.

CL Tree MW 31.1 Business Intelligence Wintersemester 2015 / 2016 Stanislav Prokupetz.

PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.

Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.

- Seite 1 TIME INTELLIGENCE ® by Titel.

Rechen- und Kommunikationszentrum (RZ) Selektionsstrategien auf Graphstrukturen Sven Porsche Seminarvorträge Aachen.

Clusteranalyse Wege und Arten Entstanden im Rahmen der Seminararbeit für WS09/10 Betreuer: Prof. Jobst Hoffmann Dr. Tim Hiddemann Aachen, Januar 2010.

Emanuel Mistretta Lukas Schönbächler

Darstellung kontinuierlicher Phänomene

Mathematik, 5. Jahrgangsstufe, Geometrie, R. Schwarz, StD

Präsentation transkript:

Algorithmische Geometrie Zeichenerkennung Algorithmische Geometrie Leonid Zavodnik, 2014

Gliederung Was ist die Zeichenerkennung Anwendungen Schwierigkeiten Techniken der Erkennung Alternativen Leonid Zavodnik, 2014

Was ist Zeichenerkennung Leonid Zavodnik, 2014

Was ist Zeichenerkennung Klassifizierung des Eingangssymbols gemäß einer vorbestimmten Klasse Leonid Zavodnik, 2014

Anwendungen Digitalisierung von Büchern und Dokumenten Automatische Überprüfung von Klausuren Erkennung von Autokennzeichen Verkehrszeichenerkennung Chipkartenverarbeitungssystemen Adressen und Postleitzahl Erkennung Leonid Zavodnik, 2014

Schwierigkeiten Ähnliche Symbolen können in Größe, Form und Stil variieren Verschiedene Verzerrungen Keine klaren und strengen Zeichenbildungsregeln Leonid Zavodnik, 2014

Techniken Online Offline Direction Based, k-NN Classifier Clustering K-means, Hierarchical, SOM, EM Feature Extraction Projection, Zoning, Border Transition, Graph Matching Pattern Matching Directional Artificial Neural Network BPNN, RBFNN, Parallel BPNN Leonid Zavodnik, 2014

Online-Methoden Leonid Zavodnik, 2014

Direction Based Algorithm Zeichen durch einen regulären Ausdruck modellieren Bewegungsrichtungen beschreiben 3 Leonid Zavodnik, 2014

Direction Based Algorithm 𝑟.𝑒 𝑢 λ 𝑟𝑑𝑙𝑟𝑑𝑙(𝑢|λ) Leonid Zavodnik, 2014

K-NN Classifier and DTW-Based Dissimilarity Measure Unähnlichkeit bewerten Alle Striche vergleichen Abstaende messen «nächste-Nachbarn Regel» benutzen Beste Probe auswählen Leonid Zavodnik, 2014

Offline-Erkennung Leonid Zavodnik, 2014

Clustering Trennung der Daten in Gruppen Homogenität innerhalb der Cluster Daten sind sehr ähnlich in demselben Cluster Heterogenität zwischen den Cluster Daten von unterschiedlichen Clustern haben maximale Unterschiede Leonid Zavodnik, 2014

K-Means-Algorithm Am häufigsten verwendeten Techniken zur Gruppierung von Objekten Optimiert die quadratischen Abweichungen von einem Mittelwert Nur mit numerischen Attributen verwendet werden Leonid Zavodnik, 2014

K-Means-Algorithm Clusterzentren werden zufällig gewählt Leonid Zavodnik, 2014

K-Means-Algorithm Alle andere Punkte werden jeweils dem Cluster mit dem nächsten Clusterzentrum zugeordnet Leonid Zavodnik, 2014

K-Means-Algorithm Die Zentren der Cluster werden neu berechnet Leonid Zavodnik, 2014

K-Means-Algorithm Wiederholen alle Schritte Leonid Zavodnik, 2014

K-Means-Algorithm Nachteile Ergebnis anhängig von den anfänglichen Clusterzentren Laufzeit 1 Iteration 𝑂 𝐶𝑙𝑢𝑠𝑡𝑒𝑟 ∗𝐴𝑡𝑡𝑟𝑖𝑏𝑢𝑡𝑒 ∗ 𝑃𝑢𝑛𝑘𝑡𝑒 Anzahl der Cluster muss im Voraus bekannt sein Leonid Zavodnik, 2014

Hierarchische Algorithmen Divisiven Agglomerativen Leonid Zavodnik, 2014

Hierarchische Algorithmen Vorteile Flexibilität durch Verwendung komplexer Distanzmaße Keine eigenen Parameter Ergebnis als Cluster- Hierarchie Nachteile Analyseaufwand Laufzeit-Komplexität Divisiv: 𝑂( 2 𝑛 ) Agglomerativ: 𝑂( 𝑛 3 ) Leonid Zavodnik, 2014

Hierarchische Algorithmen Eingabe Ergebnis Leonid Zavodnik, 2014

Self Organizing Map (SOM) Algorithm Flexibel, stark und parallelisierbar Bilderkennung, Signalverarbeitung, Visualisierung Struktur 2 Schichten: Input und Mapping, vollständig verbunden Jeder Mapping knoten initialisiert mit zufälligen Zahlen Lernen Der Unterschied zwischen Input-knoten und Mapping-knoten wird in einem Adaptionsschritt verringert Alle benachbarten Knoten proportional adaptiert Leonid Zavodnik, 2014

Self Organizing Map (SOM) Algorithm Ergebnis: räumliche Anordnung der Eingangsdaten, bei den ähnlichen Regionen gruppiert Leonid Zavodnik, 2014

Expectation Maximization Algorithm 2 Schritte Expectation-Schritt die Punkte werden besser zugeordnet Maximization-Schritt das Modell wird so verändert, dass es besser zu den Daten passt Leonid Zavodnik, 2014

Expectation Maximization Algorithm Leonid Zavodnik, 2014

Feature Extraction Extraktion der wichtige Merkmale Seitenverhältnis Prozentuale Anzahl der Pixel Anzahl der Striche Durchschnittliche Entfernung von der Mitte Symmetrie bezüglich der Koordinatenachsen Mehr Kontrolle über die Merkmale Entwicklungzeit wächst Leonid Zavodnik, 2014

g Projection Method Schwarzen Pixel auf Achsen projizieren Feature: die Anzahl der Pixel g Leonid Zavodnik, 2014

g Zoning Symbol in kleine Fragmente teilen Feature: Anzahl (Durschnitt) der Pixel in jedem Fragment g Leonid Zavodnik, 2014

Border Transition Technique (BTT) Symbol in vier Quadranten teilen Feature: Anzahl der zero‑to‑one transitions in jedem Quadrant g Leonid Zavodnik, 2014

3 Graph Matching Method End point verbindet nur ein Pixel Curve point verbindet zwei Pixel Branch point verbindet drei oder mehr Pixel 3 Leonid Zavodnik, 2014

Pattern Matching Zeichen durch die Analyse von Form und der Vergleich der Merkmale identifiziert Photometric pattern matching Arbeitet mit Bild als eine Matrix von Intensitätswerten oder Funktionen Geometric pattern matching Arbeitet mit der Geometrie des Objekts Leonid Zavodnik, 2014

Pattern Matching Hohe Bearbeitungsgeschwindigkeit Unwirksam, wenn es Verzerrungen der Schrift, Schiefe, Streckungen, unnötige Verbindungen oder zerrissene Striche gibt Vorgehensweise Symbol auf eine normierte Größe bringen In Blöcke gruppiert (z.B. 8x8), um die Anzahl der Merkmale zu reduzieren Die Kanten mit Lowpassfiltering und Downsampling glätten Die Merkmale vergleichen Leonid Zavodnik, 2014

Patternerkennung A 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 Leonid Zavodnik, 2014

Patternerkennung Mitte der Matrix finden Radius berechnen Durch die Anzahl der Spuren teilen Sektoren bestimmen Trek-Sector Matrix generieren Anzahl von „1“ auf jedem Schnittpunkt des Sektors und der Spur zählen Die resultierende Matrix mit Vorlagen aus der Datenbank vergleichen 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 Leonid Zavodnik, 2014

Artificial Neural Network Lernfähig, flexibel Niedrige Reaktionszeit Hohe Geschwindigkeit Für Echtzeitsysteme gut geeignet Verbindungen mit «Gewichte» Zusammenhänge zwischen Eingängen und Ausgängen Korrekte Ergebnis bei unvollständigen (verzerrten) Daten Leonid Zavodnik, 2014

Alternative OCR Ungenauigkeit >30% reCAPTCHA für Digitalisierung der Bücher 1 000 000 Wörter pro Tag 2 500 000 Bücher pro Jahr 2009 - Google gekauft Für Googlemaps benutzt http://www.ted.com/talks/luis_von_ahn_ma ssive_scale_online_collaboration Leonid Zavodnik, 2014

Quellen Suruchi G. Dedgaonkar, Anjali A. Chandavale, Ashok M. Sapkal: Survey of Methods for Character Recognition, S. 180-189, ISSN: 2277-3754 http://ijeit.com/vol 1/Issue 5/IJEIT1412201205_36.pdf (17.06.2014) Faisal Mohammad, Jyoti Anarase, Milan Shingote, Pratik Ghanwat: Optical Character Recognition Implementation Using Pattern Matching, S. 2089, ISSN: 0975-9646 http://www.ijcsit.com/docs/Volume 5/vol5issue02/ijcsit20140502254.pdf (17.06.2014) http://de.wikipedia.org/wiki/K-Means-Algorithmus (17.06.2014) http://de.wikipedia.org/wiki/EM-Algorithmus (17.06.2014) http://de.wikipedia.org/wiki/Selbstorganisierende_Karte (17.06.2014) Leonid Zavodnik, 2014