Matthias Jauernig Michael Lahl

Slides:



Advertisements
Ähnliche Präsentationen
Submodell Softwareentwicklung (SE)
Advertisements

Die Planungsphase -Anforderungsanalyse-
Projektplanung für Softwareprojekte
WS 04/05 wiss. Übung: Systemanalyse und Softwaredesign
Enno Rehling und Roger Butenuth, Uni-GH Paderborn: Arminius: Software für Linux-basierte SCI-Cluster Arminius: Software für Linux-basierte SCI-Cluster.
SAP R/3 - Speichermanagement
Systemanalyse In der Systemanalyse wird aus den fachspezifischen Anforderungen das Systemmodell erstellt; im Systemmodell ist spezifiziert, was das System.
Referatsthema… Referent/in 1 Rerefent/in 2
XDoclet ETIS SS05.
Institut für Angewandte Mikroelektronik und Datentechnik Fachbereich Elektrotechnik und Informationstechnik, Universität Rostock Programmierung eingebetteter.
zur Vorlesung Neuronale Netzwerke
Excel Kurs Teil I Excel starten, Verknüpfungen auf dem Desktop anlegen. F. Bäumer.
Programmierung 1 - Repetitorium
Concurrent Versions System
© 2008 Wolfgang Bossert Comedison Inhalt Präsentation Folie erstellen/einrichten Fast-Folie Folienlayout © 2009 Wolfgang Bossert Folienlayout Das Folienlayout.
Der C-Präprozessor EDV1 - 04Präprozessor.
Der C-Präprozessor 08-CPräprozessor.
Wismar Business School
Kennlinie Lichtregelung in JavaNNS Version 1.1
Präsentation wxOCR Matthias Jauernig Michael Lahl.
Maschinelles Lernen und automatische Textklassifikation
Tipps und Tricks für Word 2000 Aytac, Felix, Steffen 04/05.
EXCEL Anfang 2005 Copyright by Maximilian Prinz, Timmy Ruppert, Benjamin Peppel.
2. Vorlesung Ansätze der Systemanalyse: Strukturierte Analyse (SA)
Eine Bewerbung schreiben
SOFTWARE.
Clustered Neuronal Network A C#.NET project for Compute Cluster Server 2003.
Clustered Neuronal Network A C#.NET project for Compute Cluster Server 2003.
Tobias Kluge: FAME Middleware / Karlsruhe / The FAME project – Middleware.
Die Planungsphase Durchführbarkeitsuntersuchung: fachlich, personell und wirtschaftlich Lastenheft (grobes Pflichtenheft) Glossar Projektkalkulation Projektplan.
Prospective Students – Personalization module Erstellung einer internen Demoversion für eine Open Text Delivery Server Web-Kompontente Kurzvorstellung.
Betriebssysteme & BIOS
Künstliches Neuronales Netz nach John Hopfield
Word. 1. Schrift Schriftart ändern Um die Schriftart zu ändern klicke mit der linken Maustaste auf.
1 Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Einführung Lernmodul Nutzungsbedingungen:
Agenda Rückblick 2. Aufbau der Software Benutzeroberfläche 4. Ausblick
Elman-Netzwerke Wintersemester 2004/05 Seminar Kindlicher Spracherwerb C. Friedrich & R. Assadollahi vorgestellt von Christian Scharinger & Guido Heinecke.
Auf ins Web!. Das World Wide Web 1990 in Genf am Hochenergieforschungszentrum CERN Ziele: neuer wissenschaftlicher Informationsaustausch über das Internet.
Boga Abschlusspräsentation
Open Source und OpenOffice
Implementierung eines RDF Stores
SWT-Übung WS 10/ Function Point.
Softwareengineering Endliche Automaten
Content-Managment-System
Die Management-Tools von Z&H COACH beinhalten zentrale Hilfsmittel für ein Management-System. Sorgfältig angewendet führen diese Tools Ihr Unternehmen.
Tabellen in Word for Windowscomputeria, Urdorf Tabellen in Word for Windows computeria Urdorf / Dieter Eckstein.
Powerpoint Grafische Oberfläche Folienmaster Folientypen
DREAMWEAVER MODUL DRWMX_0203 WEBDESIGN MODUL DRW_02 h.huetter 1 Dreamweaver MX - Tabellen Teil 3 Den Schriftstil ändern Um die CSS-Formatierungen auch.
Datenbanken im Web 1.
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
1.Review SWT - Praktikum SS SWT Praktikum SS062 Projektaufgabe Erstellen eines Editors für die Entwicklung IT-basierten Dienstleistungen.
Pool Informatik, Sj 11/12 GZG FN W.Seyboldt 1 Pool Informatik 5 GZG FN Sj. 11/12 Kopieren, Daten, Programme.
Andrea Herzog-Kienast Zeig was du kannst - SkillUp! TYPO3 Session Wien,
Funktionen. Aufgabe : Eingabe zweier Zahlen ---> Minimum bestimmen Dann nochmals Eingabe zweier Zahlen ---> Minimum bestimmen.
Einführung in Windows 7 Der Datei-Explorer.
Pointer. Grundsätzliches: Im Arbeitsspeicher werden Daten gespeichert. Um auf die Daten eindeutig zugreifen zu können, werden diesen Daten Adressen zugeordnet.
Einführung in Windows 7 Arbeiten mit Bibliotheken.
Die elektronische Unfallanzeige: Handlungsanleitung für Anwender Elektronische Unfallanzeige.
Einführung. Ziel der Veranstaltung  Vermittlung von Grundkenntnissen in C++  Solide Basis für anschließende Weiterentwicklung  Fähigkeit, kleine Programme.
PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.
Förderverein Bürgernetz München Land e.V. Seite 1 von 16 Textverarbeitung-2016_06 © 2016–Günther Scheckeler Tel.: Inhalt 1 Bestandteile eines.
Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.
[Titel der Veranstaltung] Arial, 32 pt
Name, Vorname | Titel des Vortrags
W Passen Sie dieses Banner mit Ihrer eigenen Aussage an! Markieren Sie den Buchstaben, und fügen Sie eigenen Text hinzu. Verwenden Sie pro Folie ein einziges.
W Passen Sie dieses Banner mit Ihrer eigenen Nachricht an! Wählen Sie den Buchstaben aus, und fügen Sie Ihren eigenen Text hinzu. Verwenden Sie ein Zeichen.
G Passen Sie dieses Banner mit Ihrer eigenen Nachricht an! Wählen Sie den Buchstaben aus, und fügen Sie Ihren eigenen Text hinzu. Verwenden Sie ein Zeichen.
a Passen Sie dieses Banner mit Ihrer eigenen Aussage an! Markieren Sie den Buchstaben, und fügen Sie eigenen Text hinzu. Verwenden Sie pro Folie.
H Passen Sie dieses Banner mit Ihrer eigenen Nachricht an! Wählen Sie den Buchstaben aus, und fügen Sie Ihren eigenen Text hinzu. Verwenden Sie ein Zeichen.
H Passen Sie dieses Banner mit Ihrer eigenen Aussage an! Markieren Sie den Buchstaben, und fügen Sie eigenen Text hinzu. Verwenden Sie pro Folie ein einziges.
 Präsentation transkript:

Matthias Jauernig Michael Lahl Verteidigung Pflichtenheft wxOCR Matthias Jauernig Michael Lahl

1. Zielbestimmung Überblick Texterkennung mithilfe eines Künstlichen Neuronalen Netzes Erkennung von „gedrucktem“ Text text-enthaltendes Bild wird verarbeitet und vom Programm in Text umgewandelt Beispiel: Bild Text Im heutigen Seminar verteidigen wir unser Pflichtenheft – hoffentlich erfolgreich…

1. Zielbestimmung Neuronales Netz Normales Feed-Forward-Netz, welches mit Backpropagation auf die aufzunehmenden Zeichensätze angelernt wird. Bekommt als Input ein Zeichen in Form eines float-Vektors, liefert als Output einen Erkennungsvektor für die jeweiligen Buchstaben.

1. Zielbestimmung Neuronales Netz Veranschaulichung: … … A B C D E F G H 0,94 0,08 … … 0,04 0,05 … Neuronales Netz Muster als float-Vektor mit skalierten Graustufen-Werten Erkennungsgrad der einzelnen Buchstaben

Aufteilung in Teilprogramme 1. Zielbestimmung Aufteilung in Teilprogramme 2 Teilprogramme: wxOCRnetTrainer: Entwickler-Tool zum Anlernen des Neuronalen Netzes wxOCR (main): Benutzerprogramm zur Durchführung der Texterkennung Effektivität der Erkennung zu großem Teil auch von Anlernbarkeit von Zeichensätzen abhängig a Fokus auf Entwicklung des netTrainers Hauptprogramm (wxOCR main) muss hauptsächlich über gute Algorithmen zur Bildverarbeitung verfügen

Aufteilung in Teilprogramme 1. Zielbestimmung Aufteilung in Teilprogramme Veranschaulichung: a Siehe auch Produktdaten: Folie 14 Zeichensatz Neuronales Netz Bild Textdatei load load save load save wxOCR net Trainer wxOCR (main)

Probleme bei der Erkennung 1. Zielbestimmung Probleme bei der Erkennung Kerning: „Unterschneiden“ Pixel des nächsten Buchstaben reichen in den vorigen hinein, daher ist z.B. Abtrennen von Buchstaben durch Finden einer leeren Spalte nicht möglich Ligaturen: 2 oder mehr Buchstaben verschmelzen miteinander, sodass sie nicht mehr durch einen Abstand voneinander getrennt werden

1. Zielbestimmung Musskriterien Implementation der beiden Teilprogramme Erkennung gedruckten Textes aus einem vom Benutzer gewählten Bild Erkannter Text kann nachträglich bearbeitet und gespeichert werden Zuverlässige Erkennung von Arial 14pt… Plattformunabhängige Implementierung als Open Source

1. Zielbestimmung Wunschkriterien Erkennung unterschiedlicher Schriften und Schriftgrößen Bedingte Behandlung von Kerning Erkennung von Text aus „schiefen“ Textzeilen Behandlung von Nicht-Textelementen (Bilder, Grafikelemente, …)

Abgrenzungskriterien 1. Zielbestimmung Abgrenzungskriterien Keine Erkennung von Handschrift sowie stark von Arial abweichenden Schriften Keine Schrift mit Ligaturen Keine Schaffung eines sehr ausgereiften Systems zur Schrifterkennung

2. Produkteinsatz Für Endbenutzer von z.B. Scannersoftware zur Erkennung von Text aus einem gescannten Bild Für Software-Entwickler oder Informatik-Studenten, die Teile des Quelltextes verwenden bzw. daraus lernen wollen

3. Produktübersicht Use-Case-Diagramm Nur 2 Use Cases, der Großteil der Arbeit findet „unter der Haube“ statt

4. Produktfunktionen Geschäftsprozesse Netz trainieren: Entwickler-Geschäftsprozess, bei dem das Neuronale Netz auf Zeichensätze antrainiert wird Text erkennen: Benutzer-Geschäftsprozess, bei dem Text aus einem Bild erkannt wird unter Verwendung des antrainierten Neuronalen Netzes

Dauerhaft zu speichern 5. Produktdaten Dauerhaft zu speichern Neuronales Netz a 1 Datei Zeichensätze a mehrere Dateien a Siehe auch: Folie 6

Zur Laufzeit anfallend 5. Produktdaten Zur Laufzeit anfallend Hauptbestandteile: Bilddaten und Matrizen erkannter Muster Daten des Neuronalen Netzes

6. Produktleistungen Anwender vom zeitintensiven Prozess des Netz-Anlernens befreien durch Aufteilung in die 2 Teilprogramme Texterkennung sollte bei A4-Seite nicht länger als 10s dauern (im Vorfeld nur bedingt abschätzbar)

7. Qualitätsanforderungen Haupt-Augenmerk zum einen auf der Benutzbarkeit, so dass es auch von einem Laien benutzt werden kann Zum anderen Schwerpunkt auf Änderbarkeit und Übertragbarkeit, vor allem in Hinblick auf Plattformunabhängigkeit und Open Source

8. Benutzungsoberfläche Benutzungsoberfläche mit Mausbedienung wxOCR net Trainer Prototyp unter Linux mit KDE 3.3 wxOCR (main) Prototyp unter Windows

9. Nichtfunktionale Anforderungen Grafikbibliothek C++ Open-Source-Bibliothek zur Erstellung plattfomunabhängiger GUIs Genauer: „Wrapper“, der Funktionsaufrufe je nach OS in verschiedene System Calls umwandelt Mächtiges Werkzeug zur plattformunabhängigen Programmierung Webseite: http://wxwidgets.org

Noch Fragen? ? ? ? ? ? ? ? ? ? ? ?