Automatische Texterkennung

Slides:



Advertisements
Ähnliche Präsentationen
Anwendungen mit dem PC Schreibprogramme
Advertisements

Schaffung von Rechtsbewusstsein
Bauteile des PC´c Werden vorgestellt: PC-Gehäuse Prozessor Tastatur
PC-Senioren Ludwigsburg
Mathematik 9. Jahrgang: Zentrische Streckung
PDF und PDF/A Universität zu Köln Historisch Kulturwissenschaftliche Informationsverarbeitung WS 2011/2012 Digitale Langzeitarchivierung Dozent:
Konzeption und Realisierung eines Text- Analysesystems zur Automatisierung der Bewerberauswahl von diesem Datenformat jede beliebige Anwendung adaptieren.
Prototyping.
Allgemein Batchdatei/en erstellen Was ist das?? Wie geht das??
Text und Bild Objekte füllen Konturenführung in InDesign CS.
Projekt Informationskompetenz Bibliothek der Universität Konstanz Dieser Inhalt ist unter einer Creative Commons-Lizenz lizenziert. Bibliothek der Universität.
Untersuchen von kristallinen Stoffen.
Briefkopfbogen anpassen
Computerkurs 1.
Unterrichtsinhalte im Internet präsentieren
Tipps und Tricks für Word 2000 Aytac, Felix, Steffen 04/05.
Microsoft PowerPoint von Bastian Hellinger, 2005
Barcode & Identifikation
Scanner.
Vom Image zum Volltext – Texterkennung im Projekt „OstDok“
Eine Bewerbung schreiben
Die Darstellung von alphanumerischen Zeichen mit dem Computer
Der Computer mit seinen Bestandteilen
Schulung für Microsoft® Office Project 2007
Die Zukunft in der Buchführung hat schon begonnen!
Griessenauer Eva Maria. EIN MEDIENPRODUKT, DAS AM BILDSCHIRM WIEDERGEGEBEN WIRD
Übungsaufgaben für Microsoft Excel
Woraus besteht eine PPT-Datei?
Tipps zum Scannen.
Theorie Praktische Beispiele
Geschichten um den Computer
DW /JR–Integration Bf BK
Abitur Informatik Unsere Inhalte heute: Dezentrales schriftliches Abitur Steffen Rüsike – Fachberater Informatik 1 / 6.
Hallo, die folgende Bildserie zeigt, wie man mit dem Programm IrfanView (kostenlos unter ein Bild in seiner Größe verändern kann. Das.
© powered by Alchimedus ® Seite 1 Ihr Schnelleinstieg führt Sie durch GenoGyn QM interaktiv Kommen wir zu Ihrem ersten Schritt:
Theorie Praktische Beispiele
Wie erhalte ich meine Ausschreibungstexte?
Referatsthema - Excel.
Norman Security Suite Anwenderfreundlicher Premium-Schutz.
Wie stelle ich eine Homepage online?
Java Programmierung.
Meine erste Website – Eine Reise in vier Etappen!.
PowerPoint 2003 Karte kopieren
Automatisierte Worterkennung (Autocorrect) Automatisierung in der Medientechnik, Labor, KulturMediaTechnologie Lucia Winsauer SS14.
ohne Animationseffekte (
Dateiformate und Multimedia
Wie erstelle ich eine einfache, weihnachtliche Menükarte
Helpdesk
Formulare in HTML.
Arbeiten mit Handzettelmastern j drücken Sie dann F5, oder klicken Sie auf Bildschirmpräsentation> Von Beginn an, um den Kurs zu starten. Klicken Sie in.
HTML, CSS und JavaScript
Von Alexander Röhr Booten.
Theorie Praktische Beispiele
Contentmanagement mit der OpenSourceLösung TYPO3
Unsere Computeria. Wo befindet sie sich Im Vorraum zum Raum der Stille.
Dokumente meistern Dokumente anlegen Dokumente speichern
Interaktive Karte Bestehende Planungen Donaustadt STB 5 I P2 Adobe Flash CS3 IEMAR.
Komponenten des Computers
Einleitung NEVARIS FINANCE ist das ideale Programm für mittlere und größere Baufirmen. In Verbindung mit unseren zuverlässigen DMS- Ergänzungen (DMS =
Christos Mavridis ‌ WG13 ‌‌‌ Köln, Update und Patch-Management.
Grundlagenunterricht Informatik „Präsentation“ Start mit PowerPoint Hinweis: Führen Sie die Aufträge auf den Folien dieser Präsentation gleich aus. So.
Vorlesungsverzeichnisse der Universität Bern: Von der Digitalisierung zur Faktenbasis Niklaus Bütikofer Universität Bern Universitätsarchiv Weiterbildungsprogramm.
OCR mit cuneiform Jürgen Weigert openSUSE user
Wie erstelle ich eine einfache, weihnachtliche Menükarte
Digitale Bildbearbeitung
Training mit Audiodateien
Titel des wissenschaftlichen Projekts
H Passen Sie dieses Banner mit Ihrer eigenen Nachricht an! Wählen Sie den Buchstaben aus, und fügen Sie Ihren eigenen Text hinzu. Verwenden Sie ein Zeichen.
Diese Seite bitte löschen
Diese Seite bitte löschen
 Präsentation transkript:

Automatische Texterkennung Themenprojekt von Judith Bühler Vorlesung: „Automatisierung der Medienproduktion“ Dozent: Professor Jürgen Walter

Problemstellung: Ausgangssituation Annahme: Person X hat einen gedruckten Text auf Papier, möchte ihn aber in digitaler Form auf einem Computer haben, um den Text weiterverarbeiten oder ändern zu können.

Problemstellung: Schritt 1 Schritt 1: Person X scannt den Text. Jetzt liegt dieser zwar digital auf dem Computer vor, jedoch in einem nicht veränderbaren Format (zum Beispiel als Bild-Datei wie tiff, jpg, png oder als PDF) (= in Bild eingebetteter Text)

Problemstellung: Schritt 2 Schritt 2: Damit der Text vom Computer als Textdatei erkannt werden kann, braucht er eine bestimmte Software, die ihm sagt, welches gedruckte Zeichen welcher Taste auf der Tastatur entspricht.

AUTOMATISCHE TEXTERKENNUNG Lösung: Deshalb gibt es die… AUTOMATISCHE TEXTERKENNUNG

Was ist die Automatische Texterkennung? Automatische Texterkennung = OCR OCR = Optical Character Recognition (optische Zeichenerkennung) Definition: „[OCR ist ein] Verfahren, mit dem gedruckte Texte in den Computer "eingelesen" (digitalisiert) werden. Die Vorlage gelangt zunächst in bzw. unter ein Lesegerät (Scanner) . Eine spezielle Software identifiziert dann die einzelnen Buchstaben, Zahlen und sonstigen Zeichen.“ Quelle: http://www.at-mix.de/ocr.htm, Zugriff: 25.04.14, 17:26 Uhr

Recherche: Programme Mittlerweile gibt es viele Programme für die Automatische Texterkennung, zum Beispiel: FineReader (von ABBYY) FormPro (von OCR Systeme) Acrobat Text Capture in Adobe Acrobat (von Adobe Systems) OneNote 2010 (von Microsoft)  kostenpflichtige Programme

Recherche: Programme Auch Freeware-Programme sind erhältlich, zum Beispiel: OCRopus GOCR CuneiForm Ocrad Tesseract FreeOCR

Fragestellung Welches Programm wandelt Bild- und PDF- Dateien zuverlässig und anwendungsfreundlich in Textdateien um, die weiterverarbeitet werden können?  Diese Fragesetellung werde ich durch Tests verschiedener OCR-Programme beantworten

Aufgabenstellung Vergleichen Sie verschiedene Texterkennungs- Programme anhand ausgewählter Texte, die nicht als Textdateien vorliegen. Führen Sie Tests unter dem Einfluss verschiedener Parameter (verschiedene Schriftarten, -größen und –farben) durch. Geben Sie anhand Ihrer Ergebnisse eine Empfehlung, welches Programm am Besten für das Erkennen eines Texts, der nicht als Textdatei vorliegt, geeignet ist

Hinweis zur Herangehensweise Ich orientiere mich in der äußeren Form und der Struktur meines Projekts im Groben an der Arbeit von Elisabeth Strecker (KMT, 1. Jahrgang). Sie hat sich im Rahmen der Vorlesung „Automatisierung der Medienproduktion“ mit Musikerkennungsprogrammen beschäftigt. Inhaltlich beziehe ich mich allerdings NICHT auf die Arbeit von Elisabeth Strecker, da Gegenstand meiner Untersuchung andere Programme aus einem anderen Bereich sein werden. (Musikerkennung versus Texterkennung)

Hinweis zur Herangehensweise Meine Projekt fertige ich eigenständig an.