Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Themenprojekt von Judith Bühler Vorlesung: Automatisierung der Medienproduktion Dozent: Professor Jürgen Walter.

Ähnliche Präsentationen


Präsentation zum Thema: "Themenprojekt von Judith Bühler Vorlesung: Automatisierung der Medienproduktion Dozent: Professor Jürgen Walter."—  Präsentation transkript:

1 Themenprojekt von Judith Bühler Vorlesung: Automatisierung der Medienproduktion Dozent: Professor Jürgen Walter

2 Annahme: Person X hat einen gedruckten Text auf Papier, möchte ihn aber in digitaler Form auf einem Computer haben, um den Text weiterverarbeiten oder ändern zu können.

3 Schritt 1: Person X scannt den Text. Jetzt liegt dieser zwar digital auf dem Computer vor, jedoch in einem nicht veränderbaren Format (zum Beispiel als Bild-Datei wie tiff, jpg, png oder als PDF) (= in Bild eingebetteter Text)

4 Schritt 2: Damit der Text vom Computer als Textdatei erkannt werden kann, braucht er eine bestimmte Software, die ihm sagt, welches gedruckte Zeichen welcher Taste auf der Tastatur entspricht.

5 Deshalb gibt es die… AUTOMATISCHE TEXTERKENNUNG

6 Automatische Texterkennung = OCR OCR = Optical Character Recognition (optische Zeichenerkennung) Definition: [OCR ist ein] Verfahren, mit dem gedruckte Texte in den Computer "eingelesen" (digitalisiert) werden. Die Vorlage gelangt zunächst in bzw. unter ein Lesegerät (Scanner). Eine spezielle Software identifiziert dann die einzelnen Buchstaben, Zahlen und sonstigen Zeichen. Quelle: Zugriff: , 17:26 Uhr

7 Mittlerweile gibt es viele Programme für die Automatische Texterkennung, zum Beispiel: FineReader (von ABBYY) FormPro (von OCR Systeme) Acrobat Text Capture in Adobe Acrobat (von Adobe Systems) OneNote 2010 (von Microsoft) kostenpflichtige Programme

8 Auch Freeware-Programme sind erhältlich, zum Beispiel: OCRopus GOCR CuneiForm Ocrad Tesseract OcradTesseract FreeOCR

9 Welches Programm wandelt Bild- und PDF- Dateien zuverlässig und anwendungsfreundlich in Textdateien um, die weiterverarbeitet werden können? Diese Fragesetellung werde ich durch Tests verschiedener OCR-Programme beantworten

10 Vergleichen Sie verschiedene Texterkennungs- Programme anhand ausgewählter Texte, die nicht als Textdateien vorliegen. Führen Sie Tests unter dem Einfluss verschiedener Parameter (verschiedene Schriftarten, -größen und –farben) durch. Geben Sie anhand Ihrer Ergebnisse eine Empfehlung, welches Programm am Besten für das Erkennen eines Texts, der nicht als Textdatei vorliegt, geeignet ist

11 Ich orientiere mich in der äußeren Form und der Struktur meines Projekts im Groben an der Arbeit von Elisabeth Strecker (KMT, 1. Jahrgang). Sie hat sich im Rahmen der Vorlesung Automatisierung der Medienproduktion mit Musikerkennungsprogrammen beschäftigt. Inhaltlich beziehe ich mich allerdings NICHT auf die Arbeit von Elisabeth Strecker, da Gegenstand meiner Untersuchung andere Programme aus einem anderen Bereich sein werden. (Musikerkennung versus Texterkennung)

12 Meine Projekt fertige ich eigenständig an.


Herunterladen ppt "Themenprojekt von Judith Bühler Vorlesung: Automatisierung der Medienproduktion Dozent: Professor Jürgen Walter."

Ähnliche Präsentationen


Google-Anzeigen