Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Termextraktion Ziele der Extraktion Stand der Extraktionsprogramme

Ähnliche Präsentationen


Präsentation zum Thema: "Termextraktion Ziele der Extraktion Stand der Extraktionsprogramme"—  Präsentation transkript:

1 Termextraktion Ziele der Extraktion Stand der Extraktionsprogramme
Praktische Übung -“Zoom”algorithmen

2 Ziele der Extraktion Laien … die ein schwieriges Buch lesen wollen
Ausländer … die nur über Grundkenntnisse Verfügen Definitionen/Glossare Wenn ich eine Diplomarbeit schreibe, welche Begriffe soll ich in den Index tun? Kann mir mein Bearbeitungsprogramm automatisch Vorschläge generieren? Kommunikationsoptimierung z.B. Behördendeutsch abschaffen Bilinguale Terminologie-Extraktion

3 Was ist Sollzustand für einen Eintrag
Was ist Sollzustand für einen Eintrag? (und was ist automatisch extrahierbar) Wort: Definition : Vor allem Unterscheidungskriterien und Eingrenzungen Kontext : In welchen Kontexten nutzbar, in welchen nicht, kann durch Positiv-Negativ Liste gegeben werden Benutzungsbeispiele : weiterführende Beispiele (im Gegensatz zum Kontext nicht ausgedachte!) Kommentare und Phraseologismen Referenzen

4 Stand der Software 1999 Studie Uni Zürich: 20% Precision, 80% Recall
2005 Arbeit von Frieder Witschel 60% F-Value Allgemeines Problem ist, dass Systeme zu ungenau sind – zu viele zu normale Terme werden geliefert Übliche Komponenten Morphologie (sehr spezifisch für Europäische Sprachen durch Regelmässigkeit des Lateinischen und Griechischen, welche oftmals Fachtermini produzieren) Grundformreduktion, Trigrammanalyse Syntax – Erkennung typischer Strukturen (NP aller Sorten) Frequenzvergleiche – mit Hintergrundkorpus

5 Frequenzvergleich richtig gemacht
Prinzip ist Vergleich Frequenz in grossem Korpus und kleinem Text Allerdings reicht einfache absolute Grösse der Abweichung nicht – dann würden immer Funktionswörter gewinnen Daher Signifikanzmass, welches errechnet, wie gross Überraschung für plötzlichen Frequenzanstieg

6 Übung Gegeben sei ein Text, extrahieren Sie alle Fachtermini
Welche Zielgruppe? Welcher allgemeine Kenntnisstand? Analyse der Vorgehensweise In mehreren Gruppen: Eine hauptsächlich Morphologie Eine Syntax Eine nach Intuition Vergleichen der Ergebnisse Rangliste der extrahierten Termini Analyse der Unterschiede

7 Beispieltext Laser (http://de.wikipedia.org/wiki/Laser)
Laser sind Strahlungsquellen, (Infrarot, sichtbares Licht, Ultraviolett), deren Gemeinsamkeit im Entstehungsprozess der Strahlung liegt, nämlich in der sogenannten induzierten Emission. So gibt es eine Vielzahl unterschiedlicher Lasermodelle mit den verschiedensten Eigenschaften. Ein Laser besteht dabei immer aus einem optisch aktiven Medium, in dem die Strahlung erzeugt wird, und meistens einem Resonator, der für die Eigenschaften des Laserstrahls, wie Parallelität oder Strahlprofil, mitverantwortlich ist. Laser haben faszinierende Eigenschaften, die sie stark von klassischen Lichtquellen (wie z. B. einer Glühlampe) unterscheiden. Aufgrund ihrer hohen Kohärenz kann mittels Lasern die Wellennatur des Lichts direkt beobachtet werden (z. B. durch Interferenzeffekte). Laserlicht kann zeitlich kohärent sein. Dadurch ist es einfarbig (monochromatisch). Wegen der hohen räumlichen Kohärenz kann Laserstrahlung hoch intensiv und gut gebündelt (fokussiert) werden, was sie für Anwendungen als Schneid- und Schweißwerkzeug oder auch als Laserskalpell in der Medizin geeignet macht. Laser können auch so konstruiert werden, dass sie Impulse mit extrem geringer Dauer (~10-fs-Bereich) aussenden, so dass die zeitaufgelöste Laserspektroskopie ein Standardverfahren zur Untersuchung schneller Prozesse geworden ist.

8 Automatische Extraktion
Initialoutput Verfeinerung Endoutput Phrasensuche schweißwerkzeug strahlprofil kohärenz medizin strahlung laserlicht strahlungsquelle strahlungsquelle laserskalpell laserstrahlung medium kohärent laserspektroskopie entstehungsprozess lasermodell prozess lichtquelle laser laserstrahl

9

10


Herunterladen ppt "Termextraktion Ziele der Extraktion Stand der Extraktionsprogramme"

Ähnliche Präsentationen


Google-Anzeigen