2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf.

Slides:



Advertisements
Ähnliche Präsentationen
PEER Umfrage Herbst 2008 Jugendliche befragen Jugendliche: Kunst und Kultur in Berlin – was geht mich das an?
Advertisements

Gestaltung eines Posters (Schrift: Punkt 70).
What Computers still cant do A Critique of Artificial Reason Hubert L. Dreyfus.
WR + WS ZEIGEN Neues aus der Mathematik.
WS 05/06Automatische Akquisition linguistischen Wissens1 Partielles Wissen erweitern 1.Zusammenhang mit bisherigen Algorithmen 2.Vom offensichtlichen zum.
8. Formale Sprachen und Grammatiken
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri)
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/5 Grundtechniken des Information Retrieval Deskribierung Hierunter versteht man eine manuelle.
QBE in MS Access formulieren
Schritte zu Datenmodellierung
Grundlagen der Analyse von Sprachdatenbanken
Internetstruktur Das Internet besteht aus vielen Computern, die weltweit untereinander vernetzt sind.
Beruf Informatiker Präsentation von T.M..
Textverarbeitung ist die erste zentrale Anwendung eines komplexen Computerprogrammes. Sie ist deshalb von besonderer Bedeutung, weil eigentlich alle Nutzer.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (11-1 –Selbstanordnende lineare Listen) Prof. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27-Selbstanordnende lineare Listen) Prof. Th. Ottmann.
Informatik II, SS 2008 Algorithmen und Datenstrukturen Vorlesung 16 Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut für Informatik Fakultät.
Datenbanken vs. Markup Manfred Thaller WS 2009/2010 Humanities Computing Linda Scholz.
Modularization of XHTML™
Wie arbeitet der Brill-Tagger und warum macht er Fehler? Der Brill-Tagger basiert auf der Kombination von regelbasierten und statistischen Verfahren. Er.
Access 2000 Datenbanken.
Datenbanken Einführung Merkmale dateiorientierte Datenverwaltung
Lesen und Exegese 1) Hilfe zum umfassenderen Verstehen. 2) Schutz vor Fehlinterpretationen. Wie verhalten sich Lesen und Exegese zueinander?
§9 Der affine Raum – Teil 2: Geraden
§9 Der affine Raum – Teil 2: Geraden
Eine Produktion von der Firma Presentations GmbH
Externe Bewertung in IB-Biologie
SOFTWARE.
? Was ist Informatik? Was ist Informatik? Alexander Lange
Gegenstand EDV Thema: Informative Webseiten
Arbeitsgruppe 1 Profilbildung von Schullandheimen Fachtagung 2004.
Dateien Datei = File (engl.) Mögliche Inhalte einer Datei
Sie gehen gerne auf Reisen und besuchen gerne andere Städte? Wir tun das auch! Sie gehen gerne auf Reisen und besuchen gerne andere Städte? Wir tun das.
Übungsaufgaben für Microsoft Excel
Wie ist das eigentlich mit dem Deutschunterricht?
Dictionaries and Beyond
CGI (Common Gateway Interface)
Von Patrik, Yannik, Marc und Luca
Dienstleistungen für Ihren Fortschritt. Neigungsprofil für Servicetechniker More than psychology structures.
Dynamische Webseiten-Generierung
Elternabend der Schule … vom …
Web 2.0 Interaktives Internet.
Johann Baron von Neumann
Informatik Formale Sprachen 1.2 Grammatiken formaler Sprachen
Technik schädlicher Software
Erste Schritte am PC EDV Kurs für Senioren.
Willkommen bei der Präsentation von interessanten Eigenschaften der Wörterbücher Lingea Lexicon. Unter den Seiten können Sie mit Hilfe von Tasten und Maus.
Mehrfachausführungen Schleifen in VB 2010 ee. Programmidee: Der Anwender gibt eine Zahl ein, und das Programm gibt die Mehrfachen dieser Zahl aus (das.
Berechenbarkeit Klaus Becker Berechenbarkeit.
Wie man aus Nichts Geld macht
7. Formale Sprachen und Grammatiken
EINFÜHRUNG IN DIE MORPHOLOGIE Morphologie = Formenlehre
2 Grundlagen In diesem Abschnitt werden die Grundbegriffe und Methoden der Theorie der formalen Sprachen und der Automaten wiederholt, soweit diese ben.
2. Forum Individuelle Förderung Dirk Bollmann, Helmholtz Gymnasium1 Workshop 5   Lernplattform und interaktives Lernmaterial (SelGO) als Möglichkeiten.
Web Services Spezielle Methoden der SWT Liste V – WS 2008/2009 Christian Boryczewski.
Greenstone. Theoretischer Teil Entstehung: Entwickelt vom New Zealand Digital Library Project an der Universität von Waikato Kooperation mit der UNESCO.
Zahlensysteme Emily Dikhoff weiter.
Künstliche Intelligenz
Ein kleiner Einblick für Anfänger
Willkommen. Austausch in Kleingruppen  Woher kommst du und warum nimmst du an dieser Konferenz teil?  Wenn du eines mitnehmen könntest, was wäre es?
„Martinsfest und Wandertag“ Wochenrückblick vom bis Die Woche startet mit Proben für unser Martinspiel. Die Kinder suchten sich ihre Rollen.
Das lerntheoretische Paradigma beruht auf der Annahme, dass Psychopathologie das Ergebnis ist von stimmt stimmt nicht …Modelllernenoo …unbewussten.
Übungsart: Seite: Bearbeitet von: Siegbert Rudolph Lesemotivationstraining Titel: Quelle: Nächste Seite 1 Bedienungshinweise: Mit einem Klick geht es immer.
PIXTURE STUDIOS M ARA P ALMESE FOTOGRAFIN !. I NFORMATIONEN ÜBER DEN BETRIEB ! Das Pixture Studios gibt es ungefähr seit 6 Jahre. Erst war es in Plattenhardt.
Programmierung unter VB.Net mit der IDE VisualStudio. Schritt für Schritt erklärt und beschrieben. Zielgruppe: Komplette Neueinsteiger mit fundiertem Computerwissen.
ДИАЛОГИК НУТ Қ КЎНИКМАЛАРИНИ ШАКЛЛАНТИРИШ. Das Thema: ENTWICKLUNG des DIALOGISCHEN SPRECHENS. М.А.Бахриддинова.
Lernen durch Medien Andreas Kamber BWS Klang und Bewegung.
 Präsentation transkript:

2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf an 200 Wissen- schaftler. Im Aufruf schildert er die Idee der Übersetzung aus einer Sprache in eine andere mit der Anwendung des Computers.

Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n Es begann eine intensive Er- forschung der Möglichkeit einer maschinellen Überset- zung. Nach der ersten Eupho- rie kam eine längere Periode der pessimistischen Resigna- tion im Bereich der automati- schen Übersetzung. In letzter Zeit erlebt jedoch auch dieser Teil der Computerlinguistik eine Renaissance.

Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n Welches sind die anderen Bereiche der rech- nerischen Verarbeitung von natürlichsprach- lichen Daten? Es sind vor allem vielleicht die speziellen Datenbanken, die man in ihrer her- kömmlichen Form gemeinhin Wörterbücher nennt.

Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n Auch die Zusammenstellung von gedruckten Wörterbüchern – wie überhaupt die Erstellung von Drucksachen – ist heute ohne Computer kaum vorstell- bar. Man kann die in beliebiger Reihenfolge eingegebenen Wör- ter jederzeit alphabetisch ord- nen oder sogar die Umkehrung des Wörterbuchs ausführen, d.h. z.B. aus einem deutsch-un- garischen Wörterbuch ein un- garisch-deutsches machen.

Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n Die Lexikographie wurde so- gar – eigentlich dank dem Computer – mit einem neuen Typ der Wörterbücher berei- chert: Mit dem rückläufigen Wörterbuch.

Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n Wozu dienen aber diese Wör- terbücher? Das kommt auch darauf an, was noch mit den Wörtern zusammen eingege- ben wird. Das rückläufige Wörterbuch der ungarischen Sprache enthält z. B. prak- tisch alle morphologischen Informationen über die ein- zelnen Wörter.

Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n Lexikographen bedienten sich auch früher u.a. der Methode, dass sie große Mengen von Texten untersuchten, um Wörter – ein sog. Korpus – für ihre Wörterbücher zusammen- zubringen. Dies war ziemlich zeitaufwendig, bis man den Computer auch dabei zu Hilfe rief.

Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n Man kann sich dabei auch das Ziel setzen, mit Hilfe der Ma- schine zusammenzuzählen, wie oft die einzelnen Wörter im Korpus auftauchen. Das Resultat ist eine Häufigkeits- liste, oder – bei ausreichender Quantität – ein Häufigkeits- wörterbuch.

Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n Ein Computer, der die Wör- ter eines Textes auflisten kann, vermag natürlich die jeweilige Umgebung dieser Wörter auch zu fixieren. Das Ergebnis nennt man Konkor- danzliste oder Konkordanz- wörterbuch.

Bereiche der maschinellen Bearbeitung von natürlichen Sprachen Es gibt schon funktionierende natürlich-sprachliche Schnitt- stellen (natural language in- terfaces), d. h. Programme, mit deren Hilfe die Computer in einer natürlichen Sprache kommandiert werden können. Solche Schnittstellen werden meistens an Datenbasisver- waltungsprogramme ange- schlossen.

Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n Die Synthese einer verständlichen (aber nicht unbedingt naturgetreuen) Rede ist wesentlich leichter zu schaffen als das Hörverstehen seitens des Rechners. Schon ein einige hundert Kilobyte großes Pro- gramm kann mit Hilfe des zur Grund- ausstattung gehörenden Tongenerators (also ohne zusätzliche Hardware) eine größtenteils verständliche Rede produ- zieren.

Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n Linguistik wird sogar in die Textverarbeitung einbezogen: Die Überprüfung der Recht- schreibung, bzw. die automa- tische Silbentrennung sind bei Sprachen mit reicher Mor- phologie (z. B. Ungarisch) ohne morphologische Analyse unvorstellbar.

Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n Textgenerierungsprogramme: é é TEXT é é KAFKA é é XCALIBUR é é ANA é é TELLTALE

Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n Linguisten arbeiten auch mit Programmen, die Phonemstatistiken, Phonemhäufigkeit, Phonemkonkordanz liefern. n n Mit Hilfe des Computers kann man sämtliche Pho- nemkombinationen auflisten, die in den verschiedenen Po- sitionstypen vorkommen (An- laut, Inlaut, Auslaut, Silben- grenze usw.).

Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n Mit Hilfe des Computers kann man auch nach Regeln suchen. Oft ließe sich z. B. die linguis- tische Beschreibung vereinfachen, wenn man die Möglichkeit gewisser syntagmatischer Ver- bindungen von formalen und/oder semanti- schen Merkmalen der beteiligten Elemente herleiten könnte.