Hauptseminar Frage-Antwort-Systeme Kursleiter: P. Hellwig

Slides:



Advertisements
Ähnliche Präsentationen
Christian Scheideler SS 2009
Advertisements

Hier einige Hieroglyphen:
Falls Algorithmen sich selbst rekursiv aufrufen, so kann ihr Laufzeitverhalten bzw. ihr Speicherplatzbedarf in der Regel durch eine Rekursionsformel (recurrence,
Vorlesung Programmieren II
Polynomial Root Isolation
Frame-Logik Eine Einführung Andreas Glausch.
Prof. Dr. W. Conen 15. November 2004
Die wichtigste Frage des Lebens!
Projektumfeld Gesellschaftliche Strömungen Strukturen/ Gliederung
Finale Semantik und beobachtbares Verhalten
Kapitel 4 Datenstrukturen
Der Hauptsatz Die Satzreihe.
Philosophie der Logik nach Frege I
Das Halteproblem. Gibt es einen Algorithmus, mit dem man für jedes beliebig vorgegebene Programm R und für jede beliebig vorgegebene Eingabe E entscheiden.
Algorithmentheorie 04 –Hashing
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Kapitel 5 Stetigkeit.
Kapitel 1 Die natürlichen und die ganze Zahlen. Kapitel 1: Die natürlichen und die ganzen Zahlen © Beutelspacher/Zschiegner April 2005 Seite 2 Inhalt.
Kapitel 6 Differenzierbarkeit. Kapitel 6: Differenzierbarkeit © Beutelspacher Juni 2005 Seite 2 Inhalt 6.1 Die Definition 6.2 Die Eigenschaften 6.3 Extremwerte.
Kapitel 2 Die rationalen und die irrationalen Zahlen.
Grammatik als Deduktionssystem
(Ron Rivest, Adi Shamit, Leonard Adleman , 1977)
Der Konjunktiv – Wiederholung zu Formen und Verwendung des Konjunktivs
Folie 1 Kapitel II. Vom Raumbegriff zu algebraischen Strukturen Neubeginn: Herleitung des Begriffs Vektorraum aus intuitiven Vorstellungen über den Raumbegriff.
§9 Der affine Raum – Teil 2: Geraden
§9 Der affine Raum – Teil 2: Geraden
Tutorium Willkommen zurück, in der wunderbaren Welt der Statistik Teil II.
Kontrollfragen zu Kapitel 12
Maschinelles Lernen und automatische Textklassifikation
Wie macht man ein Sudoku? Transformations-Methode:
Variationsformalismus für das freie Teilchen
Liebe Marla,   es hat lange Zeit gedauert, Dir diesen Brief zu schreiben, so wie es oft lange dauert, sich für etwas zu entscheiden.Als mir Antje die Frage.
Dies zu lesen kostet nichts - Bah....
Eine kleine Geschichte:     Mein Freund öffnete eine Schublade der Kommode seiner Frau und holte daraus ein kleines.
Sali zäma.
Wortstellung / Word Order
Computational Thinking Online Algorithmen [Was ist es wert, die Zukunft zu kennen?] Kurt Mehlhorn Konstantinos Panagiotou.
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
§3 Allgemeine lineare Gleichungssysteme
Verarbeitung von Implikaturen iv Ist die Interpretation von skalaren Implikaturen gegenüber der wörtlichen Interpretation verzögert? Grodner et al
Gleichungen und Gleichungssysteme
Anspruchsmerkmale und technische Äquivalente
Dr. Rolf Haenni, University of KonstanzNovember 28, 2002 Page 1/15 Aspekte eine echten Informationstheorie 1.Einführung 2.Informationsalgebren 3.Unsicherheit.
TRANSAKTIONEN (Transaktionsanalyse)
Konditionalsätze Julija Jadzevičiūtė
Bereit ???? Nimm dir 10 Minuten Zeit. Ich versuche es dir zu erklären.
UML-Kurzüberblick Peter Brusten.
Das perfekte Herz.
Das Kausalnetz als Kern eines DSS
Dies zu lesen kostet nichts
Ein kleiner Text, der zu denken gibt - das dauert nur 2 Minuten!
Hospitationen gut durchdacht W. Guillaume Studienseminar Friedberg
Dies zu lesen kostet nichts -
MODAL-PARTIKELN.
ENDLICHE KÖRPER RSA – VERFAHREN.
Petrinetze 1. Einführung Informatik : wesentlich Modellierung von
Listening Activity Deutsch 3
Statistik – Regression - Korrelation
Gewaltfreie Kommunikation (GfK)
Das Fragezeichen Zeichensetzung.
Grammatikalische Begriffe im Unterricht
7. Formale Sprachen und Grammatiken
Deutsche Rechtschreibung. Verschiedene Satzzeichen
Wolfgang´s Powerpoint Präsentation.
Wann ist eine Funktion (über den natürlichen Zahlen) berechenbar?
Definition und Grobklassenbildungen nach Harald Burger
Reflexivpronomen D6 Aina Pujol Ferrà.
Radikaler Konstruktivismus
Programmiersprachen II Vorbesprechung Klausur Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
 Präsentation transkript:

Fragetypologie unter syntaktisch-funktionalen und semantischen Aspekten Hauptseminar Frage-Antwort-Systeme Kursleiter: P. Hellwig Referent: Fabian Lorenzen

Eine Problemstellung für die maschinelle Verarbeitung von Fragen: Übertragung/Übermittlung des semantischen Wertes der Frage: was ist der Frageinhalt?

Ansatzpunkt: syntaktische Eigenheiten von Fragen. Identifizieren einer Äußerung als Frage (syntaktischer Ansatz) Eine Frage: unterscheidet sich (in der Regel) in der Satzstellung von einem Aussagesatz: (1) Peter kommt. Vs. Kommt Peter? weist in vielen Fällen (jedoch nicht immer) einen bestimmtes Fragepronomen auf, also z.B. „wer“, „wie“, „wo“ usw.

Ansatzpunkt: syntaktische Eigenheiten von Fragen. Identifizieren einer Äußerung als Frage (syntaktischer Ansatz) Somit: Oft möglich, Frage anhand syntaktischer Form als solche zu erkennen Problem: Erkennen der Frage als solche nur erster Schritt

Beispielhaftes Problem Adäquate Antwort auf die Frage (2) F: Wann wird ein Stern zu einem schwarzen Loch? (2’)A: *Ein Stern wird immer Mittwochs um 12.30 Uhr zu einem Schwarzen Loch (2’’)A: Das passiert, wenn das fusionierbare Material eines sehr massereichen Sternes aufgebraucht ist, er dann als Supernova explodiert und danach zum schwarzen Loch kollabiert. (2’’’)A: Wenn er eine Masse von mehr als 3 Sonnenmassen besitzt.

Beobachtungen (2’) ist zwar eine syntaktisch zulässige Antwort, aber würde in diesem Zusammenhang natürlich keinen Sinn machen. Sie ist daher vom semantischen Standpunkt her unzulässig. dagegen sind (2’’) und (2’’’) sowohl syntaktisch als auch semantisch zulässig.

Beobachtungen Das Fragepronomen „wann“ ist mehrdeutig und nicht auf temporale Sachverhalte beschränkt, es kann auch bei konditionalen Sachverhalten auftauchen.

Beobachtungen Was auch auffällt, ist, dass der in diesem Fall in der Tat gefragte konditionale Sachverhalt mehrdeutig beantwortet werden kann, ohne dass die Antwort semantisch unzulässig wird: (2’’) beschreibt den Auslöser des Vorgangs: „sobald X eintritt, folgt daraus Y“ (2’’’) beschreibt die Voraussetzung für den Vorgang: „es gilt X, und deswegen passiert irgendwann Y).

Beobachtungen Zwickmühle: Frage an sich enthält keine Markierung, ob H am Auslöser oder an der Voraussetzung dafür, wann ein Stern zu einem Schwarzen Loch werden kann, interessiert ist. Möglich jedoch: kontextuelle Markierung: (2a) „Zwischen 1,4 und 3 Sonnenmassen wird ein Stern am Ende seiner Existenz zu einem Neutronenstern, hat er weniger Masse, wird er zu einem Weißen Zwerg.“

Generelle Folgerung syntaktische Analyse der Frage kann nur ein Ausgangspunkt sein, unerlässlich ist aber auch die semantische Analyse.

Semantische Analyse von Fragen (nach Conrad, 1978) Grundsituation: dem Fragesteller sind bestimmte Zusammenhänge oder Ereignisse der Wirklichkeit nicht bekannt er setzt deren objektive Existenz als möglich voraus -> Annahme, dass wenigstens eine wahre Antwort auf die Frage existiert.

Berkov (1972) Frage als („…Mittel der Fixierung einer Problemsituation als Ausdruck eines Widerspruchs zwischen Subjekt und Objekt im Erkenntnisprozess.“) in diesem Zusammenhang gestellte Fragen(also im Sprecher-Hörer Dialogsituation) bezeichnet Conrad (1978) als…

kommunikative Fragen (3) „Was machst du heute“? (4) „Wer hat ‚Harry Potter I’ verfilmt?“ Es gibt auch Fragen, die ohne eine Sprecher-Hörer- Dialogsituation aufkommen können; Berkov (1972) bezeichnet sie als…

„Probleme“ oder gnoseologische Fragen (5) Was hat Sir Charles von Baskerville getötet? (6) Gibt es unter dem Eispanzer des Jupitermondes Europa einen Ozean? es gibt keinen Gesprächspartner, der die Frage beantworten könnte, da die Antwort (noch) nicht in der Menge des vorhandenen Wissens enthalten ist oder es bisher keinen Algorithmus für die Lösung des Problems gibt.

„Probleme“ oder gnoseologische Fragen Aufforderung, eine für die Frage gültige Antwort durch Ermittlungen oder Forschen zu finden: ermittle X, erforsche Y, („rekognosizierende Verben“). Problem kann dabei sein: erkennen, ob es in der Menge vorhandenen Wissens wirklich noch keine mögliche Antwort auf die Frage gibt.

Formalisierung in logisch-semantischer Beschreibung der Fragebedeutung. Conrad (1978) beschreibt einen Versuch, Bedeutungskomponenten wie etwa die beschriebenen kommunikativen und rekognoszierenden Bedeutungskomponenten innerhalb einer Frage formal auszudrücken. Hierbei wird die Frage als Aufforderung angesehen (Imperativparaphrase der ursprünglichen Frage)

Formalisierung in logisch-semantischer Beschreibung der Fragebedeutung. (4) Wer hat Harry Potter I verfilmt? – Nennen Sie mir denjenigen, der Harry Potter I verfilmt hat (6) Was hat Sir Charles von Baskerville getötet? – Ermitteln Sie, was Sir Charles von Baskerville getötet hat. Er führt hierzu die Prädikate COMM und REC ein.

Formalisierung in logisch-semantischer Beschreibung der Fragebedeutung. Conrad (1978) stellt weiterhin fest, dass der Anteil der Komponenten COMM und REC an der Gesamtbedeutung der Frage je nach deren Charakter (kommunikativ vs. gnoseologisch) stark variiert und mitunter eine Komponente ganz fehlen kann. Daher entscheidet er sich für das Einführen einer so genannten Spezifizierungrelation SPEZ (S, S’), die es ermöglicht, diese beiden Komponenten situationsbezogen zueinander in Relation zu setzen.

Formalisierung in logisch-semantischer Beschreibung der Fragebedeutung. Für eine formale Umschreibung eines beliebigen Fragesatzes ?(S) schlägt Conrad (1978) vor: (7) ?(S) <-> AUFF (Sp, Hö (REC (Hö, S’ (SPEZ (S,S’)))) v (COMM (Hö, Sp, S’ (SPEZ (S,S’))))) Umschreibung: “Der Sprecher fordert den Hörer auf, ein S’ zu ermitteln, das in der Spezifizierungsrelation zum in der Frage gegebenen Satz S steht und/oder dem Sprecher dieses/ein S’ mitzuteilen, das in der Spezifizierungsrelation zu S steht.

Formalisierung in logisch-semantischer Beschreibung der Fragebedeutung. Er führt weiterhin aus: „Bei kommunikativen Fragen wird REC (Hö, S’ (SPEZ (S,S’))) bereits als erfüllt betrachtet, während sich bei gnoseologischen Fragen der Mitteilungsakt COMM (Hö, Sp, S’ (SPEZ (S,S’))) auf Grund der Sprecher-Hörer-Identität erübrigt.“

Strukturelle Antwortdetermination Relativ Allgemeine Definition für eine Antwort nach Conrad (1978): „Eine Antwort A auf eine Frage F ist ein Satz, der den in F vorgegebenen Bedingungen entspricht.“ Fragestellung: was sind diese Bedingungen?

Strukturelle Antwortdetermination Ajdukiewicz (1934): jeder Fragesatz enthält einen logischen Satz oder ein Satzfragment, der bzw. das die Menge der möglichen Antworten bestimmt, z.B. (8) Wer entdeckte Amerika? enthält als Satzfunktion (datum questionis) „x entdeckte Amerika“ und grenzt dadurch die Menge der zulässigen Antworten auf diejenigen ein, die etwas in die Frageunbekannte x einsetzen.

Strukturelle Antwortdetermination Wie lässt sich dabei eine Äußerung als Reaktion auf eine Frage als Antwort bzw. Nicht-Antwort einordnen? Conrad führt aus, dass eine Frage neben der generellen Aufforderung, etwas mitzuteilen, grundsätzliche Bedingungen für eine gültige Antwort im Fragesatz übermittelt: ein bereits bis auf die gefragte(n) Stelle(n) ausgefülltes Strukturschema eines Satzes, dem die Antwort entsprechen muss (gilt vor allem für geschlossene, weniger für offene Fragen) die Forderung, in der Antwort die vorher als gefragt markierten Stellen in Übereinstimmung mit der Funktion (Frageunbekannten) zu ersetzen.

Strukturelle Antwortdetermination Diese Abhängigkeit der Zahl und Form möglicher Antworten von den strukturellen Eigenschaften der Frage selbst bezeichnet Conrad als „strukturelle Antwortdetermination“ (strukturell ist in diesem Zusammenhang nicht gleichbedeutend mit reinen syntagmatischen Abhängigkeiten

Strukturelle Antwortdetermination Veranschaulichung des Begriffs „strukturelle Antwortdetermination.“ (9) Welchen Wochentag sollte man am besten abschaffen? (9’) *Man sollte am besten den Januar abschaffen. In der Frage ist einerseits dem in der Frage vorgegebenen Strukturschema Rechnung getragen, aber die Frageunbekannten wurde mit einem Element einer anderen als der in der Frage vorgegebenen Klasse ersetzt (Wochentag vs. Monat), somit ist (9’) keine gültige Antwort auf (9).

Strukturelle Antwortdetermination Analog: (10) Wo warst du heute Essen? (10’) *Das Geld steckt unter der Matratze. „unter der Matratze“ ist zwar eine mögliche Einsetzungsinstanz für „wo“, aber der Satz trägt nicht dem in der Frage vorgegebenen Strukturschema Rechnung, ist also keine gültige Antwort auf (10).

Strukturelle Antwortdetermination Wichtig: die strukturelle Antwortdetermination kann nicht allein an syntaktischen Beziehungen zwischen Frage und Antwort festgemacht werden, sondern es ist im Gegenteil wichtig, sie vor allem auf semantischer Ebene festzumachen. Fälle, in denen beides gilt (syntaktische Kongruenz), sind zwar häufig anzutreffen, aber letztlich leider nur Spezialfälle der strukturellen Antwortdetermination, die nicht alle Frage-Antwort-Paare abdecken können).

„Offene“ und „geschlossene“ Fragen eine in der Logikliteratur verbreitete Unterscheidung in Verbindung des Begriffs des „Antwortschemas“ Conrad (1978) beschreibt einerseits „geschlossene Fragen“ als solche, für die man „ein erschöpfendes Verzeichnis der möglichen Antworten, ein Antwortschema oder eine wirksame Methode zur Konstruktion zulässiger Antworten geben kann. Analog dazu sind „offene Fragen“ solche, bei denen dies alles nicht der Fall ist.

„Offene“ und „geschlossene“ Fragen Problem: Abgrenzung der beiden Fragetypen. Tondl (1969) führt zu Recht an, dass eine „solche scharfe Trennungslinie auf Grund der Unbegrenztheit des menschlichen Erkenntnisprozesses auch kaum möglich sein dürfte“.

„Offene“ und „geschlossene“ Fragen Typische offene Fragen nach Definition wären z.B. (11) Was weißt du über das viktorianische Zeitalter? (12) Warum hast du wieder mit dem Rauchen angefangen? (13) Wie kam es zum Abwurf der Atombombe?

„Offene“ und „geschlossene“ Fragen Akzeptable bzw. zulässige Antworten für (11) wären z.B. (11’) Es war die Regierungsperiode von Königin Victoria von England. (11’’) Im viktorianischen Zeitalter entwickelte sich England zur führenden Kolonialmacht. (11’’’) Während dieser Zeit stieg das Besitzbürgertum zur prägenden Kraft Englands auf.

„Offene“ und „geschlossene“ Fragen (11’’’’) Das viktorianische Zeitalter war die Regierungszeit von König Victor I. und dauerte von 1883-1904. kann nach Definition auch als zulässige Antwort auf (11) angesehen werden, obwohl sich ihr Wahrheitswert von den Antworten (11’-11’’’) unterscheidet. (11’-11’’’’) stellen aber in ihrer Gesamtheit z.B. keine zulässigen Antworten auf die offene Frage (12) dar.

„Offene“ und „geschlossene“ Fragen Folgerung: auch „offene“ Fragen sind in Hinsicht auf die Konstruktion der Antwort nicht völlig offen. Es können nicht beliebige Erwiderungen gegeben werden, sondern nur welche, die zu dem X, das in der „offenen Frage“ als Geltungsbereich eingeführt wird, in einer Relation stehen.

„Offene“ und „geschlossene“ Fragen weitere Einschränkung: (11’’’’’) *Ich hätte so gerne während des viktorianischen Zeitalters gelebt. keine zulässige Antwort auf (11), denn obwohl die Antwort in Relation zum Geltungsbereich „viktorianisches Zeitalter“ steht, genügt sie nicht den Frageparametern, in welchen nicht beliebige Aussagen über das viktorianische Zeitalter erwartet werden, sondern nur solche, die irgend eine Form von Wissen des Hörers über den Geltungsbereich „viktorianisches Zeitalter“ zum Ausdruck bringen.

Antworterwartung Generelle Definition der Antworterwartung: „eine Annahme oder Vermutung des Fragestellers über diejenige(n) Aussage(n), die er mit einer bestimmten Wahrscheinlichkeit auf seine Frage als Antwort erwartet.“

Antworterwartung Antworterwartung in Kombination mit der strukturellen Antwortdetermination. Erinnerung: die strukturelle Antwortdetermination ist diejenige Beziehung zwischen Frage und Antwort, durch die die Menge der linguistisch möglichen oder zulässigen Antworten definiert ist.

Antworterwartung Fragebeispiele (12) Bist du in meiner Arbeitsgruppe? (12a) Du bist in meiner Arbeitsgruppe? sind vom Standpunkt der strukturellen Antwortdetermination aus beide Entscheidungsfragen, die eine ja/nein Entscheidung verlangen.

Antworterwartung Tatsächlich hat aber (12) den Wert einer neutralen Entscheidungsfrage (ja oder nein wird mit gleicher Wahrscheinlichkeit erwartet), während (12a) schon eine bestimmte Vermutung über die wahrscheinliche Antwort enthält.

Antworterwartung Conrad (1978) folgert daraus, dass die Mengen zulässiger (strukturelle Antwortdetermination) und erwarteter (Antworterwartung) Antworten in vielen Fällen divergieren, aber in einigen Fällen (z.B. neutrale Entscheidungsfragen) auch übereinstimmen können.

Antworterwartung die II. Es gibt Grenzfälle, in denen die Antworterwartung außerhalb der nach struktureller Antwortdetermination möglichen Antworten liegt:

Antworterwartung die II. (13) Darf es noch etwas sein? Der Verkäufer erwartet hier nur im „Nein“-Falle eine echte Antwort auf die gestellte Frage („Nein, danke.), während im „Ja“ Falle unmittelbar eine Antwort auf die nicht explizit gestellte aber implizierte Frage „Welche weiteren Artikel möchten sie?“ erwartet wird.

Antworterwartung die II. Laut Conrad kein Ausnahmefall für die Relation von Antwortdetermination und Antworterwartung, da in diesen Fällen die strukturell tatsächlich gegebene Antwortdetermination durch eine zweite, nicht direkt ablesbare ersetzt wird. (Verwandtschaft zu indirekten Antworten)

Frageklassifizierung Conrad unterteilt Fragetypen zunächst in „Ergänzungsfragen“ und „disjunktive Fragen“, und verfeinert dann die Klassifizierung mit Hilfe von speziellen Strukturschemen Anderer Ansatz: Graesser: „Eine Taxonomie für Erkundigungen“

Typologie Conrad - Beispiele Unmarkiertes formales Strukturschema (unmarkiert = für jeden Fragetyp gültig) ?x[Kg](S(x)) ? = Frageoperator (jeder Frage inhärente Aufforderung zur Ermittlung der A bzw. diese dem Fragesteller mitzuteilen) [Kq] = Fragebereich, zu dem gefragtes Element X gehören muss S(X) = Antwortschema (ein im Fragesatz selbst vorgegebener Satz, der X enthält

Typologie Conrad - Beispiele (I) Ergänzungsfragen (Erweiterung der allg. Struktur durch Quantoren oder Quantifikatoren) Bsp.:“Welcher“ -> Jota Operator wird Strukturschema hinzugefügt: ?Jx[Kq] („welches ist dasjenige x,das…?“) (Plural ?Jkx[Kq] („welches sind diejenigen X, die…“ mit k>1)

Typologie Conrad - Beispiele (I) Ergänzungsfragen Unterteilung in WELCHER und WAS FÜR EIN, WER und WAS, WAS TU-/MACH, WIE (Quantifizierung), WIE (Art des Prädikats), WIE (Verfahrensweise), WO, WOHER, WOHIN, WANN, WARUM, WIEVIEL (jeweils mit entsprechenden Operatoren)

Typologie Conrad - Beispiele (II) Disjunktive Fragen Modifikation des Strukturschemas dahingehend, dass 2 bis n Elemente x den Fragebereich ausfüllen können: ?x[x1, x2, … xn] S(x))

Typologie Conrad - Beispiele (II) Disjunktive Fragen Alternativfragen Entscheidungsfragen Neutrale Entscheidungsfragen Mit bestimmter Antworterwartung

Typologie Graesser Siehe Handout

Projekt!? Z.B. Anwendung der vorgestellten Typologien zur Systematisierung eines großen Fragenkorpus (mehrere FAQ Sammlungen) Betrachtung weiterer Typologien neben den vorgestellten Problembehandlung, Grenzfallanalyse, Überlegungen ob es Möglichkeiten gibt, bestehende Typologien zu verbessern

Literatur Conrad, Rudi: Studien zur Syntax und Semantik von Frage und Antwort. Akademie-Verlag. Berlin, 1977. Graesser, Arthur et al. "Mechanisms that Generate Questions" in Lauer / Peacock, Questions and Information systems (Frageklassifikation) Projektseite: www.jaganaud.de/fas/