Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Institut für Informatik eAQUA Extraktion von strukturiertem Wissen aus antiken und frühneuzeitlichen Quellen für die Altertumswissenschaft Charlotte Schubert,

Ähnliche Präsentationen


Präsentation zum Thema: "Institut für Informatik eAQUA Extraktion von strukturiertem Wissen aus antiken und frühneuzeitlichen Quellen für die Altertumswissenschaft Charlotte Schubert,"—  Präsentation transkript:

1 Institut für Informatik eAQUA Extraktion von strukturiertem Wissen aus antiken und frühneuzeitlichen Quellen für die Altertumswissenschaft Charlotte Schubert, Gerhard Heyer Universität Leipzig

2 eAQUA 2 C. Schubert, G. HeyereAQUA Textorientierte Altertumswissenschaften und sprachverarbeitende Informatik: Eine interdisziplinäre Kooperation Die... Wissenschaft um das Altertum hat natürlich keine ewige Dauer, ihr Stoff ist zu erschöpfen. Nicht zu erschöpfen ist die immer neue Akkomodation jeder Zeit an das Altertum, das Sich- daran-Messen. (F. Nietzsche, Unzeitgemäße Betrachtungen, Gedanken und Entwürfe zu der unzeitgemäßen Betrachtung: Wir Philologen, Nr.7, München 1964, 391)

3 eAQUA 3 C. Schubert, G. HeyereAQUA Der Projektverbund: Geistes- und NaturwissenschaftlerInnen H.-Schmidt-Universität Hamburg Prof. Dr. Burkhard Meißner Projekt CAMENA, Universität Heidelberg Prof. Dr. Wilhelm Kühlmann Universität Leipzig Prof. Dr. Charlotte Schubert / Prof. Dr. Reinhold Scholl Prof. Dr. Marcus Deufert / Prof. Dr. Kurt Sier Prof. Dr. Gerhard Heyer Wissenschaftlicher Beirat Prof. G. Crane (Tufts University, USA), Dr. J. Garcés (British Library, UK), Prof. E.Gaussier (Grenoble, FRA)

4 eAQUA 4 C. Schubert, G. HeyereAQUA Bereits erfolgreich laufende Kooperationen: –Leipzig/Altertumswissenschaften: Etablierung eines gemeinsamen Masterstudiengangs Classical Studies (akkreditiert) –Leipzig/Alte Geschichte und Informatik (ASV): Aufbau einer TLG- basierten Kookkurrenz- und Satz-Datenbank (http://wortschatz.uni- leipzig.de/eaqua/)http://wortschatz.uni- leipzig.de/eaqua/ –Leipzig/ Alte Geschichte und Universitätsbibliothek: Digitalisierungsprojekte (Deutsches Papyrus-Portal, Codex Sinaiticus mit British Library)

5 eAQUA 5 C. Schubert, G. HeyereAQUA Die Wissensbasis Die digitalen Bibliotheken antiker Texte: (fast) vollständige Korpora: –Perseus, Thesaurus Linguae Graecae (TLG), Bibliotheca Teubneriana Latina (BTL), Library of Latin Text, PHI (Inschriften, Papyri) Anwendung und Weiternutzung: –Kooperation mit folgenden Partnern und freie Nutzung des zu entwickelnden Tools: Perseus, USA (2,1 Mio Zugriffe/Monat) British Library, UK (2 Mio Zugriffe/Monat) Camena/ Termini, Heidelberg ( Zugriffe/Monat) Wortschatz-Portal der ASV, Leipzig ( Webseite: ca. 1 Mio Zugriffe/Monat, Webservice: 5 Mio/Monat) –Publikation der Einzelprojekte

6 eAQUA 6 C. Schubert, G. HeyereAQUA Das Ziel: Vom Wissensrohstoff zu strukturiertem Wissen Von der Überlieferungsgeschichte zur Wissenschaftsgeschichte: Transferstufen, Weiterverwendungen, Umwertungen, Neubildungen I.Neue inhaltliche Zusammenhänge: – Gewinnung von neuen und inhaltlich relevanten Zusammenhängen Teilprojekte Atthidographen, Platon – Ergänzung von fragmentarischen Texten Teilprojekte Inschriften/ Papyri – Neue metrische Zusammenhänge Teilprojekt Plautinische Metrik II. Wissensnetze – Bestimmung bzw. Überprüfung von Autorenschaften, Referenzen, Abhängigkeiten und Zitaten Teilprojekt Camena

7 eAQUA 7 C. Schubert, G. HeyereAQUA Beispiel: Gewinnung von neuen und inhaltlich relevanten Zusammenhängen

8 eAQUA 8 C. Schubert, G. HeyereAQUA Architektur der Plattform

9 eAQUA 9 C. Schubert, G. HeyereAQUA Warum ist die ASV für diese Aufgaben qualifiziert? Erfahrungen mit großen und kleinen Textkorpora – Leipzig Corpus Collection (LCC): 18 fertige Normgrößenkorpora (http://corpora.uni-leipzig.de/)http://corpora.uni-leipzig.de/ – Mitglied in D-SPIN/CLARIN Erfahrungen mit Text Mining – Kookurrenzanalyse – Überwachtes und unüberwachtes POS-Tagging – Differenzanalyse – Semantische Wortähnlichkeiten – Morphologische Analyse – Rechtschreibkorrektur (Aufbereitung von verrauschten Korpora )

10 eAQUA 10 C. Schubert, G. HeyereAQUA Wechselwirkung zwischen Geistes- und Naturwissenschaften AltertumswissenschaftenInformatik Ergänzung fachspezifischer Arbeits- methoden durch Texttechnologien Erweiterung der Fragestellungen (Von der Überlieferungs- zur Wissenschaftsgeschichte) Codierungsprobleme (Griechisch, Latein, Textkommentare) Die Texte umfassen einen großen Zeit- raum, daher Probleme mit konsistenten Bezeichnern und semantischem Wandel Möglichkeit der Einflussnahme auf die Entwicklung fachspezifischer Textanalyse-Werkzeuge Vorreiter einer neuen Generation traditioneller Geisteswissenschaft Verallgemeinerung der entwickelten Verfahren zu einer allgemeinen Stilometrie Übertragung dieser Verfahren auf andere Anwendungen (Identifikation und Verifikation von Autorenschaften) Herausforderungen Chancen

11 eAQUA 11 C. Schubert, G. HeyereAQUA

12 eAQUA 12 C. Schubert, G. HeyereAQUA eAQUA Extraktion von strukturiertem Wissen aus Antiken Quellen für die Altertumswissenschaft Charlotte Schubert, Gerhard Heyer Universität Leipzig


Herunterladen ppt "Institut für Informatik eAQUA Extraktion von strukturiertem Wissen aus antiken und frühneuzeitlichen Quellen für die Altertumswissenschaft Charlotte Schubert,"

Ähnliche Präsentationen


Google-Anzeigen