Charlotte Schubert, Gerhard Heyer Universität Leipzig

Slides:



Advertisements
Ähnliche Präsentationen
Kernveranstaltung: 4. – 6. Juli 2008
Advertisements

Zentrales Verzeichnis Digitalisierter Drucke
Eine Frage der Sichtweise
eAQUA: Teilprojekt Atthidographen
Papyrologie und Textmining.
Fachkommission FH-Bibliotheken (FHB) Jahrestagung 16. Juni 2009
Für Studierende im Bereich Bibliotheks- und Informationswesen Präsentation an der Fachhochschule Köln am
1 Retrodigitalisierung und Langzeitarchivierung Die Bedeutung internationaler Standards Die Idee der Verteilten Digitalen Forschungsbibliothek – Bericht.
Information Portal Suite (IPS)
ZfS Aachen: Kompetenzen und Dienstleistungen für Mittelstand und Lehre.
DFG-Projekt „Aufbau einer Informationsplattform zu Open Access“ – Ziele, Struktur und Inhalte Homepage: Anja Kersting Bibliothek der.
Hamburg University Press Der Open-Access-Verlag der Staats- und Universitätsbibliothek Hamburg Carl von Ossietzky Entwicklung – Produkte – Vernetzung Isabella.
DFG-Projekt Architektur- und Ingenieurzeichnungen der deutschen Renaissance. Digitalisierung und wissenschaftliche Erschließung des Zeichnungsbestandes.
Virtuelle Fachbibliothek Romanischer Kulturkreis
Dr. Helmuth Sagawe WS 2010/11 Universität Heidelberg
Ein Projekt des Ibero-Amerikanischen Institutes Berlin, des Institutes für Iberoamerika-Kunde Hamburg, der Staats- und Universitätsbibliothek Bremen und.
Die Elektronische Zeitschriftenbibliothek
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Gegen die Vergänglichkeit digitaler Informationen Susanne Kurz AWV Sitzung Daten- und Speichermanagement, Köln,
Leistungszentren für Forschungsinformation II – Sicherung und Bereitstellung von Textquellen und Primärdaten DINI – AG Informationsmanagement Essen, 17.
Literaturverwaltung und Wissensorganisation
Seite 1 Dr. F. Bode / Düsseldorf / Hochschulrektorenkonferenz 1996: In der Informationsgesellschaft werden sich Methoden und Techniken der Erzeugung,
Erschließen von semantischen Referenzen mit Ontology-Reasoning-Werkzeugen Das Ziel dieser Masterarbeit war die Erweiterung des ORBI Systems um ein Inferenz-System.
Wissenschaftliches elektronisches Publizieren
Datenbanken vs. Markup Manfred Thaller WS 2009/2010 Humanities Computing Linda Scholz.
Der Umgang mit qualitativ erhobenen Daten: Strategien der Datenanalyse
1 · Universität Oldenburg · Fakultät II – Department für Informatik · Abteilung Informationssysteme · Escherweg 2 · Oldenburg.
Datenbanksystementwicklung – Praktikum & Vorlesung – WS 2004/2005
Die Virtuelle Fachbibliothek Altertum
Spree SoSe 2007 Titel Lexikographie und Metalexikographie Lexikonproduktion und Lexikontheorie Dank an Franziskus Geeb, der mir seine Unterrichtsmaterialien.
Indexierung - Verschlagwortung
Dipl. Phys. Marisela Bohne Universität Bremen Dipl. Phys. Julika Mimkes ISN Oldenburg.
Elektronische, internetbasierte Lerninfrastruktur für die Aus- und Weiterbildung an der FHTW Berlin 1. Juni Mai 2006 eTrain.
Citavi im Prozess der wissenschaftlichen Arbeit
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Thomas Hilmer Fachbereich Philosophie / Geschichtswissenschaften
April 09_1 Universität Rostock Die Interdisziplinäre Fakultät mit den Departments: - Life, Light and Matter - Maritime Systems - Aging Science and Humanities.
Executive Master of Insurance
Gerd Grasshoff Universität Bern SS 2010
E-lib.ch im europäischen Kontext von Wolfram Neubauer, Zürich Digitale Medien und Infrastrukturen / 11. u
Rechtliche Grundlagen
Teilprojekt Bibliothek Präsentation aus Anlass des öffentlichen Hearings 23. Juni 2010 Prof. Dr. Elisabeth Oy-Marra Institut für Kunstgeschichte mit Arbeitsbereich.
Rechtliche Grundlagen
Deutsche Digitale Bibliothek Ein großes Vorhaben nimmt Gestalt an 1.
Kathrin Grummich1, Katrin Jensen2 Christoph M Seiler1 Markus K Diener1
Wissenschaftliches Arbeiten im Ausland
FAU Erlangen-Nürnberg Department Geschichte Professur für Alte Geschichte Herzlich Willkommen zum ModulEinführung in die Arbeitsweise der Altertumswissenschaft.
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? nestor und Grid Jens Ludwig Baden-Baden, 2.
What works? Die Synthese von Hattie (2009)
Überlegungen zum Contentmanagement an der Universität Wien
Gymnasium (Sekundarstufe II) Dresden, Juni 2009Dr. Anja Abdel-Haq Fina Frauen in Ingenieur- und Naturwissenschaften.
DFG Round Table Session “Web Research” Darmstadt
Wissensbewegungen – Bewegliches Wissen
Philippe Blanchard Hans-Jürgen Eikmeyer Barbara Job Alexander Mehler Sprachliche Netzwerke texttechnologische Repräsentation computerlinguistische Synthese.
Archäologie Thomas Arkai, 10a. Aufbau 1) Vorraussetzungen für das Studium 2) Lernbereich 3) Dauer und was man damit anfangen kann 4) Universitäten.
Eike Schallehn, Martin Endig
Die Alexander von Humboldt-Stiftung Verknüpfung wissenschaftlicher Exzellenz weltweit – Wissenstransfer und Kooperation auf höchstem Niveau.
BADI – Barrierefreie Aufbereitung Digitaler Inhalte
Digitising Patterns of Power (DPP)
Physik multimedial: LiLi und die Lernplattform physik multimedial Lehr- und Lernmodule für das Studium der Physik als Nebenfach Julika Mimkes:
Computer und Internet fürs Altgriechische laudamus veteres sed nostris utimur annis (Ovid, Fasti 1,225) „Wir loben die alte, nutzen aber unsere Zeit.“
Bibliothek2.0 VZG Verbundzentrale des GBV (VZG) ‏ Till Kinstler / Digitale Bibliothek 1 Bibliothek 2.0 – Planungen und Realisierungen der Verbundzentrale.
Citavi im Prozess der wissenschaftlichen Arbeit
Einführung eines Forschungsinformationssystems an der WWU Münster Workshop Forschungsinformationssysteme Karlsruhe, 22./
Ziel - Konzept - Realisierung 28. August 2003 Ursula Jutzi.
Webzubi Ein Web 2.0-Netzwerk zur Gestaltung innovativer Berufsausbildung für gewerblich-technische Auszubildende.
RHEIN-MAIN-UNIVERSITÄTEN – EINE STRATEGISCHE ALLIANZ – Unterzeichnung der Rahmenvereinbarung 11. Dezember 2015 Prof. Dr. Birgitta Wolff PRÄSIDENTIN DER.
Vernetzung von Projekten und Initiativen zur Überwindung der Digitalen Spaltung Prof. Dr. Herbert Kubicek.
Gefördert durch die Senatsverwaltung für Justiz des Landes Berlin und den Europäischen Sozialfonds Erfahrungen bei der Etablierung und Entwicklung eines.
Technische und soziale forschungsinfrastrukturen für die humanities das beispiel dagaare – english – cantonese dictionary eveline wandl-vogt1, adams bodomo2,
 Präsentation transkript:

Charlotte Schubert, Gerhard Heyer Universität Leipzig eAQUA Extraktion von strukturiertem Wissen aus antiken und frühneuzeitlichen Quellen für die Altertumswissenschaft Charlotte Schubert, Gerhard Heyer Universität Leipzig

Textorientierte Altertumswissenschaften und sprachverarbeitende Informatik: Eine interdisziplinäre Kooperation „Die ... Wissenschaft um das Altertum hat natürlich keine ewige Dauer, ihr Stoff ist zu erschöpfen. Nicht zu erschöpfen ist die immer neue Akkomodation jeder Zeit an das Altertum, das Sich- daran-Messen.“ (F. Nietzsche, Unzeitgemäße Betrachtungen, Gedanken und Entwürfe zu der unzeitgemäßen Betrachtung: Wir Philologen, Nr.7, München 1964, 391) C. Schubert, G. Heyer eAQUA

Der Projektverbund: Geistes- und NaturwissenschaftlerInnen H.-Schmidt-Universität Hamburg Prof. Dr. Burkhard Meißner Projekt CAMENA, Universität Heidelberg Prof. Dr. Wilhelm Kühlmann Universität Leipzig Prof. Dr. Charlotte Schubert / Prof. Dr. Reinhold Scholl Prof. Dr. Marcus Deufert / Prof. Dr. Kurt Sier Prof. Dr. Gerhard Heyer Wissenschaftlicher Beirat Prof. G. Crane (Tufts University, USA), Dr. J. Garcés (British Library, UK), Prof. E.Gaussier (Grenoble, FRA) C. Schubert, G. Heyer eAQUA

Bereits erfolgreich laufende Kooperationen: Leipzig/Altertumswissenschaften: Etablierung eines gemeinsamen Masterstudiengangs Classical Studies (akkreditiert) Leipzig/Alte Geschichte und Informatik (ASV): Aufbau einer TLG- basierten Kookkurrenz- und Satz-Datenbank (http://wortschatz.uni- leipzig.de/eaqua/) Leipzig/ Alte Geschichte und Universitätsbibliothek: Digitalisierungsprojekte (Deutsches Papyrus-Portal, Codex Sinaiticus mit British Library) C. Schubert, G. Heyer eAQUA

Die Wissensbasis Die digitalen Bibliotheken antiker Texte: (fast) vollständige Korpora: Perseus, Thesaurus Linguae Graecae (TLG), Bibliotheca Teubneriana Latina (BTL), Library of Latin Text, PHI (Inschriften, Papyri) Anwendung und Weiternutzung: Kooperation mit folgenden Partnern und freie Nutzung des zu entwickelnden Tools: Perseus, USA (2,1 Mio Zugriffe/Monat) British Library, UK (2 Mio Zugriffe/Monat) Camena/ Termini, Heidelberg (200.000 Zugriffe/Monat) Wortschatz-Portal der ASV, Leipzig ( Webseite: ca. 1 Mio Zugriffe/Monat, Webservice: 5 Mio/Monat) Publikation der Einzelprojekte C. Schubert, G. Heyer eAQUA

Das Ziel: Vom Wissensrohstoff zu strukturiertem Wissen Von der Überlieferungsgeschichte zur Wissenschaftsgeschichte: Transferstufen, Weiterverwendungen, Umwertungen, Neubildungen I. Neue inhaltliche Zusammenhänge: Gewinnung von neuen und inhaltlich relevanten Zusammenhängen Teilprojekte Atthidographen, Platon Ergänzung von fragmentarischen Texten Teilprojekte Inschriften/ Papyri Neue metrische Zusammenhänge Teilprojekt Plautinische Metrik II. Wissensnetze Bestimmung bzw. Überprüfung von Autorenschaften, Referenzen, Abhängigkeiten und Zitaten Teilprojekt Camena C. Schubert, G. Heyer eAQUA

Beispiel: Gewinnung von neuen und inhaltlich relevanten Zusammenhängen C. Schubert, G. Heyer eAQUA

Architektur der Plattform C. Schubert, G. Heyer eAQUA

Warum ist die ASV für diese Aufgaben qualifiziert? Erfahrungen mit großen und kleinen Textkorpora Leipzig Corpus Collection (LCC): 18 fertige Normgrößenkorpora (http://corpora.uni-leipzig.de/) Mitglied in D-SPIN/CLARIN Erfahrungen mit Text Mining Kookurrenzanalyse Überwachtes und unüberwachtes POS-Tagging Differenzanalyse Semantische Wortähnlichkeiten Morphologische Analyse Rechtschreibkorrektur (Aufbereitung von verrauschten Korpora) Anmerkungen: ----------------- C. Schubert, G. Heyer eAQUA

Wechselwirkung zwischen Geistes- und Naturwissenschaften Altertumswissenschaften Informatik Ergänzung fachspezifischer Arbeits- methoden durch Texttechnologien Erweiterung der Fragestellungen (Von der Überlieferungs- zur Wissenschaftsgeschichte) Codierungsprobleme (Griechisch, Latein, Textkommentare) Die Texte umfassen einen großen Zeit- raum, daher Probleme mit konsistenten Bezeichnern und semantischem Wandel Möglichkeit der Einflussnahme auf die Entwicklung fachspezifischer Textanalyse-Werkzeuge Vorreiter einer neuen Generation traditioneller Geisteswissenschaft Verallgemeinerung der entwickelten Verfahren zu einer allgemeinen Stilometrie Übertragung dieser Verfahren auf andere Anwendungen (Identifikation und Verifikation von Autorenschaften) Herausforderungen Chancen Anmerkungen: ----------------- C. Schubert, G. Heyer eAQUA

C. Schubert, G. Heyer eAQUA

Charlotte Schubert, Gerhard Heyer Universität Leipzig eAQUA Extraktion von strukturiertem Wissen aus Antiken Quellen für die Altertumswissenschaft Charlotte Schubert, Gerhard Heyer Universität Leipzig Anmerkungen: ----------------- C. Schubert, G. Heyer eAQUA