Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Antje Heidecker Geändert vor über 9 Jahren
1
Seite 1 Gegründet im Jahr 1669, ist die Universität Innsbruck heute mit mehr als 28.000 Studierenden und über 4.000 Mitarbeitenden die größte und wichtigste Forschungs- und Bildungseinrichtung in Westösterreich. Alle weiteren Informationen finden Sie im Internet unter: www.uibk.ac.at. Korpus der Zeitschrift des Deutschen und Österreichsichen Alpenvereins Claudia Posch, claudia.posch@uibk.ac.at Gerhard Rampl, gerhard.rampl@uibk.ac.at go!digital
2
Seite 2 Projektidee: spezialisiertes Korpus des ZAV Digitalisierung und korpuslinguistische Erschließung alpinistischer Texte Inspiriert durch das Korpus: Text&Berg digital (Volk/Bubenhofer, Zürich); www.textberg.ch (=Parallelkorpus)www.textberg.ch Vielfältige linguistische Analysemethoden: Wie wird über die Berge geschrieben? Bubenhofer, N. ; Volk, M. ; Klaper, D. ; Weibel, M. ; Wüest, D. (Hrsg.): Text+Berg-Korpus (Release 147_v03) : Institut für Computerlinguistik, Universität Zürich, 2013. go!digital
3
Seite 3 Partner Martin Achrainer, Oesterreichischer Alpenverein (OeAV), Archiv & Geschichte d. OeAV & Alpenarchiv Günter Mühlberger, Abteilung für Digitalisierung & Elektronische Archivierung (DEA), Institut für Germanistik Innsbruck Karlheinz Mörth, Institut für Corpuslinguistik und Texttechnologie (ICLTT), ÖAW Noah Bubenhofer, TU Dresden, Institut für Germanistik, Professur für Angewandte Linguistik,Projektleiter Text+Berg digital Gerald Hiebl, Universität Innsbruck, Arbeitsbereich Vermessung und Geoinformation Neue PartnerInnen Martin Volk, Institut für Computerlinguistik, Universität Zürich Michel Généreux, Verena Lyding, Egon W. Stemle Institut for Specialized Communication and Multilingualism, EURAC – Bozen go!digital
4
Seite 4 Quellen Zeitschrift des Deutschen und Oesterreichischen Alpenvereins (1872 – 1942) Zeitschrift des Oesterreichischen Alpenvereins (1949 – today) ca. 150 – max. 500 Seiten pro Band ca. 38.000 Buchseiten wissenschaftliche Beiträge, Expeditions- und Besteigungsberichte, Routenbeschreibungen, Beschreibungen von Bergen und Gebirgen, Alpinliteratur kleine Textsorten werden ausgeklammert (e.g. Karten, Kleinanzeigen, usw.) go!digital
5
Seite 5 Vorarbeiten Oktober 2013: Gastvortrag von N. Bubenhofer in Innsbruck Daten schürfen am Textberg. Linguistische Analysen zum Sprechen übers Bergsteigen. Workshop zum Wissenstransfer Übergabe des Text&Berg Korpus und XML Daten zu Testzwecken ZAV – in TIF, PDF und FineReader Format auf ALO Rudimentäre Metadatenauszeichnung Neuscan mit FineReader 11 Pilotprojekt mit zwei Testbänden 1885, 1985 go!digital
6
Seite 6 Projektstart 15. Oktober Inst. f. Sprachen und Literaturen, Abt. Sprachwissenschaft: Mag. Daniela Feistmantl, Mag. Irina Windhaber Abt. Digitalisierung & Elektronische Archivierung (DEA), Inst. f. Germanistik, Uni IBK Dipl.-Ing. Sebastian Colutto go!digital
7
Seite 7 FEP Functional Extension Parser Digitalisierung & Elektronische Archivierung (DEA)
8
Seite 8
9
Seite 9
10
Seite 10
11
Seite 11
12
Seite 12 Projekt Ziel 1: Datenexport Datenstruktur + Metadaten Datenexport in unterschiedliche Formate TEI-Konform mit den CLARIN-standards Für Integration in die corpus_shell (ICLTT) go!digital
13
Seite 13 Projektziel 2: linguistische Annotation Tokenisierung SBD Annotierung NER Trainierter TreeTagger und Lexikon von Text&Berg verwendbar go!digital
14
Seite 14 Projektziel 3: NER und Publikation des Korpus Verbesserung der NER mittels vorhandener Namendatenbanken Integration in Ontologien (CIDOC) IMS Open Corpus Workbench (CWB): CQP-web corpus_shell (ICLTT)
15
Seite 15 Weitere Möglichkeiten Weitere Textverbesserungen durch Crowdsourcing Deutsches Textarchiv, SAC- KOKOS) OeAV garantiert auch die Verwendung weiterer Daten/OeAV Archivalien go!digital
16
Seite 16 Weitere Ziele Kritische Diskursanalyse: Topoi, Intensivierer, Personalpronomina Intensivierer, Geokollokationen Onomastik: Bergnamenforschung, Mikrotoponymie go!digital
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.