D-SPIN CLARIN Deutsche Sprachressourcen Infrastruktur (D-SPIN) Prof. Dr. Erhard Hinrichs D-SPIN Koordinator Universität Tübingen.

Slides:



Advertisements
Ähnliche Präsentationen
Beate Sturm (SUB/MPDL)
Advertisements

Markus Zimmermann T-Systems Solutions for Research GmbH
Charlotte Schubert, Gerhard Heyer Universität Leipzig
Mediencommunity 2.0 Das Wissensnetzwerk der Druck- und Medienbranche
Innovationstransferprojekt
Zur SCORM-Fähigkeit konventioneller XML-unterstützender eLearning Developer Tools im Projekt I-can-EIB OFFIS Oldenburger Forschungs- und Entwicklungsinstitut.
Einfluss von Web Services Technologien auf organisatorische Strukturen Referent: Sergej Groß
1 Retrodigitalisierung und Langzeitarchivierung Die Bedeutung internationaler Standards Die Idee der Verteilten Digitalen Forschungsbibliothek – Bericht.
Deutsches Forschungsnetz. Zentren für Kommunikation und Informationstechnik in Lehre und Forschung Herbsttagung Technische Universität Ilmenau 12. September.
DataCite Jan Brase, TIB & DataCite 3. November 2011 TIB-Workshop zur DOI-Registrierung Hannover.
Library of Labs Co-funded by the Community programme eContentplus Library of Labs WP 4: Metadaten Definition Universitätsbibliothek Stuttgart (UBS)
Dublin Core Antje Schregel, Dublin Core Was ist DC? Architektur von DC (Elements, Qualifiers) Anwendung Aktuelle Situation Projekte.
Dr. Christian Hänger, Magnus Pfeffer
Natascha Schumann TU Darmstadt IuK-Konferenz, März 2003
IuK2003, Osnabrück Th. Severiens, ViFaPhys Virtuelle Fachbibliothek Physik Ein kooperatives Dienstleistungsangebot für die Physik.
Zum Stand und den Perspektiven des Kompetenznetzwerks Neue Dienste, Standardisierung, Metadaten (bmb+f) Rudi Schmiede Infrastrukturen für innovative Digital.
Knowledge Exchange Ein Netzwerk von vier europäischen Förderorganisationen 8th International Bielefeld Conference, Bielefeld, Dr. Sigrun Eckelmann.
Einige Bemerkungen zur weiteren Entwicklung der informationellen Infrastruktur in Deutschland und Europa Gert G. Wagner.
Alliance for Permanent Access to the Records of Science - Eine Vision für die Langzeitarchivierung von Forschungsdaten in Europa Stefan Strathmann SUB.
Dr. Joachim Mönkediek Netzmemorandum Überarbeitung des Netzmemorandums in den Punkten: Redundanz Mobilität, Funkvernetzung Konvergenz der.
Gegen die Vergänglichkeit digitaler Informationen Susanne Kurz AWV Sitzung Daten- und Speichermanagement, Köln,
Eigenschaften und Pflichten vertrauenswürdiger digitaler Archive
Self-study online e-learning und e-teaching Medienentwicklung an der Universität Stuttgart 1.
WIESEL – Integration von Wissensmanagement und E-Learning auf der Basis von Semantic Web Technologien Matthias Rust, XML-Tage 2004, Berlin WIESEL Integration.
Jörg Feuerhake 13. September 2005, Berlin
Mit Condat-Effekt. Mobile Business we make IT berlinbrandenburg XML-Tage 2005: E-Learningforum Blended Learning in der Praxis (2)
7th international Bielefeld Konferenz Thinking beyond Digital Libraries Designing the Information Strategy for the next Decade Dynamische Infrastrukturen.
Community Building im Bereich ePublishing Das CARPET Projekt.
Spree SoSe 2007 Titel Lexikographie und Metalexikographie Lexikonproduktion und Lexikontheorie Dank an Franziskus Geeb, der mir seine Unterrichtsmaterialien.
Pflichtenhefterstellung
Data Documentation Initiative (DDI)
Neues BMBF-Fachprogramm
Arbeitsstand und Arbeitsbedarf Bibliotheken
1. Metadaten-Workshop der AfS / META-LIB-Abschluss-Workskop, 21./22. Oktober 2002 Zusammenfassung, Ausblick Renate Gömpel Arbeitsstelle für Standardisierung.
WEM GEHÖRT DIE DEUTSCHE SPRACHE?
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Anforderungen von eScience und Grid-Technologie.
DARIAH-DE Digitale Infrastrukturen für die Geisteswissenschaften in Deutschland - und in Köln. Dr.des Patrick Sahle 1. Juli 2011 Universität zu Köln Historisch-Kulturwissenschaftliche.
Rainer Spittel Technologie-Zentrum Informatik, Universität Bremen
Deutsche Digitale Bibliothek Ein großes Vorhaben nimmt Gestalt an 1.
Wissen, Kreativität und Transformation von Gesellschaften INST–Konferenz Wien, Dezember 2007 Vortrag zum Schwerpunkt Divergierende Konzepte von.
EScience eScience ist die globale Zusammenarbeit in Schlüsselgebieten der Forschung und die nächste Generation Werkzeuge, um diese Art von Forschung zu.
Expertise Grid und eScience Jens Klump nestor AG Grid/eScience DNB, Frankfurt (M),
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? nestor und Grid Jens Ludwig Baden-Baden, 2.
Naturwissenschaft, bei der die neuen Technologien jede Phase der wissenschaftlichen Arbeit unterstützen: Die Informationsbeschaffung - Sensoren. Die Informationsverarbeitung.
FOToN: Fibre Optic Technology Network Prof. Dr. M. Loch Prof. Dr. K. F. Klein 14. Dezember 1999.
Wirtschaftsforum, 12. Oktober 2004 Die Technologieinitiative XML Condat AG Die Condat AG ist ein Software- und Systemhaus, das die Geschäftsprozesse seiner.
Integration existierender digitaler Bibliotheken in Lernumgebungen LEBONED (Learning Environment Based On Non Educational Digital Libraries) Dipl.-Inform.
KOOP-LITERA Tagung 2003, 8. / 9. Mai 2003 Archivierung digitaler Dokumente Problemstellung - kooperative Lösungsansätze - Aktivitäten der Österreichischen.
DFG Round Table Session “Web Research” Darmstadt
Michael Gerndt Technische Universität München Peridot Zusammenfassung des Projektplans.
Neuausrichtung des URZ
Dublin Core IT-Zertifikat Daten- und Metadatenstandards.
Das Projekt “eBZ – Digital City” Johann Gamper Freie Universität Bozen.
Daten- und Metadatenstandards SoSe 2009 IT-Zertifikat der Philosophischen Fakultät der Universität zu Köln Dozent: Patrick Sahle 26. Juni 2009: Dublin.
Digitising Patterns of Power (DPP)
MareNet Ein neuer elektronischer Informationsdienst für die Meeresforschung IuK Trier, 12. März 2001 Michael Hohlfeld Institute for Science Networking.
Bern University of Applied Sciences Engineering and Information Technology Documentation generator for XML-based description standards Ausgangslage: Die.
MareNet Marine Research Institutions & Documents Worldwide Ein elektronischer Informationsdienst für die Meeresforschung Michael Hohlfeld, Institute for.
XML Die “E-Lance Economy” oder die “Digital Economy” stellt neue Anforderungen an Funktionalität im Netz. XML wurde vom World Wide Web Consortium (W3C)
Vom Dokumentenserver MIAMI zum service-orientierten OAIS-konformen Archivsystem Burkard Rosenberger Universitäts- und Landesbibliothek Münster Düsseldorf,
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
Blended Library Ergebnisworkshop Konstanz, 31.Juli 2014.
1 TextGrid Virtuelle Forschungsumgebung in den eHumanities Kathleen Smith und Felix Lohmeier (SUB) Seminar Digitale Publikationen und Editionen in der.
Ausschnitt Systemarchitektur
+ Ulrike Cress, Nina Grabowski Das STELLAR Exzellenznetzwerk Brownbagsession
Institut für Informatik Betriebliche Informationssysteme S.Dietzold, T.Riechert, J.Lehmann, A.Aslam, M.Herrmann1 Semantic Web Services and Interfaces Sebastian.
Russisch-Deutsches Zentrum für Zusammenarbeit in Wissenschaft und Bildung Ein Gemeinschaftsprojekt des Instituts für Philologie und interkulturelle Kommunikation.
Vernetzte Forschungsumgebung in den eHumanities
Technische und soziale forschungsinfrastrukturen für die humanities das beispiel dagaare – english – cantonese dictionary eveline wandl-vogt1, adams bodomo2,
M. Dreyer Göttingen, 12. Sept. 2007
 Präsentation transkript:

D-SPIN CLARIN Deutsche Sprachressourcen Infrastruktur (D-SPIN) Prof. Dr. Erhard Hinrichs D-SPIN Koordinator Universität Tübingen

D-SPIN CLARIN Mannheim, ESFRI „The ESFRI Roadmap identifies new Research Infrastructure (RI) of pan-European interest corresponding to the long term needs of the European research communities, covering all scientific areas, regardless of possible location.“

D-SPIN CLARIN Mannheim, ESFRI Roadmap Preparatory Phase ( ) Ko-Finanzierung durch EU und nationale Mittel Construction and Exploitation Phase ( ) Primäre Förderung aus nationalen Mitteln Phase I ( ) Phase 2 ( )

D-SPIN CLARIN Mannheim, ArbeitsgruppenESFRI Roadmap Projects Im Bereich der Geistes- und Sozialwissenschaften: CLARIN (Common LAnguage Resources and Technology INfrastructure); DARIAH (DigitAl Research Infrastructure for the Arts and Humanities); CESSDA (Council of European Social Science Data Archives);

D-SPIN CLARIN Mannheim, Gliederung Total number of members: 151 Number of countries involved: 32 Clarin

D-SPIN CLARIN Mannheim, D-SPIN Projektpartner Berlin-Brandenburgische Akademie der Wissenschaften Deutsches Forschungszentrum für Künstliche Intelligenz Saarbrücken GmbH (DFKI) Institut für Deutsche Sprache (IDS) Mannheim Max-Planck-Institut für Psycholinguistik Nijmegen Eberhard-Karls Universität Tübingen; Computerlinguistik Justus-Liebig-Universität Gießen; Ang. Sprachw. und CL Universität Frankfurt; Vergleichende Sprachwissenschaft Universität Leipzig, Institut für Informatik Universität Stuttgart, Inst. für masch. Sprachverarbeitung

D-SPIN CLARIN Mannheim, ArbeitsgruppenD-SPIN Arbeitspakete AP 1: Projekt Management (Uni Tübingen, MPI Nijmegen, IDS Mannheim, BBAW Berlin) AP 2: Etablierung der technischen Infrastruktur (MPI Nijmegen, Uni Tübingen, IDS Mannheim, BBAW Berlin, Uni Leipzig, Uni Frankfurt, DFKI Saarbrücken, Uni Stuttgart) AP 3: Ressourcen- und Anwendungsplanung im Hinblick auf geisteswissenschaftliche Anwender (BBAW Berlin, Uni Frankfurt, Uni Gießen) AP 4: Verbindung mit nationalen und europäischen Initiativen (MPI Nijmegen, Uni Tübingen)

D-SPIN CLARIN Mannheim, D-SPIN Arbeitspakete AP 5: Anpassung und Integration von Ressourcen und Tools (Uni Tübingen, MPI Nijmegen, IDS Mannheim, BBAW Berlin, Uni Leipzig, Uni Frankfurt, DFKI Saarbrücken, Uni Stuttgart) AP 6: Training und Ausbildung (Uni Gießen, Uni Tübingen, Uni Frankfurt) AP 7: Urheberrecht und ethische Fragen der Verwendung von Sprachressourcen, Lizenzmodelle (IDS Mannheim) AP 8: Ausarbeitung einer organisatorischen Struktur für die Nachhaltigkeit auf nationaler Ebene (IDS Mannheim)

D-SPIN CLARIN Mannheim, ArbeitsgruppenAP1 - Management Koordination der Projektarbeiten mit Aktivitäten des CLARIN- Projekts Durchführung der regelmäßigen Treffen des Leitungsausschusses, des Beirats, des Plenums und der Arbeitsgruppen Ansprechpartner: Prof. Dr. Erhard Hinrichs (wissenschaftlicher Leiter) Kathrin Beck (Projektkoordinatorin, )

D-SPIN CLARIN Mannheim, ArbeitsgruppenMitglieder des D-SPIN Beirats Helge Kahler (BMBF) Axel Horstmann (Volkswagen Stiftung) Christiane Fellbaum (Princeton University) Bernhard Neumair (GWDG, Göttingen) Neil Freistat (Maryland Institute for Technology in the Humanities) Paul Doorenbosch (Koninklijke Bibliotheek NL) Bente Maegaard (University of Copenhagen; CLARIN Liaison)

D-SPIN CLARIN Mannheim, ArbeitsgruppenAP 2: Technische Infrastruktur Etablierung der technischen Infrastruktur Infrastruktur Service-Zentren neuen Typs Sprach-Ressourcen-Föderation Registraturen Web-Services Basis-Services und Applikationen

D-SPIN CLARIN Mannheim, ArbeitsgruppenAP 3: Geisteswissenschaften Ressourcen- und Anwendungsplanung im Hinblick auf geisteswissenschaftliche Anwender Welchen Bedarf an Sprachressourcen gibt es in den Geisteswissenschaften? Welche Anforderungen muss eine Forschungsinfrastruktur für die Geisteswissenschaften erfüllen?

D-SPIN CLARIN Mannheim, ArbeitsgruppenAP 4: Liaison Verbindung mit nationalen und europäischen Initiativen Koordination mit anderen europäischen und nationalen Infrastruktur-Projekten wie DARIAH, FLaReNet (EU- Projekte); eAQUA, TextGrid (BMBF-Projekte); Dobes (Volkswagen-Stiftung); Entwicklung einer gemeinsamen Roadmap für Infrastrukturen und Standards im Bereich geisteswissenschaftlicher Ressourcen

D-SPIN CLARIN Mannheim, AP 5: Integration Anpassung und Integration von Ressourcen und Tools Standardisierung und Integration deutscher Ressourcen der verschiedenen Ressourcentypen Anreicherung der Ressourcen mit CLARIN-Metadaten Festlegung der Schnittstellen zwischen Daten und Werkzeugen Definition und Implementation von Webservices

D-SPIN CLARIN Mannheim, AP 6: Training und Ausbildung Entwicklung von Lehrmaterialien und Kurse Forscher mit den Möglichkeiten, die Sprachressourcen für die empirische Forschung bieten, vertraut machen die verfügbaren Typen von sprachlichen Ressourcen bekannt machen und den Zugriff auf diese vermitteln anhand von Beispielen aus der Praxis das Potential von Sprachressourcen darstellen Sommerschule für Nachwuchswissenschaftler und Dozentenworkshop, 2010 in Gießen

D-SPIN CLARIN Mannheim, AP 7: Recht und Ethik Urheberrecht und ethische Fragen der Verwendung von Sprachressourcen, Lizenzmodelle

D-SPIN CLARIN Mannheim, AP 8: Nachhaltigkeit Ausarbeitung einer organisatorischen Struktur für die Nachhaltigkeit auf nationaler Ebene

D-SPIN CLARIN Mannheim, Webservices Webservices zur Erschließung linguistischer Ressourcen Verteilte Architektur (z.Z. Stuttgart, Tübingen) Standardisierte Web 2.0 Technologien Standardisierte Metadaten beschreiben Tools und Daten Entwicklung eines gemeinsamen Datenformats (Stuttgart, Leipzig) Verkettung der einzelnen Services mittels Toolchain Webservice-Demonstrationen am Nachmittag

D-SPIN CLARIN Mannheim, Webservices In D-Spin schon verfügbare Webservices StandortWebservice StuttgartTokenizer POS Tagger Konstituenten Parser SMOR TübingenPlain Text to XML GermaNet – Wortnetz OpenThesaurus - Synonyme

D-SPIN CLARIN Mannheim, Webservices am IMS Trainierbarer Tokenizer (Parameter für DE, EN, FR, IT) TreeTagger (Tagger und Lemmatizer; Parameter für DE, EN, FR, IT) Morphologiesystem SMOR Parser BitPar (Parameter für DE, EN) Dependenzparser FSPAR (DE) Paketlösung zur Extraktion von signikanten Wortpaaren aus geparstem Text auf Basis FSPAR (DE) UCS toolkit zur Berechnung von Wortpaar-Assoziationen (sprachunabhängig)

D-SPIN CLARIN Mannheim, GermaNet Web Applikation GermaNet gruppiert Wörter desselben Konzepts und zeigt Relationen zwischen diesen Konzepten auf: Auto  Automobil, Kraftfahrzeug, Wagen, Kraftwagen GermaNet: Ein semantisches Wortnetz des Deutschen

D-SPIN CLARIN Mannheim, D-Spin Tool Chainer Verkettung von Webservices: Der D-Spin Tool Chainer Die einzelnen Webservices bauen aufeinander auf und können in eine logische Kette geschaltet werden Einfacher Text wird von Webservice zu Webservice weitergereicht und mit linguistischen Informationen angereichert

D-SPIN CLARIN Mannheim, Einbeziehen weiterer Partner IDS Mannheim BBAW Berlin

D-SPIN CLARIN Mannheim, Webservices Peter Wittenburg: Metadaten und technische Infrastruktur von D-Spin

D-SPIN CLARIN Mannheim, Vielen Dank für Ihre Aufmerksamkeit!

D-SPIN CLARIN Mannheim, Bisherige Ergebnisse AP 1: Management Durchführung von Projekttreffen u.a. in Saarbrücken, Berlin, Frankfurt Teilnahme an CLARIN-Treffen Konstitution des wissenschaftlichen Beirats Ausarbeiten der Verträge, insbesondere Kooperationsvertrag und FE-Verträge Einrichtung eines Wikis für die interne Projektkoordination

D-SPIN CLARIN Mannheim, Bisherige Ergebnisse AP 2: technische Infrastruktur Erstellung von Anforderungs-Spezifikations-Dokumenten und Short Guides Aufstellung von Zentren Föderationen und PIDs Metadaten (siehe Vortrag Peter Wittenburg) Entwicklung von Webservices

D-SPIN CLARIN Mannheim, Bisherige Ergebnisse AP 3: Ressourcen- und Anwenderplanung im Hinblick auf geisteswissenschaftliche Anwender Uni Gießen: Fallstudie zum Einsatz von Sprachressourcen im Computer-Assisted Language Learning (CALL) BBAW: Erstellung eines Fragebogens zur Ermittlung der Anforderungen von Geistes- und Sozialwissenschaftlern an Sprachressourcen und Services

D-SPIN CLARIN Mannheim, Bisherige Ergebnisse AP 4: Verbindung mit nationalen und europäischen Initiativen Interaktionen mit CLARIN Interaktionen mit TextGrid Interaktionen mit DEISA II bzgl. Langzeitarchivierung und Auslagerung von rechenintensiven Prozessen auf universitäre Rechenzentren Interaktionen mit dem DFN-Verein Gespräche zum Schwerpunktprogramm zu eHumanities Interaktionen mit FlareNet Mitgliedschaft bei ISO TC37/SC4 (Management of Language Resources)

D-SPIN CLARIN Mannheim, Bisherige Ergebnisse AP 5: Anpassung und Integration der Ressourcen und Tools Implementation von Webservices (ISOcat, LMF-basierte Lexika, Metadaten) Erstellung von Metadaten Formatanpassungen von Ressourcen für die Anbindung an Webservices Integration der Webservices in einen Workflow Entwicklung einer prototypischen Infrastruktur Z.B. die Frankfurter TITUS-Datenbank: Umwandlung in eine standardkonforme Struktur, Konvertierung in XML, Erstellung von sprachspezifischen Teilkorpusübersichten

D-SPIN CLARIN Mannheim, Bisherige Ergebnisse AP 6: Training und Ausbildung Planung eines inhaltlichen und didaktischen Konzepts der Ausbildungsmodule Anlegen einer Testplattform und Integration der ersten Module (moodle, Uni Frankfurt) Standardkonforme Bereitstellung existierender Lehrmaterialien Planung erster D-SPIN-bezogener Lehrveranstaltungen Durchführung einer lehrbezogenen D-SPIN-Umfrage Sommerschule für Nachwuchswissenschaftler und Dozentenworkshop, 2010 in Gießen

D-SPIN CLARIN Mannheim, Bisherige Ergebnisse AP 7: Urheberrecht und ethische Fragen Zusammenarbeit mit CLARIN Erstellungen von Muster-Lizenzvereinbarungen

D-SPIN CLARIN Mannheim, Bisherige Ergebnisse AP 8: Ausarbeitung einer organisatorischen Struktur für die Nachhaltigkeit auf nationaler Ebene Enge Kooperation mit CLARIN Planung langfristige Perspektiven für eine deutsche Sprachressourceninfrastruktur