Symposium: Die phonetisch-phonologischen, orthoepischen und orthographischen Unterschiede zwischen dem Bosnischen/Bosniakischen, Kroatischen und Serbischen.

Slides:



Advertisements
Ähnliche Präsentationen
Web-Content-Management-Systeme
Advertisements

Warum Corinis CMS? Trennung von Inhalt, Layout und Struktur des Internetauftritts Dezentrale Pflege der Inhalte in den jeweiligen Fachabteilungen Pflege.
Zur SCORM-Fähigkeit konventioneller XML-unterstützender eLearning Developer Tools im Projekt I-can-EIB OFFIS Oldenburger Forschungs- und Entwicklungsinstitut.
Einer der Dienste im Internet
Webportale mit Typo3 Eine Einführung 29. März 2008
Martin Köllner XMLCompany XML-Datenbanken Xindice als Datenquelle einer Website im Zusammenspiel mit Cocoon und authentic TM.
Modell der Verfahrensdokumentation für die E-Buchführung
Online Publikationsverbund der Universität Stuttgart (OPUS) Frank Scholze Universitätsbibliothek Stuttgart.
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Web 2.0 und RIAs - Adobe Air1 Seminar: Web 2.0 und Rich Internet Applications Wintersemester 2007/2008 Daniel Thaidigsmann
Sicherheit und Personalisierung Internet Portal der Universität München.
Seminar: XML für Fortgeschrittene Referent: Katrin Apel
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
METS / MODS. METS – Metadata Encoding and Transmission Standard – 2002 veröffentlicht – XML Schema – Reale Objekte digital abbilden – hierarchische Struktur.
TempaVoila Referent: Johannes Lenz. TemplaVoila Ist eine templating enginge Dient dazu eigene Templates (hauptsächlcih Designs) zu erstellen Wurde entwickelt.
Renardus The Academic Subject Gateway in Europe Nationalbibliotheken und nationale Dienste – Interoperabilität mit Subject Gateways Christel Hengel.
Der Testprozess als Bestandteil des SE Prozesses:
By Monika Krolak & Christian Meschke
Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library
Access 2000 Datenbanken.
Überlegungen zur Architektur eines Fachinformations-Netzwerkes am Beispiel des CeGIM Mehrwert ist es nicht nur, Daten von ihren Quellen zu den Nutzern.
Tobias Högel & Dennis Böck,
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Use Cases Gesamtprojekt
Systementwicklungsprojekt:
T E I [Text Encoding Initiative] IT-Zertifikat Kurs 4 :Daten und Metadaten Dozent: Patrick Sahle.
Abschlusspräsentation Semesteraufgabe 2007
1 Alexander Arimond, University of Kaiserslautern, Germany Entwicklung und Evaluation eines Raytracing-Dienstes für das Venice Service Grid Alexander Arimond.
Integration heterogener verteilter Systeme mit WS-BPEL – ein Praxisbeispiel Dr. Wolf-Dieter Heinrichs.
SQL Server 2005 CLR-Integration
Was macht eigentlich dieses ExsoForm? Ein Beispiel für eine Dokumentendefinition in Screenshots.
1 Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Einführung Lernmodul Nutzungsbedingungen:
INFORMATIONSSYSTEM ZUR STUDIERENDENVERWALTUNG OPUS-College.
Typo3 Templates und TypoScript
Digitale Bibliotheken. Dient zum Aufbau und zur Verbreitung digitaler Bibliotheken Basiert auf Java Existiert seit 2000 Entwickelt wurde sie von dem New.
Nicolas Frings Maximilian Bernd Stefan Piernikarcyk
Sesame Florian Mayrhuber
XML-Serverpages Vortrag im Rahmen des Seminars XML-Technologien Tobias Faessler.
Bernd-Kristian Kaczenski Humboldt-Universität zu Berlin
JavaServer Faces Urs Frei. Inhalt JSF Funktionsweise Rückblick JSP Bestandteile von JSF So einfach ist die Anwendung (Beispiel) Eclipse im Einsatz (Entwicklungsumgebung)
XML (Extensible Markup Language)
Dynamische Webseiten-Generierung
PHP Einführung Anbindung an XML Technologien Jürgen Mangler.
Text einer HTML-Seite in Excel-Blatt kopieren
1 Mehrsprachigkeit Das Backend von TYPO3 ist mehrsprachig, so dass jeder Redakteur mit TYPO3 Zu einem mehrsprachigen Webauftritt gehört bei einem ausgereiften.
UNIDAM Initiative: Historisch-kulturwissenschaftliche Fakultät
Content Management System
Dokumenten- und Publikationsserver
Drucken mit XSL-FO DaimlerChrysler  Drucken von Webseiten
Eine kurze Einführung.  Software zur Erstellung eines Dokumenten- servers  Dient zur Aufbewahrung von allen Typen von digitalen Inhalten (Texte, Bilder,
Dublin Core IT-Zertifikat Daten- und Metadatenstandards.
Contentmanagement mit der OpenSourceLösung TYPO3
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
Contentmanagement mit der OpenSourceLösung TYPO3
->Prinzip ->Systeme ->Peer – to – Peer
Dedizierte Systeme – Opus Eva Cynkar Dedizierte Systeme - Digital Library.
Vom Dokumentenserver MIAMI zum service-orientierten OAIS-konformen Archivsystem Burkard Rosenberger Universitäts- und Landesbibliothek Münster Düsseldorf,
TypoScript.
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
XML in der Praxis: Electronic Bill Presentment (EBP) Institut für Wirtschaftsinformatik J. W. Goethe-University J. W. Goethe University Institute of Information.
GATE/Annie Zara Kanaeva, November 2002, Information Extraction.
Internet - Grundbegriffe Unterlagen zum Kurs "Wie erstelle ich eine Homepage?"
Die grammatikalischen Unterschiede zwischen dem
Die Publikationsdatenbank der Technischen Universität Wien Karl Riedling.
Vorteile von XML Die installed base von HTML, HTTP und Webbrowsern XML ist einfach und portabel XML kann Dokumente beliebiger Komplexität abbilden XML.
OAISter wichtigste Verbundkatalog für digitale Ressourcen Open Access wissenschaftliche Literatur und Materialien im Internet frei zugänglich zu machen.
Tutorial Holdings Management Erstellen, Bearbeiten und Zuweisen von Links für Full Text Finder support.ebsco.com.
Digital Repository Auffindbare Publikationen. Was sind Repositorien ? Als Repositorium bezeichnet man eine Struktur in der Dokumente Organisiert abgelegt.
 Präsentation transkript:

Symposium: Die phonetisch-phonologischen, orthoepischen und orthographischen Unterschiede zwischen dem Bosnischen/Bosniakischen, Kroatischen und Serbischen Institut für Slawistik, Universität Graz April 2007 Korpuserstellung im Kontext eines AM-basierten Frameworks Institut für Informationsverarbeitung in den Geisteswissenschaften Hubert Stigler

Gralis Text-Korpus: "je.*"

Agenda  Workflow zur Erstellung des Gralis Text-Korpus  Ein Korpustext aus der BearbeiterInnenperspektive  XML-basierte Validierung der Korpustexte  Asset Management Systeme (AMS)  Anwendungsbeispiel aus der Literaturwissenschaft  Ein Korpus-Asset Inhaltsmodell  AMS Anwendungsszenarien in der Korpuserstellung

Workflow zur Generierung des Gralis Text-Korpus

Ein Korpustext aus der BearbeiterInnenperspektive Die roten Absatzmarken markieren Segmentgrenzen, die zunächst über ein Makro unter Verwendung von Regular Expressions eingefügt und bei Bedarf im Bearbeitungsvorgang interaktiv – durch Verschieben oder Löschen – in der Office Anwendung korrigiert werden können.

XML-basierte Validierung der Korpustexte Gralis buildCorpus 1.1 © Hubert Stigler Searching for file triples in directory: /data/xo/gralis/data/ -- file triple: Albanija_dospjela_na_listu ok -- file triple: Albanski_politicari ok -- file triple: Albert_Einstein couldn't found hr -- file triple: Americka_vlada_izjavila couldn't validate bs -- file triple: Americki_predsjednik segment error hr: 6; sr: 6; bs: 5 -- file triple: Anatole_France ok file triples were processed 121 file triples were written to the corpus files 3 non valid triples were found Execution terminated normally Im Bulk-Modus werden die in einem Verzeichnis abgelegten Korpustexte validiert und die für die Weiterverarbeitung mit der IMS Corpus Workbench 1 benötigten vertikalisierten Korpusdateien erstellt. 1 Developed by Institute for Natural Language Processing, University of Stuttgart

Asset Management Systeme  Dienen der metadatenbasierten Verwaltung von digitalen Ressourcen  Bieten die Möglichkeit, über persistente Zitierbarkeit Assets einfach in webbasierte Kontexte zu integrieren (Lernplattformen, Frameworks u.a.)  Stellen (intelligente) Suchstrategien zur Verfügung  Ermöglichen Kollaboration in der Assetbearbeitung und -verwaltung  Ermöglichen die Bildung von Sammlungen für unterschiedliche Zwecke  Bieten Möglichkeiten zur fein granulierbaren Vergabe von Zugriffsrechten

Beispiel: Ulrich Schulz-Buschhaus Aufsatzwerk

Ein Korpus-Asset Inhaltsmodell Ein Asset dient als Speichercontainer für beschreibende Metadaten und Datenströme beliebiger Art: Texte, Audio-/Videodateien u.v.m. Zusätzlich bietet ein AMS die Möglichkeit, im sogenannten Inhaltsmodell Objektmethoden (z.B. XSLT-Transformationen u.Ä.) zu definieren, die auf den im Asset enthaltenen Daten operieren.

AMS Anwendungsszenarien in der Korpuserstellung  In einem Korpus-Asset werden sowohl Office-Dokumente als auch XML- Repräsentanten aller drei Sprachvarianten eines Korpustextes verwaltet  Während HTML- und PDF-Getter-Methoden des Korpustextes über das Web frei zugänglich sind, stehen Office- und TEI-Datenstrom, sowie LaTeX-Getter-Methode nur autorisierten BenutzerInnen zur Verfügung  Über die HTML- und PDF-Getter-Methoden aller Korpustexte generiert sich ein Webauftritt des Korpus  Alle Korpustexte werden bei der Bearbeitung einem Container zugewiesen, der als Objektmethode in seinem Inhaltsmodell die Generierung der vertikalisierten Korpusdateien für die IMS Corpus Workbench ermöglicht  und, und, und... Danke für Ihre Aufmerksamkeit!