Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Auf dem Weg vom Wörterbuch zur Webanwendung

Ähnliche Präsentationen


Präsentation zum Thema: "Auf dem Weg vom Wörterbuch zur Webanwendung"—  Präsentation transkript:

1 Auf dem Weg vom Wörterbuch zur Webanwendung
Auf dem Weg vom Wörterbuch zur Webanwendung Vortrag für den Workshop "Elektronische Ressourcen in der Japanforschung“ in Tübingen am Januar 2007 von Dr. Thomas Latka

2 Vom Wörterbuch zur Webanwendung
Webanwendung mit Datenbank Buch Datei Viele Autoren, wenige Organisatoren 50% Qualitätssicherung, 50% Organisation der Community und Technik Klare Trennung zwischen Daten und Format (Datenbank und Ausgabekanäle) Wissenschaffung als dauernder, gemeinschaftlicher Prozess Ein Autor 100% Einzelleistung Keine Trennung zwischen Daten und Format Institutionelle Wissenschaft

3 Vom Wörterbuch zur Webanwendung
Webanwendung mit Datenbank Buch Datei Ein namentlich bekannter Autor (der berühmt wird) Einer schreibt, alle anderen lesen. Ein aktueller Autor, andere können Updates schicken. Einer schreibt, alle anderen lesen. viele Autoren in einer Community, keine Trennung zwischen Lesern und Autoren Ergebnis: 100 % Einzelleistung Ergebnis: 90% Community-Leistung Veröffentlichung: einmalig Veröffentlichung: häufig Veröffentlichung: immer Medium: Papier Medium: Eine lokale Datei Medium: Internet Keine Trennung von Daten und Format Nur Daten (teilw. Formatiert und nicht normalisiert, redundant) Daten sind normalisiert in der Datenbank (ohne Redundanzen), Formatierung je nach Ausgabekanal anders (Web, XML, Print …) Datenhaltung: Datei Datenhaltung: Datenbank Umfang: möglichst viele Daten Umfang: nur Kerndaten, alle anderen werden gezogen, von dort wo sie am besten gepflegt werden (z.B. Wikipedia, andere Wörterbücher) Keine Programme Lokale Programme ohne Versionierung und Kollaboration (Word, Excel, Filemaker) Webbasierte Programme mit intelligenter Suche, Versionierung und Kollaboration: Wikis, GoogleSpreadsheet, Writely Wissen schaffen, weil man dazu authorisiert ist (Organisation Wissenschaft) Wissen schaffen, was nützlich ist (Leben fördert), und jeder kann dazu beitragen Voraussetzung: institutionelle Authorisierung Vorraussetzung: technische Affinität Voraussetzung: Initiative, Spass am gemeinsamen Arbeiten Technische Voraussetzung zur Erstellung und Nutzung: Schrift (Lesen und Schreiben) Technische Voraussetzung: lokales Programm (Excel, Filemaker) Technische Voraussetzung: Webanwendung, die kollaboratives Arbeiten erlaubt, muss programmiert werden Beispiel: Brockhaus Beispiel: wadoku.csv Beispiel: wadoku.de, wikipedia.de Wissenschaft als Einzelleistung Wissensschaffung als gemeinschaftlicher Prozess Anforderung: 100% Manuskript schreiben (einmalig) Anforderung: 90% Dateipflege, 10% Updates integrieren Anforderung: 80% Erstellen der Anwendung und Organisation der Community, 20% Kontrolle der Datenpflege Suchlogik: Mensch Suchlogik: liegt außerhalb der Datei, so gut wie lokal installiertes Programm Suchlogik: über Datenbank und Anwendung anpassbar nach Anforderung

4 www.wadoku.de Seit 2001: www.wadoku.de
Basiert auf Ulrich Apels WaDokuJT-Datei User können neue Einträge erstellen und kommentieren Hierarchisierte Suchtreffer Beste Treffer oben System: Dedicated Server JavaServerPages & MySQL Database

5 Entwicklung: Vier Jahre lang fast keine Änderungen am User-Interface Steigende Suchanfragen: von 200 Hits pro Tag bis Hits pro Tag Von 10 Visits bis Visits pro Tag

6 Status: Ende 2006 über Visits pro Tag über Views pro Tag

7 Status: Ende 2006 Zugriffe aus: 50 % Deutschland 40 % Japan 5 % Österreich 3 % Schweiz Innerhalb Deutschland: 25 % NRW 12 % Bayern 10 % Hessen 10 % Berlin 6 % Baden-Würt. Innerhalb Japan: über 30 % aus Tokio

8 Status: Ende 2006 70% Wiederkehrende User (Stammkunden) 30% Neue User 60% der User kommen direkt über die URL 20 % kommen über Google

9 Status: Ende 2006 Europäisches Ausland: London Paris Madrid Göteburg Budapest Außer Japan: Peking Seoul Shanghai Taipei Singapur USA: Burlingame Madison Bloomingdale Amherst

10 Verbesserungen 2006: Schnellere Suche
Trotz steigender Anfragen konnte die Suche mit optimiertem Index noch schneller gemacht werden: Eine einzelne Suche dauert nur wenige Millisekunden: Aufwendige Komposita-Suche braucht weniger wie eine Sekunde:

11 Verbesserungen 2006: Änderungshistorie
Alle Änderungen der Einträge können nachvollzogen werden. Änderungen werden farblich hervorgehoben.

12 Verbesserung 2006: Nachschlagen in externe Quellen
Automatisches Nachschlagen aller Einträge in externen Quellen wie: Google, japanischen und englischen Wörterbücher, Wikipedia

13 Verbesserung 2006: Bewertung und Löschen von Einträgen
Editoren Editoren können Einträge akzeptieren oder zum Löschen markieren

14 Verbesserung 2006: Editierfunktion für Editoren aus dem Forum
Alle Felder können von den Editoren editiert werden Referenzen können per Schnellsuche hinzugefügt werden, und nicht nur per Text Kommentare können gelöscht oder bestätigt werden

15 Beiträge der Community 2006
Über Neueinträge (plus Duplikate) Über Änderungen und Fehlerbeseitigungen Bestätigte und gelöschte Kommentare Bestätigte oder angezweifelte Einträge Neues professionelles Forum: 130 registrierte User über 900 Beiträge

16 Seit Ende 2006: Wadoku Wiki (vorallem für Japanische Grammatik)
Wiki: jeder kann beitragen, wie bei Wikipedia Schon jetzt beachtlicher Inhalt:

17 2007: Der Prozess der Strukturanreicherung ist nötig und unumkehrbar
Text-Format {Biologie} Baum {m}; Strauch {m} (große Pflanze) Struktur Tag-Format <DOM: Biologie> Baum {m}; Strauch {m} (<Expl.: große Pflanze>) Entscheidung XML-Format <sense dom=„bio“> <trans> <tr>Baum</tr> </trans> <tr>Strauch</tr> <def>große Pflanze</def> </trans> </sense> <sense dom=„bio“> <trans> <tr>Baum</tr> </trans> <tr>Strauch</tr> </trans> <def>große Pflanze</def> </sense>

18 2007: Vom Text zum XML-Format
Text-Format {Biologie} Baum {m} (große Pflanze) Text2Tag-Converter Tag-Format <DOM: Biologie> Baum {m} (<Expl.: große Pflanze>) Tag2XML-Converter XML-Format (+ Tabellen) <sense dom=„bio“> <trans> <tr>Baum</tr> <def>große Pflanze</def> </trans> </sense> Baum : m bio : Biologie : 生物学

19 An TEI (Text Encoding Initiative) angelehntes XML-Schema (XSD)
TEI: De-facto Standard für die Kodierung und den Austausch von Texten innerhalb der Geisteswissenschaften (www.tei-c.org) TEI-Standard etwas vereinfacht und für Japanisch angepasst Echtzeit Umrechnung von Tag zu XML (Preview jederzeit)

20 2007: XML-basierter Index XML-Inhalt ist Grundlage für alle weitere Indizierungen XML-Format <sense dom=„bio“> <trans> <tr>Baum</tr> <def>große Pflanze</def> </trans> </sense> Domain-Index Usage-Index POS-Index

21 2007: XML basierte Ausgabe in verschiedene Kanäle
Verschiedene Ausgabekanäle für neutrale XML-Daten möglich <sense dom=„bio“> <trans> <tr>Baum</tr> <def>große Pflanze</def> </trans> </sense> HTML Verschiedene angepasste Templates für Einsteiger und Profis Webservice-XML Verschiedene automatische Dienste Elektronische Geräte Denshi-jisho Print Old School ausgedruckte Wörterbücher

22 2007: Zukunft Und es geht immer weiter …!


Herunterladen ppt "Auf dem Weg vom Wörterbuch zur Webanwendung"

Ähnliche Präsentationen


Google-Anzeigen