Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Www.wadoku.de Auf dem Weg vom Wörterbuch zur Webanwendung Vortrag für den Workshop "Elektronische Ressourcen in der Japanforschung in Tübingen am 8.-9.

Ähnliche Präsentationen


Präsentation zum Thema: "Www.wadoku.de Auf dem Weg vom Wörterbuch zur Webanwendung Vortrag für den Workshop "Elektronische Ressourcen in der Japanforschung in Tübingen am 8.-9."—  Präsentation transkript:

1 Auf dem Weg vom Wörterbuch zur Webanwendung Vortrag für den Workshop "Elektronische Ressourcen in der Japanforschung in Tübingen am Januar 2007 von Dr. Thomas Latka

2 Vom Wörterbuch zur Webanwendung BuchDatei Webanwendung mit Datenbank Ein Autor 100% Einzelleistung Keine Trennung zwischen Daten und Format Institutionelle Wissenschaft Viele Autoren, wenige Organisatoren 50% Qualitätssicherung, 50% Organisation der Community und Technik Klare Trennung zwischen Daten und Format (Datenbank und Ausgabekanäle) Wissenschaffung als dauernder, gemeinschaftlicher Prozess

3 Vom Wörterbuch zur Webanwendung Ein namentlich bekannter Autor (der berühmt wird) Einer schreibt, alle anderen lesen. Ein aktueller Autor, andere können Updates schicken. Einer schreibt, alle anderen lesen. viele Autoren in einer Community, keine Trennung zwischen Lesern und Autoren Ergebnis: 100 % EinzelleistungErgebnis: 90% Community-Leistung Veröffentlichung: einmaligVeröffentlichung: häufigVeröffentlichung: immer Medium: PapierMedium: Eine lokale DateiMedium: Internet Keine Trennung von Daten und FormatNur Daten (teilw. Formatiert und nicht normalisiert, redundant) Daten sind normalisiert in der Datenbank (ohne Redundanzen), Formatierung je nach Ausgabekanal anders (Web, XML, Print …) Datenhaltung: DateiDatenhaltung: Datenbank Umfang: möglichst viele Daten Umfang: nur Kerndaten, alle anderen werden gezogen, von dort wo sie am besten gepflegt werden (z.B. Wikipedia, andere Wörterbücher) Keine ProgrammeLokale Programme ohne Versionierung und Kollaboration (Word, Excel, Filemaker) Webbasierte Programme mit intelligenter Suche, Versionierung und Kollaboration: Wikis, GoogleSpreadsheet, Writely Wissen schaffen, weil man dazu authorisiert ist (Organisation Wissenschaft) Wissen schaffen, was nützlich ist (Leben fördert), und jeder kann dazu beitragen Voraussetzung: institutionelle AuthorisierungVorraussetzung: technische AffinitätVoraussetzung: Initiative, Spass am gemeinsamen Arbeiten Technische Voraussetzung zur Erstellung und Nutzung: Schrift (Lesen und Schreiben) Technische Voraussetzung: lokales Programm (Excel, Filemaker) Technische Voraussetzung: Webanwendung, die kollaboratives Arbeiten erlaubt, muss programmiert werden Beispiel: BrockhausBeispiel: wadoku.csvBeispiel: wadoku.de, wikipedia.de Wissenschaft als EinzelleistungWissensschaffung als gemeinschaftlicher Prozess Anforderung: 100% Manuskript schreiben (einmalig)Anforderung: 90% Dateipflege, 10% Updates integrieren Anforderung: 80% Erstellen der Anwendung und Organisation der Community, 20% Kontrolle der Datenpflege Suchlogik: MenschSuchlogik: liegt außerhalb der Datei, so gut wie lokal installiertes Programm Suchlogik: über Datenbank und Anwendung anpassbar nach Anforderung BuchDatei Webanwendung mit Datenbank

4 Seit 2001: Basiert auf Ulrich Apels WaDokuJT-Datei User können neue Einträge erstellen und kommentieren Hierarchisierte Suchtreffer Beste Treffer oben System: Dedicated Server JavaServerPages & MySQL Database

5 Entwicklung: Vier Jahre lang fast keine Änderungen am User-Interface Steigende Suchanfragen: von 200 Hits pro Tag bis Hits pro Tag Von 10 Visits bis Visits pro Tag

6 Status: Ende 2006 über Visits pro Tag über Views pro Tag

7 Status: Ende 2006 Zugriffe aus: 50 % Deutschland 40 % Japan 5 % Österreich 3 % Schweiz Innerhalb Deutschland: 25 % NRW 12 % Bayern 10 % Hessen 10 % Berlin 6 % Baden-Würt. Innerhalb Japan: über 30 % aus Tokio

8 Status: Ende % Wiederkehrende User (Stammkunden) 30% Neue User 60% der User kommen direkt über die URL 20 % kommen über Google

9 Status: Ende 2006 Europäisches Ausland: London Paris Madrid Göteburg Budapest Außer Japan: Peking Seoul Shanghai Taipei Singapur USA: Burlingame Madison Bloomingdale Amherst

10 Verbesserungen 2006: Schnellere Suche Eine einzelne Suche dauert nur wenige Millisekunden: Aufwendige Komposita-Suche braucht weniger wie eine Sekunde: Trotz steigender Anfragen konnte die Suche mit optimiertem Index noch schneller gemacht werden:

11 Verbesserungen 2006: Änderungshistorie Alle Änderungen der Einträge können nachvollzogen werden. Änderungen werden farblich hervorgehoben.

12 Verbesserung 2006: Nachschlagen in externe Quellen Automatisches Nachschlagen aller Einträge in externen Quellen wie: Google, japanischen und englischen Wörterbücher, Wikipedia

13 Verbesserung 2006: Bewertung und Löschen von Einträgen Editoren können Einträge akzeptieren oder zum Löschen markieren Editoren

14 Verbesserung 2006: Editierfunktion für Editoren aus dem Forum Alle Felder können von den Editoren editiert werden Referenzen können per Schnellsuche hinzugefügt werden, und nicht nur per Text Kommentare können gelöscht oder bestätigt werden

15 Beiträge der Community 2006 Über Neueinträge (plus Duplikate) Über Änderungen und Fehlerbeseitigungen Bestätigte und gelöschte Kommentare Bestätigte oder angezweifelte Einträge Neues professionelles Forum: 130 registrierte User über 900 Beiträge

16 Seit Ende 2006: Wadoku Wiki (vorallem für Japanische Grammatik) Wiki: jeder kann beitragen, wie bei Wikipedia Schon jetzt beachtlicher Inhalt:

17 {Biologie} Baum {m}; Strauch {m} (große Pflanze) Baum Strauch große Pflanze Baum {m}; Strauch {m} ( ) Text-Format Tag-Format XML-Format Baum Strauch große Pflanze Entscheidung Struktur 2007: Der Prozess der Strukturanreicherung ist nötig und unumkehrbar

18 2007: Vom Text zum XML-Format {Biologie} Baum {m} (große Pflanze) Baum große Pflanze Baum {m} ( ) Baum : m Text-Format Tag-Format XML-Format (+ Tabellen) bio : Biologie : Text2Tag-Converter Tag2XML-Converter

19 An TEI (Text Encoding Initiative) angelehntes XML-Schema (XSD) TEI: De-facto Standard für die Kodierung und den Austausch von Texten innerhalb der Geisteswissenschaften (www.tei-c.org)www.tei-c.org TEI-Standard etwas vereinfacht und für Japanisch angepasst Echtzeit Umrechnung von Tag zu XML (Preview jederzeit)

20 2007: XML-basierter Index Baum große Pflanze XML-Format Domain-IndexUsage-IndexPOS-Index XML-Inhalt ist Grundlage für alle weitere Indizierungen

21 2007: XML basierte Ausgabe in verschiedene Kanäle Baum große Pflanze Verschiedene Ausgabekanäle für neutrale XML-Daten möglich HTML Verschiedene angepasste Templates für Einsteiger und Profis Webservice-XML Verschiedene automatische Dienste Print Old School ausgedruckte Wörterbücher Elektronische Geräte Denshi-jisho

22 2007: Zukunft Und es geht immer weiter …!


Herunterladen ppt "Www.wadoku.de Auf dem Weg vom Wörterbuch zur Webanwendung Vortrag für den Workshop "Elektronische Ressourcen in der Japanforschung in Tübingen am 8.-9."

Ähnliche Präsentationen


Google-Anzeigen