Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Crawling von Gesetzestexten und automatisches Konvertieren in XML Datenstrukturen Meilensteinpräsentation der Gruppe 2.1 - Was ist bisher geleistet - -

Ähnliche Präsentationen


Präsentation zum Thema: "Crawling von Gesetzestexten und automatisches Konvertieren in XML Datenstrukturen Meilensteinpräsentation der Gruppe 2.1 - Was ist bisher geleistet - -"—  Präsentation transkript:

1 Crawling von Gesetzestexten und automatisches Konvertieren in XML Datenstrukturen Meilensteinpräsentation der Gruppe 2.1 - Was ist bisher geleistet - - Was wird noch implementiert -

2 Bestandteile des Systems § Datenbanksyste m Crawler Webservice Webapplikation SVG GraphM L GraphML + Embedded SVG

3 Der Crawler § (X)HTML-Crawler Link-Finder XML-Builder Datenbanksyste m

4 Stand der Dinge - Crawler Bisher fand eine Analyse der Datenquellen statt. Erste Implementierungen des Crawlers mit seinen Komponenten sind erfolgt. Der eigentliche Crawler ist in Java realisiert und verwendet eine eigene Codebase. Stand der Dinge: arbeitet und bedarf einiger kleinerer kosmetischer Korrekturen. Link-Finder: ist dazu bestimmt „Verlinkungen“ inerhalb von Gesetzestexten zu finden. markieren und zu speichern. Stand der Dinge: funktioniert größtenteils, benötigt aber auch noch einige kleinere Verbesserungen. XML-Builder: erstellt aus dem gefilterten Input ein XML, das dem XML-Schema entspricht. Stand der Dinge: in der Planungsendphase, wird demnächstt implementiert.

5 Stand der Dinge XML-Schema Ein XML-Schema existiert derzeit, allerdings ist die nicht richtig validierbar. Das Schema umfasst Verordnung und Gesetzesbücher inklusive ihrer inneren Struktur. (Es findet ein Runterbrechen bis auf Absatzebene statt.) Sollten Datenstrukturen gefunden werden, die nicht erfasst werden können, besteht die Möglichkeit diese in Dummystrukturen zu überführen.

6 Stand der Dinge – Webservice Bisher wurde eine einfache Implementierung eines Grundgerüsts realisiert, das einfache Anfragen annehmen kann und diese aus der Datenbank beantwortet. Dabei wird statisches SVG und GraphML ausgeliefert. Konvertierungsmechamismen von XML in SVG und GraphML sind bereits implementiert.

7 Wie geht es weiter? Zunächst wird der XML-Builder implementiert und kleinere Änderungen am Crawler vorgenommen. Zeitgleich wird der Web-Service dynamisch implementiert, so dass auch dynamisches SVG ausgeliefert werden kann. Danach erhällt der Webservice eine formale Spezifikation mit WSDL und es wird eine Demo-Webapplikation implementiert, die mit dem Webservice kommuniziert. Sollte noch genügend Zeit bis zum Codefreeze bleiben, so wird an einem dritten Ausgabeformat des Webservice gearbeitet: GraphML + embedded SVG. XML Schema bearbeiten bis es valide ist.


Herunterladen ppt "Crawling von Gesetzestexten und automatisches Konvertieren in XML Datenstrukturen Meilensteinpräsentation der Gruppe 2.1 - Was ist bisher geleistet - -"

Ähnliche Präsentationen


Google-Anzeigen