AURIS-MM Spezifikation AG 2 Online Toolkit, Suchmaschine Thiemo Sammern Salzburg, 18.10.2000
Diese Präsentation enthält... Kurzbeschreibung Ist-Zustand Grundanforderungen Lösungsansätze Diskussionsgrundlage Salzburg, 18.10.2000
Kurzbeschreibung Ist-Zustand Mehrere Quellen für forschungsrelevante Dokumente Keine gemeinsame Suchmöglichkeit Uneinheitliche Anbindung an andere Datenbanken Salzburg, 18.10.2000
Grundanforderungen (scheinbare) Zusammenführung der vorhandenen Datenbanken attraktive Recherche-Möglichkeiten Multimediale Inhalte Standardkonformität Anbindung an internationale Suchmaschinen Salzburg, 18.10.2000
Erreichung der Ziele durch... Online-Toolkit Erzeugung von konformen Meta-Daten Zugangs- und Qualitätskontrolle Suchmaschine Suche in AURIS-MM und angeschlossenen Datenbanken Aufbereitung für internationale Suchmaschinen Salzburg, 18.10.2000
Einbringung von Meta-Daten Direkte Eingabe durch den Forscher mit sofortiger Speicherung in einer Datenbank Umwandlung der Meta-Daten in HTML-Meta-Tags, Indizierung und Speicherung in Datenbank (wie in SAFARI) Salzburg, 18.10.2000
AURIS-MM-Dokumente Direkt registrierte Dokumente (Online-Toolkit) Volltext-Dokumente (Online-Toolkit) automatisch generierte Dokumente (z.B. aus AURIS) Anbindung anderer Datenbanken mit eigenem Such-Interface Salzburg, 18.10.2000
Dokumentregistrierung Direkt registrierte bzw. Volltext-Dokumente Forscher DB-Benutzer Online-Toolkit AURIS-MM-DB Salzburg, 18.10.2000
Dokumentregistrierung automatisch generierte Dokumente (AURIS, AUFDAT, etc.) Forscher DB-Benutzer DB X AURIS-MM-DB Salzburg, 18.10.2000
Dokumentregistrierung Anbindung an andere Datenbanken Forscher AURIS-MM-DB DB-Benutzer DB X Salzburg, 18.10.2000
Auswahl von Meta-Tags Dublin-Core-Elemente (DC) Tags zur Beschreibung von Multimedia-Inhalten Z39.50 u.ä. konforme Felder leicht erweiterbar ohne Software-Änderung Definition über XML-DTD? Jedes Meta-Tag hat auch einen „Datentyp“ Verweis auf andere Dokumente möglich (DOC, PDF, etc.) Salzburg, 18.10.2000
Zugangs- und Qualitätskontrolle zu vermeiden ist: Junk-Content (schlechte oder falsche Beschreibungen, Scherzeintragungen) Registrierende Person muss auch für den Inhalt zuständig sein Zugangskontrolle besteht aus: Identifikation Authentifikation Authorisierung Salzburg, 18.10.2000
Verwendung bestehender Systeme Übliche Schritte: Benutzer identifiziert sich Benutzer gibt Auftrag ein System führt Auftrag aus Problem: Vielzahl von Benutzersystemen Identifizierung/Authentifizierung über Firewall-Grenzen Salzburg, 18.10.2000
Verwendung bestehender Systeme Zugangskontrolle bei AURIS-MM Benutzer gibt Auftrag ein System sendet e-mail an Benutzer Benutzer bestätigt e-mail (=Identifikation/Authentifizierung) System führt Auftrag aus Salzburg, 18.10.2000
Authorisierung Benutzer muss Meta-Tags in HTML-Code einbetten Schreibrechte auf HTML-Dokument erforderlich Damit auch Berechtigung zum Ändern des Dokuments selbst Salzburg, 18.10.2000
Qualitätskontrolle - Clearingstellen abhängig von URL des Dokumentes URLs ohne Clearingstelle werden abgewiesen Clearingstelle prüft Dokument und Metadaten und gibt sie frei oder verständigt den Benutzer Clearingstelle kann aus mehreren Personen bestehen (Round-Robin-Prinzip) Salzburg, 18.10.2000
Registrierung beim Online-Toolkit Eingabe der Meta-Daten bzw. Verweis auf bestehendes Dokument, e-mail-Adresse, URL, gewünschte Volltext-Indizierung, Linkverfolgung Toolkit erstellt Meta-Tags, die in HTML-Dokument eingefügt werden Benutzer erhält e-mail, die bestätigt werden muss Suchmaschine prüft Meta-Tags Salzburg, 18.10.2000
Registrierung beim Online-Toolkit Suchmaschine schickt Meldung an Clearingstelle Clearingstelle prüft Metadaten und Dokument Suchmaschine liest Meta-Tags aus und speichert sie in Datenbank Salzburg, 18.10.2000
Benutzeroberfläche Reine Web-Anwendung (PHP?) Java-Applet gute Datenbank-Anbindung keine Client-Software notwendig ausser Browser Java-Applet bessere Benutzeroberfläche Java-VM muss installiert sein Salzburg, 18.10.2000
Recherche in AURIS-MM Volltextsuche Suche über alle Meta-Tag-Felder Suche über einzelne Meta-Tags logische Verknüpfungen (AND, OR, XOR, NOT) Angabe von Suchbereichen (verschiedene Datenbanken) Salzburg, 18.10.2000
Suchergebnis „Karteikarte“ mit den wichtigsten Informationen Link zum ursprünglichen Dokument Link zu Dokument in anderer Datenbank Ranking? Salzburg, 18.10.2000
Datentyp-spezifische Suche Text all words, any word, phrase einfache wildcards (?,*) reguläre Ausdrücke (z.B. "^(.+)@(.+)\.(.+)$") unterstützen? komplexe Konzepte in Volltextsuche? (AG 4 - Linguistik) Mehrsprachigkeit!! Zahlen genaue Zahlenangabe Zahlenbereiche (z.B. "5-45") Salzburg, 18.10.2000
Datentyp-spezifische Suche Datum genaue Angabe (verschiedene Standards unterstützen? 15.08.2000 oder 2000-08-15 (ISO-8601)) Datumsbereiche (z.B. "16.08.2000-23.09.2000") komplexere Suchen? (z.B. "2-15.5-9.1998-2002") Klassifikationssuche Zeitdauer? Beträge? Personen? Salzburg, 18.10.2000
Anbindung an internationale Datenbanken Standard-konformes Suchinterface HTML-Reports der Dokumente für Volltext-Maschinen (Altavista, Google, HotBot, etc.) Salzburg, 18.10.2000
Offene Arbeiten nicht-funktionaler Prototyp Anforderungen an Fehlerverhalten System- und Benutzerdokumentation Abnahmekriterien Beschreibung der Systemumgebung Unix, Apache mit Skriptmodul (PHP, Perl) RDBMS (z.B. Oracle) Salzburg, 18.10.2000
Fragen & Diskussion http://www.mm-auris.lexiter.com Salzburg, 18.10.2000