Alles wird gut! Suche im MyCoRe Jens Kupferschmidt Universitätsrechenzentrum
Alles wird gut! Grundsätzliche Sucharten Parametrische Suche Das Objekt muss diesem genau oder in Teilen entsprechen. Operatoren wie LIKE, = ,>, … keine Umlautnormalisierung Bsp.: CM 8.2 ohne TS, eXist, Tamino, Lucene??? Alles wird gut! Parametrische Suche mit TS Erweiterung Das Objekt muss diesem linguistisch entsprechen. Operatoren wie LIKE, CONTAINS, =, … Umlautnormalisierung und linguistische Variationen Bsp.: CM 8.2 mit TS, Tamino, Lucene??? Jens Kupferschmidt Universitätsrechenzentrum
Alles wird gut! Suche über das gesamte Metadaten-Objekt In MyCoRe werden alle als suchbar konfigurierten Daten im Attribut ts gespeichert. Unter CM8.2 suche mittels linguistischer Suche. Unter eXist nur parametrische Suche. Unter Tamino ??? Unter Lucene ??? Alles wird gut! Linguistische Suche im Dokument Unter CM 8.2 durch Speichern des Dokumentes in DKLobText und dessen Abfrage via XPath. Unter eXist muss dies separat realisiert werden. Tamino ??? Lucene ??? Jens Kupferschmidt Universitätsrechenzentrum
Alles wird gut! XPath-Ausdrücke unter MyCoRe Unter MyCoRe werden alle Datenmodellelemente einzeln abgefragt. Dabei sind Kombinationen der dazu gehörenden Textknoten und Attributen möglich. Alle Einzelabfragen sollen den selben XML-Metadaten-Typ liefern. Die Einzelabfragen werden mit AND oder OR verknüpft. Die Syntax ist: /mycoreobject[ tag|attribut op value] { and|or /mycoreobject[…] } Alles wird gut! Jens Kupferschmidt Universitätsrechenzentrum
Alles wird gut! Speichern von Text-Derivaten IFS System Für das Erzeugen der Text-Extrakte sind die Persitence-Layer selbst verantwortlich! IFS System Alles wird gut! ContentSelectionRules MimeTypes FilsSystem keine ling. Suche IBM CM 8.2 Ling. Suche FileSystem mit seperatem TS Ling. Suche File File Index Resource Manager Jens Kupferschmidt Universitätsrechenzentrum
Alles wird gut! Suche im Dokument - kombinierte Queries Neue reservierte Abfrage: /mycoreobject[@doctext contains(‚…‘)] Jede Implementierung des Such-interfaces ist selbst für die Auswertung der Query verantwortlich. eXist mit FS wird auf [@ts like ‚…‘] ersetzt, keine Suche im Dokument CM 8.2 Query wird in 2 separate Queries aufgespalten Suche in den Metadaten + Suche im Dokument Merge der beiden MCRXMLContainer entsprechend der Verknüpfung (AND/OR) Rückgabe eines MCRXMLContainer Lösung für Tamino ??? Alles wird gut! Jens Kupferschmidt Universitätsrechenzentrum
Alles wird gut! Erweiterung des MCRSearchMaskServlets Fall: In der Trefferliste sollen verlinkte Metadaten-Typen angezeigt werden. Beispiel Papyrus-Projekt: Frage nach einem Datum aus den Textbeschreibungen, Anzeige des Schriftträgers in der Trefferliste. Das SearchMaskServlet muss implizit eine weitere Query generieren. Alles wird gut! Jens Kupferschmidt Universitätsrechenzentrum
Alles wird gut! Meinungen??? Jens Kupferschmidt Universitätsrechenzentrum