Intelligente Portal-/Intranet-Suchmaschinen InsumaFocus Insuma GmbH Intelligente Portal-/Intranet-Suchmaschinen InsumaFocus
Technologie Basis-Technologie: Verteilte Suchplattform Erweiterbar durch Module (Plug-Ins) - auch während laufenden Betriebs! Eigene Module (Morphologie, Phonetik, Tippfehler-Erkennung, Sprachsupport, etc.) Kommerzielle Module (Thesauri, Taxonomien, etc.)
Technologie v Modulares Suchsystem: Suchplattform + Module Verteiltes Multi-Server Suchsystem Problemlose Skalierung bei großen Datenmengen v Integration weiterer Module: XML-Interfaces Intelligente Crawler: Thematische Filter Intelligente Benutzerführung Anfrage-Verfeinerung Automatische Dokumenten-Klassifikation . . .
InsumaFocus: Portal-Suche Fragestellung: Integration unterschiedl. Dienste Suche innerhalb des Portals Eigener Web-Auftritt (CMS) Dynamische Webseiten/Integration von DBs: Oracle, Informix, MS SQL, DB2, MySQL, etc. Klassifikation Taxonomie (Lebenslagenmodel) Routing (automatisches Zuteilen von Dok. zu Kategorien) Integration externer Server-Inhalte File-Server, Lotus Notes (Intranet) Intranet-Inhalte Benutzer-/Zugriffsrechte
InsumaFocus: Portal-Suche Fragestellung: Einfache Benutzer-Führung: Zusammengesetzte Wörter, Pluralendungen (Morphologie DEU + weitere europ. Sprachen „Handyverträge“ -> „Vertrag mit Handy“ Phonetik bei Eigennamen (Firmen-, Produktnamen) „Hulet-Pekart“ -> „Hewlett-Packard“ Tippfehler-Korrektur (Buchstabendreher/-auslasser) „Spiegle“ -> „Spiegel“ Inhaltlich ähnliche Dokumente (semantische Suche) „Frikadelle“ -> „Bulette“ Suchen/Navigation in Kategorien
InsumaFocus: Verteilte Suche Suche über Portale + externer Dienst: Verteilte zentrale Suche Klassifikation nach Produkten, Anbietern, Events, News DB1 XML Produkte Portal 1 DB2 DB3 Anbieter Events DB1 XML Produkte Portal 20 DB2 DB3 Anbieter Events XML . . . DB4 Externer News-Server
Taxonomien, Lebenslagen Regio-/Stadt-Portale Kommunale Portale: Suche über Portal-Inhalte Stadtinformations-Dienst . . . Eigenschaften: Integration von DBs (inkl. Zugriffsrechte) Einbindung von Formular-Servern (eGovernment) CMS CMS DB DB Formular Server
Taxonomien, Lebenslagen Lebenslagenmodell Routing: Automatisches Zuteilen von Dokumenten zu Kategorien/Lebenslagen Umzug Auto Beispiel-Dok. Web Wohnort Routing Post
Insuma Control-Center Start-Adressen (URLs) MIME-Typen Gewichtung aller Tags Deduplizierung Dok.-Zusammenfassung Crawler-Frequenz Definition der Kategorien (Meta-Tags, URL-Pfad) Eingabe von Thesaurus + Synonymlisten
Insuma Control-Center Control-Center: schnelles Austesten der Suche CGI-Suchschnittstelle XML-Schnittstelle volle Anpassung der Suche Anpassung der Suchergebnisse über XML-Schnittstelle (inkl. DTD) <?xml version="1.0" encoding="iso-8859-1“?> <!DOCTYPE query SYSTEM "insuma_search_html.dtd"> <query max_results="5" show_attrs="summary"> <condition predicate="match" attr="body_morpho" value="hochschule Heidelberg"/> </query>
Insuma Control-Center Crawler-Statistiken Indexer-Statistiken Such-Statistiken XML-Handbook Insuma GmbH
Regioportal Suche für das Regio Rheinland: Zentrale übergreifende Suche über 55 Kreise, 3 Städte (Köln, Bonn, Leverkusen), 12 externe Partnerfirmen und -vereine Routing/Klassifikation: 8 Kategorien 6 Unterkategorien 4 Dokumenteninhalts-Typen Deutsche Morphologie Tippfehler-Erkennung Phonetische Suche für Eigennamen, Volltext- und Felderbezogene Suche
Kommunale Regio-Portale Suche über Intranet-Inhalte (Kommunale Server) Benutzerfreundliche Auswahl der Regionen/Städte Dokumenten- Zusammenfassung Highlighting der Suchwörter VIP-Search: Benutzer- definiertes Ranking XML-Schnittstellen für Ein- und Ausgabe Borna/ Sachsen Rheinnavigator
Intelligenter Crawler InsumaScout Intelligenter Crawler Business-Intelligence: Erweiterung der Firmen-internen Wissens-Domäne Internet Eigenschaften: Lernfähiger Web-Robot Semantischer Filter Anpassbar durch Benutzer-Profile Strukturierte Ausgabe durch Klassifikation Dok-Filter MyNews Cat1: Marketing Benutzer-Rechte Cat2: Research Klassifikation Cat3: Finance
Business-Intelligence Robot sucht ständig frei im Web Lernfähiger Robot Lernt durch Dokumenten-Bewertungen Anpassbar an persönliche Informationsbedürfnisse Dokumenten-Klassifikation / Clusterung Statistische Auswertung des Benutzer-Verhaltens Sofortige Benachrichtigung bei neuen relevanten Nachrichten
Beispiel-Anwendungen News-Reporter: Filterung und strukturierte Zusammenfassung von Nachrichten nach semantischen Kriterien Market-Watch: Neueste Information über Mitbewerber, Märkte und Trends Zusenden bei Neuigkeiten z. B. per Email Business-Intelligence: Erweiterung der Firmen-internen Wissens-Domäne Fachsuchmaschine über vorgegebenes Thema
Kombinationen und viele weitere ... 1 2 Intelligenter Crawler Internet Portal / Intranet und viele weitere ... Suche kann problemlos kombiniert und skaliert werden: Unterschiedliche Datenquellen, Formate und Protokolle HTML, DOC, RTF, PDF, Text/Emails, etc. HTTP, Datenbanken, Legacy-Systeme 1 Suche für Web-Portale und Intranets 2 Freie thematische Suche im Internet
Referenzkunden Bayer AG Bundesverband niedergelassener Chirurgen SES Astra S.A. WEKA MEDIA GmbH Mindwerk AG shopping-services 4U GmbH Perlitz Strategy Group KnowledgeAgent GmbH
Hannover Messe Industrie Referenzkunden InsumaFocus-Suchmaschine für: Hannover Messe Industrie CeBIT Heimtextilien
Kontakt Insuma GmbH Dr. Udo Heuser Sand 13 D-72076 Tübingen Germany Tel.: +49-(0)7071 / 29 78 997 Mobil: +49-(0) 171 / 6 229 003 Fax: +49-(0)7071 / 29 50 62 Email: uh@insuma.de Web: www.insuma.de