Online–Weiterbildungsinformationen Entwicklung einer MetaSuchmaschine für Online–Weiterbildungsinformationen Software Solutions GmbH & Co. KG Stresemannstraße 374 • 22761 Hamburg http://www.engine.de
Suchmaschinen: Technische Lösungen Klassische Suchmaschinen Spezialisierte Suchmaschinen Neue Wege zur Vernetzung von Informationsangebote
Klassische Suchmaschinen: Robots Crawling: Über Links verbundene Web-Seiten und Inhalte im Internet durchsuchen Indizieren: Erstellung von Volltextindizes und Cache Bewertung: Algorithmen zur Bewertung der Qualität der Inhalte
Spezialisierte Suchmaschinen Meta Suchmaschinen: Suchmaschinen die Ergebnisse anderer Suchmaschinen zusammenfassen. Beispiele: http://www.metacrawler.com . http://www.search.com . Thematisch spezialisierte Suchmaschinen. Beispiele: Volkswitschaft: http://www.inomics.com . Finanzen: http://www.financialfind.com . Medizin: http://www.hon.ch/MedHunt .
Lösungsansätze spezialisierter Suchmaschinen Konzentrieren auf bestimmte Themen Halb-automatische Stichwort-Indizes Konzentrieren auf gezielte Quellen Spezialisierung auf Struktur und Aufbau der Quellen so wie der Anfragetechnik und Ergebnisform der Quelle
Neue Wege der Vernetzung von Informationsangebote Definierte CGI-Einstiegspunkte für Anfragen und Form der Ergebnisse (Buchhandlung Lehmanns) Konventionen zum Datenaustausch beschrieben in XML-Schemata (Stichwort Biztalk.org) Web Services – SOAP (Stichwort UDDI.org)
XML-Schemata: BizTalk.org BizTalk.org ist eine zentrale Datenbank für Schnittstellen zu anderen Datenbanken .. Jeder hat Zugriff auf BizTalk.org Schnittstellen in Form von Schemata, Dokumentation und Beispiele der Implementierung
Die Bedeutung von XML XML – ein Standard entwickelt von dem gleichen Gremium, das HTML verabschiedete: Das W3C.org (World-Wide Web-Consortium) Auf XML basierend entwickelte Standards XSD: XML-Schemata, facilities for describing the structure and constraining the contents of XML 1.0 documents (Stichwort DTD – Document Type Definition). XSLT: language for transforming XML documents into other XML documents. SOAP: SOAP is a lightweight protocol for exchange of information in a decentralized, distributed environment.
XML Transformation Input XML XSLT Output XML XSD XSD Daten in XML Definition der Daten Transformation Daten in XML Format Input XML XSLT Output XML XSD XSD Beschreibung der Datenstruktur Beschreibung der Datenstruktur
Input Beispiel XSD + XML-Daten <?xml version="1.0" encoding="UTF-8"?> <xsd:schema xmlns:xsd="http://www.w3.org/2000/10/XMLSchema" elementFormDefault="qualified"> <xsd:element name="Anbieter" type="xsd:string"/> <xsd:element name="Bezeichnung" type="xsd:string"/> <xsd:element name="Ort" type="xsd:string"/> <xsd:element name="Seminar"> <xsd:complexType> <xsd:sequence> <xsd:element ref="Bezeichnung"/> <xsd:element ref="Anbieter"/> <xsd:element ref="Ort"/> </xsd:sequence> </xsd:complexType> </xsd:element> <xsd:element name="SeminarKatalog"> <xsd:element ref="Seminar" maxOccurs="unbounded"/> </xsd:schema> <?xml version="1.0" encoding="UTF-8"?> <SeminarKatalog xmlns:xsi=http://www.w3.org/2000/10/XMLSchema-instance xsi:noNamespaceSchemaLocation="SeminarKatalog1.xsd"> <Seminar> <Bezeichnung>SQL-Datenbankabfragesprache</Bezeichnung> <Anbieter>bios AG</Anbieter> <Ort>Brauhausstieg 15-17, 22041 Hamburg</Ort> </Seminar> <Bezeichnung>Datenbankgestütze Informationssysteme</Bezeichnung> <Anbieter>Denkträume - Frauenbildung</Anbieter> <Ort>60443 Montabaur, Isarstr. 3 </Ort> </SeminarKatalog> XSD XML
Transformations Beispiel XSLT <?xml version="1.0" encoding="UTF-8"?> <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> <xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/> <xsl:template match="/"> <Liste> <xsl:apply-templates select="SeminarKatalog/Seminar"/> </Liste> </xsl:template> <xsl:template match="SeminarKatalog/Seminar"> <Angebot> <name><xsl:value-of select="Bezeichnung"/></name> <Anbieter><xsl:value-of select="Anbieter"/></Anbieter> <Adresse><xsl:value-of select="Ort"/></Adresse> </Angebot> </xsl:stylesheet> XSLT
Output Beispiel XSD + XML-Daten <?xml version="1.0" encoding="UTF-8"?> <xsd:schema xmlns:xsd="http://www.w3.org/2000/10/XMLSchema" elementFormDefault="qualified"> <xsd:element name="Adresse" type="xsd:string"/> <xsd:element name="Anbieter" type="xsd:string"/> <xsd:element name="Angebot"> <xsd:complexType> <xsd:sequence> <xsd:element ref="name"/> <xsd:element ref="Anbieter"/> <xsd:element ref="Adresse"/> </xsd:sequence> </xsd:complexType> </xsd:element> <xsd:element name="Liste"> <xsd:element ref="Angebot" maxOccurs="unbounded"/> <xsd:element name="name" type="xsd:string"/> </xsd:schema> <?xml version="1.0" encoding="UTF-8"?> <Liste xmlns:xsi= "http://www.w3.org/2000/10/XMLSchema-instance" xsi:noNamespaceSchemaLocation="SeminarKatalog2.xsd"> <Angebot> <name>SQL-Datenbankabfragesprache</name> <Anbieter>bios AG</Anbieter> <Adresse>Brauhausstieg 15-17, 22041 Hamburg</Adresse> </Angebot> <name>Datenbankgestütze Informationssysteme</name> <Anbieter>Denkträume - Frauenbildung</Anbieter> <Adresse>60443 Montabaur, Isarstr. 3 </Adresse> </Liste> XSD XML
Tools zur Erstellung von XSLT Biztalk Mapper
Biztalk Server Server Software die für den flexiblen Datenaustausch entwickelt wurde Unterstützung diverser Transportmechanismen HTTP, HTTPS, FTP, SMTP, EDI Unterstützung diverser Datenformate XML, Textfile-Formate (z.B. Tab-Delimited), mdb, etc. Framework ist über Komponenten Erweiterbar
Web Services Web Services: Web Services basieren auf SOAP Dienste wie stockwatch.de liefern Bedienoberfläche im Browser (Endanwender als Zielgruppe) Künftig Dienste, welche programmatisch nutzbar sind Web Services basieren auf SOAP SOAP: Plattformübergreifende Objektkommunikation im Internet über XML Keine Bindung an bestimmte Plattformen oder Programmiersprachen / Laufzeitumgebungen
Web Services - Technisch Programmatischer Zugriff auf Services im Web Kommunikation von Web-Anwendungen untereinander XML als Standard für Daten(beschreibung) (plattform- und sprachunabhängig) SOAP als Protokoll für Funktionsaufrufe (plattform- und sprachunabhängig) WSDL als Metabeschreibung der Web Services UDDI die Gelbenseiten der Web Services
UDDI Server UDDI Verzeichniss Publish Query Request Client
Beispiele Abfrage von Fluginformation bei Scandinavian Airlines (web-service) Buchpreisvergleich von Amazon und B&N Ein news Service (demo) Weitere zu finden unter www.uddi.org , www.xmethod.de und www.salcentral.com
Cache + Synchrone Weiterleitung der Anfrage InfoWeb Weiterbildung Web Schnittstelle Benutzer Ergebniss Anfrage WebService Anfrage Schnittstelle InfoWeb Cache CGI Schnittstelle Web Schnittstelle DB- Anbieter DB- Anbieter DB- Anbieter
Cache Daten Import BizTalk . Anfragen Robot Sektion Titel Beschreibung Ort PLZ Vorbildung Suchwörter . MainGroup Title Content Location ZIP ShortDesc Robot Import über Diverse Formate: MDE, MDB Text-File (z.B. Tab-Delimited) Und Transport-Mechanismen: HTTP, FTP, SMTP, etc. Cache InfoWeb Web-Service XML-Katalog
BizTalk - Mapping und Schnittstellen InfoWeb DBase MySQL Informix Sektion Titel Beschreibung Ort PLZ Vorbildung Suchwörter. . Sektion Titel Beschreibung Ort PLZ Vorbildung . MainGroup Title Content Location ZIP ShortDesc Bereich Überschrift Inhalt Ort PLZ . KeyWords Direktkommunikation mit dem BizTalk-Server HTTP, SMTP, FTP, EDI … Publikation im Biztalk.org InfoWeb Summe der Informationen definieren Beispiel 2 Daten-Mapping Beispiel 1 Daten-Mapping Standard -Mapping
Definierte Schnittstellen BizTalk Schnittstelle InfoWeb DBase MySQL Informix Weiterbildungs DB-Anbieter Sektion Titel Beschreibung Ort PLZ Vorbildung Suchwörter. . Sektion Titel Beschreibung Ort PLZ Vorbildung Suchwörter . Weiterbildungs DB-Anbieter MainGroup Title Content Location ZIP ShortDesc InfoWeb Weiterbildungs DB-Anbieter Weiterbildungs DB-Anbieter BizTalk FTP, SMPT, HTTP… WebServices (SOAP) Weiterbildungs DB-Anbieter WebService (SOAP) Portale Themenspezifische Branchenspezifische Regionalspezifische UDDI Publikation
Quellen Suchmaschinen W3C World Wide Web Consortium www.searchenginewatch.com www.robotstxt.org The Invisble Web (1,2,3) W3C World Wide Web Consortium HTML: HyperText Markup Language XML: Extensible Markup Language XHTML: Extensible HyperText Markup Language XSL: Extensible Stylesheet Language XSLT: language for transforming XML documents into other XML documents XPath: language for addressing parts of an XML document XSD: XML Schema definition language SOAP: Simple Object Access Protocol
Vielen Dank für Ihre Aufmerksamkeit.