1 Bettina Berendt www.berendt.de Web Mining 1. Ein Überblick 2. Analyse von Nutzer- und Kundenverhalten: Zur Rolle von Distributionsstrategien und demographischen.

Slides:



Advertisements
Ähnliche Präsentationen
Zwischen Kontrolle & Freiheit Felix Stalder HGKZ.
Advertisements

Tourismus Marketing 2011 Fünf Fakten, die man wissen sollte
Das Web in der politischen Bildung – Das Politische im Web
e-Commerce Erfolgreiche Internetportale als Profit-Center
Intelligente Anwendungen im Internet
DNS-Resolver-Mechanismus
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
Information Portal Suite (IPS)
Grundstudiumspraktikum “Maschinelle Übersetzung”
1-1 Schlank und schnell zum Datawarehouse Marc Bastien Oracle Deutschland GmbH BTW Leipzig,
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Quantitative Internet- Charakteristiken Wie viele Pages hat das Internet? Bei welchen Wachstums-/Änderungsraten? Wie viele Suchanfragen haben die Suchmaschinen?
Stefanie Selzer - Pascal Busch - Michael Kropiwoda
Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.
Reguläre Sprachen Karin Haenelt.
© Karin Haenelt 2006, Äquivalenzen Reg.Ausdrücke, Reg.Sprachen, EA ( ) 1 Reguläre Sprachen Karin Haenelt.
© Karin Haenelt 2006, Operationen auf Akzeptoren und Transduktoren, ( ) 1 Operationen auf endlichen Akzeptoren und Transduktoren.
PinK Plattform für intelligente Kollaborationsportale Dr. Joachim Quantz, e.V. Berlin, 13. September 2005.
DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie neofonie Forschung und Entwicklung: Innovative Suchmethoden Präsentiert von Ronald.
Internet facts 2006-I Graphiken zu dem Berichtsband AGOF e.V. September 2006.
Internet facts 2006-III Graphiken zum Berichtsband AGOF e.V. März 2007.
Internet facts 2008-II Graphiken zu dem Berichtsband AGOF e.V. September 2008.
Internet facts 2006-II Graphiken zu dem Berichtsband AGOF e.V. November 2006.
Internet facts 2005-IV Graphiken zu dem Berichtsband AGOF e.V. Juli 2006.
Internet facts 2005-III Graphiken aus dem Berichtsband AGOF e.V. März 2006.
Vorlesung: 1 Betriebssysteme 2007 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebssysteme Hochverfügbarkeit (Einführung) 3. Quartal.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Vorlesung 3: Verschiedenes Universität Bielefeld – Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin
Christian Schindelhauer
Vermessungsportal Auskünfte – Auszüge – Shop
Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.
Vortragender Messung des Erfolgs einer Website Subjektive Attraktivität Besuchsintensität Produktivität Finanzielle Maße
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Die Bank von morgen - eine neue Welt für IT und Kunden? 23. Oktober 2001.
Grundschutztools
Kann man im Netz Geld verdienen? Proseminar 2: Medienlehre Dozentin: Maria Löhblich, M.A. Denka Stancheva
1 Vorlesung 3 Verschiedenes Peter B. Ladkin
Entitäten Extraktion Einführung
Welche Funktion hat die php.ini? -Beinhaltet wichtige Einstellungen für PHP. Genannt seien hier u.a. der Speicherort von Cookies, Parameter der Kompilierung,
20:00.
Semantic Web-Anwendungen auf Basis des BAM-Portals Ein Prototyp Volker Conradt.
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Internetverwendung und Werbeaffinität APA-IT Forum 7. Mai 2008
Don`t make me think! A Common Sense Approach to Web Usability
Semantic Web Services - An Introduction
Ontologien im Wissensmanagement
Folie 1 © IAB Austria, Presseinformation Roland M. Kreutzer, 4/2005.
Studentische Arbeiten im Social Web Aktuelle Nutzung und Anforderungen für die Nutzung Klaus Tochtermann Seite 1.
E-Learning in Theorie & Praxis
Wie der Datenaustausch das Reisen revolutionierte
HORIZONT 1 XINFO ® Das IT - Informationssystem Java Scanner HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 / 540.
RATEME Suchen und Bewerten von Ausgangsorten. Inhalt RateMe - Pirmin Schürmann, Thomas Junghans - Hochschule für Technik Zürich 2 Unser Ziel.
1 CeBIT 2008 Knowledge Management 2.0 Ulrich Kampffmeyer PROJECT CONSULT Unternehmensberatung Dr. Ulrich Kampffmeyer GmbH Breitenfelder Straße
WS 2009/10 Datenbanksysteme Fr 15:15 – 16:45 R Vorlesung #3 Das relationale Modell (Teil 2)
R zieht ein in das Oracle Data Warehouse
HORIZONT 1 XINFO ® Das IT - Informationssystem PL/1 Scanner HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 / 540.
RATEME Suchen und Bewerten von Ausgangsorten. Inhalt RateMe - Pirmin Schürmann, Thomas Junghans - Hochschule für Technik Zürich 2 Unser Ziel.
Formale Sprachen Reguläre Sprachen Rudolf FREUND, Marian KOGLER.
Agenda Rückblick 2. Aufbau der Software Benutzeroberfläche 4. Ausblick
Struktur von RDF Fabian Scheller.
PARTENARIAT ÉDUCATIF GRUNDTVIG PARTENARIAT ÉDUCATIF GRUNDTVIG REPERES KULTURELLER ZUSAMMENHALT UND AUSDEHNUNG DER IDEEN AUF EUROPÄISCHEM.
XML (Extensible Markup Language)
Analyseprodukte numerischer Modelle
RATEME Suchen und Bewerten von Ausgangsorten. Inhalt RateMe - Pirmin Schürmann, Thomas Junghans - Hochschule für Technik Zürich 2 Unser Ziel.
1 e-Communication Das Internet als Wachstumsmotor für den stationären Handel.
Eike Schallehn, Martin Endig
prof. dr. dieter steinmannfachhochschule trier © prof. dr. dieter steinmann Folie 1 vom Montag, 30. März 2015.
„Informationskompetenz steigern“: Datenbanken kennenlernen Vortrag auf der 3. Gemeinsamen Jahrestagung der Arbeitsgemeinschaft katholisch-theologischer.
Dreamteam: Web 2.0 und der Katalog Anne Christensen und Thomas Hapke GBV-Verbundkonferenz
Master in Web Science Shape the Web of Tomorrow!.
 Präsentation transkript:

1 Bettina Berendt Web Mining 1. Ein Überblick 2. Analyse von Nutzer- und Kundenverhalten: Zur Rolle von Distributionsstrategien und demographischen Variablen

2 Agenda 1. Person 2. Motivation 3. Web Mining 4. Web Usage Mining 5. 2 Fallstudien + Methodenbeispiele

3 Zur Person Derzeit Juniorprofessorin für Wirtschaftsinformatik, Humboldt-Universität zu Berlin Ausbildung: n Habilitation 2003 – Wirtschaftsinformatik, Pädagogik und Informatik (HU Berlin), Computervisualistik (Magdeburg) n Promotion 1998 – Informatik / Kognitionswissenschaft (Hamburg) n M.Sc – Informatik / Künstliche Intelligenz (Edinburgh) n Diplom 1991 – Betriebswirtschaftslehre (FU Berlin) n M.Phil – Volkswirtschaftslehre (Cambridge)

4 Wirtschaftsinformatik – Information Systems Science n Gegenstand: Informations- und Kommunikationssysteme in Institutionen (IS) n IS = Systeme interdependenter Agenten – menschliche und maschinelle –, die l gemeinsame Ziele und Aufgaben haben, l unter den Einschränkungen knapper Resourcen entscheiden u. handeln n Ziele und Aufgaben: abhängig von der Art der Institution n „Business Intelligence“: die analytischen Konzepte, Prozesse und Werkzeuge, um unternehmensinterne und -externe Daten in entscheidungsrelevantes Wissen zu transformieren. ~ Wissensentdeckung / Knowledge Discovery / Data Mining (Anm.: Das beinhaltet Data Warehousing, Reporting usw. – da die Begrifflichkeiten in den beteiligten Communities nicht eindeutig und häufig auch wenig formal sind, bitte ggf. nachfragen!)

5 Ziele und Fragen: Bsp. 0 / Verstehen der Domäne Woher kommt die Cholera? J. Snow: “cholera map“, 1854

6 Warum Web? Das WWW als Datenquelle und Ort wirtschaftlichen und gesellschaftlichen Handelns Millionen Menschen online! Daten:

7 Ziele und Fragen: Bsp. 1 / Marktforschung (und ?) Wo wohnen Menschen, die demnächst den Koran kaufen werden? [Owad (2006).

8 Ziele und Fragen: Bsp. 2 / Marktforschung, polit. Willensbildung,... Was werden Menschen demnächst kaufen (was sie vielleicht noch gar nicht wissen)? The Lance Armstrong Performance Program: Seven Weeks to the Perfect Ride by Lance Armstrong, Chris Carmichael, & Peter Jore Nye [Gruhl, Guha, Kumar, Novak, & Tomkins, Proc. SIGKDD 2005]

9 Ziele und Fragen: Bsp. 3 / Customer Relationship Management Warum in ein Geschäft gehen wenn es doch alles im Internet gibt?

10 Ziele und Fragen: Bsp. 4 / Usability Wie kann ein Informationssystem weltweit, d.h. für verschiedenste Nutzergruppen, nutzbar gemacht werden?

11 Web Mining

12 Web Mining Knowledge discovery (aka Data mining): “the non-trivial process of identifying valid, novel, potentially useful, and ultimately understandable patterns in data.” 1 Web Mining: die Anwendung von Data-Mining- Techniken auf Inhalt, (Hyperlink-) Struktur und Nutzung von Webressourcen. Webmining-Gebiete: Web content mining Web structure mining Web usage mining 1 Fayyad, U.M., Piatetsky-Shapiro, G., Smyth, P., & Uthurusamy, R. (Eds.) (1996). Advances in Knowledge Discovery and Data Mining. Boston, MA: AAAI/MIT Press

13 Muster, Data-Mining-Aufgaben, Methodenbeispiele n Globale Muster l Deskription –Clustering »K-means, EM, hierarchisches Clustern,... –Hidden Markov Modelle –Zitationsmuster l Prädiktion –Klassifikation »Bayes-Verfahren, Entschei-dungsbäume, Support Vector Machines,... –Regression n Lokale Muster l Häufige Itemsets, Sequenzen, Subgraphen »A priori und abgeleitete Verfahren l Assoziationsregeln l Cliquen (“Web Communities“)

14 Anwendungsbereiche, die (u.a.) Web Mining einsetzen Suchmaschinen: Ranking Digitale Bibliotheken e-Learning Wissensmanagement Informationssuche, ubiquitäre Information Semantic Web Suchmaschinen: Query Mining Kennzahlen für den e-Commerce Evaluation von Informationssystemen E-Privacy Trend-Entdeckung, Evolution Entdeckung von Missbrauch (fraud detection) Empfehlungssysteme (z.B. cross-/up-selling), Personalisierung Suchmaschinen: Dokumenten-Erschließung Web Communities Blog Mining Spam-Erkennung Plagiarismus- Entdeckung Marktforschung, z.B. Kundensegmentierung

15 Wer wird demnächst welches Buch kaufen (und wo wohnt er/sie)? 1. ing=UTF8&type=wishlist&field-name=edgar&page=1 contains “edgar“ wishlist URLs: l ding=UTF8&type=wishlist&id=theFirstEdgar line shell script + wget : Viele Wunschlisten 3. ls -1 | xargs grep -HiFof bookSpec.txt > matches.txt (bookSpec: ISBN or term): l book  {person name + city} 4. l book  {name + address} 5. geocoder: l book  {geo-coordinates} 6. Google Maps API: Geo-Koordinaten in Karte einfügen [Owad (2006).

16 Welche Bücher werden demnächst gekauft (ohne dass dieses explizit gesagt wurde)? [Gruhl, Guha, Kumar, Novak, & Tomkins, Proc. SIGKDD 2005] Blog Tagging / Recommendation: [Berendt & Navigli, Proc. AAAI Spring Sympos. Weblogging 2006] 1. Sales rank: 2. Blogs (+) data: 3. Einfache Keyword (Namen, Buchtitel)-Suchmaschine 4. Definition von „spike“ l alle ranks > 1 Woche weg vom min. rank m sind > max(m+50,1.5*m) 5. Zeitreihen-Kreuzkorrelation für den besten lag k = arg max c BS (k) Cross-correlation r BS (k) = c BS (k) / sqrt( c BB (0) * c SS (0) ) 6. Vorhersage-Modelle l Moving average, weighted least-squares prediction; Markov predictor l Spike predictor on blog mention rank data –Predict spike if current rank > max. rank (history) and > mean of history + 4 * standard deviation of history

17 Web Usage Mining... p3ee24304.dip.t-dialin.net - - [19/Mar/2002:12:03: ]"GET /search.html?t=jane%20austen&SID= &ord=asc HTTP/1.0" p3ee24304.dip.t-dialin.net - - [19/Mar/2002:12:05: ] "GET /search.html?t=jane%20austen&m=vide o&SID=023785&ord=desc HTTP/1.0" p3ee24304.dip.t-dialin.net - - [19/Mar/2002:12:06: ] "GET /view.asp?id=3456&SID= HTTP/1.0" Ver- stehen

18 n Mining-Verfahren: l Assoziationsregel-Mining l Sequenzmining l Graphmining l Semantic Web Mining n Anwendungsfragen: l Distributionskanäle l Informationssuche l Demographische Variablen 2 Fallstudien zum Web Usage Mining

19 Anwendung: Distributionskanal-Mix bei Multi-Channel- Händlern  Fragen: Wie verhalten sich Kunden? Sind Kundensegmente erkennbar? Kann Mining zur Erfolgsmessung in Multi-Channel-Sites beitragen?  Fragen: Wie verhalten sich Kunden? Sind Kundensegmente erkennbar? Kann Mining zur Erfolgsmessung in Multi-Channel-Sites beitragen? [BCG 2002]

20 Einschub: Das Web als optimaler Vertriebskanal für Suchgüter?! Erfahrungsgut Winterjacke Suchgut Kamera [Berendt, Günther, & Spiekermann, Comm. of the ACM,2005; Berendt, Data Mining and Knowlege Disc. 2002]

21 Schritt 1: Modellierung  Ontologien

22 Webseiten/Anfragen: Inhalt und Dienst  Site-Modell = (Inhalts-Ontologie, Dienst-Ontologie) Inhalt: Produkt  Produktkategorie ...  Inhalts-Taxonomie/-Ontologie Inhalt: Produkt  Produktkategorie ...  Inhalts-Taxonomie/-Ontologie Dienst: Suche nach Marke  Suche  Dienst Suche nach Preis  Suche  Dienst Sofortbestellung  Bestellung  Dienst Produktbeschreibung  Dienst...  Dienst-Taxonomie/-Ontologie Dienst: Suche nach Marke  Suche  Dienst Suche nach Preis  Suche  Dienst Sofortbestellung  Bestellung  Dienst Produktbeschreibung  Dienst...  Dienst-Taxonomie/-Ontologie

23 Was ist eine Ontologie? Definition Kernontologie mit Axiomen: Eine Struktur O := ( C, ≤ C, R, σ, ≤ R, A ) aus n zwei disjunkten Mengen C (Konzept-Identifizierer) und R (Relationen-Identifizierer) n einer partiellen Ordnung ≤ C auf C (Konzept-Hierarchie o. Taxonomie) n einer Funktion σ : R → C + (Signatur), wobei C + die Menge aller finiten Tupel von Elementen in C ist. n einer partiellen Ordnung ≤ R auf R (Relationen-Hierarchie), wobei l r 1 ≤ R r 2 impliziert |σ(r 1 )| = |σ(r 2 )| l  i (σ(r 1 )) ≤ C  i (σ(r 2 )) für alle 1 ≤ i ≤ |σ(r 1 )|, mit  i der Projektion auf die i-te Komponente n einer Menge A von Axiomen in einer logischen Sprache L [s. Stumme, Hotho, & Berendt, Journal of Web Semantics, in press, sowie Quellen dort]

24 Schritt 2: Was bedeutet ein Klick?

25 Atomare Anwendungsereignisse Def.: Ein Tupel AAE := (s,c) mit s: ein Konzept oder eine Relation aus der Dienste-Ontologie S des Site-Modells (S,C), c: ein Konzept oder eine Relation aus der Inhalts-Ontologie C des Site-Modells Eine Anfrage und somit eine URL / Webseite kann einem oder mehreren AAEs zugeordnet werden. [vereinfacht und modifiziert nach Berendt, Stumme, & Hotho. In Data Mining: Next Generation Challenges and Future Directions. AAAI/MIT Press 2004]

26 Webseite/Anfrage  Anwendungsereignis: Extraktion von Konzepten und Relationen aus URLs 1. URL in einer Semantic-Web-Site mit Konzepten und Relationen : FORALL N, ITEMS > "M57"] and ITEMS: Product [name->>N]. [nach ka2portal.aifb.uni-karlsruhe.de – Ontologie, Wissensbasis, Anfragen in F-Logic] 2. URL einer typischen datenbankgenerierten Webseite: options=zubehoer&search=name [Oberle, Berendt, Hotho, & Gonzalez, Proc. AWIC 2003; Berendt & Spiliopoulou, VLDB Journal 2000; Berendt, Data Mining and Knowledge Discovery 2002]

27 Schritt 3: Was bedeutet eine Sequenz von Anfragen?

28 Komplexe Anwendungsereignisse Def.: Ein CAE ist eine nichtleere n Sequenz n Regulärer Ausdruck n Graphenstruktur deren Elemente AAEs sind. [vereinfacht und modifiziert nach Berendt, Stumme, & Hotho. In Data Mining: Next Generation Challenges and Future Directions. AAAI/MIT Press 2004]

29 Semantik: Der Kaufprozess als Dienst-Ontologie

30 Mining 1: Der Kaufprozess als regulärer Ausdruck Alternativ: n = online, f = offline, a = acquisition etc.; Kaufprozess = ( na | (fa,fi?) ), ni, no, ( (np,nd,ns) | (np,nd,fs) | (np,fd,fs) | (fp,fd,fs) )

31 Mining 2: Assoziationsregeln zur Untersuchung der Präferenzen für Handlungskonzepte im Kaufprozess Studie basierend auf ~100K Sessions, ~13K Transaktionen aus 2002 bei einem führenden europäischen Konsumelektronik-Anbieter zeigte u.a.: Online payment  Direct delivery (s=0.27, c=0.97) < 1/3 tradit. Online-User! Online payment  In-store pickup (s=0.02, c=0.03) Cash on delivery  Direct delivery (s=0.02, c=0.03) In-store payment  In-store pickup (s=0.69, c=0.94)  Site wird v.a. zur Informationssuche genutzt.  Kennzahlen („Web metrics “), z.B.: Konversionseffizienz Offline-Konversion Effektivität und Effizienz von Suchoptionen  Kennzahlen („Web metrics “), z.B.: Konversionseffizienz Offline-Konversion Effektivität und Effizienz von Suchoptionen [Berendt & Spiliopoulou, VLDB Journal, 2000, Berendt, Data Mining and Knowl. Discovery, 2002; Teltzrow & Berendt, Proc. WebKDD 2003]

32 Resultate: Einfluss von demographischen Variablen, Einfluss des Offline-Distributionskanals ?! Signifikante Pearson- Korrelationen:  Anzahl der Kunden in PLZ- Gebiet, normalisiert durch Anzahl der Einwohner des PLZ-Gebiets   Distanz zum nächsten Geschäft (r = -0.3, p < 0.001).  Anzahl der Einwohner in PLZ-Gebiet   Distanz zum nächsten Geschäft (r =-0.01, p<0.001) Shops Customers

33 Schritt 4: Was bedeuten weitere Strukturen auf Anfragen?

34 Anwendung: Suche in Informationsportalen; e-Health  Fragen: Wie suchen Nutzer? Gibt es unterschiedliche Suchtypen? Führen unterschiedliche Suchoptionen zu unterschiedlichen Arten der Exploration? Zusammenh ä nge zwischen Verhalten u. Sprache, Kultur, Dom ä nenwissen?  Fragen: Wie suchen Nutzer? Gibt es unterschiedliche Suchtypen? Führen unterschiedliche Suchoptionen zu unterschiedlichen Arten der Exploration? Zusammenh ä nge zwischen Verhalten u. Sprache, Kultur, Dom ä nenwissen?

35 Semantik: Dienst-Ontologie Alphabetic al search Diagnosis Diagnosis info TOP Search

36 [Berendt, Proc. WebKDD 2005] Mining: Häufige Subgraphen, Visualisierung mit Detail & Kontext

37 Grundidee des Mining-Algorithmus: Suche im Muster-Raum (“Apriori”) a – b – c | d a – b – ca – b – d c – b – d a – b b – cb – d Ø Duplikatenerkennung und Einbettung in die Daten erfordern Isomorphietests  prinzipiell NP(-vollständig)  Was sind geeignete Vereinfachungen? Duplikatenerkennung und Einbettung in die Daten erfordern Isomorphietests  prinzipiell NP(-vollständig)  Was sind geeignete Vereinfachungen?

38 Apriori-Algorithmus zum Finden häufiger Patterns – Grundprinzip FP  all frequent patterns of size 1; k  2 while k ≤ K Max do extend frequent patterns of size (k-1) to patterns of size k (processing each candidate further only once) for each candidate pattern cp do if cp is frequent in the data add cp to the set of k-frequent patterns FP k++ Candidate generation Support pruning Duplicate detection Subgraph embedding Lösungsansatz : Isomorphie-Tests durch: Bekannte Automorphismen Kanonische Formen IP: sortierte Kantenlisten AP: spezielle kan. Formen für Pfade, Bäume, zyklische Graphen Verringerung der Duplikatengenerierung durch kanonische Formen Reduktion von Zugriffen auf die Daten / Subgraphen-Isomorphietests [Weiterentw. v. Nijssen & Kok‘s Gaston, SIGKDD 2004] Lösungsansatz : Isomorphie-Tests durch: Bekannte Automorphismen Kanonische Formen IP: sortierte Kantenlisten AP: spezielle kan. Formen für Pfade, Bäume, zyklische Graphen Verringerung der Duplikatengenerierung durch kanonische Formen Reduktion von Zugriffen auf die Daten / Subgraphen-Isomorphietests [Weiterentw. v. Nijssen & Kok‘s Gaston, SIGKDD 2004]

39 Laufzeit-Verhalten: lineare Abhängigkeit von Datenmenge und Zahl der Muster

40 Suchverhalten: häufige abstrakte Muster Diagnosen sind “Hubs" für die Navigation (5.3%, 4%) Alphabetische Suche: hub-and-spoke → nur linguistische Relationen (6.4%) Lokalisationssuche: linear / Tiefensuche → Suchverfeinerung & medizinisches Wissen (5%) 2 Studien (Webserverlog: 277K Sessions aus 188 Ländern; Webserverlog + Fragebogen: 165 Personen aus 34 Ländern): l Suchmaschine, alphabetische Suche: v.a. Muttersprachler, Ärzte l Lokalisationssuche: nicht-muttersprachliche Patienten  Domänenwissen kompensiert geringe Sprachkenntnisse. [Berendt, Proc. WebKDD 2005] [Kralisch & Berendt, New Review of Hypermedia and Multimedia 2005]

41 Kontext: Projekte und weitere Aktivitäten n Leiterin des Bildungsportals ( ) n Projekte mit l dem Bildungsportal l dem Digitalen-Bibliotheks-Portal edoc.hu-berlin.deedoc.hu-berlin.de l E-Business-, E-Health-, Informations-Sites l Deutsche Welle Neue Medien n EU 5FP Network of Excellence KDNet ( ) n EU 6FP Coord. Action KDUbiq (2005-), Leiterin von “HCI / Cognitive Modelling“ n Interdisziplinäres Zentrum „Ubiquitäre Information“, HU Berlin (2006-) n Virtuelles Institut für Bildwissenschaft (2004-) n Semantics, Web, und Mining: Workshops, Tutorials (seit 2001) l ECML/PKDD, AAAI, KDD, IJCAI,... n Mitaufbau / Mitgestaltung des Masters Wirtschaftsinformatik sowie weitere Bachelor- und Masterstudiengänge (seit 2004) n Erasmus/Socrates-Kooperation mit der Informatischen Fakultät der Universidad Politécnica de Madrid (seit 2005)

42 Zusammenfassung und Ausblick n Web Mining ist Wissensentdeckung / Business Intelligence+ auf globalen Daten. n Datenquellen-Kombination: zentrale Chance und Risiko n Web Mining: Verständnis, Gestaltung/Verbesserung, Evaluation von Informationssystemen n Web Usage Mining: wertvoll, da Verhaltensbeobachtung Aktuelle Projekte: n Ubiquitäre Wissensentdeckung n Semantic Web Mining für Partizipative Medien (Blogs,...) n Digitale Bibliotheken: wissensbasiertes eLearning für das wissenschaftliche Schreiben

43 … für Ihre Aufmerksamkeit! Danke …

44 Bildnachweise - mit herzlichem Dank an die Internet-Gemeinde! - S.5: S.9: S. 10: und Weitere Abbildungen wurden den zitierten Quellen entnommen bzw. sind Screenshots der untersuchten Websites.