LS 8 – Künstliche Intelligenz www-ai.cs.uni-dortmund.de LS 8 – Künstliche Intelligenz Prof. Dr. Katharina Morik Timm Euler, Felix Jungermann, Ingo Mierswa, Michael Wurst
Hauptstudium Eigentlich ist die Universität immer die Gemeinschaft der Lehrenden und Lernenden. Spätestens aber im Hauptstudium wird gemeinsam geforscht! Wissen
evolutionäre Strategien Linguistik Statistik Logik Psychologie Mustererkennung Lernbarkeit evolutionäre Strategien LS12 LS2 LS8 LS11 LS6 LS7
LS8-Schwerpunkt: Maschinelles Lernen Textsammlungen – Web 2.0 Automatische Auszeichnung von Textteilen Induktive Datenbanken (data mining) Welche Kunden werden ihren Vertrag kündigen? mein neues Produkt kaufen? Mediensammlungen Strukturierung nach verschiedenen Aspekten
LS8-Stil Eine gute Theorie ist die beste Praxis! Systeme entwickeln, die weltweit eingesetzt werden MOBAL Yale (jetzt: RapidMiner) Theoretische Aussagen, die den Beobachtungen entsprechen Vollständigkeit der gefundenen Regeln Fehlerschranke nah an beobachteten Fehlern Inspektionsmöglichkeiten
Lebenszyklus der Forschung Induktive logische Programmierung: Obere und untere Lernbarkeitsschranke gemäß LE, LB, LH Schnellster Beweiser für eingeschränkte Hornlogik Jörg-Uwe Kietz 1996 Lernen von Merkmalsextraktionen aus Musikdaten (Mierswa 2002) Organisation von Musiksammlungen (Wurst 2005) Automatische Erkennung von Eigennamen (Rössler 2006) Verteiltes data mining Stützvektormethode zur Textklassifikation: Formales Modell TCat Schranke des erwarteten Fehlers Thorsten Joachims 2002
Musikdaten Klassifikation von Musikstücken nach Benutzerpräferenzen Automatische Merkmalsextraktion Clustering von Musiksammlungen nach verschiedenen Gesichtspunkten Verteiltes kollaboratives Strukturieren Jetzt das selbe für Videos?
Stöberngemäß eigener Präferenzen Nemoz NEtwork Media OrganiZer: Collaborative clustering in P2P networks Einbindung von Yale Klassifikation Clustering Kopieren Stöberngemäß eigener Präferenzen
Lehre am LS 8 Vorlesung "Wissensentdeckung und maschinelles Lernen (Data Mining)“ mit Fachbereich Statistik 4V+2Ü jedes Sommersemester Vorlesung „Maschinelles Lernen“ rein Informatik 2V + 2Ü WS 2006/7 PGs: KDD Cup (endete SoSe 2004) Kollaboratives Strukturieren von Multimediadaten in peer2peer-Netzen (endete SoSe2005) Intelligence Service – Informationsextraktion aus dem Web Seminare zu Spezialthemen
Abgeschlossene Diplomarbeiten... Stephan Deutsch (2006). Outlier Detection in Usenet Newsgruppen. Benjamin Helbig (2005). Eine Umgebung zur Informationsextraktion aus Geschäftsbriefen. Mierswa, Ingo (2004). Automatisierte Merkmalsextraktion aus Audiodaten. Hüppe, Christian (2003). Benutzergeführtes Lernen von Dokumentstrukturauszeichnungen aus Formatierungsmerkmalen. Michaelis, Stefan (2000). Techniken des Data Mining zur Analyse von Telekommunikationsnetzwerken
Erwartungen an Diplomandinnen Von der Anwendung zur Methode zur Theorie und wieder zurück! Fragestellungen aus der Anwendung in solche des Fachs übertragen Algorithmen entwickeln Vorhandene Systeme erweitern Sorgfältige Evaluation Und...
Lesen! Bücher: Zeitschriften: Proceedings: Hand, Mannila, Smyth Mitchell Schölkopf, Smola Zeitschriften: JMLR (im WWW) MLJ (Kluwer) Knowledge and Information Systems (Springer) Proceedings: ICDM KDD PKDD ICML ECML
Offene Diplomarbeiten -- Beispiele Entdecken wissenschaftlicher Communities anhand von home pages. Lernen von taggings mit SVMstruct Automatische Merkmalsextraktion aus Bilddaten Personalisierte Literaturempfehlung für interdisziplinäres Arbeiten