Maschinelles Lernen mit multiplen Kernen

Slides:



Advertisements
Ähnliche Präsentationen
Kopplung von Simulation und Optimierung
Advertisements

Präsentiert von Torben Pastuch
Matrixmultiplikation
Perceptrons and the perceptron learning rule
Rekursion: Rekurrenz: Algorithmen rufen sich selbst (rekursiv) auf.
Falls Algorithmen sich selbst rekursiv aufrufen, so kann ihr Laufzeitverhalten bzw. ihr Speicherplatzbedarf in der Regel durch eine Rekursionsformel (recurrence,
Wiederholung TexPoint fonts used in EMF.
Komplexität und Phasenübergänge
Wiederholung TexPoint fonts used in EMF.
Wiederholung: Ziehen von Elementen
Wiederholung Operationen auf Mengen Relationen, Abbildungen/Funktionen
Die Hattie Studie und erfolgreicher Unterricht
3. Kapitel: Komplexität und Komplexitätsklassen
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2012.
Peter Marwedel TU Dortmund, Informatik 12
Einführung in Berechenbarkeit und Formale Sprachen
Einführung Übersicht Einsatz der Zielwertsuche Einsatz des Solvers
Genetische Algorithmen
Algorithmen und Datenstrukturen
Kapitel 3 Elementare Datenstrukturen TexPoint fonts used in EMF.
Wiederholung Formale Potenzreihen
Die Nukleon-Nukleon Wechselwirkung
Thorsten Jost INF-M2 – AW1 – Sommersemester Mai 2008
High Performance = Innovative Computer Systems + Efficient Algorithms Friedhelm Meyer auf der Heide 1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen.
Bestimmung des ggT zweier Zahlen
Vorlesung: Einführung in der Bioinformatik
Seminar: Informationstechnik in der Medizin Universität Dortmund Skin Detection Fakultät für Elektrotechnik und Informationstechnik Lehrstuhl für Kommunikationstechnik.
Machine Learning Was wir alles nicht behandelt haben.
Die Hattie Studie und erfolgreicher Unterricht
Diplomarbeit von Daniel Tameling
Machine Learning & Spiele: Probleme und Ideen von Samuel bis heute Giuliana Sabbatini
Best Fit Matching von Punktewolken
Rolf Schenker, Statistik Stadt Zürich
Agenda Motivation Grundlagen der Matrix-Vektor-Multiplikation
Abschlussvortrag zur Studienarbeit
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Polynome und schnelle Fourier-Transformation
10.1 Recherche: Lernenden-Ebene
Einführung in die Programmierung Wintersemester 2008/09 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
Einführung in die Programmierung Wintersemester 2009/10 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
Einführung in die Programmierung Wintersemester 2011/12 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
Einführung in die Programmierung Wintersemester 2012/13 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
Institut für Theoretische Informatik
Institut für Theoretische Informatik
Institut für Theoretische Informatik
Institut für Theoretische Informatik

Institut für Theoretische Informatik
Finnische Lehrerinnenbildung: Forschungsorientiert Englisch Research-based teaching According to the teaching philosophy of the University, teaching and.
Bild: Still Univ.-Prof. Dr.-Ing. Jochen Deuse, Dipl.-Logist. Markus Droste OptiMilk – Mathematische Modellierung innerbetrieblicher Milkrun-Systeme zur.
KiP 2 – Finissage, 4. Mai 2012 Christine Heidinger Das Bio-KiP-Modell: Wie gelingt der Zugang zur Welt der Naturwissenschaften? SchülerInnen, LehrerInnen,
Friday Lectures, 23. Nov. 2007, W. Grossmann, K. Schinagl Ziele Content Blended Learning Szenario Besonderheiten Implementierung Evaluation.
Forschungsplattform Theorie und Praxis der Fachdidaktik(en)
Forschungsplattform Theorie und Praxis der Fachdidaktiken Workshop Finalisierung der Forschungsinstrumente 28 – 29. Jänner 2010 USZ 1, Schmelz.
Klassifikation und Regression mittels neuronaler Netze
Lecture 8: Maschinelles Lernen mit multiplen Kernen
Masterarbeit Im Zuge der Masterarbeit soll die Genauigkeit von Schallfeldmessungen durch Entfaltung erhöht werden. Dazu soll ein Algorithmus für die Anwendung.
Directors Prof. Dr.-Ing. K.D. Müller-Glaser Prof. Dr.-Ing. J. Becker Prof. Dr. rer. nat. W. Stork Institute for Information Processing Technology.
Grundlagen der Algorithmen und Datenstrukturen Kapitel
SS 2009Maschinelles Lernen und Neural Computation 133 Kapitel 7: Ensemble Methoden.
Diskrete Mathematik Angelika Steger Institut für Theoretische Informatik TexPoint fonts used in EMF. Read the TexPoint manual before.
5.1 5 Retrieval auf Bildern (.... in a nutshell)  Bedeutung.... ... im Zusammenhang mit Information Retrieval ... für Anwendungen Medizin: "Finde ähnliche.
EIN NEUES ENSEMBLE- KLASSIFIKATIONSVERFAHREN Tim Schneider Rotation Forest.
Focusing Search in Multiobjective Evolutionary Optimization through Preference Learning from User Feedback Thomas FoberWeiwei ChengEyke Hüllermeier AG.
Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.
Bildunterschrift [Cohen, 1994]
Wiederholung TexPoint fonts used in EMF.
TexPoint fonts used in EMF.
 Präsentation transkript:

Maschinelles Lernen mit multiplen Kernen Marius Kloft Technische Universität Berlin Kolloquium zum GI Disserationspreis, Dagstuhl, 14. Mai 2012 TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA

Maschinelles Lernen Zielstellung Beispiel Erlernen des Zusammen- hanges zweier Zufallsgrößen und auf Grundlage von Beobach- tungen Kernbasiertes Lernen: Beispiel Erkennung von Objekten in Bildern

Multiple Sichtweisen / Kerne (Lanckriet, 2004) Raum Sichtweisen wie kombinieren? Form Gewichtungen. Farbe

Bestimmung der Gewichte? Stand der Forschung „Spärliche“ Gewichtungen Kerne / Sichtweisen werden komplett ausgeschaltet Aber warum Information verwerfen? (Bach, 2008) Sparsity: Ideologische Sache / Trend

Von der Vision zur Wirklichkeit? Bisher: Spärliches Verfahren Empirisch ineffektiv in Anwendungen (Gehler et al., Noble et al., Shawe-Taylor et al., NIPS 2008) Dissertation: Neue Methodologie hat sich als Standard etabliert Effektiv in Anwendungen In der Praxis wirk- samer und effektiver Durch bei Lern- schranken: O(M/n)

Vorstellung der Methodologie Nicht-spärliche, Multiple, Kernbasierte Lernverfahren

Neue Methodologie Bestimmung der Gewichte? Generelle Formulierung (Kloft et al., ECML 2010, JMLR 2011) Bestimmung der Gewichte? Model Kern Mathematisches Programm Konvexes Problem. Generelle Formulierung Erstmalig beliebiger Verlust Erstmalig beliebige Normen z. B. lp-Normen: 1-Norm führt zu Spärlichkeit: Instanzierung neuer MKL Formulierunen Optimierung über Gewichte

Theoretische Fundamente Theoretische Klärung Aktives Thema NIPS Workshop 2010 Wir beweisen : Theorem (Kloft & Blanchard). Die lokale Rademacher-Kom- plexität von MKL ist be- schränkt durch: Folgerungen Lernschranke mit Rate bisher beste Rate: Üblicherweise Zwei Größenordnungen bes- ser für (Cortes et al., ICML 2010) (Kloft & Blanchard, NIPS 2011, JMLR 2012)

Beweisschritte Abschätzung der Originalklasse durch die zentrierten Klasse Abschätzung der Komplexität der zentrierten Klasse Ungleichungen von Khintchine-Kahane (1964) und Rosenthal (1970) Abschätzung der Komplexität der Originalklasse Umformulierung als Trunkierung der Spektren der Kerne

Optimierung Algorithmen Implementierung Newton-Methode (Kloft et al., JMLR 2011) Algorithmen Newton-Methode Sequentielle, quadratisch- bedingte Programmierung mit Höhenlinien-Projektionen Blockkoordinaten-Algorithmus Alterniere Löse (P) bezüglich w Löse (P) bezüglich %: Bis Konvergenz (bewiesen) Implementierung In C++ (“SHOGUN Toolbox”) Matlab/Octave/Python/R support Laufzeit: ~ 1-2 Größenordnungen effizienter (Skizze) EM-Algorithmus Wir beweisen nicht nur, es existiert eine Methode… analytisch

Anwendungsgebiet: Maschinelles Sehen Visuelle Objekterkennung Zielstellung: Annotation visueller Medien (z. B. Bilder): Motivation:  inhaltsbasierter Bildzugriff Flugzeug Fahrrad Vogel

Anwendungsgebiet: Maschinelles Sehen Visuelle Objekterkennung Zielstellung: Annotation visueller Medien (z. B. Bilder): Motivation:  inhaltsbasierter Bildzugriff Empirische Analyse Datensatz: PASCAL VOC’08 Genauigkeitsgewinn gegenüber uniformer Kerngewichtung: Gewinner: ImageCLEF 2011 Photo Annotation challenge! Multiple Kerne basierend auf Pixelfarben Formen (Gradienten) lokale Merkmale (SIFT-Wörter) räumliche Merkmale

Zusammenfassung Appli- kationen Scharfe Lernschranken Visuelle Objekterkennung Als Standard etabliert: Gewinner des Image- CLEF Wettbewerbs Training mit > 100 000 Daten- Punkten und > 1 000 Kernen Scharfe Lernschranken Appli- kationen Bioinformatik Genauerer TSS-Er- kenner als Gewinner internat. Vergleichs Methode ist praktikabel und die Leute benutzen sie – und zitieren sie freundlicherweise auch  philosophische Komponente: Trend zu Sparsity in den letzten Jahren. Einfacher sparse zu machen. Aber nicht so gut. Arbeit lieber auf schnellere Optimierung von nicht-sparsen Sachen. Mit der Arbeit Trendwende eingeleitet.

Referenzen Abeel, Van de Peer, Saeys (2009).  Toward a gold standard for promoter prediction evaluation. Bioinformatics. Bach (2008).  Consistency of the Group Lasso and Multiple Kernel Learning. Journal of Machine Learning Research (JMLR). Kloft, Brefeld, Laskov, Sonnenburg (2008). Non-sparse Multiple Kernel Learning. NIPS Workshop on Kernel Learning. Kloft, Brefeld, Sonnenburg, Laskov, Müller, Zien (2009). Efficient and Accurate Lp-norm Multiple Kernel Learning. Advances in Neural Information Processing Systems (NIPS). Kloft, Rückert, Bartlett (2010). A Unifying View of Multiple Kernel Learning. ECML. Kloft, Blanchard (2011). The Local Rademacher Complexity of Lp-Norm Multiple Kernel Learning. Advances in Neural Information Processing Systems (NIPS). Kloft, Brefeld, Sonnenburg, Zien (2011). Lp-Norm Multiple Kernel Learning. Journal of Machine Learning Research (JMLR). Kloft, Blanchard (2012). On the Convergence Rate of Lp-norm Multiple Kernel Learning. Journal of Machine Learning Research (JMLR), to appear. Lanckriet, Cristianini, Bartlett, El Ghaoui, Jordan (2004). Learning the Kernel Matrix with Semidefinite Programming. Journal of Machine Learning Research (JMLR).

Vielen Dank für Ihre Aufmerksamkeit. Für weitere Fragen stehen ich Ihnen gerne zur Verfügung.

Anwendungsgebiet: Bioinformatik (Kloft et al., NIPS 2009, JMLR 2011) Theoretische Analyse Einfluss von lp-Norm auf Schranke: Bestätigung des Experimentes: Stärkere theoretische Garantie für vorgeschlagenen Ansatz (p>1) Empirie nähert sich Theorie an für Stichprobengröße Detektion von Transkriptionsstartpunkten: mittels Kernen basierend auf: Sequenzalignment Nukleotidverteilung downstream, upstream Faltungseigenschaften Bindungsenergien, Winkel Empirische Analyse Detektionsgenauigkeit (AUC): Höhere Genauigkeiten als spärliches MKL sowie ARTS ARTS Gewinner eines Vergleichs von 19 Modellen Abb. aus Alberts et al. (2002) (Abeel et al., 2009)