Maschinelles Lernen und automatische Textklassifikation

Slides:

Advertisements

Ähnliche Präsentationen

Präsentiert von Torben Pastuch

Advertisements

Algorithmen für das Erfüllbarkeitsproblem SAT

Seminarankündigung für das SS04

Freie Universität Berlin Institut für Informatik

Perceptrons and the perceptron learning rule

Definition [1]: Sei S eine endliche Menge und sei p eine Abbildung von S in die positiven reellen Zahlen Für einen Teilmenge ES von S sei p definiert.

Rekursion: Rekurrenz: Algorithmen rufen sich selbst (rekursiv) auf.

Falls Algorithmen sich selbst rekursiv aufrufen, so kann ihr Laufzeitverhalten bzw. ihr Speicherplatzbedarf in der Regel durch eine Rekursionsformel (recurrence,

6. Regelbasierte Systeme

Steigung m berechnen Man kann die Steigung auch berechnen,

Übung Datenbanksysteme WS 2003/ Übung Datenbanksysteme Entwurf eines Bibliothekssystems

Data Mining Anwendungen und Techniken

verweis-sensitive Grafiken

3. Kapitel: Komplexität und Komplexitätsklassen

8. Formale Sprachen und Grammatiken

Friedhelm Meyer auf der Heide 1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität Grammatiken beschreiben Sprachen L µ *, indem.

Objektrelationales Mapping mit JPA Testing Jonas Bandi Simon Martinelli.

1 Computergestützte Verifikation Symbolisches Model Checking 4.1 CTL Model Checking mit Binary Decision Diagrams (1. Systeme 2. Spezifikationen.

Genetische Algorithmen

Tina John Ebenen und Links in Sprachdatenbanken. Ebenen = Symbole werden mit der Zeit in einer Ebene verbunden. Namen der Ebenen Symbole der Word-Ebene.

Motivation Richard Göbel.

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/4 Machine Learning (ML) Der erste Teil dieser Definition ist auch eine Beschreibung von Machine.

Union-Find-Strukturen

Entscheidungsunterstützungssysteme IWI Frankfurt 2003

Algorithmen und Komplexität

Was ist ein Modell ? Repräsentiert Zugang: Mathematik Zugang: Empirie

Informatik Oberstufe A. Gillmann, M. Reker, V. Reimchen.

Datenbasisschema Wegen der Freizügigkeit des Modells: Keine a-priori Vereinbarung eines Schemas Hingegen: a-posteriori Extraktion eines Schemas: Gibt es.

Handlungsplanung und Allgemeines Spiel „Game Description Language (GDL)“ Peter Kissmann.

Neuronale Netzwerke am Beispiel eines MLP

Neuronale Netze (Mitchell Kap. 4)

Bayes‘sche Verfahren (Mitchell Kap. 6), Teil 1

Machine Learning KNN und andere (Kap. 8).

Maschinelles Lernen und automatische Textklassifikation

Neuronale Netze 2 (Mitchell Kap. 4)

Machine Learning Decision Trees (2).

Maschinelles Lernen Bayessche Verfahren (Mitchell Kap. 6), Teil 1.

Entitäten Extraktion Einführung

Entitäten Extraktion Wichtige Schritte Petra Maier WS 05/06.

Variationsformalismus für das freie Teilchen

? Was ist Informatik? Was ist Informatik? Alexander Lange

Java ohne Kara. Java ohne Kara Ab jetzt: Java ohne Kara Ziel: Erfahrungen sammeln mit ersten Java Programmen.

1 Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Einführung Lernmodul Nutzungsbedingungen:

Computational Thinking Online Algorithmen [Was ist es wert, die Zukunft zu kennen?] Kurt Mehlhorn Konstantinos Panagiotou.

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Softwaretechnologie II (Teil I): Simulation und 3D Programmierung Prof.

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/ /23.1.

Hartmut Klauck Universität Frankfurt SS

AEVO Kurs, IHK Oldenburg

1 Learning to Construct Knowledge Bases from the World Wide Web Mark Craven, Dan DiPasquo, Dayne Freitag, Andrew McCallum, Tom Mitchell, Kamal, Neigam,

ProSeminar WS 2007/08 Leo Hackstein

Abteilung für automatische Sprachverarbeitung

Dieser nicht Fehler finden Algorithmus enthält einfach einen gravierenden welcher zu ist.

1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Informatik III Christian Schindelhauer Wintersemester.

Information Retrieval, Vektorraummodell

Lisa Blum - Kathrin Kunze - Michael Kreil

Berechenbarkeit Klaus Becker Berechenbarkeit.

Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Softwaretechnologie II (Teil I): Simulation und 3D Programmierung Prof.

Inhalt Einordnung und Funktion der lexikalische Analyse Grundlagen

Testtheorie (Vorlesung 7: ) Rekapitulation: Modellierungsansatz

SS 2009Maschinelles Lernen und Neural Computation 133 Kapitel 7: Ensemble Methoden.

 Definieren Sie das Thema. › Fassen Sie zusammen, was das Publikum in dieser Veranstaltung lernen wird. › Erkundigen Sie sich nach relevanten Erfahrungen.

Geoinformationssysteme

Probleme mit Wareneingängen (Bestellungen) SAP Business One

Programmiersprachen II Vorbesprechung Klausur Prof. Dr. Reiner Güttler Fachbereich GIS HTW.

Simple Recurrent Networks

Generierung von Flächenrepräsentationen aus Punktdaten

Präsentation transkript:

Maschinelles Lernen und automatische Textklassifikation Einführung: maschinelles Lernen

Warum maschinelles Lernen? Fortschritte bei Algorithmen und Theorie Unüberschaubare Menge online verfügbarer Daten Rechenkapazität verfügbar Kommerzielle Anwendungen gefragt Menschliche Arbeitskraft oft zu teuer oder nicht verfügbar

Warum maschinelles Lernen? Probleme, bei denen die exakten Mechanismen oder Regeln nicht bekannt sind Beispiel: automatische Klassifikation von Zeitungsartikeln nach Ressort Versuchen Sie operationale Regeln anzugeben, wann ein Artikel zum Ressort „Sport“ gehört!

Typische Anwendungen Data Mining: Verwendung historischer Daten um Entscheidungen zu verbessern Patientendaten Sofware Applikationen, die nicht von Hand programmiert werden können Roboter, automatische Steuerung Erkennung gesprochener Sprache Selbstlernende Programme Newsreader, der Anwender-Interessen lernt

Weitere Beispiele Spiele, z.B. Schach Komplexe Entscheidungen, z.B. Betriebswirtschaftl. Entscheidungen Expertensysteme Mustererkennung, z.B. OCR Bilderkennung Vorhersagen von best. Verhalten/Ereignissen Wettervorhersage Aktienkurse

Beispiel: Medizin

Was ist Lernen? Lernen = verbesserte Bewältigung einer Aufgabe A durch Übung/Erfahrung Ü Verbesserung bei Aufgabe A In Bezug auf ein bestimmtes Qualitätsmaß Q Aufgrund der Übung/Erfahrung Ü Beispiel 1: Schach A: Schach spielen Q: Anteil der gewonnenen Spiele Ü: Möglichkeit gegen sich selbst zu spielen Beispiel 2: Handschriftenerkennung A: korrekte Erkennenung handschriftlicher Wörter in Bildern Q: Anteil korrekt erkannter Wörter Ü: große Menge handgeschriebener Wörter mit korrekter Transkription

Erfahrung/Übung Direkt: Indirekt: Trainer: was ist optimaler nächster Zug Welches Wort Indirekt: Ausgang des Spiels Korrekt erkannter Text, ... Trainer: Anleitung

Maschinelles Lernen Betrachte maschinelles Lernen als Lernen von Input-Output-Funktionen Idee: gegeben Trainingsmenge, z.B. Menge vorklassifizierter Zeitungsartikel gesucht Funktion f, die für jeden Input den gewünschten Output liefert Vorgehen: finde Funktion h, die auf der Trainingsmenge mit f bestmöglich übereinstimmt

Input-Output-Funktionen Im ML werden Input-Output-Funktionen typischerweise als Funktionen auf Vektoren betrachtet: F: (x1, x2, x3, ...,xn) -> (y1, y2, y3, ..., ym) D.h. Input und Output müssen als Vektor repräsentiert werden -> Repräsentationsproblem Wie könnte eine Vektorrepräsentation im Falle des Beispiels der Klassifikation von Zeitungsartikeln aussehen?

Repräsentation Schach: Liste von Koordinaten mit Spielfigur und schwarz/weiss Handschrifterkennung: Pixelkoordinaten, Graustufe Textklassifikation: „Bag-of-Words“

Zielfunktion Schach: Handschrifterkennung: Textklassifikation: Brett-Koordinaten -> nächster Zug Handschrifterkennung: Pixelkoordinaten -> Wort Textklassifikation: Wortmenge -> Kategorie Problem: es gibt in der Regel beliebig viele Funktionen h, die auf einer gegebenen Trainingsmenge mit f übereinstimmen Einschränkung auf bestimmte Typen von Funktionen!

Input-Output-Funktionen Evaluierung der Hypothese h: Erfordert weitere Samples für das Verhalten von f: Testset Typisches Vorgehen: splitte Samplemenge in Trainingsset (typischerweise 80%) Testset (typischerweise 20%) Zur Verbesserung: Variation von Trainings-/Testset

Design Entscheidungen Art des Trainings? Definition der Zielfunktion? Repräsentation der gelernten Funktion? Welcher Lernalgorithmus?

Wichtige Punkte Welche Lernalgorithmern sind für welche Funktionen geeignet? Wie groß muß das Trainingsset sein? Welchen Einfluß hat die Komplexität der Hypothesen? Was passiert, wenn das Trainingsset fehlerhafte Daten enthält? Was sind die Grenzen von maschinellem Lernen? Wie kann Zusatzwissen genutzt werden? Was können wir von biologischem Lernen ableiten?

Aufgaben Klassifikation von Zeitungsartikeln in elektronischer Form danach, ob sie Sportartikel sind oder nicht. Definieren Sie eine geeignete Repräsentation der Daten Definieren Sie eine geeignete Zielfunktion Versuchen Sie auf der Basis der gewählten Repräsentation möglichst operative Regeln zu formulieren, wann ein Artikel ein Sportartikel ist.