ISWeb - Information Systems & Semantic Web Marcin Grzegorzek 5.4 Latent Semantic Indexing und Singulärwertzerlegung Zerlegung von.

Slides:



Advertisements
Ähnliche Präsentationen

Advertisements

Psychosoziale Unterstützung (PSU) im THW
Information Systems & Semantic Web University of Koblenz Landau, Germany 5. Feature - Transformationsverfahren 5.1 Diskrete Fourier-Transformation (DFT)
Schwerpunkt Mindestlohn
Schuljahr 2007/2008 Hannes Pfeiffer
ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Komplexe Distanzfunktionen 7. Effiziente Algorithmen und Datenstrukturen.
OZ - Virtueller Übungsraum
Hard Science – Soft Science
13. Transformationen mit Matrizen
Energiebereitstellung in der Muskelzelle
Bildungsportal Thüringen
ISWeb - Information Systems & Semantic Web Marcin Grzegorzek 5.3 Karhunen-Loeve-Transformation Minimalität und Orthogonalität innerhalb.
Andreas Kalender Institut für Informatik FU Berlin Seminar über Algorithmen Durchschnittsverzögerung.
Lösung von linearen Gleichungssystemen - Grundlagen
Beispiele für Gleichungssysteme
Scannen & Bildoptimieren Grundlagen und Übung.
3 Prinzipien des Information Retrieval
ISWeb - Information Systems & Semantic Web Marcin Grzegorzek 6 Distanzfunktionen 6.1 Eigenschaften und Klassifikation 6.2 Distanzfunktionen.
ISWeb - Information Systems & Semantic Web Marcin Grzegorzek 7 Effiziente Algorithmen und Datenstrukturen 7.1 Hochdimensionale Indexstrukturen.
ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Anwendung DFT zur Feature-Aufbereitung Ziel: Minimalität der Feature-Werte.
ISWeb - Information Systems & Semantic Web Marcin Grzegorzek 3.3 Relevance Feedback Bewertung von Ergebnisdokumenten Auswertung.
Einführung eines Remote Desktop Systems am RRZE
Ebay - Tipps und Tricks Sven Wölfel 19. Dezember 2003.
Linux-HA-Cluster – Heartbeat mit DRBD
Erstellen eines Internetzugangs für Kongressteilnehmer
Redundanter Fileserver mit Heartbeat2 und DRBD - Linux-HA-Cluster
Methoden des Ausdauertrainings
© data2type 2005, 1 Publishing mit XML Einsatz von XSL für das multimediale, automatisierte Publishing.
„ Stadtentwicklungskonzept Ehingen (Donau)
Möglichkeiten der Asphaltbauweise
Folie 1 § 30 Erste Anwendungen (30.2) Rangberechnung: Zur Rangberechnung wird man häufig die elementaren Umformungen verwenden. (30.1) Cramersche Regel:
Folie 1 § 29 Determinanten: Eigenschaften und Berechnung (29.1) Definition: Eine Determinantenfunktion auf K nxn ist eine Abbildung (im Falle char(K) ungleich.
§ 29 Determinanten: Eigenschaften und Berechnung
Tutorium
Risiken des Freiberuflers und deren Reduzierung in den Bereichen Umsatzsteuer und Wettbewerbsverbote Rechtsanwalt und Mediator (DAA) Dr. Benno Grunewald.
Projekt Vorlagenkatalog
Projekt Vorlagenkatalog Projektbesprechung 13. Dezember 2006.
Der Web-Baukasten der Friedrich-Alexander-Universität ( Projekt Vorlagenkatalog) 21. Januar 2008.
Sonderpädagogische Förderung in Tübingen
Matrix-Algebra Grundlagen 1. Matrizen und Vektoren
Dienstbesprechung Bitte nicht stören! Neurobiologie des Schlafs
Rekommunalisierung der Stromversorgung am Beispiel der Stadt Landsberg
Künstlergemeinschaft Ober-Ramstadt
Professionelles Selbst und professionelles Handeln im Lehrerberuf
„Über den Tellerrand schauen - GBM-Beratung“
der Gedanken und Gefühle
18. November 2006 Einführung in die Welt der fast 1000 Digital Möglichkeiten / Stefan Schmid / Herzlich willkommen Einführung.
Service Orientierte Architektur
Lineare Algebra Komplizierte technologische Abläufe können übersichtlich mit Matrizen dargestellt werden. Prof. Dr. E. Larek
Leinen und Anschlagmittel Stiche und Bunde in der FGr W
AG Bfp - Deutschlands Schulen werden selbstständiger – auch besser? Selbstständigkeitsbestrebungen im Schulwesen unter besonderer.
ISWeb - Information Systems & Semantic Web Marcin Grzegorzek R-Baum und Varianten R-Baum X-Baum M-Baum.
Jugendordnung | KONKRET| Dezember Adventjugend in Nordrhein- Westfalen © 2013 | | Jugendordnung | Der Jugendverband Adventjugend.
Stimmzettel auszählen mit:
Die Zukunft des kommunalen öffentlichen Dienstes
SEO-Textenwww.journalistenakademie.de1/20 Traffic für den Blog! Was die Suchmaschinen- Optimierung leisten kann. Was Sie unbedingt tun müssen, um Leser.
Wie das Internet genutzt wird
Multivariate Statistische Verfahren
Diplomverteidigung Ulrich Dinger Thema: Untersuchung und Entwicklung von Ansätzen und Techniken zur Realisierung einer (Web) Service Language.
Multivariate Statistische Verfahren
Multivariate Statistische Verfahren
bluechip Modular Server
C++11 Defaulted & Deleted Functions / 48 C++11 Defaulted & Deleted Functions Detlef Wilkening
Regeltest Online auf Regeltest Online auf
Kropewww.senioren-lernen-online.de1 Workshop 1 „Senioren und Neue Medien“ Referentin Uta Krope (Senioren-Lernen-Online)
SEO-Textenwww.journalistenakademie.de1/20 Traffic auf die Tageszeitungs-Website! Was die Suchmaschinen- Optimierung leisten kann. Was Sie unbedingt tun.
Fischer‘s Software Service Uwe Fisher Ihr Partner für professionelle Lösungen Consulting – Softwareentwicklung – Personal Training.
2.5.2 Multivariate Monte Carlo-Simulation
Graphische Datenverarbeitung
PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.
 Präsentation transkript:

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek 5.4 Latent Semantic Indexing und Singulärwertzerlegung Zerlegung von in Matrizen enthalten orthonormale Spaltenvektoren Matrix ist Diagonalmatrix reduzierte, zerlegte Matrizen bedeuten Speichereinsparung Zerlegung entspricht Abbildung auf minimale, schlummernde (latente), künstliche Konzepte

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Zerlegung der Feature-Matrix entspricht dem Rang der Matrix F

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Beispiel Feature-Vektoren

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Beispiel Feature-Vektoren nach Zerlegung Vektoren in Matrix :

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Analyse der Matrix Diagonalwerte der Matrix geben Relevanz der einzelnen Konzepte an niedrige Werte entsprechen geringer Relevanz und umgekehrt absteigende Sortierung der Diagonalelemente durch geschicktes Tauschen der Spalten/Zeilen

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Dimensionsreduzierung: Entfernen der Konzepte mit den kleinsten Diagonalwerten minimierter Approximationsfehler reduzierte Matrizen bedeuten häufig reduzierten Speicheraufwand Analyse der Matrix (2)

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Dimensionsreduzierung graphisch

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Korrespondenz von Spalten und Zeilen

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Ähnlichkeitsvergleiche Ähnlichkeitsberechnung auf der Basis der drei Matrizen Vergleich von Feature-Vektoren: Skalarprodukt auf Matrizen und berechenbar daher Kosinusmaß und euklidsche Distanz leicht berechenbar

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Vergleich der Dimensionen Skalarprodukt auf Matrizen und berechenbar z.B. Synonymerkennung in Texten Skalarprodukt ähnlich der Kovarianz zweier Dimensionen Ähnlichkeitsvergleiche

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Dynamische Feature-Matrix ständige Neuberechnung der Zerlegung ist zu aufwändig Lösungsansatz: Zerlegung einer repräsentativen, statischen Untermenge der Feature-Vektoren neue Feature-Vektoren werden dann mit und multipliziert

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Bewertung des LSI-Verfahrens Bewertung ähnlich zur KLT Hauptunterschiede: Zerlegung der Feature-Matrix an Stelle der Kovarianzmatrix Speichern und Manipulieren der zerlegten Matrizen an Stelle Rücktransformation nach Reduktion

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Beispiel Feature-Matrix Beispiel Feature-Matrix: Erzeugung einer dritten Dimension durch Summierung der ersten beiden plus 0,5:

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Singulärwertzerlegung ist spaltenorthonormale -Matrix ist -Diagonalmatrix ist zeilenorthonormale -Matrix ist Rang der Matrix

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Singulärwertzerlegung (2) Berechnung durch Ausnutzung folgender Gesetze:

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Singulärwertzerlegung des Beispiels

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Reduzierung der Matrizen Zeilen-/Spaltentausch damit Diagonalwerte von absteigen Reduzieren heißt Streichen entspr. -Spalten

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Reduzierung der Matrizen (2) Approximationsfehler ist abhängig von entfernten Diagonalwerten siehe Matrizenproduktion in dyadischer Schreibweise:

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Reduzierung im Beispiel Wert 0,2295 im Vergleich zu anderen Werten verschwindend klein dritte Dimension wurde künstlich erzeugt Reduzierung der dritten Dimension

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Transformation neuer Feature-Vektoren Annahme: Zerlegung erfolgte auf repräsentativer Feature- Matrix Ziel: Erzeugung der entsprechenden -Spaltenvektoren es gilt:

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Transformation neuer Feature-Vektoren (2) sei zu transformierender Feature-Vektor erzeugt durch Multiplikation mit Matrizen und

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Transformation im Beispiel Transformation von zu

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Berechnungen auf transformierten Vektoren Ausnutzung von zur Berechnung Skalarprodukt Kosinusmaß:

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek Berechnungen auf transformierten Vektoren (2) Ausnutzung von zur Berechnung Skalarprodukt euklidsche Distanz: