Graph Matching Torsten Gründel 03.11.2006
Überblick Was ist Graph Matching Morphismen Allgeimeines Graphisomorphismus Subgraphisomorphismus Eigenschaften
Überblick Kategorien von Matchingmethoden Exakte Matchingmethoden Unexaktes Matching Matchingkosten Optimale & Suboptimale Inexakte Matchingalgorithmen Matchingmethoden
Überblick Subgraphalgorithmus von Ullmann Zusammenfassung Referenzen Definitionen Einfacher Aufzählungsalgorithmus Verbesserte Prozedur Zusammenfassung Referenzen
1. Was ist Graph Matching? Rechenintensive Technik aus den späten 70ern „Graph Matching ist der Prozess, eine Korrespondenz zwischen Knoten und Kanten zweier Graphen zu finden, die (mehr oder weniger strikte) Bedingungen erfüllt und sicherstellt, dass gleiche Substrukturen eines Graphen auf gleiche Substrukturen des anderen Graphen abgebildet werden.“ Vielfältige Einsatzgebiete: 2D & 3D Bildanalyse Dokumentenverarbeitung Biometrische Identifizierung Bilddatenbanken Videoanalyse Biomedizinische und Biologische Anwendungen
2. Morphismen Allgemeines Graphisomorphismus Subgraphisomorphismus Eigenschaften
2. Morphismen „Ein Morphismus ist eine Abbildung zwischen zwei mathematischen Objekten des selben Typs, die die grundlegende Struktur der Objekte erhält.“ Hier: Abbildung zwischen den Knoten der Graphen G=(V,E) und G‘=(V‘,E‘), die die Kantenverbindungen erhält. Definition Graphenhomomorphisus (schwächste Form): Striktere Form: Graphmonomorphismus Hier müssen die Knotenabbildungen eindeutig sein
2. Morphismen Allgemeines Graphisomorphismus Subgraphisomorphismus Eigenschaften
2.1 Graphisomorphismus Definition: Ein Graphenisomorphismus ist ein bijektiver Graphenhomomorphismus zwischen zwei Graphen G=(V,E) und G‘=(V‘,E‘) 4 A D B C E A D F(A) = 1 F(B) = 2 F(C) = 3 F(D) = 4 F(E) = 5 1 3 C 2 B E 5
2.1 Graphisomorphismus Definition: Ein Graphenisomorphismus ist ein bijektiver Graphenhomomorphismus zwischen zwei Graphen G=(V,E) und G‘=(V‘,E‘) 1 4 2 3 5 A A D B C E D F(A) = 2 F(B) = 1 F(C) = 3 F(D) = 5 F(E) = 4 C B E
2. Morphismen Allgemeines Graphisomorphismus Subgraphisomorphismus Eigenschaften
2.2 Subgraphisomorphismus Knoteninduzierter Subgraph: G‘=(V‘,E‘) ist Subgraph von G=(V,E) und Definition: Ein Subgraphisomorphismus ist ein Graphisomorphismus zwischen einem Graph G=(V,E) und einem knoteninduzierten Subgraph eines zweiten Graphen G‘=(V‘,E‘) 4 A A F(A) = 1 F(B) = 3 F(C) = 2 1 1 3 3 B B 2 2 C C 5
2.2 Subgraphisomorphismus Knoteninduzierter Subgraph: G‘=(V‘,E‘) ist Subgraph von G=(V,E) und Definition: Ein Subgraphisomorphismus ist ein Graphisomorphismus zwischen einem Graph G=(V,E) und einem knoteninduzierten Subgraph eines zweiten Graphen G‘=(V‘,E‘) 4 A A F(A) = 1 F(B) = 3 F(C) = 4 1 3 B B 2 C C 5
2. Morphismen Allgemeines Graphisomorphismus Subgraphisomorphismus Eigenschaften
2.5 Eigenschaften Graphisomorphismus: nicht bewiesen ob in NP Alle Anderen: NP-Vollständig Polynomielle Algorithmen für spezielle Graphen existieren Rechenzeit heute akzeptabel, da Gesteigerte Rechenleistung Graphen in Praxis unterscheiden sich von „Worst Case Graphen“ Knoten- & Kanteneigenschaften reduzieren Suchzeiten
3. Graph Matching Methoden Exaktes Matching Unexaktes Matching Matchingkosten Optimale & Suboptimale Inexakte Matchingalgorithmen Matchingmethoden
3.1 Exaktes Graph Matching 2 Matching anhand vorgestellter Morphismen Meist werden Bäume verwendet Suchstrategie (z.B. BFS, DFS) gibt Reihenfolge vor Grundidee: Partielles Matching (anfangs leer) iterativ um Matchingpaar erweitert A B 1 { } {(A,1)} {(A,2)} {(A,1), (B,1)} {(A,1), (B,2)} {(A,2), (B,1)} {(A,2), (B,2)}
3. Graph Matching Methoden Exaktes Matching Unexaktes Matching Matchingkosten Optimale & Suboptimale Inexakte Matchingalgorithmen Matchingmethoden
3.2 Unexaktes Matching Gründe für Unexaktheit: Nichtdeterministische Elemente sind enthalten Exaktes Matching ist zu teuer (Rechenzeit) Matching muss nicht kantenerhaltend sein Bestrafung durch zuweisen von Kosten bei Unterschieden Suche Matching mit minimalen Kosten Unterscheiden: Optimale Inexakte Matchingalgorithem Suboptimale Matchingalgorithmen
3.2.1 Matchingkosten Fehlerkorrektur oder Fehlertoleranz Zuweisung von Kosten für jeden Fehler (z.B. fehlender Knoten) Vergleich der Graphen anhand der Kosten Graphenbearbeitungskosten (GbK) Zuweisung von Kosten für Graphenbearbeitungsoperationen GbK = billigste Sequenz von Operationen zur Transformierung von G in G‘ Graphenbearbeitungsabstand Graphenbearbeitungskosten erfüllen gewisse Bedingungen Operationen zur Transformierung als Maß für den Abstand zwischen Graphen Graphabstand (nur für Algorithmen in metrischen Räumen) Kostendefinition erfüllt Distanzfunktionseigenschaften Kosten sind Maß für die Ungleichheit von Graphen
3.2.2 Optimale & Suboptimale inexakte Matchingalgorithmen Finden immer globales Minimum, also auch exakte Lösung wenn vorhanden Kommt mit Graphschwankungen zurecht Kostenintensiver als Exakte Algorithmen Eignen sich zur Lösung von Problemen wenn exakte Lösung erforderlich aber Graphschwankungen vorliegen Suboptimale Matchingalgorithmen Finden lokales Minimum Keine Garantie exakte Lösung zu finden, wenn vorhanden Normalerweise polynomielle Vergleichszeit Eignen sich, wenn Rechenzeit gespart werden soll
3.2.3 Matchingmethoden Baumsuche Kontinuierliche Optimierung Heuristische Abschätzung der Matchingkosten für verbleibende Knoten Entfernen von unfruchtbaren Pfaden anhand Abschätzungen Kontinuierliche Optimierung Grundidee: Graphmatching umwandeln in kontinuierliches, nichtlineares OP Anwendung eines Optimierungsalgorithmus um Lösung zu finden Rücktransformierung in Graphmatching Domäne Polynomielle Rechenzeit (mit kleinem Exponenten) bzgl. Graphgröße Spektralmethoden Benutzt Eigenschaft, dass
4. Ullmanns Subgraphalgorithmus Allgemeines Einfacher Aufzählalgorithmus Verbesserte Version Eigenschaften
4.1 Allgemeines Wahrscheinlich bekanntester Graphmatching Algorithmus Anwendbar für Subgraphisomorphismus Graphisomorphismen Graphmonomorphismen MCS Maximum Clique Exakter DFS Baumsuchalgorithmus Findet Subgraphisomorphismen zwischen zwei Graphen und
4. Ullmanns Subgraphalgorithmus Allgemeines Einfacher Aufzählalgorithmus Verbesserte Version Eigenschaften
4.2 Einfacher Aufzählungsalgorithmus Benutzen Matrizen der Form: Einträge bestehen aus 0 und 1 Genau eine 1 in jeder Reihe Nicht mehr als eine 1 pro Spalte Matrizen dienen Zur Permutation von Adjazenzmatrizen Permutationsmatrix Falls , dann korrespondiert der j-te Knoten in zu dem i-ten Knoten in
4.2 Einfacher Aufzählungsalgorithmus (Beispiel Permutation) 1 2 4 3 1 3 2
4.2 Einfacher Aufzählungsalgorithmus Vergleiche Resultierenden Graph mit Isomorphismus vorhanden falls Erstellung einer Startmatrix mit Generierung aller mit durch systematisches umändern von 1en in 0en Baum von Matrizen mit Terminierungsebene
4.2 Einfacher Aufzählungsalgorithmus (Generierung Startmatrix) 1 1 2 2 4 3 3
4.2 Einfacher Aufzählungsalgorithmus (Der Algorithmus) Step 6: Speichere welche Zeile verwendet wurde und erhöhe die Zeilenanzahl um 1 Step 7: Backtracking Step 5: Überprüfe, ob es einen Eintrag weiter rechts in Matrix gibt, der 1 ist und verwendet werden kann Step 4: Falls Terminierungslevel erreicht, dann überprüfe ob Isomorphismus vorhanden Step 2: Gibt es in aktueller Reihe eine 1, deren Spalte noch nicht verwendet wurde? Wenn ja, dann verwende diese Spalte Step 3: Suche ersten verwendbaren Spalteneintrag mit 1 und setze alle anderen Einträge der Zeile auf 0 Step 1: Initialisieren der Variablen, starten bei Initialmatrix und erster Zeile. Alle Spalten wurden noch nicht verwendet
4.2 Einfacher Aufzählungsalgorithmus (Beispiel) Step 1 Step 3 Step 2 Step 5 Step 6 Step 7 Step 4
4.2 Einfacher Aufzählungsalgorithmus (Beispiel) Vergleiche mit A 1 2 3 1 1 2 1 4 1 4 2 4 2 1 1 3 3 3 3 3 3 2 3 1 1 3 2
4.3 Verbesserte Prozedur Wenn für alle Isomorphismen M‘ unter M gilt dann setze Neue Bedingung: Iteratives Testen bis keine 1 in 0 umgewandelt wird
4.3 Verbesserte Prozedur (Der Algorithmus) Step 8: Setze Eintrag auf 0 Step 9: Nächster Matrixeintrag und nächster Knoten j Step 10: Fehler, nächster Knoten i, neuer Durchlauf oder Erfolg Step 7: Überprüfe ob Nachbar des i-ten Knotens auf einen Knoten gemappt werden kann. Step 6: Überprüfe ob Matrixeintrag 0 ist Step 1: Variablen aufsetzen Step 2 - 4: Nachbarn des i-ten Knoten suchen Step 5: nächster Matrixeintrag
4.3 Verbesserte Prozedur (Anwendung) Verbesserung durch Anwendung von
4.3 Verbesserte Prozedur (Anwendung) i = 1 j = 1 sc = 1000 lst = 3 h = 1 x = 3 i = 1 j = 1 sc = 1000 lst = 3 h = 1 i = 1 j = 1 sc = 1000 lst = 3 i = 1 j = 1 sc = 1000 lst = 3 h = 2 x = 3 Step 7 Step 1,2,3,4,5 Step 6
4.3 Verbesserte Prozedur (Anwendung) i = 1 j = 2 sc = 0100 lst = 3 h = 1 x = 3 i = 1 j = 2 sc = 0100 lst = 3 h = 2 x = 3 Step 8 Step 9 Step 6 Step 7
4.3 Verbesserte Prozedur (Adaptierter Suchalgorithmus)
4.2 Verbesserte Prozedur (Beispiel) Step 7 Step 5 Step 6 Step 3 Step 1 Step 2 Step 4
5. Zusammenfassung Rechenintensiv, aber akzeptabel Verschiedene Arten von Matching und Methoden Vielfältige Anwendungsgebiete und Methoden (>170 Referenzen im zweiten Paper) Für uns besonders RDF-Matching interessant
Referenzen