Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Bertram Laubenstein Geändert vor über 10 Jahren
1
Seminar: Aktuelle Themen der Bioinformatik Thema: Genome Rearrangement Ceyhun Tamer actamer@aol.com
2
Ceyhun Tamer, 6.Semester Bioinformatik - 2 - Übersicht Einleitung in das Thema Genome Rearrangement Multiple genome rearrangement: a general approach via the evolutionary genome graph (Dmitry Korkin, Lev Goldfarb; 2002) Multiple genome rearrangement (David Sankoff, Mathieu Blanchette;1998)
3
Ceyhun Tamer, 6.Semester Bioinformatik - 3 - Grundlagen Genome Rearrangement Möglichkeiten der Evolution auf DNA-Ebene: Änderungen in der Sequenzabfolge der Basen in Genen: Änderungen in der Anordnung der Gene:
4
Ceyhun Tamer, 6.Semester Bioinformatik - 4 - Grundlagen Genome Rearrangement
5
Ceyhun Tamer, 6.Semester Bioinformatik - 5 - Grundlagen Genome Rearrangement Möglichkeiten der Evolution auf DNA-Ebene: Änderungen in der Sequenzabfolge der Basen in Genen: Änderungen in der Anordnung der Gene:
6
Ceyhun Tamer, 6.Semester Bioinformatik - 6 - Grundlagen Genome Rearrangement (Weißkohl) (Weißrübe)
7
Ceyhun Tamer, 6.Semester Bioinformatik - 7 - Grundlagen Genome Rearrangement Entdeckung des Genome Rearrangement Ende 1980er Jahren von Jeffrey Palmer und seinen Kollegen entdeckt mitochondriale Gene von Weißkohl und der Weißrübe zu 99% identisch mitochondriale Genome unterscheiden sich stark in der Gen- Reihenfolge
8
Ceyhun Tamer, 6.Semester Bioinformatik - 8 - Grundlagen Genome Rearrangement Wozu Genome Rearrangement?? Traditionell Rekonstruktion phylogenetischer Bäume anhand von Punktmutationen in einzelnen oder wenigen Genen für den Fall Weißkohl vs. Weißrübe keine gute Wahl Herpesviren evolvieren sehr schnell Betrachtung 7 konservierter Blöcke; Veränderungen in deren Reihenfolge ist wesentlich langsamer Optimal wäre es die Vorteile von Gen- und Genom-Vergleichen in einem Algorithmus zu vereinen
9
Multiple genome rearrangement: a general approach via the evolutionary genome graph Dmitry Korkin und Lev Goldfarb
10
Ceyhun Tamer, 6.Semester Bioinformatik - 10 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Motivation: Es existiert kein vereinheitlichter Rahmen, um Fragestellungen aus diesem Bereich zu behandeln Ziel: einen solchen Rahmen bereitstellen Und z.B. die Ähnlichkeit zweier Genome über den jüngsten gemeinsamen Vorfahren berechnen Einführung des EG-Graphen (evolutionary genome graph)
11
Ceyhun Tamer, 6.Semester Bioinformatik - 11 - Grundlegende Definitionen 0 = {A,C,G,T} ist unser Alphabet Ein Gen ist definiert als ein Element aus einer Menge von Strings Ein Genom G ist definiert als eine Sequenz von Genen G = (s 1, s 2,…,s n ), s k є S, 1 k n daraus resultiert die Genomsequenz G = s 1 ° s 2 ° … ° s n |G| ist die Länge der Genomsequenz Multiple genome rearrangement: a general approach via the evolutionary genome graph
12
Ceyhun Tamer, 6.Semester Bioinformatik - 12 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen Subsequenz: = {a,b,…,z} a = s 1, s 2,…, s n, s i є, 1 i n b = s i1, s i2,…, s ik, 1 i j n, 1 j k
13
Ceyhun Tamer, 6.Semester Bioinformatik - 13 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen MLCS (multiple longest subsequence): = {a,b,…,z} S = {a 1, a 2,…,a d } eine Menge von Sequenzen |a 1 | = n 1, |a 2 | = n 2,…, |a d | = n d b ist der MLCS dann wenn: b ist eine Subsequenz von a i für 1 i d b ist die Längste Sequenz auf, die die vorige Bedingung zutrifft Wenn d=2 so wird der MLCS nur LCS (longest common subsequence) genannt
14
Ceyhun Tamer, 6.Semester Bioinformatik - 14 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen A = (a 1, a 2,…, a n ), B = (b 1, b 2,…, b n ) p: {1,2,…,n} {1,2,…,n}, so daß b i = a p(i) oder b i = a p(i) Abbildungsfunktion f: Γ Γ, f(A) = B wird gene order transformation (gor-transformation) für Genom A genannt die Menge aller gor-Transformationen wird mit Φ gor bezeichnet
15
Ceyhun Tamer, 6.Semester Bioinformatik - 15 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen genome rearrangement: ein Rearrangement von Genom G nach Genom G m ist eine Sequenz (f 1, f 2,…, f m ), m 1, f i є Φ gor G 1 = f 1 (G), G 2 = f 2 (G 1 ), G i = f i (G i-1 ), 1 i m (Weißkohl) (Weißrübe) f1f1 f2f2 f3f3
16
Ceyhun Tamer, 6.Semester Bioinformatik - 16 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen gor-Transformationen: Inversionen Transpositionen ins-Transformation (Insertions-Transformation)
17
Ceyhun Tamer, 6.Semester Bioinformatik - 17 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen Inversionen: A = (a 1, a 2,…, a n ), B = (b 1, b 2,…, b n ) f є Φ gor ist eine Inversion einer Subsequenz A 1 = (a k, a k+1,…, a k+m ), wenn: b i = a i, 1 i k-1 oder k+m+1 i n b k+i = a k+(m-i), 0 i m a 1,…,a k-1, a k,a k+1, …,a k+m, a k+m+1,…,a n a 1,…,a k-1, a k+m,a k+m-1, …,a k, a k+m+1,…,a n Genom A: Genom B:
18
Ceyhun Tamer, 6.Semester Bioinformatik - 18 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen Transpositionen: A = (a 1, a 2,…, a n ), B = (b 1, b 2,…, b n ) f є Φ gor ist eine Transposition einer Subsequenz A1 = (a k, a k+1,…, a k+m ), wenn: b i = a i, 1 i min(k,j) oder max(k,j)+m+1 i n b j+i = a k+i, 1 i m a 1,…,a k, a k+1,a k+2, …,a k+m, a k+m+1,…,a n a 1,…,a j, a k+1,a k+2, …,a k+m, a j+1,…,a n Genom A: Genom B:
19
Ceyhun Tamer, 6.Semester Bioinformatik - 19 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen b i+m = a i, j+1 i k (Achtung nur für j k ) a 1,…,a j, a j+1,…,a k, a k+1,a k+2,…,a k+m, a k+m+1,.. a n a 1,…,a j, a k+1,a k+2,…,a k+m, a j+1,…,a k, a k+m+1,…,a n Genom A: Genom B:
20
Ceyhun Tamer, 6.Semester Bioinformatik - 20 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen Insertions-Transformation: ändert die Länge eines Genoms A = (a 1,a 2,…,a n ), B = (b 1,b 2,…,b n+m ) für m > 0 Abbildungsfunktion f: Γ Γ, f(A) = B wird ins-Transformation einer Sequenz A 1 = (c 1,c 2,…,c m ) genannt, wenn ein k existiert mit 1 k n : b i = a i, 1 i k b k+i = c i, 1 i m b i+k+m = a i+k, 1 i n-k a 1,…, a k, a k+1,…, a n a 1,…,a k, c 1,c 2,, …,c m, a k+1,…,a n A: B:
21
Ceyhun Tamer, 6.Semester Bioinformatik - 21 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen Menge der ins-Transformationen wird mit Φ ins bezeichnet Menge der ins- und gor-Transformationen ist Φ Eine Entwicklung von Genom G zu Genom G m ist eine Folge (f 1,f 2,…,f m ), m 1, f i є Φ G 1 = f 1 (G), G 2 = f 2 (G1), G i = f i (G i-1 ), mit f i є Φ
22
Ceyhun Tamer, 6.Semester Bioinformatik - 22 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen Genom C ist gemeinsamer Vorfahre für Γ 1 : für alle G є Γ 1 : G = C oder C G existiert Γ 1A ist die Menge aller gemeinsamen Vorfahren von Γ 1 Γ 1 = {1,2,…,7} Γ 1A = {7,8}
23
Ceyhun Tamer, 6.Semester Bioinformatik - 23 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen Genom C ist jüngster gemeinsamer Vorfahre von Γ 1 wenn es zur Menge gehört, so daß für alle G є Γ 1A mit G є Γ 1C ein C є Γ 1C und G C existiert Γ 1 = {1,2,…,7} Γ 1A = {7,8} Γ 1C = {7}
24
Ceyhun Tamer, 6.Semester Bioinformatik - 24 - Multiple genome rearrangement: a general approach via the evolutionary genome graph EG-Graph und Problemstellung EG-Graph für Γ 1 : gerichtet, zusammenhängend DG = (V,E) mit l V : V Γ, l E : E Φ sink node: O source node: O es existiert genau ein source node V 0, V 0 є V l V ist injektiv und wenn G 0 = l V (V 0 ), dann ist G 0 = C von Γ 1 Problem: Wege sind nicht eindeutig
25
Ceyhun Tamer, 6.Semester Bioinformatik - 25 - Multiple genome rearrangement: a general approach via the evolutionary genome graph EG-Graph und Problemstellung Ähnlichkeitsbegriff: um 2 Genome unter Einbeziehung von Transformationen vergleichen zu können µDG: l V (V) x l V (V) R Problemstellung: gegeben Γ 1 = {G 1, G 2,…, G n } und ein Ähnlichkeitsmaß µDG konstruiere EG-Graph DG, DG = (V,E), so daß und p DG ( Γ 1 ) = minimal unter allen EG-Graphen +
26
Ceyhun Tamer, 6.Semester Bioinformatik - 26 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung EG-Graph: S = {g 1,g 2,…,g n ), Γ = {G|G = {g i1,g i2,…,g ik ) es ist, f ist eine Inversion oder Insertion und für V S die Menge der sink nodes ist l V (V S ) = Γ 1 Beschränkungen für den EG-Graphen: kein Genom in Γ enthält doppelte Gene ein Gen g є S darf nicht zweimal invertiert werden keine Transpositionen alle Genome bestehen aus denselben Genen
27
Ceyhun Tamer, 6.Semester Bioinformatik - 27 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung Lemma: durch die Beschränkungen ist DG = (V,E) ein azyklischer Graph Transpositionen sind nicht erlaubt ein Genom kann niemals zu einer Vorstufe zurückkehren durch Beschränkung der Anzahl an Insertionen ist die Erstellung aller möglichen Genome endlich Transformation f einer Sequenz von Genen X = f X
28
Ceyhun Tamer, 6.Semester Bioinformatik - 28 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung Lemma: A,B є Γ und C der jüngste gemeinsame Vorfahre wenn B = f X (A), für f X eine Transposition, dann A = f X (C) und B = f X (C) wenn B = f(A), für f eine Inversion, dann ist A = C (bzw. umgekehrt im symmetrischen Fall)
29
Ceyhun Tamer, 6.Semester Bioinformatik - 29 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung weighting scheme: Gewichtung für Inversionen und Insertionen für eine Transformation f A ist das Gewicht w(f A ) = |A| Bestimmung der Ähnlichkeit von A und B : EG-Graph mit A,B є Γ und C gegeben A = f n ° f n-1 ° … f 1 (C) B = g m ° g m-1 ° … g 1 (C) µDG(A,B) =
30
Ceyhun Tamer, 6.Semester Bioinformatik - 30 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung Was wurde dadurch erreicht? ein Maß für Verwandtschaft es ist nun möglich einer Verwandtschaftsbeziehung einen reellen Wert zuzuweisen je geringer µDG(A,B), desto verwandter sind die beiden Genome
31
Ceyhun Tamer, 6.Semester Bioinformatik - 31 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung kontextsensitive Gen-Transformationen: Sinn: Prozess des Genome Rearrangement von der Struktur des Genoms abhängig abhängig von bestimmter Region: lokaler Kontext abhängig von weit entfernten Regionen: globaler Kontext globaler Kontext ist sehr komplex wird hier nicht behandelt außerdem Beschränkung auf Inversionen und Insertionen
32
Ceyhun Tamer, 6.Semester Bioinformatik - 32 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung Definition: gegeben Γ 1 und eine Transformation f X (Inversion/Insertion) lokaler Kontext ist (C 1,C 2 ), C 1,C 2 є * f X eine Inversion von X nach X, B = f X (A) A = A 1 C 1 X C 2 A 2 B = B 1 C 1 X C 2 B 2 f X eine Insertion, B = f X (A) A = A 1 C 1 C 2 A 2 B = B 1 C 1 X C 2 B 2 wobei A 1, A 2, B 1, B 2, C 1, C 2 є * wenn C 1 und C 2 Null-String f X ist kontextfrei
33
Ceyhun Tamer, 6.Semester Bioinformatik - 33 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung Wozu kontextsensitive Transformationen? cs-Transformation ist diskriminierender cf-Transformation erstellt Genome, die weiter entfernt sind biologisch plausibler cs-Transformationen sollten bevorzugt werden
34
Ceyhun Tamer, 6.Semester Bioinformatik - 34 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung weighting scheme update: w cs (f X ) = wenn C 1 und C 2 leer sind ist w cs (f x ) = w cf (f x ) wenn C 1 und C 2 groß geringeres Gewicht spezifischere Transformation kontextsensitive Transformation ist bevorzugt
35
Ceyhun Tamer, 6.Semester Bioinformatik - 35 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung Was haben wir gewonnen? Transformationen können reelle Werte zugewiesen werden Möglichkeit Verwandtschaftsbeziehungen zu berechnen Verwandtschaftsbeziehungen vergleichen Miteinbeziehung eines möglichen lokalen Kontexts Was fehlt? Transpositionen globaler Kontext Unterscheidung zwischen Insertion und Inversion
36
Ceyhun Tamer, 6.Semester Bioinformatik - 36 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Implementierung: nur mit Transpositionen Was wird gemacht: Erstellen eines EG-Graphen aus Γ es werden nur Insertionen betrachtet die Idee des MLCS wird verwendet (dominant-points) Beschränkung auf, so daß jedes Genom in ein anderes durch endlich viele Operationen überführt werden kann Beschränkung, daß jedes Genom aus Δ, aus denselben Genen in S besteht es wird ein möglicher EG-Graph ausgegeben
37
Ceyhun Tamer, 6.Semester Bioinformatik - 37 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Algorithmus Input: Γ 1, | Γ 1 | = N Output: DG = (V,E), mit V = {v 1,v 2,…,v K } ist die Menge der Knoten und E = {e 1,e 2,…,e M } ist die Menge der Kanten
38
Ceyhun Tamer, 6.Semester Bioinformatik - 38 - Multiple genome rearrangement: a general approach via the evolutionary genome graph
39
Ceyhun Tamer, 6.Semester Bioinformatik - 39 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Zeitkomplexität Ο(s * d (T + L)) | Γ 1 | = d, |S| = s, O(T) Komplexität für MLCS, L = max{|G 1 |,…,|G d |} O(T) = O(n * s * d + |D| * s * d * (log d-3 * n + log d-2 * s)) |D| ist die Größe der Menge aller dominanten Positionen
40
Ceyhun Tamer, 6.Semester Bioinformatik - 40 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Ergebnisse G 1 = D A B E C F G H; G 2 = A D G B C F H E; G 3 = A G B D C F E H; G 4 = G A B D C F E H; G 5 = E G C A F D B H; G 6 = C E A F B G H D.
41
Ceyhun Tamer, 6.Semester Bioinformatik - 41 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Ergebnisse
42
Ceyhun Tamer, 6.Semester Bioinformatik - 42 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Fazit Einführung des EG-Graphen, der die Entwicklung mehrerer Genome repräsentiert Es ist möglich gleich mehrere Genome untereinander zu vergleichen Aber es gibt noch viel zu tun, da bisher viele Einschränkungen vorhanden sind
43
Multiple genome rearrangement David Sankoff und Mathieu Blanchette
44
Ceyhun Tamer, 6.Semester Bioinformatik - 44 - Multiple genome rearrangement Motivation: Multiples Alignment von Sequenzen betrachtet nur lokale Insertion, Deletion und Substitution Ziel: Multiples Alignment für Gensequenzen mit Inversionen und Transpositionen
45
Ceyhun Tamer, 6.Semester Bioinformatik - 45 - Multiple genome rearrangement Worum wird es gehen: gesucht: Belegung der inneren Knoten (Vorfahren) bisher selten genutzt
46
Ceyhun Tamer, 6.Semester Bioinformatik - 46 - Multiple genome rearrangement Breakpoint Analyse: A = (a 1,a 2,…,a n ) und B = (b 1,b 2,…,b n ) mit a i,b i є S a i und a i+1 sind adjazent in A aber nicht in B, so bilden sie einen Breakpoint Φ(A,B) ist die Anzahl Breakpoints in A A:g 1, g 2, g 3, g 4, g 5, g 6 BP: (g 1,g 2 ), (g 2, g 3 ), (g 3, g 4 ) B:g 2, g 1, g 4, g 5, g 6, g 3 BP: (g 2,g 1 ), (g 1, g 4 ), (g 6, g 3 )
47
Ceyhun Tamer, 6.Semester Bioinformatik - 47 - Multiple genome rearrangement Orientierte Genome: Miteinbeziehung einer Polarität der Gene Orientierung gibt die Richtung der Transkription an Modifizierung des Begriffs: Breakpoint keine Breakpoints: g h -h -g Breakpoints: h g -g -h g -h -g h h -g -h g
48
Ceyhun Tamer, 6.Semester Bioinformatik - 48 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Definition: S = {g 1,g 2,…,g n } eine Menge von Genen T = (V,E) ein ungewurzelter Baum mit N 3 Blättern, die Blätter des Baumes, N+1 L 2N-2, die inneren Knoten minimiere:
49
Ceyhun Tamer, 6.Semester Bioinformatik - 49 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Aufgabe: minimiere: finde eine Belegung der inneren Knoten, so daß die Anzahl der Breakpoints minimal ist
50
Ceyhun Tamer, 6.Semester Bioinformatik - 50 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Consensus-Graph (Stars): Bestimmung eines Medians für N Genome mit jeweils n Genen ohne Orientierung S = {g 1, g 2, g 3 }, N = 3, n = 3 G 1 = g 2 g 1 g 3 G 2 = g 3 g 2 g 1 G 3 = g 1 g 3 g 2
51
Ceyhun Tamer, 6.Semester Bioinformatik - 51 - Multiple genome rearrangement Multiple Genome Rearrangement auf Bäumen: Consensus-Graph (Stars): Γ ist der vollständige Graph die Knoten sind Element aus S für jede Kante gh in E(Γ) sei u(gh) die Anzahl in der g und h adjazent sind g1g1 g3g3 g2g2
52
Ceyhun Tamer, 6.Semester Bioinformatik - 52 - Multiple genome rearrangement Multiple Genome Rearrangement auf Bäumen: Consensus-Graph (Stars): G 1 = g 2 g 1 g 3 (g 2 g 1 ), (g 1 g 3 ) G 2 = g 3 g 2 g 1 (g 3 g 2 ), (g 2 g 1 ) G 3 = g 1 g 3 g 2 (g 1 g 3 ), (g 3 g 2 ) u(g 2 g 1 ) = 2, u(g 1 g 3 ) = 2 u(g 3 g 2 ) = 2, u(g 1 g 2 ) = 0 u(g 2 g 3 ) = 0, u(g 3 g 1 ) = 0
53
Ceyhun Tamer, 6.Semester Bioinformatik - 53 - Multiple genome rearrangement Multiple Genome Rearrangement auf Bäumen: Consensus-Graph (Stars): w(gh) ist das Gewicht der Kante gh mit w(gh) = N - u(gh) w(g 2 g 1 ) = 1, w(g 1 g 3 ) = 1, w(g 3 g 2 ) = 1, w(g 1 g 2 ) = 3 w(g 2 g 3 ) = 3, w(g 3 g 1 ) = 3 das TSP wird auf ( Γ,w) angewendet
54
Ceyhun Tamer, 6.Semester Bioinformatik - 54 - Multiple genome rearrangement Multiple Genome Rearrangement auf Bäumen: Consensus-Graph (Stars): mögliche Lösungen (Mediane): g1 g3 g2Kosten: 3 g2 g1 g3 g3 g2 g1 G 1 = g 2 g 1 g 3 G 2 = g 3 g 2 g 1 G 3 = g 1 g 3 g 2 g1g1 g3g3 g2g2 1 1 1 3 3 3
55
Ceyhun Tamer, 6.Semester Bioinformatik - 55 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Consensus-Graph (Stars): Bestimmung eines Medians für N Genome mit jeweils n Genen mit Orientierung S = {-g 1, g 1, -g 2, g 2, -g 3, g 3 }, N = 3, n = 3 G 1 = -g 2 g 1 g 3 G 2 = g 3 -g 1 -g 2 G 3 = g 1 g 2 g 3
56
Ceyhun Tamer, 6.Semester Bioinformatik - 56 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Consensus-Graph (Stars): Γ ist der vollständige Graph die Knoten sind Element aus S für jede Kante gh in E(Γ) sei u(gh) die Anzahl in der - g und h adjazent sind w(gh) = N - u(gh) wenn g = -h w(gh) = -Z g1g1 g3g3 g2g2 -g 1 -g 2 -g 3 G 1 = g 1 g 2 g 3 G 1 = g 1 -g 1 | g 2 -g 2 | g 3 -g 3 G 2 = g 1 g 2 -g 3 G 2 = g 1 -g 1 | g 2 -g 2 | -g 3 g 3
57
Ceyhun Tamer, 6.Semester Bioinformatik - 57 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Consensus-Graph (Stars): G 1 = -g 2 g 1 g 3, G 2 = g 3 -g 1 -g 2, G 3 = g 1 g 2 g 3 u(g 2 g 1 ) = 1, u(-g 1 g 3 ) = 1, u(-g 3 -g 1 ) = 1, u(g 1 -g 2 ) = 1, u(-g 1 g 2 ) = 1, u(-g 2 g 3 ) = 1 w(g 2 g 1 ) = 2, w(-g 1 g 3 ) = 2, w(-g 3 -g 1 ) = 2, w(g 1 -g 2 ) = 2, w(-g 1 g 2 ) = 2, w(-g 2 g 3 ) = 2
58
Ceyhun Tamer, 6.Semester Bioinformatik - 58 - Multiple genome rearrangement
59
Ceyhun Tamer, 6.Semester Bioinformatik - 59 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Consensus-Graph (Stars): Lösungen: g 1 -g 1 g 2 -g 2 g 3 -g 3 Kosten: -3 * Z + 4 g 2 -g 2 g 3 -g 3 -g 1 g 1 -g 2 g 2 g 1 -g 1 g 3 -g 3 g 3 -g 3 -g 1 g 1 -g 2 g 2 Mediane: g 1 g 2 g 3 : 4 Inversionen Abstand g 2 g 3 -g 1 : 7 Inversionen Abstand -g 2 g 1 g 3 : 5 Inversionen Abstand g 3 -g 1 -g 2 : 5 Inversionen Abstand
60
Ceyhun Tamer, 6.Semester Bioinformatik - 60 - Multiple genome rearrangement Wie gut sind die Lösungen?
61
Ceyhun Tamer, 6.Semester Bioinformatik - 61 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: binäre Bäume (completely resolved): |V(T)| = 2N - 2 alle nicht-terminalen Knoten haben Grad 3 Beginn mit einem Start-Baum inneren Knoten werden Genome zugeordnet Zerlegung des Gesamtproblems in Teile von 3-Stars
62
Ceyhun Tamer, 6.Semester Bioinformatik - 62 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: binäre Bäume (completely resolved): initiale Belegung der inneren Knoten: eine feste Permutation zufällige Permutationen eine Permutation aus nächster Verwandtschaft Consensus von drei Permutationen aus nächster Verwandtschaft Initiales TSP für jeden inneren Knoten, Kantengewichte über dynamische Programmierung Initiales TSP für jeden inneren Knoten, Kantengewichte sind gemittelt über drei benachbarte Knoten
63
Ceyhun Tamer, 6.Semester Bioinformatik - 63 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Der Algorithmus: algorithm optimizetree input G 1,…,G N initialize each of G N+1,…,G 2N-2 to some Genome cost := routine iteratemedian output G N+1,…,G 2N-2
64
Ceyhun Tamer, 6.Semester Bioinformatik - 64 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: routine iteratemedian while C = < cost, cost := C do for i = N+1,…,2N-2, G* := median(G h, G j, G k ) if G i := G * end if enddo endwhile
65
Ceyhun Tamer, 6.Semester Bioinformatik - 65 - Multiple genome rearrangement Wie gut sind die Ergebnisse:
66
Ceyhun Tamer, 6.Semester Bioinformatik - 66 - Multiple genome rearrangement Fazit Multiples Alignment von Genomen mit Hilfe von Stars und binären Bäumen Aussagen über die Genauigkeit der Lösung Beschränkung der Genome auf dieselbe Genmenge ist unrealistisch
67
Ceyhun Tamer, 6.Semester Bioinformatik - 67 - Multiple genome rearrangement
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.