Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Seminar: Aktuelle Themen der Bioinformatik Thema: Genome Rearrangement Ceyhun Tamer

Ähnliche Präsentationen


Präsentation zum Thema: "Seminar: Aktuelle Themen der Bioinformatik Thema: Genome Rearrangement Ceyhun Tamer"—  Präsentation transkript:

1 Seminar: Aktuelle Themen der Bioinformatik Thema: Genome Rearrangement Ceyhun Tamer actamer@aol.com

2 Ceyhun Tamer, 6.Semester Bioinformatik - 2 - Übersicht Einleitung in das Thema Genome Rearrangement Multiple genome rearrangement: a general approach via the evolutionary genome graph (Dmitry Korkin, Lev Goldfarb; 2002) Multiple genome rearrangement (David Sankoff, Mathieu Blanchette;1998)

3 Ceyhun Tamer, 6.Semester Bioinformatik - 3 - Grundlagen Genome Rearrangement Möglichkeiten der Evolution auf DNA-Ebene: Änderungen in der Sequenzabfolge der Basen in Genen: Änderungen in der Anordnung der Gene:

4 Ceyhun Tamer, 6.Semester Bioinformatik - 4 - Grundlagen Genome Rearrangement

5 Ceyhun Tamer, 6.Semester Bioinformatik - 5 - Grundlagen Genome Rearrangement Möglichkeiten der Evolution auf DNA-Ebene: Änderungen in der Sequenzabfolge der Basen in Genen: Änderungen in der Anordnung der Gene:

6 Ceyhun Tamer, 6.Semester Bioinformatik - 6 - Grundlagen Genome Rearrangement (Weißkohl) (Weißrübe)

7 Ceyhun Tamer, 6.Semester Bioinformatik - 7 - Grundlagen Genome Rearrangement Entdeckung des Genome Rearrangement Ende 1980er Jahren von Jeffrey Palmer und seinen Kollegen entdeckt mitochondriale Gene von Weißkohl und der Weißrübe zu 99% identisch mitochondriale Genome unterscheiden sich stark in der Gen- Reihenfolge

8 Ceyhun Tamer, 6.Semester Bioinformatik - 8 - Grundlagen Genome Rearrangement Wozu Genome Rearrangement?? Traditionell Rekonstruktion phylogenetischer Bäume anhand von Punktmutationen in einzelnen oder wenigen Genen für den Fall Weißkohl vs. Weißrübe keine gute Wahl Herpesviren evolvieren sehr schnell Betrachtung 7 konservierter Blöcke; Veränderungen in deren Reihenfolge ist wesentlich langsamer Optimal wäre es die Vorteile von Gen- und Genom-Vergleichen in einem Algorithmus zu vereinen

9 Multiple genome rearrangement: a general approach via the evolutionary genome graph Dmitry Korkin und Lev Goldfarb

10 Ceyhun Tamer, 6.Semester Bioinformatik - 10 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Motivation: Es existiert kein vereinheitlichter Rahmen, um Fragestellungen aus diesem Bereich zu behandeln Ziel: einen solchen Rahmen bereitstellen Und z.B. die Ähnlichkeit zweier Genome über den jüngsten gemeinsamen Vorfahren berechnen Einführung des EG-Graphen (evolutionary genome graph)

11 Ceyhun Tamer, 6.Semester Bioinformatik - 11 - Grundlegende Definitionen 0 = {A,C,G,T} ist unser Alphabet Ein Gen ist definiert als ein Element aus einer Menge von Strings Ein Genom G ist definiert als eine Sequenz von Genen G = (s 1, s 2,…,s n ), s k є S, 1 k n daraus resultiert die Genomsequenz G = s 1 ° s 2 ° … ° s n |G| ist die Länge der Genomsequenz Multiple genome rearrangement: a general approach via the evolutionary genome graph

12 Ceyhun Tamer, 6.Semester Bioinformatik - 12 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen Subsequenz: = {a,b,…,z} a = s 1, s 2,…, s n, s i є, 1 i n b = s i1, s i2,…, s ik, 1 i j n, 1 j k

13 Ceyhun Tamer, 6.Semester Bioinformatik - 13 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen MLCS (multiple longest subsequence): = {a,b,…,z} S = {a 1, a 2,…,a d } eine Menge von Sequenzen |a 1 | = n 1, |a 2 | = n 2,…, |a d | = n d b ist der MLCS dann wenn: b ist eine Subsequenz von a i für 1 i d b ist die Längste Sequenz auf, die die vorige Bedingung zutrifft Wenn d=2 so wird der MLCS nur LCS (longest common subsequence) genannt

14 Ceyhun Tamer, 6.Semester Bioinformatik - 14 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen A = (a 1, a 2,…, a n ), B = (b 1, b 2,…, b n ) p: {1,2,…,n} {1,2,…,n}, so daß b i = a p(i) oder b i = a p(i) Abbildungsfunktion f: Γ Γ, f(A) = B wird gene order transformation (gor-transformation) für Genom A genannt die Menge aller gor-Transformationen wird mit Φ gor bezeichnet

15 Ceyhun Tamer, 6.Semester Bioinformatik - 15 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen genome rearrangement: ein Rearrangement von Genom G nach Genom G m ist eine Sequenz (f 1, f 2,…, f m ), m 1, f i є Φ gor G 1 = f 1 (G), G 2 = f 2 (G 1 ), G i = f i (G i-1 ), 1 i m (Weißkohl) (Weißrübe) f1f1 f2f2 f3f3

16 Ceyhun Tamer, 6.Semester Bioinformatik - 16 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen gor-Transformationen: Inversionen Transpositionen ins-Transformation (Insertions-Transformation)

17 Ceyhun Tamer, 6.Semester Bioinformatik - 17 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen Inversionen: A = (a 1, a 2,…, a n ), B = (b 1, b 2,…, b n ) f є Φ gor ist eine Inversion einer Subsequenz A 1 = (a k, a k+1,…, a k+m ), wenn: b i = a i, 1 i k-1 oder k+m+1 i n b k+i = a k+(m-i), 0 i m a 1,…,a k-1, a k,a k+1, …,a k+m, a k+m+1,…,a n a 1,…,a k-1, a k+m,a k+m-1, …,a k, a k+m+1,…,a n Genom A: Genom B:

18 Ceyhun Tamer, 6.Semester Bioinformatik - 18 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen Transpositionen: A = (a 1, a 2,…, a n ), B = (b 1, b 2,…, b n ) f є Φ gor ist eine Transposition einer Subsequenz A1 = (a k, a k+1,…, a k+m ), wenn: b i = a i, 1 i min(k,j) oder max(k,j)+m+1 i n b j+i = a k+i, 1 i m a 1,…,a k, a k+1,a k+2, …,a k+m, a k+m+1,…,a n a 1,…,a j, a k+1,a k+2, …,a k+m, a j+1,…,a n Genom A: Genom B:

19 Ceyhun Tamer, 6.Semester Bioinformatik - 19 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen b i+m = a i, j+1 i k (Achtung nur für j k ) a 1,…,a j, a j+1,…,a k, a k+1,a k+2,…,a k+m, a k+m+1,.. a n a 1,…,a j, a k+1,a k+2,…,a k+m, a j+1,…,a k, a k+m+1,…,a n Genom A: Genom B:

20 Ceyhun Tamer, 6.Semester Bioinformatik - 20 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen Insertions-Transformation: ändert die Länge eines Genoms A = (a 1,a 2,…,a n ), B = (b 1,b 2,…,b n+m ) für m > 0 Abbildungsfunktion f: Γ Γ, f(A) = B wird ins-Transformation einer Sequenz A 1 = (c 1,c 2,…,c m ) genannt, wenn ein k existiert mit 1 k n : b i = a i, 1 i k b k+i = c i, 1 i m b i+k+m = a i+k, 1 i n-k a 1,…, a k, a k+1,…, a n a 1,…,a k, c 1,c 2,, …,c m, a k+1,…,a n A: B:

21 Ceyhun Tamer, 6.Semester Bioinformatik - 21 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen Menge der ins-Transformationen wird mit Φ ins bezeichnet Menge der ins- und gor-Transformationen ist Φ Eine Entwicklung von Genom G zu Genom G m ist eine Folge (f 1,f 2,…,f m ), m 1, f i є Φ G 1 = f 1 (G), G 2 = f 2 (G1), G i = f i (G i-1 ), mit f i є Φ

22 Ceyhun Tamer, 6.Semester Bioinformatik - 22 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen Genom C ist gemeinsamer Vorfahre für Γ 1 : für alle G є Γ 1 : G = C oder C G existiert Γ 1A ist die Menge aller gemeinsamen Vorfahren von Γ 1 Γ 1 = {1,2,…,7} Γ 1A = {7,8}

23 Ceyhun Tamer, 6.Semester Bioinformatik - 23 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Grundlegende Definitionen Genom C ist jüngster gemeinsamer Vorfahre von Γ 1 wenn es zur Menge gehört, so daß für alle G є Γ 1A mit G є Γ 1C ein C є Γ 1C und G C existiert Γ 1 = {1,2,…,7} Γ 1A = {7,8} Γ 1C = {7}

24 Ceyhun Tamer, 6.Semester Bioinformatik - 24 - Multiple genome rearrangement: a general approach via the evolutionary genome graph EG-Graph und Problemstellung EG-Graph für Γ 1 : gerichtet, zusammenhängend DG = (V,E) mit l V : V Γ, l E : E Φ sink node: O source node: O es existiert genau ein source node V 0, V 0 є V l V ist injektiv und wenn G 0 = l V (V 0 ), dann ist G 0 = C von Γ 1 Problem: Wege sind nicht eindeutig

25 Ceyhun Tamer, 6.Semester Bioinformatik - 25 - Multiple genome rearrangement: a general approach via the evolutionary genome graph EG-Graph und Problemstellung Ähnlichkeitsbegriff: um 2 Genome unter Einbeziehung von Transformationen vergleichen zu können µDG: l V (V) x l V (V) R Problemstellung: gegeben Γ 1 = {G 1, G 2,…, G n } und ein Ähnlichkeitsmaß µDG konstruiere EG-Graph DG, DG = (V,E), so daß und p DG ( Γ 1 ) = minimal unter allen EG-Graphen +

26 Ceyhun Tamer, 6.Semester Bioinformatik - 26 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung EG-Graph: S = {g 1,g 2,…,g n ), Γ = {G|G = {g i1,g i2,…,g ik ) es ist, f ist eine Inversion oder Insertion und für V S die Menge der sink nodes ist l V (V S ) = Γ 1 Beschränkungen für den EG-Graphen: kein Genom in Γ enthält doppelte Gene ein Gen g є S darf nicht zweimal invertiert werden keine Transpositionen alle Genome bestehen aus denselben Genen

27 Ceyhun Tamer, 6.Semester Bioinformatik - 27 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung Lemma: durch die Beschränkungen ist DG = (V,E) ein azyklischer Graph Transpositionen sind nicht erlaubt ein Genom kann niemals zu einer Vorstufe zurückkehren durch Beschränkung der Anzahl an Insertionen ist die Erstellung aller möglichen Genome endlich Transformation f einer Sequenz von Genen X = f X

28 Ceyhun Tamer, 6.Semester Bioinformatik - 28 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung Lemma: A,B є Γ und C der jüngste gemeinsame Vorfahre wenn B = f X (A), für f X eine Transposition, dann A = f X (C) und B = f X (C) wenn B = f(A), für f eine Inversion, dann ist A = C (bzw. umgekehrt im symmetrischen Fall)

29 Ceyhun Tamer, 6.Semester Bioinformatik - 29 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung weighting scheme: Gewichtung für Inversionen und Insertionen für eine Transformation f A ist das Gewicht w(f A ) = |A| Bestimmung der Ähnlichkeit von A und B : EG-Graph mit A,B є Γ und C gegeben A = f n ° f n-1 ° … f 1 (C) B = g m ° g m-1 ° … g 1 (C) µDG(A,B) =

30 Ceyhun Tamer, 6.Semester Bioinformatik - 30 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung Was wurde dadurch erreicht? ein Maß für Verwandtschaft es ist nun möglich einer Verwandtschaftsbeziehung einen reellen Wert zuzuweisen je geringer µDG(A,B), desto verwandter sind die beiden Genome

31 Ceyhun Tamer, 6.Semester Bioinformatik - 31 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung kontextsensitive Gen-Transformationen: Sinn: Prozess des Genome Rearrangement von der Struktur des Genoms abhängig abhängig von bestimmter Region: lokaler Kontext abhängig von weit entfernten Regionen: globaler Kontext globaler Kontext ist sehr komplex wird hier nicht behandelt außerdem Beschränkung auf Inversionen und Insertionen

32 Ceyhun Tamer, 6.Semester Bioinformatik - 32 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung Definition: gegeben Γ 1 und eine Transformation f X (Inversion/Insertion) lokaler Kontext ist (C 1,C 2 ), C 1,C 2 є * f X eine Inversion von X nach X, B = f X (A) A = A 1 C 1 X C 2 A 2 B = B 1 C 1 X C 2 B 2 f X eine Insertion, B = f X (A) A = A 1 C 1 C 2 A 2 B = B 1 C 1 X C 2 B 2 wobei A 1, A 2, B 1, B 2, C 1, C 2 є * wenn C 1 und C 2 Null-String f X ist kontextfrei

33 Ceyhun Tamer, 6.Semester Bioinformatik - 33 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung Wozu kontextsensitive Transformationen? cs-Transformation ist diskriminierender cf-Transformation erstellt Genome, die weiter entfernt sind biologisch plausibler cs-Transformationen sollten bevorzugt werden

34 Ceyhun Tamer, 6.Semester Bioinformatik - 34 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung weighting scheme update: w cs (f X ) = wenn C 1 und C 2 leer sind ist w cs (f x ) = w cf (f x ) wenn C 1 und C 2 groß geringeres Gewicht spezifischere Transformation kontextsensitive Transformation ist bevorzugt

35 Ceyhun Tamer, 6.Semester Bioinformatik - 35 - Multiple genome rearrangement: a general approach via the evolutionary genome graph ein evolutionsbasiertes Modell der Genom-Entwicklung Was haben wir gewonnen? Transformationen können reelle Werte zugewiesen werden Möglichkeit Verwandtschaftsbeziehungen zu berechnen Verwandtschaftsbeziehungen vergleichen Miteinbeziehung eines möglichen lokalen Kontexts Was fehlt? Transpositionen globaler Kontext Unterscheidung zwischen Insertion und Inversion

36 Ceyhun Tamer, 6.Semester Bioinformatik - 36 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Implementierung: nur mit Transpositionen Was wird gemacht: Erstellen eines EG-Graphen aus Γ es werden nur Insertionen betrachtet die Idee des MLCS wird verwendet (dominant-points) Beschränkung auf, so daß jedes Genom in ein anderes durch endlich viele Operationen überführt werden kann Beschränkung, daß jedes Genom aus Δ, aus denselben Genen in S besteht es wird ein möglicher EG-Graph ausgegeben

37 Ceyhun Tamer, 6.Semester Bioinformatik - 37 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Algorithmus Input: Γ 1, | Γ 1 | = N Output: DG = (V,E), mit V = {v 1,v 2,…,v K } ist die Menge der Knoten und E = {e 1,e 2,…,e M } ist die Menge der Kanten

38 Ceyhun Tamer, 6.Semester Bioinformatik - 38 - Multiple genome rearrangement: a general approach via the evolutionary genome graph

39 Ceyhun Tamer, 6.Semester Bioinformatik - 39 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Zeitkomplexität Ο(s * d (T + L)) | Γ 1 | = d, |S| = s, O(T) Komplexität für MLCS, L = max{|G 1 |,…,|G d |} O(T) = O(n * s * d + |D| * s * d * (log d-3 * n + log d-2 * s)) |D| ist die Größe der Menge aller dominanten Positionen

40 Ceyhun Tamer, 6.Semester Bioinformatik - 40 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Ergebnisse G 1 = D A B E C F G H; G 2 = A D G B C F H E; G 3 = A G B D C F E H; G 4 = G A B D C F E H; G 5 = E G C A F D B H; G 6 = C E A F B G H D.

41 Ceyhun Tamer, 6.Semester Bioinformatik - 41 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Ergebnisse

42 Ceyhun Tamer, 6.Semester Bioinformatik - 42 - Multiple genome rearrangement: a general approach via the evolutionary genome graph Fazit Einführung des EG-Graphen, der die Entwicklung mehrerer Genome repräsentiert Es ist möglich gleich mehrere Genome untereinander zu vergleichen Aber es gibt noch viel zu tun, da bisher viele Einschränkungen vorhanden sind

43 Multiple genome rearrangement David Sankoff und Mathieu Blanchette

44 Ceyhun Tamer, 6.Semester Bioinformatik - 44 - Multiple genome rearrangement Motivation: Multiples Alignment von Sequenzen betrachtet nur lokale Insertion, Deletion und Substitution Ziel: Multiples Alignment für Gensequenzen mit Inversionen und Transpositionen

45 Ceyhun Tamer, 6.Semester Bioinformatik - 45 - Multiple genome rearrangement Worum wird es gehen: gesucht: Belegung der inneren Knoten (Vorfahren) bisher selten genutzt

46 Ceyhun Tamer, 6.Semester Bioinformatik - 46 - Multiple genome rearrangement Breakpoint Analyse: A = (a 1,a 2,…,a n ) und B = (b 1,b 2,…,b n ) mit a i,b i є S a i und a i+1 sind adjazent in A aber nicht in B, so bilden sie einen Breakpoint Φ(A,B) ist die Anzahl Breakpoints in A A:g 1, g 2, g 3, g 4, g 5, g 6 BP: (g 1,g 2 ), (g 2, g 3 ), (g 3, g 4 ) B:g 2, g 1, g 4, g 5, g 6, g 3 BP: (g 2,g 1 ), (g 1, g 4 ), (g 6, g 3 )

47 Ceyhun Tamer, 6.Semester Bioinformatik - 47 - Multiple genome rearrangement Orientierte Genome: Miteinbeziehung einer Polarität der Gene Orientierung gibt die Richtung der Transkription an Modifizierung des Begriffs: Breakpoint keine Breakpoints: g h -h -g Breakpoints: h g -g -h g -h -g h h -g -h g

48 Ceyhun Tamer, 6.Semester Bioinformatik - 48 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Definition: S = {g 1,g 2,…,g n } eine Menge von Genen T = (V,E) ein ungewurzelter Baum mit N 3 Blättern, die Blätter des Baumes, N+1 L 2N-2, die inneren Knoten minimiere:

49 Ceyhun Tamer, 6.Semester Bioinformatik - 49 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Aufgabe: minimiere: finde eine Belegung der inneren Knoten, so daß die Anzahl der Breakpoints minimal ist

50 Ceyhun Tamer, 6.Semester Bioinformatik - 50 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Consensus-Graph (Stars): Bestimmung eines Medians für N Genome mit jeweils n Genen ohne Orientierung S = {g 1, g 2, g 3 }, N = 3, n = 3 G 1 = g 2 g 1 g 3 G 2 = g 3 g 2 g 1 G 3 = g 1 g 3 g 2

51 Ceyhun Tamer, 6.Semester Bioinformatik - 51 - Multiple genome rearrangement Multiple Genome Rearrangement auf Bäumen: Consensus-Graph (Stars): Γ ist der vollständige Graph die Knoten sind Element aus S für jede Kante gh in E(Γ) sei u(gh) die Anzahl in der g und h adjazent sind g1g1 g3g3 g2g2

52 Ceyhun Tamer, 6.Semester Bioinformatik - 52 - Multiple genome rearrangement Multiple Genome Rearrangement auf Bäumen: Consensus-Graph (Stars): G 1 = g 2 g 1 g 3 (g 2 g 1 ), (g 1 g 3 ) G 2 = g 3 g 2 g 1 (g 3 g 2 ), (g 2 g 1 ) G 3 = g 1 g 3 g 2 (g 1 g 3 ), (g 3 g 2 ) u(g 2 g 1 ) = 2, u(g 1 g 3 ) = 2 u(g 3 g 2 ) = 2, u(g 1 g 2 ) = 0 u(g 2 g 3 ) = 0, u(g 3 g 1 ) = 0

53 Ceyhun Tamer, 6.Semester Bioinformatik - 53 - Multiple genome rearrangement Multiple Genome Rearrangement auf Bäumen: Consensus-Graph (Stars): w(gh) ist das Gewicht der Kante gh mit w(gh) = N - u(gh) w(g 2 g 1 ) = 1, w(g 1 g 3 ) = 1, w(g 3 g 2 ) = 1, w(g 1 g 2 ) = 3 w(g 2 g 3 ) = 3, w(g 3 g 1 ) = 3 das TSP wird auf ( Γ,w) angewendet

54 Ceyhun Tamer, 6.Semester Bioinformatik - 54 - Multiple genome rearrangement Multiple Genome Rearrangement auf Bäumen: Consensus-Graph (Stars): mögliche Lösungen (Mediane): g1 g3 g2Kosten: 3 g2 g1 g3 g3 g2 g1 G 1 = g 2 g 1 g 3 G 2 = g 3 g 2 g 1 G 3 = g 1 g 3 g 2 g1g1 g3g3 g2g2 1 1 1 3 3 3

55 Ceyhun Tamer, 6.Semester Bioinformatik - 55 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Consensus-Graph (Stars): Bestimmung eines Medians für N Genome mit jeweils n Genen mit Orientierung S = {-g 1, g 1, -g 2, g 2, -g 3, g 3 }, N = 3, n = 3 G 1 = -g 2 g 1 g 3 G 2 = g 3 -g 1 -g 2 G 3 = g 1 g 2 g 3

56 Ceyhun Tamer, 6.Semester Bioinformatik - 56 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Consensus-Graph (Stars): Γ ist der vollständige Graph die Knoten sind Element aus S für jede Kante gh in E(Γ) sei u(gh) die Anzahl in der - g und h adjazent sind w(gh) = N - u(gh) wenn g = -h w(gh) = -Z g1g1 g3g3 g2g2 -g 1 -g 2 -g 3 G 1 = g 1 g 2 g 3 G 1 = g 1 -g 1 | g 2 -g 2 | g 3 -g 3 G 2 = g 1 g 2 -g 3 G 2 = g 1 -g 1 | g 2 -g 2 | -g 3 g 3

57 Ceyhun Tamer, 6.Semester Bioinformatik - 57 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Consensus-Graph (Stars): G 1 = -g 2 g 1 g 3, G 2 = g 3 -g 1 -g 2, G 3 = g 1 g 2 g 3 u(g 2 g 1 ) = 1, u(-g 1 g 3 ) = 1, u(-g 3 -g 1 ) = 1, u(g 1 -g 2 ) = 1, u(-g 1 g 2 ) = 1, u(-g 2 g 3 ) = 1 w(g 2 g 1 ) = 2, w(-g 1 g 3 ) = 2, w(-g 3 -g 1 ) = 2, w(g 1 -g 2 ) = 2, w(-g 1 g 2 ) = 2, w(-g 2 g 3 ) = 2

58 Ceyhun Tamer, 6.Semester Bioinformatik - 58 - Multiple genome rearrangement

59 Ceyhun Tamer, 6.Semester Bioinformatik - 59 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Consensus-Graph (Stars): Lösungen: g 1 -g 1 g 2 -g 2 g 3 -g 3 Kosten: -3 * Z + 4 g 2 -g 2 g 3 -g 3 -g 1 g 1 -g 2 g 2 g 1 -g 1 g 3 -g 3 g 3 -g 3 -g 1 g 1 -g 2 g 2 Mediane: g 1 g 2 g 3 : 4 Inversionen Abstand g 2 g 3 -g 1 : 7 Inversionen Abstand -g 2 g 1 g 3 : 5 Inversionen Abstand g 3 -g 1 -g 2 : 5 Inversionen Abstand

60 Ceyhun Tamer, 6.Semester Bioinformatik - 60 - Multiple genome rearrangement Wie gut sind die Lösungen?

61 Ceyhun Tamer, 6.Semester Bioinformatik - 61 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: binäre Bäume (completely resolved): |V(T)| = 2N - 2 alle nicht-terminalen Knoten haben Grad 3 Beginn mit einem Start-Baum inneren Knoten werden Genome zugeordnet Zerlegung des Gesamtproblems in Teile von 3-Stars

62 Ceyhun Tamer, 6.Semester Bioinformatik - 62 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: binäre Bäume (completely resolved): initiale Belegung der inneren Knoten: eine feste Permutation zufällige Permutationen eine Permutation aus nächster Verwandtschaft Consensus von drei Permutationen aus nächster Verwandtschaft Initiales TSP für jeden inneren Knoten, Kantengewichte über dynamische Programmierung Initiales TSP für jeden inneren Knoten, Kantengewichte sind gemittelt über drei benachbarte Knoten

63 Ceyhun Tamer, 6.Semester Bioinformatik - 63 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: Der Algorithmus: algorithm optimizetree input G 1,…,G N initialize each of G N+1,…,G 2N-2 to some Genome cost := routine iteratemedian output G N+1,…,G 2N-2

64 Ceyhun Tamer, 6.Semester Bioinformatik - 64 - Multiple genome rearrangement Multiple Genome Rearrangement auf Graphen: routine iteratemedian while C = < cost, cost := C do for i = N+1,…,2N-2, G* := median(G h, G j, G k ) if G i := G * end if enddo endwhile

65 Ceyhun Tamer, 6.Semester Bioinformatik - 65 - Multiple genome rearrangement Wie gut sind die Ergebnisse:

66 Ceyhun Tamer, 6.Semester Bioinformatik - 66 - Multiple genome rearrangement Fazit Multiples Alignment von Genomen mit Hilfe von Stars und binären Bäumen Aussagen über die Genauigkeit der Lösung Beschränkung der Genome auf dieselbe Genmenge ist unrealistisch

67 Ceyhun Tamer, 6.Semester Bioinformatik - 67 - Multiple genome rearrangement


Herunterladen ppt "Seminar: Aktuelle Themen der Bioinformatik Thema: Genome Rearrangement Ceyhun Tamer"

Ähnliche Präsentationen


Google-Anzeigen