Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Übersicht DIALIGN = DIagonal ALIGNment

Ähnliche Präsentationen


Präsentation zum Thema: "Übersicht DIALIGN = DIagonal ALIGNment"—  Präsentation transkript:

0 Seminarvortrag von Germar Brauer
DIALIGN Seminarvortrag von Germar Brauer

1 Übersicht DIALIGN = DIagonal ALIGNment
Versionen: DIALIGN, DIALIGN 2, DIALIGN-T neue und spezielle Methode für multiples Sequenzalignment (MSA) Idee: Finden von Proteinfamilien mit gleicher Funktion (hochkonservierte Stücke in verschiedenen Organismen) Einsatzgebiet: Nukleinsäuresequenzen, Proteinsequenzen

2 Voraussetzungen Algorithmus von Needleman-Wunsch mit gegebener Matrix (PAM, BLOSUM) „lokale“ Version von Smith-Waterman Regionen mit hoher Ähnlichkeit werden von Regionen mit geringer Ähnlichkeit unterbrochen (Introns bei DNA, Loops bei Proteinen) es werden Blöcke statt einzelner Zeichen miteinander verglichen

3 Was wird untersucht? untersucht werden nur die Diagonalen

4 Konsistente und nicht-konsistente Paare
konsistente Zuordnung

5 Konsistente und nicht-konsistente Paare
nicht-konsistente Zuordnung a) doppelte Belegung b) cross-over Zuordnung

6 Algorithmus Bilden aller optimalen paarweisen Alignments

7 Algorithmus gegeben : Diagonale D mit Länge l und Anzahl m von Matchen
P ist die Wahrscheinlichkeit eine Diagonale der Länge l mit mindestens m Matches zu bekommen p Wahrscheinlichkeit in Matrix ein Match zu repräsentieren p=0,25 bei DNA, p=0,05 bei Proteinen

8 Algorithmus T ist frei wählbarer Schwellenwert (verringert Rauschen)
die Länge Diagonale ist mindestens 7 Werte

9 Algorithmus Problem: - Dialign bevorzugt viele kurze Diagonalen vor wenigen langen signifikante lokale Gemeinsamkeiten gehen im „Rauschen“ der kleinen zufälligen Diagonalen unter keine allgemeine Regel für T (Schwellenwert) benötigte Mindestlänge der Diagonalen ist sehr willkürlich

10 Algorithmus Lösung: neue Wahrscheinlichkeit in Dialign 2
finde eine Diagonale der Länge l mit mindestens m gemeinsamen Paaren, in einer Vergleichsmatrix von 2 zufälligen Sequenzen mit derselben Länge, wie die Originalsequenzen die Wahrscheinlichkeit hängt nun von l, m und der Länge der Sequenzen ab

11 Algorithmus für kleinere Werte gilt folgende Approximation definiere:
basieren auf experimentell ermittelten Werten für kleinere Werte gilt folgende Approximation definiere:

12 Algorithmus (Overlap)
Sj gehört zu Dl und Dm

13 Algorithmus (Overlap)
sind Dl und Dm identisch oder haben keinen Overlap für eine beliebige Diagonale D wird Overlap-Gewicht folgendermaßen definiert

14 Algorithmus Gewichtsscore für Diagonalen berechnen
je größer das Gewicht, desto signifikanter die Diagonale

15 Algorithmus Überführen der Diagonalen in MSA mit Greedy-Strategie
Diagonale mit höchsten Score wird die erste Diagonale Überprüfen der weiteren Diagonalen auf Konsistenz und MSA hinzufügen

16 Algorithmus Wiederholen des Algorithmus – weitere Diagonale
D5 mit Gewicht 4,6 zum MSA hinzufügen im weiteren Schritt keine neuen Diagonalen

17 Algorithmus einmal hinzugefügte Diagonale kann nicht mehr entfernt werden Ergebnis: alle Diagonalen werden in Spalten angeordnet unbenutzte Zeichen werden klein geschrieben

18 Überblick

19 Zeitkomplexität für x und Sequenz S1 für x und Sequenz S2
„consistency bounds“ und für x und Sequenz S1 für x und Sequenz S2 benötigt für jede Diagonale, die zu M2 kommt

20 Zeitkomplexität (a) (b) (c) (d) Gesamtkomplexität:

21 Ergebnisse Vergleich mit anderen MSA Algorithmen
(HTH = Helix-Turn-Helix, bHLH = basic Helix-Loop-Helix)

22 Vorteile beim globalen Alignment vergleichbare Ergebnisse mit anderen Standardmethoden (Clustal W) bessere Ergebnisse im Vergleich mit anderen Methoden beim lokalen Alignment kleine hochkonservierte Regionen werden erkannt keine Strafpunkte für Gaps Nachteil: Dialign kann leicht im lokalen Maximum laufen

23 Screenshot http://bibiserv.techfak.uni-bielefeld.de/dialign/

24 Beispiel

25 Literatur B. Morgenstern (1999) DIALIGN 2: improvement of the segment-to- segment approach to multiple sequence alignment. Bioinformatics 15, B. Morgenstern, W.R. Atchley, K. Hahn, A. Dress (1998) Segment- based scores for pairwise and multiple sequence alignments. Proceedings ISMB'98, pp B. Morgenstern, A. Dress, T. Werner (1996) Multiple DNA and protein sequence alignment based on segment-to-segment comparison.Proc. Natl. Acad. Sci. USA 93, B. Morgenstern, K. Frech, A. Dress, T. Werner (1998) DIALIGN: Finding local similarities by multiple sequence alignment.Bioinformatics 14,


Herunterladen ppt "Übersicht DIALIGN = DIagonal ALIGNment"

Ähnliche Präsentationen


Google-Anzeigen