Alignments mit Hidden Markov Modellen. Wofür sind HMMs gut? Gehört eine Sequenz zu einer bestimmten Familie? Falls eine Sequenz aus einer Familie stammt,

Slides:



Advertisements
Ähnliche Präsentationen
Software Assurance Erweiterte Software Assurance Services
Advertisements

Perceptrons and the perceptron learning rule
Kap. 7 Sortierverfahren Kap. 7.0 Darstellung, Vorüberlegungen
Markow-Ketten Anwendungen aus der Genetik. Grundlagen aus der Biologie G9: Genetik und Evolution sind Thema in – der 10-ten Jahrgangsstufe – 12/2 (Genetik)
Gensuche mit Hidden Markov Modellen Zentrum für Bioinformatik
Paarweises Sequenz Alignment
Polynomial Root Isolation
Statistische Aspekte der PSG
Löschoperationen (1) VDB VDB' DB DB' o = lösche(aname) p?? v v = AName (ArtikelArt) n Löschen entspricht der relationenalgebraischen Differenz. Dann ergibt.
Gliederung Einführung Profile HMMs in der Theorie
Das LCA – Problem in Suffixbäumen
Beat- und Metrumsextraktion mit gaußifizierten Einsatzzeiten Musikwissenschaftliches Institut Hamburg WS 2005/06 Klaus Frieler.
Allgemeines Unterschiedliche Vertriebswege aus Sicht der Vertreiber
HEINZ NIXDORF INSTITUT Universität Paderborn Fachbereich Mathematik/Informatik Algorithmische Probleme in Funknetzwerken XV Christian Schindelhauer
Übersicht DIALIGN = DIagonal ALIGNment
Quellen-Filter Theorie der Sprachproduktion
Zeitliches probabilistisches Schließen
Heute Prüfung der Produkt-Moment Korrelation
Dynamische Programmierung (2) Matrixkettenprodukt
Sven Schuierer Universität Freiburg
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (19 - Analyse natürlicher Bäume) Prof. Th. Ottmann.
WS Algorithmentheorie 08 – Dynamische Programmierung (2) Matrixkettenprodukt Prof. Dr. Th. Ottmann.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation II Vorlesung In welcher Masche liegt der Punkt p?
PG 520 Intelligence Service – gezielte Informationen aus dem Internet
Analyse von DNA-Sequenzen
Einführung in Berechenbarkeit, Formale Sprachen und Komplexitätstheorie Wintersemester 2005/ Vorlesung Dominic Dumrauf.
nach Signalen und Genen in DNA
Hauptseminar Automaten und Formale Sprachen
Illustration Beispiel: Benutzergruppen für Lagerverwaltung:
3 % von % von 700 9% von % von 2000.
Hidden Markov Modelle (HMM) (Rabiner Tutorial)
Vortrag zum Thema Brute - Force Algorithmus Vortragende
Einheiten der Parameter
Kurzformaufgaben Mit welcher Zahl geht die Zahlenreihe ...5, 4, 8, 7, 14… weiter?  13  28  15  9.
Schwimmen Sie sich fit. Auch an den Feiertagen. Die Hallenbäder Loreto und Herti sind am Bettag, 18. September, für Sie offen. Von 9 bis 17 Uhr.
Franchisesystem - Provision
12. Kapitel: Unsicherheit
Wie entsteht eine Wettervorhersage?
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Effiziente Algorithmen
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Christian Scheideler Institut für Informatik Universität Paderborn
Gliederung des Vortrags
Mehrbelastung durch Maut, Möst und Fahrerlohnkosten Erhöhung
1 Stichprobenverfahren zur Qualitätssicherung Hilfestellung der Statistik in der Wirtschaftsprüfung.
3 4 = 3 : 4 = 0, = 0,75 denn: 3 : 4 = 0,75 Die Division geht auf. Es entsteht ein endlicher Dezimalbruch = 4,12 denn:
Formale Sprachen Reguläre Sprachen Rudolf FREUND, Marian KOGLER.
WINALITE Polska CASE = 50 Pkte.x 10% = 5 Pkte. Verkauf DETAILVERK. Gewinn 33 I II III IV 1 Cases = 77 SILBER Verkaufsberater 5.
LR Akademie Der Top-Tiefenbonus.
Beispiele: KFG 2.Teil Beispiel 1: Sei G eine Grammatik mit den folgenden Regeln: S  Ac | Bd A  aAb | ab B  aBbb | abb Definieren Sie.
Dimensions of Space chello.at Visualization of Legal Theory Space 01.
DER BALL DER IMMER GRÖSSER WURDE !
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Informatik III Christian Schindelhauer Wintersemester.
Beachten Sie die Temperaturen von Locarno und Altdorf.
Institut für Softwarewissenschaft – Universität WienP.Brezany 1 Beispiele (Frist: ) Beispiel 1: Sei  = {a, b} ein Alphabet und Q = {q 0, q 1 } eine.
Schwimmen : Die Anzahl 2: Die Bestzeit.
Gummiecke Wandschoner DIMENSION : Breite: 80 MM Länge : 900 MM Stärke : 10 MM Befestigungslöcher : 6 Gewicht: KG.
1 Äußere Verbindung (Outer Join) (3) Beispiel: Der Right Natural(!) Outer Join zwischen Lagerhilfsmittel und LagerhilfsmittelArt kann aufzeigen, für welche.
Gene Prediction Marco Block Jonas Heise Nima Keshvari Michael Schreiber.
 Präsentation transkript:

Alignments mit Hidden Markov Modellen

Wofür sind HMMs gut? Gehört eine Sequenz zu einer bestimmten Familie? Falls eine Sequenz aus einer Familie stammt, was kann man über ihre interne Struktur sagen?

Markov Kette Modell zum Generieren von Sequenzen Die Wahrscheinlichkeit für das Auftreten eines Symbols hängt nur vom Vorgängersymbol ab Wie wahrscheinlich ist eine Sequenz / Nukleotidfolge

Markov Kette Beispiel für DNA:

Markov Kette Transitionswahrscheinlichkeit: r st = P(x i = t | x i-1 = s) Wahrscheinlichkeit einer Sequenz: P(x) = P(x L | x L-1 )*P(x L-1 | x L-2 )*.. *P(x 2 | x 1 )*P(x 1 ) = P(x 1 )П i=2 r x i-1 x i

Markov Kette Beginzustand x 0 = B mit: P(x 1 = s) = r Bs Endzustand x L+1 = E mit: P(E | x L = t) = r tE

Hidden Markov Model Keine 1 zu 1 Übereinstimmung von Zuständen und generierten Symbolen Einbettung von Markov Ketten in die Zustände Es gibt bestimmte vordefinierte Wahrscheinlichkeiten, dass ein Zustandübergang erfolgt Sei e k (b) = P(x i = b | π i-1 = k) die WK, dass Symbol b im Zustand k auftritt (wobei π die Zustandsequenz ist)

HMM Beispiel: unfaires Casino:

HMM Beispiel: unfaires Casino: Problem: Wie findet man die richtige (wahrscheinlichste) Zustandssequenz, die der vorliegenden Symbolsequenz zugrunde liegt?

Viterbi Algorithmus Beispiel: CpG - Inseln Das Auftreten einer bestimmten Base (A, T, G, C) an einer bestimmten Stelle ist nicht gleich wahrscheinlich In bestimmten DNA-Bereichen: Hohe Wahrscheinlichkeit, dass C zu einem T mutiert Somit kleinere Wahrscheinlichkeit, dass ein C vor einem G steht Es gibt allerdings Regione in welchen die Mutationswahrscheinlichket (von C zu T) deutlich kleiner ist (zum Beispiel bei den Startregionen diverser Gene)

Viterbi Algorithmus Beispiel: CpG - Inseln Markov Kette

Viterbi Algorithmus Beispiel: CpG - Inseln Verschiedene Wahrscheinlichkeiten für das Auftreten eines Symbols (A, T, G, C), je nach dem ob es innerhalb (+ Modell) oder ausserhalb (- Modell) der CpG – Inseln stattfindet Daraus leitet sich die WK r st für jedes dieser beiden Modelle: r st + = c st + / t` c st` + r st - = c st - / t` c st` - (wobei c st die Anzahl der Fälle in welchen Symbol t Symbol s folgte ist) r st + und r st - statistisch ermittelbar

Viterbi Algorithmus +ACGT-ACGT A A C C G G T T

Viterbi Algorithmus Beispiel: CpG – Inseln HMM

Viterbi Algorithmus Ein rekursiver Algorithmus zum Finden des wahrscheinlichsten Pfades π* (mit π* = argmaxP(x, π)) Sei v k (i) die WK eines wahrscheinlichsten Pfades, der in Zustand k endet mit Beobachtung i Sei v k (i) bekannt für alle i, dann für i+1 gilt: v l (i+1) = e l (x i+1 )max(v k (i)r kl )

Viterbi Algorithmus Versteckte Zustände Beobachtete Zustände Initiale WK eines Anfangszustandes SonneFußball spielenSonne0.63 WolkenSpazierenWolken0.17 RegenPutzenRegen0.20 -Lesen--

Viterbi Algorithmus Wetter heute Wetter gestern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Versteckte Zustände FußballSpazierenPutzenLesen Sonne Wolken0.25 Regen

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen *

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen *

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen *0.25

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken0.042 Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen *

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen *

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen *0.500

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen *0.500*0.15

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen *0.500*

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen *0.375

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen *0.375*0,

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne0.378 Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen *0.125*

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen Max(0.028, 0.002, ) = 0.028

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen Max(0.028, 0.002, ) = 0.028

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen *0.25*

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen *0.125*

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken0.042 Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen *0.675*

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen Max(0.023, 0.001, 0.001) = 0.023

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken Regen0.010 Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen

Viterbi Algorithmus FußballPutzenLesen Sonne Wolken Regen Wetter heute Wetter Ges tern SonneWolkenRegen Sonne Wolken Regen Beobachtete Zustände Verst. Zust. Fuß ball Spazi eren Pu tzen Lesen Sonne Wolken0.25 Regen WK für Anfangszustand SonneWolkenRegen Max(0.407, 0.416, 0.417) = 0.417

Viterbi Algorithmus

Initialisierung (i = 0): v 0 (0) = 1, v k (0) = 0 für alle k > 0 Rekursion (i = 1..L): v l (i) = e l (x i )max k (v k (i-1)r kl ) ptr i (l) = argmax k (v k (i-1)r kl ) Terminierung: P(x, π*) = max k (v k (L)r k0 ) π* L = argmax k (v k (L)(r k0 ) Backtracking (i = L..1): π* i-1 = ptr i (π* i)

Paarweises Alignment mit HMM F(i-1, j-1)F(i, j-1) F(i-1, j) F(i,j) = max[F(i-1,j-1)+s(x i,y j ), F(i-1,j)-d, F(i,j-1)-d] +s(x i, y j ) -d

Paarweises Alignieren mit HMM Alignment mit affinen Gapkosten: Optimaler score für ein Alignment von x 1..x i und y 1..y j, der keinen Gap am Ende hat M(i,j) = max[M(i-1,j-1)+s(x i,y j ), I x (i-1,j-1)+s(x i,y j ), I y (i-1,j-1)+s(x i,y j )] Optimaler score für ein Alignment von x 1..x i und y 1..y j, wo am Ende x mit einen Gap aligniert wird I x (i,j) = max[M(i-1,j)-d, I x (i-1,j)-e] Optimaler score für ein Alignment von x 1..x i und y 1..y j, wo am Ende y mit einen Gap aligniert wird I y (i,j) = max[M(i,j-1)-d, I y (i,j-1)-e] L G A x i L G V y j L G A x i L G _ y j L G _ x i L G V y j

Paarweises Alignieren mit HMM Alignment mit affinen Gapkosten: M(i,j) = max[M(i-1,j-1)+s(x i,y j ), I x (i-1,j-1)+s(x i,y j ), I y (i-1,j-1)+s(x i,y j )] I x (i,j) = max[M(i-1,j)-d, I x (i-1,j)-e] I y (i,j) = max[M(i,j-1)-d, I y (i,j-1)-e] A|A|C| |A|ATTCCG|A|C|T |AC A|C|T|ACC|T| |C|G|C|- -

Paarweises Alignieren mit HMM Alignment mit affinen Gapkosten: M(i,j) = max[M(i-1,j-1)+s(x i,y j ), I x (i-1,j-1)+s(x i,y j ), I y (i-1,j-1)+s(x i,y j )] I x (i,j) = max[M(i-1,j)-d, anderer Block, neue Gapfolge I x (i-1,j)-e] selber Block, fortgesetzte Gapfolge I y (i,j) = max[M(i,j-1)-d, anderer Block, neue Gapfolge I y (i,j-1)-e] selber Block, fortgesetzte Gapfolge } }

Paarweises Alignment mir HMM

V L S P K H L _ _ K

Paarweises Alignment mir HMM V L S P K H L _ _ K

Paarweises Alignment mir HMM V L S P K H L _ _ K

Paarweises Alignment mir HMM V L S P K H L _ _ K

Paarweises Alignment mir HMM V L S P K H L _ _ K

Paarweises Alignment mir HMM V L S P K H L _ _ K

Paarweises Alignieren mit HMM NFA für Alignment mit affinen Gapkosten: dazugehöriges Wahrscheinlichkeitsmodell:

Paarweises Alignment mit HMM AA 0.21 AC 0.01 AG 0.05 AT 0.04 CA 0.02 …. 1-2 Match A- 0.2 C- 0.4 G- 0.3 T- 0.1 Gap Y 1- -A 0.2 -C 0.4 -G 0.3 -T 0.1 Gap X 1- Begin

Paarweises Alignieren mit HMM Das Wahrscheinlichkeitsmodell mit Begin und End Zuständen:

Paarweises Alignieren mit HMM Was ist neu? Es wird nicht mehr eine einzelne Sequenz generiert sondern ein paarweises Alignment Man benötigt eine zusätzliche Dimension und deshalb wird v k (i) zu v k (i,j) erweitert

Paarweises Alignieren mit HMM Angepasster Viterbi Algorithmus: Initialisierung: v M (0,0) = 1, alle anderen v*(i,0), v*(0,j) sind 0 Rekursion (i = 1..n, j = 1..m): v M (i,j) = p x i y j max[(1-2δ-τ)v M (i-1,j-1), (1-ε-τ)v X (i-1,j-1), (1-ε-τ)v Y (i-1,j-1)] v X (i,j) = q x i max[δv M (i-1,j), εv X (i-1,j)] v Y (i,j) = q y i max[δv M (i,j-1), εv X (i,j-1)] Terminierung: v E = τmax(v M (n,m),v X (n,m),v Y (n,m))

Paarweises Alignieren mit HMM lokales Alignment mit HMM: Zuerst definieren wir ein Random-Modell:

Paarweises Alignieren mit HMM lokales Alignment mit HMM:

Zusammenfassung Markov Ketten: Modelle für Sequenzgenerierung HMM: verschiedene WK für dieselben Symbole abhängig vom Kontext Viterbi Algorithmus: Algorithmus zum finden des wahrscheinlichsten Pfades durch die Zustände Alignment mit HMM: Überführung von score-Gleichungen in die Wahrscheinlichkeitsmodelle

Ende Fragen???