Gene Prediction Marco Block Jonas Heise Nima Keshvari Michael Schreiber.

Slides:



Advertisements
Ähnliche Präsentationen
Vortrag von Stephanie Weirauch Jens Pleger Peter Jancke Frank Wejmelka
Advertisements

Algorithmentheorie 08 – Dynamische Programmierung (4) Editierdistanz Approximative Zeichenkettensuche Sequence Alignment Prof. Dr. Th. Ottmann WS
Grundlagen des A*-Algorithmus und Anwendung in der Routenplanung
Gensuche mit Hidden Markov Modellen Zentrum für Bioinformatik
Man bestimme den „minimalen aufspannenden Baum“ des Graphen.
Falls Algorithmen sich selbst rekursiv aufrufen, so kann ihr Laufzeitverhalten bzw. ihr Speicherplatzbedarf in der Regel durch eine Rekursionsformel (recurrence,
Inhalt Saarbrücken,.
Minimum Spanning Tree: MST
Paarweises Sequenz Alignment
Polynomial Root Isolation
Steigung m berechnen Man kann die Steigung auch berechnen,
Schnelle Matrizenoperationen von Christian Büttner
Zerlegung von Graphen.
Docking von starren und flexiblen Proteinen
SST - Sequence Search Tree
Vorlesung Biologie für Mediziner (Bölker FB17)
Die 1-Baum-Relaxation des TSP mit der Subgradientenmethode
Simulated Annealing Marco Block & Miguel Domingo Seminar : Maschinelles Lernen und Markov KettenSommersemester 2002.
Übersicht DIALIGN = DIagonal ALIGNment
1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (03 – Verschiedene Algorithmen für dasselbe Problem) Prof. Dr. Th. Ottmann.
Bestimmung des Next-Arrays im KMP-Algorithmus
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Informatik II, SS 2008 Algorithmen und Datenstrukturen Vorlesung 4 Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut für Informatik Fakultät.
1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (21 – Kürzeste Wege) T. Lauer.
1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (03 – Verschiedene Algorithmen für dasselbe Problem) Prof. Dr. Th. Ottmann.
Secondary Structure Prediction for Aligned RNA Sequences
Analyse von DNA-Sequenzen
High Performance = Innovative Computer Systems + Efficient Algorithms Friedhelm Meyer auf der Heide 1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen.
Algorithmen und Komplexität
Minimum Spanning Tree: MST
Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.
Addierwerke.
Hauptseminar Automaten und Formale Sprachen
Genmutation.
Effiziente Algorithmen
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Effiziente Algorithmen
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Effiziente Algorithmen
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Dynamische Programmierung mit Anwendung auf Sequence Alignment Problem
… oder wie finde ich den Weg
Suchen In Texten Von Adriano Feola & Marc Draschl.
Formale Sprachen Grammatiken und die Chomsky-Hierarchie
Translation und Transkription
Multivariate Statistische Verfahren
Paarweises Sequenz-Alignment
Das Traveling Salesman Problem (TSP)
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation III Vorlesung 1 WS 2001/02 Punkt-in-Landkarte I (Streifenkarte)
SFZ FN Sj. 13/14 Python 3 Rekursion Inf K1/2 Sj 13/14
Vom graphischen Differenzieren
Die identische Reduplikation
Vergleich von RNA Strukturen A General Edit Distance between RNA Structures von Sebastian Juenemann.
Minimal spannende Bäume
Optimierungs- Algorithmen
Gliederung der Vorlesung
Joelle, Paul & Philipp RNA- Prozessierung.
Binärbäume.
Lineare Optimierung Nakkiye Günay, Jennifer Kalywas & Corina Unger Jetzt erkläre ich euch die einzelnen Schritte und gebe Tipps!
Rechen- und Kommunikationszentrum (RZ) Selektionsstrategien auf Graphstrukturen Sven Porsche Seminarvorträge Aachen.
Das Problem des Handlungsreisenden
 Präsentation transkript:

Gene Prediction Marco Block Jonas Heise Nima Keshvari Michael Schreiber

Einführung Wichtiges Gebiet der Bioinformatik Problematik (exon alignment problem) Biologische Herangehensweise Kombinatorischer Ansatz exon assembly problem auf Pfadsuche in einem gerichteten Graphen reduzieren (spliced alignment problem) Optimierung : spliced alignment problem auf network alignment problem (Kruskal) transformieren

exon alignment problem

Grundlagen der Biologie Die Zelle ist von der Zellhülle oder –membran umgeben. Im Zellleib oder Soma befindet sich der Zellkern. Im Zellkern ist das Erbmaterial, die DNS.

Grundlagen der Biologie Auf der DNS liegen die Gene. Die Gene codieren für Proteine.

Grundlagen der Biologie Die Gene sind unterteilt in Exons und Introns.

Grundlagen der Biologie Die Exons werden bei der Translation (Produktion eines Proteins aus mRNA) übersetzt, die Introns werden durch Splicing entfernt.

Biologische Herangehensweise RT-PCR

Naiver Ansatz - Suche alle möglichen Exon-Blöcke - Finde durch ausprobieren aller möglichen Kombinationen die bes

Kombinatorischer Ansatz 1.Rekursives Verfahren 2.Gerichteter Lösungsgraph wird erstellt

Kombinatorischer Ansatz 1a/10 Begrifflichkeiten : GString mit g 1...g n (genomic sequence) TString mit t 1...t m (target sequence)  = {B 1,B 2,...,B b } BSubstring von G mit g i...g j s(G,T)optimal alignment zwischen G und T  = (B 1,B 2,...,B b ) mit B 1 <B 2 <...<B b ** String mit B 1 * B 2 *... * B b )  (i) = {k : last(k) < i}, Blöcke die strikt vor der Position von i enden

Kombinatorischer Ansatz 1b/10

Kombinatorischer Ansatz 2/10 Nun lässt sich das spliced alignment problem mit G,T und B formulieren, als : Suche nach der Stringkette , die unsere Funktion s(  *, T), unter allen möglichen Blockketten aus B, maximiert.

Kombinatorischer Ansatz 3/10 Wir erstellen einen Graphen, dessen Knoten die Blöcke und dessen Kanten die potential transitions zwischen diesen sind. Das Kantengewicht ergibt sich aus dem optimal alignment zwischen den konkatenierten Blöcken. Dieses Problem ist aber nicht mit dem kürzesten-Wege-Problem verwandt, da die Gewichte der Knoten und Kanten in den Graphen noch nicht definiert sind.

Kombinatorischer Ansatz 4/10

Kombinatorischer Ansatz 5/10

Kombinatorischer Ansatz 5/10

Kombinatorischer Ansatz 5/10

Kombinatorischer Ansatz 5/10

Kombinatorischer Ansatz 5/10

Kombinatorischer Ansatz 5/10

Kombinatorischer Ansatz 6/10 Aufruf :

Kombinatorischer Ansatz 7/10 Laufzeit : Wir können, das spliced alignment problem zu dem bereits von Kruskal formulierten network alignment problem transformieren. Dabei versuchen wir den Weg zu finden, der die grösste Ähnlichkeit mit einer gegebenen target-Sequence besitzt. Laufzeit : O(mnc * mb²) O(mnc * mb) Es werden nun weniger Kanten benötigt.

Kombinatorischer Ansatz 7/10 Graphskizze :

Kombinatorischer Ansatz 9/10

Kombinatorischer Ansatz 8/10

Kombinatorischer Ansatz 8/10

Vergleichsfunktion  Zwei Aminosäuren As1 und As2 werden nach chemischer Ähnlichkeit verglichen Eine Matrix liefert die Score für jedes As- paar Bewertungsmatrix kann angepasst werden, keine Optimale Lösung bekannt

Beispielmatrix Scoringmatrix, nach Myers/Miller Verwendet im Programm „ ALIEN“ ( berechnet multiple sequence Alignment )

Beispielmatrix E : Glutamat, geladene As F: Phenylalanin, aromatische unpolare As -> negative Score (Penalty)

Beispielmatrix K : Lysin, basische As F: Arginin, ebenfalls basisch -> positive Score

Kombinatorischer Ansatz 8/10

Option 2 Biologisches Phänomen: In der DNA kann es zu INsertion und DELetion von Basen kommen, es kann also ein besserer Match gefunden wenn statt zu Vergleichen diese Basen übersprungen werden. Dabei wird eine Penalty vergeben ( negatives Vorzeichen von  indel !!!)

Beispiel zu InDel LIEBE LEBEN mögliches Annealing: 1Match LIEBE_ L_EBEN besseres Annealing: 4 Matches, 2 InDel‘s

Kombinatorischer Ansatz 8/10

Kombinatorischer Ansatz 8/10

Kombinatorischer Ansatz 8/10

Kombinatorischer Ansatz 8/10

Kombinatorischer Ansatz 8/10

Vergleich beider Verfahren RT-PCR Spliced Alignment Vorteile : Nachteile : Vorteile : Nachteile : - nachweisbar (genauer) - kurze Sequenzen probl schnelleres Verfahren - je mehr Daten zur Verfügung, desto optimaler - grosser Aufwand

Weitere Problemlösungsansätze Statistische Annäherung Hidden Markov Modelle Reverse Gene Finding

Kombinatorischer Ansatz Zusatz Beispiel : genomic sequence : It was brilliant thrilling morning and the slimy hellish lithe doves gyrated and gambled nimbly in the waves. famous line : ´t was brillig, and the slithy toves did gyre and gimble in the wabe. (Lewis Carroll)

Kombinatorischer Ansatz 7/10 Ablauf des Algorithmus :

Option 1 Rekursive Berechnung: S(i, j, k) ist Summe aus : -Score des vorherigen Schrittes -Ergebnis der Vergleichsfunktion  As 1, As 2 

Option 3 Am Anfang eines neuen Blocks wie Option 1, aber Bezug auf vorherigen Block.