Phylogenetic Footprinting

Slides:



Advertisements
Ähnliche Präsentationen
Junk DNA — Nicht-proteinogene DNA
Advertisements

Entscheiden unter Unsicherheit: Heuristiken und Biases
8. Termin Teil B: Wiederholung Begriffe Baum
Perceptrons and the perceptron learning rule
Inhalt Saarbrücken,.
Paarweises Sequenz Alignment
Filterfunktion auf Websites
R. Der - Vorlesung Algorithmen und Datenstrukturen (Magister)
5. Sortier-Algorithmen Vorbemerkungen:
Anwendung und Visual Basic
On a Buzzword: Hierachical Structure David Parnas.
1 Whole Genome Alignment mit Suffixbäumen Fortgeschrittene Algorithmische Bioinformatik SoSe 2005 Emre Kutbay.
Übersicht DIALIGN = DIagonal ALIGNment
Formale Sprachen – Mächtigkeit von Maschinenmodellen
V5 – Analyse von Genomsequenzen
Protein-Protein Bindungsstellen
Isolation of cDNA clones encoding T cell- specific membrane-associated proteins Matthias Weißkopf 1 Sequence relationships between putative.
Heuristiken Automatic Problem Solving Institut für Informatik
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Genetische Algorithmen
Nicht-Lineare Regression
FTP – File Transfer Protocol
Seminar: Aktuelle Themen der Bioinformatik Thema: Genome Rearrangement Ceyhun Tamer
Bioinformatik-Seminar
Secondary Structure Prediction for Aligned RNA Sequences
DNA - Sequenzierstrategien
Analyse von DNA-Sequenzen
Algorithmen des Internets 2005 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität 1 Klausuraufgaben.
Minimum Spanning Tree: MST
Datenmanagement in Sensornetzen PRESTO - Feedback gesteuertes Datenmanagement - SS 2007 Sören Wenzlaff.
Vortrag: Ingo Gensch, Mathias Reich am:
Die Vorlesung Statistische Methoden II findet am (nächste Woche) wegen der Projektwoche nicht wegen der Projektwoche nicht statt.
Classification of Credit Applicants Using Data Mining. Thema.
Martina Littich, Florian Hottner, Dariusz Kuzara Three Strategies for Elaborating the Cultivation Hypothesis Potter(1988)
Tutorium Willkommen zurück, in der wunderbaren Welt der Statistik Teil II.
Seminar: Informationstechnik in der Medizin Universität Dortmund Skin Detection Fakultät für Elektrotechnik und Informationstechnik Lehrstuhl für Kommunikationstechnik.
On the Power of Profiles for Transcription Factor Binding Site Detection Sven Rahmann* Tobias Müller Martin Vingron * Computational Molecular Biology,
Christian Schulz, Marc Thielbeer, Sebastian Boldt
Splay Trees Von Projdakov Benjamin.
Effiziente Algorithmen
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Dynamische Programmierung mit Anwendung auf Sequence Alignment Problem
Intelligent Design und Darwinismus
… oder wie finde ich den Weg
Project: Architekten - Otto Wagner - Visueller Prototyp.
Christian-Albrechts-Universität zu Kiel
VL Algorithmische BioInformatik (19710)
Dallinger Georg, 8.A BRG Schloss Wagrain
Multivariate Statistische Verfahren
Rekonstruktion phylogenetischer Bäume.
Paarweises Sequenz-Alignment
Schnittpunkt von zwei Geraden
Die Clusteranalyse Zielsetzung Datenreduktion: Zusammenfassung einer Vielzahl von Objekten oder Variablen zu Gruppen mit möglichst ähnlichem Informationsgehalt.
AUGE e.V. - Der Verein der Computeranwender Augmented reality Kostenlose Apps für Android-Devices Peter G. Poloczek, M5543.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Foliendesign: Jörg Steinrücken & Tobias Kahn Vorlesung
Gene Prediction Marco Block Jonas Heise Nima Keshvari Michael Schreiber.
Der A*-Algorithmus.
1 Neue Regionalgeographie Regionalgeographische Ansätze im Unterricht der sekundar Stufe 1.
Objektorientierte (OO) Programmierung
Bibliotheksarbeit im Fach Natur und Technik: „Der Hund“ Beispiel für eine Unterrichtseinheit in der 5. Jahrgangsstufe des Gymnasiums Susanna Räde, Maximilian-von-Montgelas.
Christoph Wirtz | Seminarvortrag EBC | Lehrstuhl für Gebäude- und Raumklimatechnik Ein Tool zum automatisierten Erstellen von Conversion Scripts.
Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.
Monophylie und Stammbaum
 Präsentation transkript:

Phylogenetic Footprinting Genregulation Phylogenetic Footprinting Genomannotation durch komparative Sequenzanalyse Referat von Mandy Fuchs & Christopher Hardt

Cross-Species Sequence Comparisons: A Review of Methods and Available resources Kelly A. Frazer, Laura Elnitski, Deanna M. Church, Inna Dubchak, and Ross C. Hardison Genome Res. 2003 Jan;13(1):1-12. Review Multi-species sequence comparison: the next frontier in genome annotation Inna Dubchak and Kelly Frazer Genome Biol. 2003;4(12):122. Epub 2003 Nov 27

Inhalt Hintergrund Alignments und Suche nach konservierten Sequenzen (2 Programme) Ergebnisse Zusammenfassung

Nach der Sequenzierung die Annotation Immer mehr Genome sequenziert Nächster Schritt: komplette und korrekte Annotation (noch sehr lückenhaft) Suche nach funktionellen Sequenzelementen durch komparative Sequenzanalyse

Basis Annahme: Evolution funktioneller Sequenzen langsamer als die der nichtfunktionellen (wegen Selektionsdruck) Betrachte mehrere Spezies mit verschiedenen (geeigneten) phylogenetischen Abständen Ziel: Finde ... kodierende Sequenzen konservierte nichtcodierende Sequenzen mit womöglich regulatorischer Funktion Spezies-exklusive Sequenzen

Appetithäppchen Referenzsequenz: Humane CFTR Region Wo sind die regulatorischen Elemente?

Appetithäppchen Ah, da sind sie ja!

PipMaker vs. VISTA Beide folgen einem gemeinsamen Schema: Aber es gibt auch Unterschiede...

PipMaker (http://bio.cse.psu.edu) Verwendet BLASTZ für lokale Alignments Kurze, exakte Matches, die zu Alignments mit Gaps erweitert werden Empirische Scoring-Matrix Affine Gap-Kosten Bis ~2mb Sequenzlänge

PipMaker: Ein- und Ausgabe Beispiel: ~308 kb auf 7q31 (ST7 Locus)

VISTA (http://www-gsd.lbl.gov/vista) Verwendet AVID für globale Alignments Maximal-Match-Finding mit Suffix Trees Ankerauswahl: Menge der nicht überlappenden oder überkreuzenden Matches Alignments der Regionen zwischen den Ankern effizient für lange Sequenzen (bis 4mb), besser als z.B. CLUSTALW

VISTA: Ein- und Ausgabe Beispiel: ~308 kb auf 7q31 (ST7 Locus)

Filtern von konservierten Elementen Heuristische Auswahl der Sequenzen, die in allen paarweisen Alignments bedeutend erscheinen (exkl. bekannte Exons): Mensch-Pavian: 95% ident./100bp Mensch-Kuh: 93% ident./100bp Mensch-Maus: 86% ident./100bp Mensch-Fugu: 55% ident./100bp  Wenige nicht-codierende Sequenzen, die aber wahrscheinlich wegen aktiver Konservierung biologische Funktionen haben

Kandidaten für regulatorische Elemente Mensch-Pavian zu sehr verwandt Mensch-Fisch dagegen zu weit entfernt Mensch-Maus: einpaar konservierte Regionen, die bzgl. ihrer Umgebung deutlich herausstechen

Neues Exon oder regulatorisches Element? Test: Suche nach entsprechenden ESTs Intronische regulatorische Sequenz? Test: Gain-of-function assay

Ergebnisse Um konservierte Regionen zu finden erscheinen Multi-Spezies Vergleiche mit 40-80 Mio. Jahre Divergenzzeit am besten (z.B. Mensch-Maus-Kuh) Entfernt verwandte Spezies (z.B. Mensch-Kugelfisch, 450 Mio. Jahre) lassen kodierende und nicht-kodierende unterscheiden Nah Verwandte (z.B. Mensch-Schimpanse) erlauben die Identifizierung von speziesspezifischen Sequenzen Letztendlich auch: Stamm - Klasse - Ordnung - Familie - Gattung – Art und die Frage: Was ist wo konserviert?  Mehr Informationen über die Mechanismen der Evolution

Komparative Genomanalyse Einige neue funktionelle Sequenzen gefunden; alte bestätigt oder z.T. widersprochen Erscheint vielversprechend, aber Probleme gibt es noch: Verschiedene Evolutionsraten zwischen Spezies, aber auch in einem Genom Ansätze mit variablen Evolutionsraten Zu nah verwandt  auch „unwichtige“ Sequenzen konserviert Zu weit entfernt  haben nur begrenzt gemeinsame Gene  grob: mehr Sequenzen liefern bessere Ergebnisse

Zusammenfassung Nutze Korrelation zwischen phylog. Abstand und Konservierung um funktionelle Sequenzen zu finden PipMaker und VISTA Ultimatives Ziel: Komplette Annotation der Genome, inkl. Identifizierung und Klassifizierung funktioneller Elemente

Ansonsten danke für die Aufmerksamkeit und ab ins Café Noch Fragen? Ansonsten danke für die Aufmerksamkeit und ab ins Café