Phylogenetic Footprinting Genregulation Phylogenetic Footprinting Genomannotation durch komparative Sequenzanalyse Referat von Mandy Fuchs & Christopher Hardt
Cross-Species Sequence Comparisons: A Review of Methods and Available resources Kelly A. Frazer, Laura Elnitski, Deanna M. Church, Inna Dubchak, and Ross C. Hardison Genome Res. 2003 Jan;13(1):1-12. Review Multi-species sequence comparison: the next frontier in genome annotation Inna Dubchak and Kelly Frazer Genome Biol. 2003;4(12):122. Epub 2003 Nov 27
Inhalt Hintergrund Alignments und Suche nach konservierten Sequenzen (2 Programme) Ergebnisse Zusammenfassung
Nach der Sequenzierung die Annotation Immer mehr Genome sequenziert Nächster Schritt: komplette und korrekte Annotation (noch sehr lückenhaft) Suche nach funktionellen Sequenzelementen durch komparative Sequenzanalyse
Basis Annahme: Evolution funktioneller Sequenzen langsamer als die der nichtfunktionellen (wegen Selektionsdruck) Betrachte mehrere Spezies mit verschiedenen (geeigneten) phylogenetischen Abständen Ziel: Finde ... kodierende Sequenzen konservierte nichtcodierende Sequenzen mit womöglich regulatorischer Funktion Spezies-exklusive Sequenzen
Appetithäppchen Referenzsequenz: Humane CFTR Region Wo sind die regulatorischen Elemente?
Appetithäppchen Ah, da sind sie ja!
PipMaker vs. VISTA Beide folgen einem gemeinsamen Schema: Aber es gibt auch Unterschiede...
PipMaker (http://bio.cse.psu.edu) Verwendet BLASTZ für lokale Alignments Kurze, exakte Matches, die zu Alignments mit Gaps erweitert werden Empirische Scoring-Matrix Affine Gap-Kosten Bis ~2mb Sequenzlänge
PipMaker: Ein- und Ausgabe Beispiel: ~308 kb auf 7q31 (ST7 Locus)
VISTA (http://www-gsd.lbl.gov/vista) Verwendet AVID für globale Alignments Maximal-Match-Finding mit Suffix Trees Ankerauswahl: Menge der nicht überlappenden oder überkreuzenden Matches Alignments der Regionen zwischen den Ankern effizient für lange Sequenzen (bis 4mb), besser als z.B. CLUSTALW
VISTA: Ein- und Ausgabe Beispiel: ~308 kb auf 7q31 (ST7 Locus)
Filtern von konservierten Elementen Heuristische Auswahl der Sequenzen, die in allen paarweisen Alignments bedeutend erscheinen (exkl. bekannte Exons): Mensch-Pavian: 95% ident./100bp Mensch-Kuh: 93% ident./100bp Mensch-Maus: 86% ident./100bp Mensch-Fugu: 55% ident./100bp Wenige nicht-codierende Sequenzen, die aber wahrscheinlich wegen aktiver Konservierung biologische Funktionen haben
Kandidaten für regulatorische Elemente Mensch-Pavian zu sehr verwandt Mensch-Fisch dagegen zu weit entfernt Mensch-Maus: einpaar konservierte Regionen, die bzgl. ihrer Umgebung deutlich herausstechen
Neues Exon oder regulatorisches Element? Test: Suche nach entsprechenden ESTs Intronische regulatorische Sequenz? Test: Gain-of-function assay
Ergebnisse Um konservierte Regionen zu finden erscheinen Multi-Spezies Vergleiche mit 40-80 Mio. Jahre Divergenzzeit am besten (z.B. Mensch-Maus-Kuh) Entfernt verwandte Spezies (z.B. Mensch-Kugelfisch, 450 Mio. Jahre) lassen kodierende und nicht-kodierende unterscheiden Nah Verwandte (z.B. Mensch-Schimpanse) erlauben die Identifizierung von speziesspezifischen Sequenzen Letztendlich auch: Stamm - Klasse - Ordnung - Familie - Gattung – Art und die Frage: Was ist wo konserviert? Mehr Informationen über die Mechanismen der Evolution
Komparative Genomanalyse Einige neue funktionelle Sequenzen gefunden; alte bestätigt oder z.T. widersprochen Erscheint vielversprechend, aber Probleme gibt es noch: Verschiedene Evolutionsraten zwischen Spezies, aber auch in einem Genom Ansätze mit variablen Evolutionsraten Zu nah verwandt auch „unwichtige“ Sequenzen konserviert Zu weit entfernt haben nur begrenzt gemeinsame Gene grob: mehr Sequenzen liefern bessere Ergebnisse
Zusammenfassung Nutze Korrelation zwischen phylog. Abstand und Konservierung um funktionelle Sequenzen zu finden PipMaker und VISTA Ultimatives Ziel: Komplette Annotation der Genome, inkl. Identifizierung und Klassifizierung funktioneller Elemente
Ansonsten danke für die Aufmerksamkeit und ab ins Café Noch Fragen? Ansonsten danke für die Aufmerksamkeit und ab ins Café