Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 3D Repräsentation von DNA Sequenzen Tomislav Grgat Patrick.

Ähnliche Präsentationen


Präsentation zum Thema: "Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 3D Repräsentation von DNA Sequenzen Tomislav Grgat Patrick."—  Präsentation transkript:

1 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 3D Repräsentation von DNA Sequenzen Tomislav Grgat Patrick Gutbell Proseminar: Visualisierung in der Bioinformatik Sommersemester 2003 Johann Wolfgang Goethe Universität Frankfurt Fachbereich: Graphische Datenverarbeitung

2 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Übersicht Einführung H Curve Z Curve ADN Viewer Zusammenfassung

3 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Einführung

4 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 DNA (Desoxyribonukleinsäure ): Trägerin der Erbsubstanz Bauplan der Baustoffe(Strukturproteine) und Bauarbeiter (Enzyme) einer Zelle Information in der Basenabfolge

5 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003

6 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Spezifische Sequenzbereiche: Introns Exons repetitive Sequenzbereiche Palindrome Sequenzbereiche mit hohem GC-Gehalt

7 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Repetitive Sequenzen: 10-25% repetitive Sequenzen meist an Enden von Chromosomen; dienen zur Erhaltung der Chromosomenspitzen Transposons: transponierbare genetische Elemente: können Ort innerhalb des Genoms wechseln

8 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Palindrome: Erkennungstelle für Enzyme 5` C C G C G G 3` 3` G G C G C C 5` RADAR

9 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Was sagt der GC-Gehalt der DNA aus? Anteil von Guanin und Cytosin an den Basen der DNA grobe Aussage über den Verwandtschaftsgrad =>geringe Variation deutet auf enge Verwandtschaft Genkonzentration korreliert mit GC-Gehalt

10 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Warum eine 3D-Darstellung der DNA ?

11 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 1 gatcattctt ccatgtaggg gcaccctgtg ctatgtgggg ggttgagcag catcctgggc 61 ctctacctcc agttgagatg gccacagatg cctccaggct gggcatctct gcttgagggg 121 agctgtcttg gcctagaaca caggctgggg gccgctggtc cagcaggagc cttcctgcct 181 cgattccctc ttggcctgcg gtgagtgttt gcagctctcc ccccgtctgt ctcctgactt 241 tccctgggct gggctggtct tgttgtgtca ccctgtttct gccagacctt gagattccag 301 tcaaaataaa acagcggtgg atagaggggc tgagtgtggc cccccgaggc cctgggacat 361 cttttaccat tcgctgtcac agccgagatc tcccctgtgt cagtgatcct atgcaacatc 421 cccagataac agtgcagggc agataagtga ggatgtggtg aagggaaatg ggggagtgga 481 cgaggggcgt ccccggggag gatggcgcct accacgggca gtaaggaggt ctgcgtgagg 541 gatgcaggga cacaggaggc cagggtggca tcctgcctcc tacttgcgca ggtccagcgg 601 ggatcagagt ggaggcctcg caccagctct gggacatgaa ggggcccgag gcagcccttg 661 tggccacacg ggccttgtca tggttcggcc tttccactct gtgttccgaa ctgtgcagtg 721 tgtatgtgta ggcacagatg tgtgcccgtg cccatgccta ggactttgcg tgtgtctgta 781 cgtgtgattt cgtgtgtgtg tgcatcttcg ttggcgacac acgtgtgcaa tagttcttcc 841 atttcatttt ctctggtttg ggttacattc acccaactat gatgttgaaa atattaaatg

12 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003

13 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Welche Kriterien sollte die Darstellung erfüllen ? Analyse von Sequenzdaten Vergleich mit anderen Sequenzen Präsentation einer großen Datenmenge

14 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 DNA 3D-Visualisierungen: H-Curve Z-Curve

15 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Prinzip der H-Curve Berechnung: jedem Nukleotid wird ein Vektor im 3D-Raum zugewiesen Startpunkt (0,n,0) Vektoren werden entsprechend der Basenfolge aneinandergehängt

16 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Basisvektoren: B: (x, y, z) A: (1, -1, 1 ) T: (1, -1, -1) C: (-1,-1,-1) G: (-1, -1, 1)

17 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Beispiel für Sequenzabfolge: ACT Koordinaten:(x, y, z) Startpunkt: ( 0, 3, 0) A ( 1, -1, 1) + ( 1, 2, 1) C (-1, -1,-1) + ( 0, 1, 0) T (1, -1, -1) + Endpunkt: (1, 0, -1 )

18 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Welche Möglichkeiten bietet die H-Curve: A)gibt relative Basenzusammensetzung innerhalb einer Sequenz an B)Erkennung von spezifischen Sequenzabschnitten D)Vergleich zwischen Sequenzen E) Darstellung des Gesamten DNA-Stranges

19 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Teil des Genoms von Bacteriophage M13

20 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 2D Projektionen der H-Curve A B A : Kurve zeigt relative Purin/Pyrimidin-Verteilung an (Seq.:ACT) B : Kurve zeigt relative CG/AT-Verteilung an

21 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Endpunkt-Indikator der H-Curve: C T A G

22 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Erweiterbare Funktionen zur H-Curve: 2D-Projektion Smoothed H-Curve Distortion-Viewing-Tool

23 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Smoothed H-Curve Errechnet sich aus Mittelwerten Lokale Muster nicht wichtig Gesamtstruktur ist entscheidend

24 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Distortion-Viewing-Tool:

25 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Nachteile der H-Curve-Darstellung: Ungenauigkeit nicht frei erhältlich Wenige Zusatzfunktionen

26 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Vorteile der H-Curve- Darstellung: direkter visueller Check des Gesamt-DNA Strangs direkte Angabe der relativen Basenzusammensetzung

27 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Z Curve Definition Visuelle Anwendungen Analytische Ableitungen

28 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 DNA Sequenz aus 29 751 Basenpaaren Quelle: Z Curve Database http://tubic.tju.edu.cn/zcurve/

29 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Z Curve Dreidimensionale vollständige Repräsentation einer DNA Sequenz Z Curve und DNA Sequenz lassen sich eindeutig aus der jeweils anderen konstruieren Zhang.C.T und Zhang.R (1994) Z Curve Database: http://tubic.tju.edu.cn/zcurve/

30 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Berechnung der Z Curve Folge von P 0,P 1,...,P N Punkten in 3D Die sequentielle Verbindung der Punkte durch Linien ergibt die 3-dimensionale Z Curve N ist die Anzahl der Basenpaare der DNA Seq. Berechnung der Punkte erfolgt mittels der sog. Z Transform

31 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Z Transform A n,G n,C n,T n bezeichnen die Auftreten der Basen A,G,C und T in der DNA Sequenz bis zur n-ten Stelle

32 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Inverse Z Transform A n + C n + G n + T n = n

33 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Bedeutung der Z Transform Jede Komponente x n,y n,z n repräsentiert die Verteilung bestimmter Basentypen zueinander: – x n repräsentiert die Verteilung von Purin/Pyrimidin (R,Y) – y n repräsentiert die Verteilung von Amino/Keto (M,K) – z n repräsentiert die Verteilung von Starken/Schwachen wasserstoffbindenden Basentypen (S/W)

34 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Bedeutung der Z Transform Ist x n > 0 dominieren Purin Basen (A oder G) über Pyrimidin Basen (C oder T) Ist y n > 0 dominieren Amino Basen (A oder C) über Keto Basen (G oder T) Ist z n > 0 dominieren schwache Wasserstoff- bindende Basen (A oder T) über stark Wasserstoffbindende Basen (G oder C)

35 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Symmetrie der Z Curve Quelle: Z Curve Database http://tubic.tju.edu.cn/zcurve/image/ecolik12.JPG

36 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 4.6 Millionen Basenpaare 5.5 Millionen Basenpaare Vergleich von DNA Sequenzen unterschiedlicher Länge

37 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Visueller Vergleich von DNA Sequenzen Quelle: Zhang R, Zhang C.T: The Z curve database: a graphic representation of genome sequences (2003)

38 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Analyse des GC Gehalts Neue 2D Kurve leitet sich aus der z-Komponente ab: z' n = z n – k X n Steigt bzw. sinkt die z' n Kurve, so überwiegen A und T bzw. G und C Basen in dieser Region

39 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Vibrio Cholerae, Quelle: Zhang R, Zhang C.T: The Z curve database: a graphic representation of genome sequences (2003)

40 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 AT- und GC-Disparitäten Chargaffs 2. Paritäts Regel besagt – A N ~ T N – G N ~ C N In den Koordinaten der Z Curve ausgedrückt: – (x N + y N ) ~ 0 – (x N – y N ) ~ 0 (2 neue Kurven in 2D)

41 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Sybean chlorotic mottle virus Quelle: Zhang R, Zhang C.T: The Z curve database: a graphic representation of genome sequences (2003)

42 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Kennedya yellow mosaic virus Quelle: Zhang R, Zhang C.T: The Z curve database: a graphic representation of genome sequences (2003)

43 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 3D Darstellung der räumlichen DNA Struktur

44 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Räumliche Struktur der DNA Diesmal: Darstellung der natürlichen 3-dimensionalen Struktur des DNA Moleküls Dies erlaubt z.B. die Visualisierung: – Der lokalen Dichte des DNA Moleküls – Der Kurvatur – Der räumlichen Ausdehnung

45 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 ADN Viewer Software zur Visualisierung der räumlichen DNA Struktur – Eingabe: DNA Sequenz – Berechnung der 3D Struktur anhand eines vom User wählbaren Verfahrens – 3D Darstellung der DNA – Bietet Möglichkeit der Detailansicht (Zoom) – Hervorheben bestimmter DNA Merkmale (z.B. einzelner Gene, in Verbindung mit Datenbank)

46 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 300 000 Basenpaare Quelle: Joan Herisson and Rachid Gherbi: Model-based prediction of the 3D Trajectory of Huge DNA Sequences

47 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Ausschnitt der vorherigen Ansicht Ausschnitt inkl. farbkodierter Darstellung der Nukleotide

48 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Visualisierung einzelner Gene (weiss) eines DNA Moleküls (S. cerevisiae chrI)

49 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Zusammenfassung

50 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Zusammefassung Statistische 3D Darstellung – H Curve, Z Curve – Visueller Vergleich – Analytische Ableitungen 3D Struktur des DNA Moleküls – ADN Viewer – Studium der räumlichen DNA Struktur

51 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 Vielen Dank für Eure Aufmerksamkeit Fragen?

52 Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003


Herunterladen ppt "Seite 1 Tomislav Grgat Patrick Gutbell 3D Repräsentation von DNA SequenzenProseminar GDV SS2003 3D Repräsentation von DNA Sequenzen Tomislav Grgat Patrick."

Ähnliche Präsentationen


Google-Anzeigen