Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

10.07.2003 Proseminar Visualisierung in der Bioinformatik Sommersemester 2003 Betreuer: Jens Barthelmes Autoren: Nikolaus Jeremic, Birger Krug Johann Wolfgang.

Ähnliche Präsentationen


Präsentation zum Thema: "10.07.2003 Proseminar Visualisierung in der Bioinformatik Sommersemester 2003 Betreuer: Jens Barthelmes Autoren: Nikolaus Jeremic, Birger Krug Johann Wolfgang."—  Präsentation transkript:

1 10.07.2003 Proseminar Visualisierung in der Bioinformatik Sommersemester 2003 Betreuer: Jens Barthelmes Autoren: Nikolaus Jeremic, Birger Krug Johann Wolfgang Goethe-Universität Frankfurt am Main Visualisierung von RNA- Sekundärstrukturen Prof. Dr. D. Krömker

2 10.07.2003 02/49 Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug Gliederung 1.Einleitung 1.1RNA und RNA-Sekundärstruktur 1.2Strukturelle Elemente und Pseudoknoten 1.3Biologische Bedeutung der RNA-Sekundärstruktur 2.Techniken zur Visualisierung der RNA-Sekundärstruktur 2.1Vorhersage der RNA-Sekundärstruktur 2.2Repräsentation der RNA-Sekundärstruktur 2.3Darstellung der H-Typ Pseudoknoten 3.Lösungen zur Visualisierung der RNA-Sekundärstruktur 3.1RnaViz2 3.2PseudoViewer 3.3Vergleich der beiden Programme 4.Zusammenfassung 5.Ausblick

3 10.07.2003 03/49 Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug Gliederung 1.Einleitung 1.1RNA und RNA-Sekundärstruktur 1.2Strukturelle Elemente und Pseudoknoten 1.3Biologische Bedeutung der RNA-Sekundärstruktur 2.Techniken zur Visualisierung der RNA-Sekundärstruktur 2.1Vorhersage der RNA-Sekundärstruktur 2.2Repräsentation der RNA-Sekundärstruktur 2.3Darstellung der H-Typ Pseudoknoten 3.Lösungen zur Visualisierung der RNA-Sekundärstruktur 3.1RnaViz2 3.2PseudoViewer 3.3Vergleich der beiden Programme 4.Zusammenfassung 5.Ausblick

4 10.07.2003 04/49 Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug Gliederung 1.Einleitung 1.1RNA und RNA-Sekundärstruktur 1.2Strukturelle Elemente und Pseudoknoten 1.3Biologische Bedeutung der RNA-Sekundärstruktur 2.Techniken zur Visualisierung der RNA-Sekundärstruktur 2.1Vorhersage der RNA-Sekundärstruktur 2.2Repräsentation der RNA-Sekundärstruktur 2.3Darstellung der H-Typ Pseudoknoten 3.Lösungen zur Visualisierung der RNA-Sekundärstruktur 3.1RnaViz2 3.2PseudoViewer 3.3Vergleich der beiden Programme 4.Zusammenfassung 5.Ausblick

5 10.07.2003 05/49 Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug Gliederung 1.Einleitung 1.1RNA und RNA-Sekundärstruktur 1.2Strukturelle Elemente und Pseudoknoten 1.3Biologische Bedeutung der RNA-Sekundärstruktur 2.Techniken zur Visualisierung der RNA-Sekundärstruktur 2.1Vorhersage der RNA-Sekundärstruktur 2.2Repräsentation der RNA-Sekundärstruktur 2.3Darstellung der H-Typ Pseudoknoten 3.Lösungen zur Visualisierung der RNA-Sekundärstruktur 3.1RnaViz2 3.2PseudoViewer 3.3Vergleich der beiden Programme 4.Zusammenfassung 5.Ausblick

6 10.07.2003 06/49 Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug Gliederung 1.Einleitung 1.1RNA und RNA-Sekundärstruktur 1.2Strukturelle Elemente und Pseudoknoten 1.3Biologische Bedeutung der RNA-Sekundärstruktur 2.Techniken zur Visualisierung der RNA-Sekundärstruktur 2.1Vorhersage der RNA-Sekundärstruktur 2.2Repräsentation der RNA-Sekundärstruktur 2.3Darstellung der H-Typ Pseudoknoten 3.Lösungen zur Visualisierung der RNA-Sekundärstruktur 3.1RnaViz2 3.2PseudoViewer 3.3Vergleich der beiden Programme 4.Zusammenfassung 5.Ausblick

7 10.07.2003 07/49 Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug 1. Einleitung 1.1 RNA und RNA-Sekundärstruktur 1.2 Strukturelle Elemente und Pseudoknoten 1.3 Biologische Bedeutung der RNA-Sekundärstruktur

8 10.07.2003 08/49 1.1 RNA und RNA-Sekundärstruktur RNA (Ribonucleinsäure) Der Zuckerbaustein des Nucleotids ist Ribose http://www.rothamsted.bbsrc.ac.uk/notebook/cou rses/guide/rnast.htm Besteht aus den Basen: http://www.bioinfo.rpi.edu/~zukerm/Bio-5495/RNAfold-html/node1.html

9 10.07.2003 09/49 1.1 RNA und RNA-Sekundärstruktur RNA (Ribonucleinsäure) http://www.rothamsted.bbsrc.ac.uk/notebook/cou rses/guide/rnast.htm RNA kommt fast immer einsträngig vor und spielt eine sehr wichtige Rolle bei der Genexpression (Proteinsythese) Bei Retroviren besteht das Genom aus einzelsträngigen RNA-Molekülen

10 10.07.2003 10/49 1.1 RNA und RNA-Sekundärstruktur RNA (Ribonucleinsäure) http://www.rothamsted.bbsrc.ac.uk/notebook/cou rses/guide/rnast.htm Die 3 wichtigsten Arten der RNA: Ribosomale RNA/rRNA (Strukturelemente der Ribosomen), Transfer RNA/tRNA (transportiert Aminosäuren) und Messenger RNA/mRNA (entsteht beim Kopieren der Gene) Weitere RNA-Typen: Katalytische RNAs RNAs, die keine Proteine kodieren: RNAi, miRNA, snRNA, tmRNA, gRNAs und snoRNAs

11 10.07.2003 11/49 1.1 RNA und RNA-Sekundärstruktur RNA-Sekundärstruktur Die RNA-Sekundärstruktur ist die Vereinfachung einer komplexen dreidimensionalen Faltung eines Biopolymers. Die Faltung entsteht durch Basenpaarung, wobei man zwischen kanonischen und nicht kanonischen Basenpaarungen unterscheidet. Watson-Crick Basenpaare: (Wasserstoffbrücken-) Bindungen zwischen den komplementären Basen (C-G und A-U) Wobble* Basenpaarung (G-U) *bei der Paarung zwischen Codon und Anticodon tritt in der dritten Position Schwankungen (wobbles) auf Bei allen anderen handelt es sich um nicht-kanonische Basenpaarungen RnaViz2, Escherichia coli MRE600

12 10.07.2003 12/49 1.2 Strukturelle Elemente und Pseudoknoten Strukturelle Elemente RNA-Schleifen (reguläre Schleifen): Sind Bereiche der Sequenz der Sekundärstruktur, die nicht kanonische Basenpaare beinhalten, jedoch durch ein oder mehrere kanonische Basenpaare begrenzt sind. Schleifenarten: Hairpin loop (Haarnadelschleife) Bulge loop Internal loop Multibranch loop Helices: Doppelstrangbestandteil, der ein benachbarter Bereich eines Basenpaares ist.

13 10.07.2003 13/49 1.2 Strukturelle Elemente und Pseudoknoten Strukturelle Elemente Hairpin loop (Haarnadelschleife) Resultieren aus der Entstehung der Basenpaare durch die Rückwärtsfaltung der Nucleinsäurestränge. Entsteht aus einem Basenpaar. Bulge loop (einseitige Schleife) Enthalten ungepaarte Nucleotide auf nur einem Strang der Doppelhelix Internal loop (interne Schleife) Sind durch zwei Helices mit kanonischen Basenpaaren begrenzt und beinhalten Nucleotide an beiden Strängen, die nicht in kanonischen Basenpaaren sind. Multibranch loop (Verzweigungen) Schleifen, bei denen sich mehr als zwei Helices schneiden.

14 10.07.2003 14/49 1.2 Strukturelle Elemente und Pseudoknoten Beispiel: Strukturelle Elemente RNA 2001 Elsevier Science Ltd Söll, Nishimura, Moore

15 10.07.2003 15/49 1.2 Strukturelle Elemente und Pseudoknoten Pseudoknoten Teile eines RNA-Tertiärstrukturelements, die sich bilden, wenn Nukleotide aus kurzen, einzelsträngigen Bereichen mit Nucleotiden in Haarnadelschleifen desselben Moleküls Basenpaarungen eingehen. Vereinfacht: 2 überlappende Stem-loop Strukturen, wobei 1 Strang in der Schleife der anderen Struktur beginnt: Tag der Forschung, Rumpf, 2002

16 10.07.2003 16/49 1.2 Strukturelle Elemente und Pseudoknoten Pseudoknoten Wichtig für verschiedene Funktionen der RNA: Die strukturelle Organisation des RNA-Komplexes Auslösen der Replikation Frameshifting Kontrolle der Translation

17 10.07.2003 17/49 1.2 Strukturelle Elemente und Pseudoknoten Pseudoknoten 3 Hauptarten der Pseudoknoten: H-Typ Pseudoknoten (hairpin loop) B-Typ Pseudoknoten (bulge loop) I-Typ Pseudoknoten (interior loop) Insgesamt sind 14 Typen möglich. Pseudoknoten Schleifen (PK loop) enthalten sowohl einen Pseudoknoten als auch einen einsträngigen Teil.

18 10.07.2003 18/49 1.2 Strukturelle Elemente und Pseudoknoten Beispiel: H-Type Pseudoknoten RNA structure, Andrew Feig, 2002

19 10.07.2003 19/49 1.3 Biologische Bedeutung der RNA-Sekundärstruktur Biologische Bedeutung der RNA- Sekundärstruktur Eine exakte Kenntnis der RNA-Sekundärstruktur ist wichtig für die Beeinflussung von RNA-Molekülen mit nukleotidischen oder nicht-peptidischen Wirkstoffen. Bedeutend für das Verständnis der Prozesse wie das Spleißen (Entfernen der Intronen und Verbinden der Exonen) und die funktionale Rolle der rRNA in der Proteinsynthese. Notwendig für die Strukturanalyse der RNA-Moleküle z.B. bei Spektroskopie, Thermographie, chemisches und enzymatisches Probing, Gelelektrophorese, Röntgenstrukturanalyse. Hilfreich für die Vorhersage der Tertiärstruktur.

20 10.07.2003 20/49 Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug 2.1 Vorhersage der RNA-Sekundärstruktur 2.2 Repräsentation der RNA-Sekundärstruktur 2.3 Darstellung der H-Typ Pseudoknoten 2. Techniken zur Visualisierung der RNA-Sekundärstruktur

21 10.07.2003 21/49 Vorhersage der RNA- Sekundärstruktur 2.1 Vorhersage der RNA-Sekundärstruktur Problem: Berechnung der Sekundärstruktur aus einer (oder mehreren) Nucleotidsequenz(en). Die Anzahl der möglichen Sekundärstrukturen auf einem Molekül ist exponentiell in der Anzahl der Nucleotide! Deshalb werden intelligente Verfahren gebraucht...

22 10.07.2003 22/49 Verfahren zur Vorhersage der RNA-Sekundärstruktur 2.1 Vorhersage der RNA-Sekundärstruktur Allgemeine Ansätze: (1) Ermittlung der Sekundärstruktur auf der Basis eines Sequenzvergleichs (2) Graphentheoretische Ansätze (3) Syntaxgesteuerter Ansatz (kontext-freie stochastische Grammatiken) (4) Optimierung einer heuristischen Energiefunktion (mittels Dynamisches Programmieren)

23 10.07.2003 23/49 Bewertung der Verfahren 2.1 Vorhersage der RNA-Sekundärstruktur (1)Vorteile: Gute Ergebnisse bei tRNAs und 5s-RNA, findet Pseudoknoten Nachteile: Mehrere Sequenzen notwendig, erfordert Multiples Alignment (2)Vorteile: Findet Pseudoknoten Nachteile: Mehrere Sequenzen notwendig, erfordert statistische Auswertung (3)Vorteile: Transparent, flexibel in der Anwendung Nachteile: Pseudoknoten können nicht mit kontext-freien Grammatiken beschrieben werden, solche Grammatiken haben ggf. sehr viele Produktionen (4)Vorteile: Benötigen nicht mehrere Sequenzen, kein multiples Alignment notwendig, akzeptable Zeit- und Speicherplatzkomplexität Nachteile: Pseudoknoten können nicht berechnet werden, Ergebnisse können ungenau sein

24 10.07.2003 24/49 Repräsentation der RNA- Sekundärstruktur 2.2 Repräsentation der RNA-Sekundärstruktur Repräsentation der RNA-Sekundärstruktur durch: Bracket Dot - Notation Mountain Plot Dot Plot Bäume Planare Graphen

25 10.07.2003 25/49 Graphen-Darstellungen (1) 2.2 Repräsentation der RNA-Sekundärstruktur RNA Visualization, Andreas De Stefani, Technische Universität Wien (modifiziert) Klassische biologische Darstellung (Stem-loop representation) Geordnete Menge von miteinander verbundenen Knoten stellt die RNA- Sturktur dar Knoten entsprechen Nucleotiden Kanten, die nicht-adjazente Knoten verbinden stellen Basenpaarungen dar ( blau markiert ) Bewertung: Biologisch informativ und weit verbreitet. Zum Vergleich von mehreren Strukturen nicht besonders gut geeignet.

26 10.07.2003 26/49 Graphen-Darstellungen (2) 2.2 Repräsentation der RNA-Sekundärstruktur Michael Gribskov : BIMM 140 - Lecture Introduction to Bioinformatics, University of California San Diego,2003 Kreis–Darstellung (Circular representation) Basen befinden sich auf der Kreislinie Basenpaarungen werden durch Linien dargestellt Bewertung: Ändert sich mit der Länge der RNA und wird selten verwendet. Keine Überschneidungen, wenn keine Pseudoknoten in der Struktur vorkommen.

27 10.07.2003 27/49 Graphen-Darstellungen (3) 2.2 Repräsentation der RNA-Sekundärstruktur Michael Gribskov : BIMM 140 - Lecture Introduction to Bioinformatics, University of California San Diego,2003 Kuppel-Darstellung (Dome representation) Nucleotide sind auf der Linie angeordnet Baasenpaarung wird durch Kreisbögen symbolisiert Bewertung: Schlecht für die Erkennung von Bulge-Schleifen. Wird selten benutzt.

28 10.07.2003 28/49 Bracket Dot-Darstellung 2.2 Repräsentation der RNA-Sekundärstruktur UUACGACUGACUACCAGUGCAUA..... ( ( ( (..... ) ) ) )..... Nucleotidsequenz: Sekundärstruktur in B. D.-Notation: Eine Klammerung repräsentiert eine Basenpaarung und ein Punkt ein freies Nucleotid. Bewertung: Gut für die Speicherung im Computer aber nicht für einen visuellen Vergleich geeignet.

29 10.07.2003 29/49 Mountain Plot-Darstellung 2.1 Repräsentation der RNA-Sekundärstruktur http://www.cacr.caltech.edu/Publications/annreps/annrep95/fig/stolorz4.gif Darstellung der Bracket Dot - Notation in einem Koordinatensystem: ( entspricht Steigung ) entspricht Gefälle. entspricht Ebene Höhe des Berges an einer Position, gibt die Anzahl der umschließenden Basenpaare wieder. Bewertung: Besser als die B. D.-Notation für einen visuellen Vergleich geeignet.

30 10.07.2003 30/49 Dot Plot-Darstellung 2.2 Repräsentation der RNA-Sekundärstruktur RNA Visualization, Andreas De Stefani, Technische Universität Wien (modifiziert) Mögliche Basenpaarungen werden durch Quadrate dargestellt, wobei die Größe eines Quadrates proportional zur Wahrscheinlichkeit ist (untere Dreiecksmatrix) Darstellung der minimalen freien Energie der Struktur (obere Dreiecksmatrix) Bewertung: Erlaubt im Gegensatz zu bisher vorgestellten Repräsentationen die graphische Darstellung der freien Energie in der Struktur.

31 10.07.2003 31/49 Baum-Darstellung 2.2 Repräsentation der RNA-Sekundärstruktur Es gibt viele Möglichkeiten die RNA-Sekundärstruktur als Baum darzustellen. Beispiel einer Baum-Darstellung: http://www.massey.ac.nz/~ppgardne/results/review/node12.html

32 10.07.2003 32/49 Fazit: Darstellungen der RNA- Sekundärstruktur 2.2 Repräsentation der RNA-Sekundärstruktur Kompromiß zwischen klarer Darstellung der Sequenz und der Darstellung der Basenpaare Darstellungen die beides versuchen sind unübersichtlich und eigenen sich somit nicht mehr für den Vergleich von mehreren RNA-Sekundärstrukturen Pseudoknoten können nicht zufriedenstellend dargestellt werden

33 10.07.2003 33/49 Darstellung der H-Typ Pseudoknoten 2.3 Darstellung der H-Typ Pseudoknoten Darstellung der Sekundärstruktur ohne Pseudoknoten im Sinne der Graphentheorie ist ein Baum Darstellung eines Pseudoknotens (blauer Pfeil) im Sinne der Graphentheorie ist ein Graph mit inneren Zyklen (und ggf. äußeren Zyklen = PK-Schleife) Ziel: Darstellung von H-Typ Pseudoknoten als planare Graphen PseudoViewer: automatic visualization of RNA pseudoknots, K. Han Y. Lee & W. Kim, 2002

34 10.07.2003 34/49 Algorithmus von Han, Lee und Kim (PseudoViewer) 2.3 Darstellung der H-Typ Pseudoknoten Eingabe: Nucleotidsequenz inkl. Sekundärstrukturdaten Schritt 1: Extraktion der strukturellen Elemente aus der Eingabe Schritt 2: Konstruktion eines abstrakten Baumes für die gesamte Struktur Schritt 3: Bestimmung der Größe und Form für jedes strukturelle Element Schritt 4: Positionierung jedes strukturellen Elementes, Ebene für Ebene durch Translationen und Rotationen Ausgabe: Darstellung der Sekundärstruktur inklusive H-Typ Pseudoknoten als planarer Graph

35 10.07.2003 35/49 Algorithmus von Han, Lee und Kim 2.3 Darstellung der H-Typ Pseudoknoten PseudoViewer: automatic visualization of RNA pseudoknots, K. Han Y. Lee & W. Kim, 2002 Bisherige Darstellung Neue Darstellung

36 10.07.2003 36/49 Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug 3.1 RnaViz2 3.2 PseudoViewer 3.3 Vergleich der beiden Programme 3. Lösungen zur Visualisierung der RNA-Sekundärstruktur

37 10.07.2003 37/49 3.1 RnaViz2 RnaViz2

38 10.07.2003 38/49 3.1 RnaViz2 RnaViz2 - Eigenschaften Hybride Programmierung (C + Tcl/Tk) Unterstützte Eingabeformate CT, DCSE und RNAML Verwendet die Stem-loop Repräsentation Mehrere Strukturen auf einer Seite darstellbar Jede Struktur besteht aus einer Anzahl einzelner Objekte. Daher können einzelne Basen, Teilbereiche, Helices, Bäume oder Strukturen in ihrer Größe verändert, verschoben und gegen den Uhrzeigersinn gedreht werden, wobei der Rest der Struktur automatisch neu geordnet werden kann, um die korrekte Struktur beizubehalten. Zu jedem Objekt lassen sich die Eigenschaften, wie Schrift, Farbe, Größe etc. verändern und anpassen Helices werden automatisch nummeriert.

39 10.07.2003 39/49 3.1 RnaViz2 RnaViz2 - Stärken Leicht portierbar Erkennt verschiedene Formate Mehrere Strukturen auf einer Seite Einfache und mächtige WYSIWYG-Editierung mit verschiedenen Auswahlmodi Freie Auswahl der Schriften, Farben und Größen für jedes Objekt Graphische Objekte (Rechtecke, ovale Linien, Text) für Kommentare Unabhängiges Skalieren der Strukturzeichnung Schablonen

40 10.07.2003 40/49 3.1 RnaViz2 RnaViz2 - Schwächen Installation umständlich Keine alternativen Ansichten, wie dot plot etc. Nicht besonders gut geeignet für den Vergleich von verschiedenen Strukturen Pseudoknoten schlecht darstellbar Keine Randinformationen

41 10.07.2003 41/49 3.2 PseudoViewer PseudoViewer

42 10.07.2003 42/49 3.2 PseudoViewer PseudoViewer - Eigenschaften Webbasiert (Java) Automatische Darstellung der H-Typ Pseudoknoten Stellt nur H-Typ Pseudoknoten dar Abschnitte und Schleifen rotierbar Markierung der Struktur Fensterunterteilung

43 10.07.2003 43/49 3.2 PseudoViewer PseudoViewer - Stärken Detaillierte Anzeige der Strukturdaten Übersichtsfenster Keine Kantenüberschneidungen Automatische Nummerierung der Basenpaare und Markierung der PK-Schleifen.

44 10.07.2003 44/49 3.2 PseudoViewer PseudoViewer - Schwächen Nur H-Typ Pseudoknoten darstellbar Kein Zugriff auf einzelne Objekte Begrenzte Editiermöglichkeiten Kein manuelles Zeichnen möglich Keine Druckoption vorhanden

45 10.07.2003 45/49 3.3 Vergleich der beiden Programme Vergleich beider Programme Beide Programme verarbeiten Eingaben, die bereits Informationen über die Sekundärstruktur enthalten (Vorhersage der Sekundärstruktur muß schon vorher geschehen) RnaViz2 bietet zwar mehr Editiermöglichkeiten, kann im Gegensatz zum PseudoViewer nicht automatisch H-Typ Pseudoknoten visualisieren

46 10.07.2003 46/49 Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug 4. Zusammenfassung Biologische Grundlagen und Bedeutung der RNA und ihrer Sekundärstruktur Vorhersage, Darstellung und Speicherung der RNA- Sekundärstruktur Lösungen zur automatischen Visualisierung der RNA- Sekundärstruktur

47 10.07.2003 47/49 Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug 5. Ausblick Automatische Visualisierung aller Pseudoknotentypen mit Möglichkeit der nachträglichen Bearbeitung der Struktur Automatische Visualisierung aller Pseudoknotentypen ist bereits realisiert: PseudoViewer 2 (Anfang 2003)

48 10.07.2003 48/49 Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug Vielen Dank für Eure Aufmerksamkeit !

49 10.07.2003 49/49 Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug Visualisierung der RNA-Sekundärstruktur Nikolaus Jeremic & Birger Krug Vielen Dank für Eure Aufmerksamkeit ! Nun werden wir versuchen noch offengebliebene Fragen zu beantworten...


Herunterladen ppt "10.07.2003 Proseminar Visualisierung in der Bioinformatik Sommersemester 2003 Betreuer: Jens Barthelmes Autoren: Nikolaus Jeremic, Birger Krug Johann Wolfgang."

Ähnliche Präsentationen


Google-Anzeigen