PTGL Ligandenintegration Protein Topology Graph Library

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Christian Scheideler SS 2009
Grundlagen des A*-Algorithmus und Anwendung in der Routenplanung
Christian Scheideler SS 2009
Zerlegung von Graphen.
Docking von starren und flexiblen Proteinen
Kardinalität von binären Beziehungen (1)
LS 2 / Informatik Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)
Graphen Ein Graph ist eine Kollektion von Knoten und Kanten. Knoten sind einfache Objekte. Sie haben Namen und können Träger von Werten, Eigenschaften.
Frozen Development in Graph Coloring
Aminosäuren bilden: Peptidbindungen
Algorithmen und Komplexität
Friedhelm Meyer auf der Heide 1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität Approximationsalgorithmen …liefern in polynomieller.
Anwendung und Visual Basic
Übersicht DIALIGN = DIagonal ALIGNment
Protein-Protein Bindungsstellen
Dynamische Programmierung (2) Matrixkettenprodukt
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (17 – Bäume: Grundlagen und natürliche Suchbäume) Prof. Th. Ottmann.
Algorithmen und Datenstrukturen
Seminar parallele Programmierung SS 2003
1 Kap. 2 Graphen Kap. 2.1 Netze Beispiele: MVV, Autobahnen, WIN, E/R, LH-Flüge, Stützgraphen, Petri-Netze, SIPs, ISA-Hierarchien, Operator-Graphen, Wartegraphen.
Secondary Structure Prediction for Aligned RNA Sequences
Algorithmen und Komplexität
Minimum Spanning Tree: MST
Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.
Modellierung von Baumstrukturen mit einem einzigen Polygonnetz
Generalisierte additive Modelle
Vortrag über Graphen Von Jörg Hendricks.
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Vorlesung 1 SS 2001 Algorithmus von Dijkstra.
Effiziente Algorithmen
Effiziente Algorithmen
Effiziente Algorithmen
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Diskrete Mathematik II
Geoinformation II Vorlesung 4 SS 2001 Voronoi-Diagramme.
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Effiziente Algorithmen
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Effiziente Algorithmen
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Hartmut Klauck Universität Frankfurt SS
Hartmut Klauck Universität Frankfurt WS 06/
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Polynome und schnelle Fourier-Transformation
Dynamische Programmierung mit Anwendung auf Sequence Alignment Problem
Das Traveling Salesman Problem (TSP)
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation II 6. Sem. Vorlesung Mai 2000 Konstruktion des Voronoi-Diagramms.
Analyse der Laufzeit von Algorithmen
HEINZ NIXDORF INSTITUT Universität Paderborn Fachbereich Mathematik/Informatik Algorithmische Probleme in Funknetzwerken VI Christian Schindelhauer
Gliederung der Vorlesung
Biologie Cytologie GSG
Adiabatisches Quantencomputing
Rechen- und Kommunikationszentrum (RZ) Selektionsstrategien auf Graphstrukturen Sven Porsche Seminarvorträge Aachen.
Das Problem des Handlungsreisenden
 Präsentation transkript:

PTGL Ligandenintegration Protein Topology Graph Library Tim Schäfer MolBI Goethe Universität Frankfurt am Main

Übersicht Proteine Protein Topology Graph Library (PTGL) Struktur und Funktion Modellierung Protein Topology Graph Library (PTGL) Motivation und Ziele Proteinmodell und Methoden Aufbau und Funktionsweise Integration von Protein-Liganden-Interaktionen Ligandendarstellung Änderungen an der PTGL

Proteinaufbau und Beschreibungsebenen Proteine Komplexe Makromoleküle 20 AS als Bausteine Strukturebenen Primärstruktur Sekundärstruktur, SSE α-Helix, β-Sheet Tertiärstruktur Quartärstruktur

Proteinaufbau und Beschreibungsebenen (FS) Strukturmotive und Folds Konservierung oft höher als auf AS-Niveau Proteinfunktion ist abhängig von 3D-Struktur Strukturaufklärung => Datenbanken Analyse erfordert Methoden zum Proteinvergleich auf unterschiedlichen Strukturebenen TIM-barrel in Triosephosphat-Isomerase (7TIM)

Vergleich von Proteinstrukturen Primärstruktur: Stringvergleiche DP: Needleman-Wunsch, Smith-Waterman Entfernte Ähnlichkeiten und untersch. Seq. Anordnung Unterschiedliche evolutionäre Konservierung auf Strukturebenen Tertiärstrukuturvergleich auf Ebene von Atomen/AS aufwändig Abstraktion: Strukturmuster können auf SSE-Ebene beschrieben werden => Nutzung der Sekundärstrukturebene Gleicher Fold => gleicher Kern von SSEs Datenmenge (80.000 Atome => 800 Reste => 70 SSEs)

PTGL - Protein Topology Graph Library Funktionen Webinterface zur Suche nach Proteintopologien Graphische Darstellung von Proteintopologien (2D) Proteinmodellierung Ungericheteter, beschrifteter Graph für jede Chain eines Proteins Ähnlichkeitsmodell: gleiche Substrukturen (max. gem. Teilgraphen) Datenquellen und Vorverarbeitung Atomkoordinaten : RCSB Protein Data Bank (PDB) SSE-Zuordnung : DSSP-Algorithmus, mod.

PTGL – Technischer Aufbau Frontend: Webinterface (Browser) Backend: PostgreSQL Datenbank, Apache Webserver Implementierung: Perl, C

PTGL – Modellierung von Proteinen als Graphen Knoten: SSEs des Proteins mit Typ Kanten: räumliche Beziehung zwischen SSEs Kontaktberechnung zwischen SSEs nötig: Überlappung der vdW- Radien (2Å), Typen: Rückgrat/Rückgrat (RG) Rückgrat/Seitenkette (SK) Seitenkette/Seitenkette Kante erfordert mindestens 2RG.RG | 2RG.SK | 3 SK.SK

PTGL – Räumliche Ausrichtung von SSEs S := Menge der Summen aller Paare von AS-Nummern, die Kontakt bilden D := Menge der Differenzen aller dieser Paare Doppelte Differenz DD := (Smax - Smin) - (Dmax – Dmin) DD > 0: parallel, DD < 0: antiparallel, DD = 0: mixed

PTGL – Räumliche Ausrichtung von SSEs (FS) D = { 80, 60, 40 } D = { 60, 60, 60 } DD = -40 DD = 40 => antiparallel => parallel

PTGL – Graphtypen Berücksichtigung aller oder nur bestimmer SSE-Typen Alpha-, Beta- oder Alpha-Beta-Graph (=Proteingraph) Diese Graphen sind nicht zwangsläufig zusammenhängend! Zusammenhangskomponenten (ZHK) entsprechen oft Domänen Eine ZHK des Graphen wird als Faltungsgraph (FG) bezeichnet Proteingraph: ein oder mehrere FGs Finden aller ZHKs mit Breitensuche Darstellung: Reihenfolge der SSEs Sequentiell: Differenz in AS-Nummer (Primärsequenz) Räumlich: Länge des kürzesten Weges zwischen den Knoten im Proteingraphen

PTGL – Notationen von Faltungsgraphen (FG) KEY: Schlüsselnotation Geordnet nach räumlicher Nähe (Start am N-Terminus) Differenzen der SSE-Nummern bei sequentieller Nummerierung (N=>C), 'x' bei parallelen SSEs; z.B. [5x, 1x, -2x, -1x, -1x, -1] ADJ: adjazente Notation Geordnet nach sequentiellem Auftreten der SSEs in Sequenz Differenzen der SSE-Nummern bei räumlicher Nummerierung, 'p': parallel, 'a': antiparallel, 'm': mixed RED: reduzierte Notation Wie ADJ, enthält aber nur SSEs des eigenen Faltungsgraphen SEQ: Sequenznotation Wie ADJ, aber sequentielle Nummerierung

FS: PTGL – Notation von Faltungsgraphen (FG)

PTGL - Substruktursuche Unverzweigte Faltungsgraphen (Grad aller Knoten <= 2) Die dargestellten eindeutigen linearen Notationen ermöglichen eine Suche nach Substrukturen über Stringvergleich Verzweigte Faltungsgraphen Besitzen SSEs, die Kontakte mit > 2 räumlichen Nachbarn haben Anpassungen der Notation für ADJ, RED, SEQ KEY-Notation ist hier nicht möglich, da es keine eindeutige räumliche Folge der SSEs gibt Finden von Teilstrukturen nicht mehr durch Stringsuche möglich, daher müssen graphtheoretische Methoden genutzt werden => Finden von maximalen gemeinsamen Teilgraphen

PTGL – Finden maximaler Teilgraphen (MTG) MTG ist NP-hart Transformation des MTG-Problem in Alle-Cliquen-Problem Cliquen im Kompatibilitätsgraphen entsprechen MTGs in den Faltungsgraphen Erstellen des Kantenkompatibilitätsgraphen der beiden Faltungsgraphen

Erstellen des Kompatibilitätsgraphen (1/2) Kanten sind kompatibel wenn Ihre Kantenmarkierungen übereinstimmen und Die Markierungen ihrer Endknoten überstimmen

Erstellen des Kompatibilitätsgraphen (2/2) Kante setzen wenn u adjazent zu u' und v adjazent zu v' oder u nicht adjazent zu u' und v nicht adjazent zu v'

PTGL – Finden maximaler Teilgraphen (MTG) MTG ist NP-hart Transformation des MTG-Problem in Alle-Cliquen-Problem Erstellen des Kantenkompatibilitätsgraphen der beiden Faltungsgraphen Cliquen im Kompatibilitätsgraphen entsprechen MTGs in den Faltungsgraphen Lösung mit bekannten Algorithmen (Bron-Kerbosch): Laufzeit für große Proteingraphen zu hoch Anpassung des Bron-Kerbosch-Algorithmus an Problem Suche statt aller MTG nur zusammenhängende MTG, denn von Interesse sind zusammenhängende Strukturen im Inneren des Proteins

Protein-Liganden-Interaktionen (PLI) Viele Proteine benötigen Liganden oder Co-Faktoren (ATP, NAD+, …) für ihre Funktion besondere Bedeutung bei vielen Anwendungen bei der Suche nach Inhibitoren / Medikamentendesign > 4000 unterschiedliche Liganden sind in der PDB Hohe Konservierung der PLI in Evolution

Ligandenintegration - Aufgaben Berechnen der Liganden-SSE-Interaktionen Aus 3D-Koordinaten in PDB-Dateien Anpassen des Graphmodells Ligandenknoten und Kanten Klassifizierung der Liganden nach Typen Abstraktionsniveau Anpassen der Dateiformate und Datenbank Dateien wie albe.dat, neue Tabellen für Liganden und Interaktionen Anpassen der Weboberfläche Eingabe-/Suchformulare, Ausgabe (Postscript)

Zusammenfassung Proteine können auf unterschiedlichen Ebenen verglichen werden, das Finden entfernter Ähnlichkeiten erfordert eine Abstraktion von der Ebene der AS-Sequenz Die PTGL benutzt 3D-Daten der PDB um unterschiedliche Proteingraphen zu erstellen, bei denen Knoten SSEs darstellen und Kanten die räumliche Beziehung zwischen diesen modellieren Das Ähnlichkeitsmodell basiert auf dem Finden maximaler gemeinsamer Teilgraphen mit Varianten des Bron- Kerbosch-Algorithmus Die Integration von Ligandeninformationen soll die Suchfähigkeiten der PTGL verbessern und erfordert Eingriffe auf unterschiedlichen Ebenen der PTGL

PTGL - Ligandenintegration Vielen Dank für Ihre Aufmerksamkeit!

Anhang - Quellen W. Kabsch& C. Sander J.Mol.Biol. 114:181 (1977) F.Kaden, I.Koch, J. Selbig J.Theor.Biol. 147:85 (1992) I.Koch, F.Kaden, J.Selbig PSFG 12:314 (1992) C.Bron & J. KerboschCommun.ACM 16:575 (1973)