Docking von starren und flexiblen Proteinen

Slides:



Advertisements
Ähnliche Präsentationen
Fast Fourier Transformation
Advertisements

Punkt-in-Polygon-Verfahren III (R/R+-Baum)
PG Air Seminararbeit März 2002 Jürgen Wieners
Rekursion: Rekurrenz: Algorithmen rufen sich selbst (rekursiv) auf.
Falls Algorithmen sich selbst rekursiv aufrufen, so kann ihr Laufzeitverhalten bzw. ihr Speicherplatzbedarf in der Regel durch eine Rekursionsformel (recurrence,
Inhalt Saarbrücken,.
Algebraische Zahlen: Exaktes Rechnen mit Wurzeln
TECHNISCHE UNIVERSITÄT DARMSTADT Naive Bayes for Ranking
B-Bäume.
Genetische Algorithmen für die Variogrammanpassung
Wie lösen wir ILPs exakt?
Standortfaktoren INTERN - Ausdrucksstark präsentieren.
Anwendung und Visual Basic
Theoretical Analysis of Protein-Protein Interactions Proseminar SS 2004.
1 Proseminar Bioinformatik: Theoretical Analysis of Protein-Protein-Interactions Scoring Functions Silke Ruzek 22.Juni.2004.
Algorithmentheorie 04 –Hashing
WS Algorithmentheorie 05 - Treaps Prof. Dr. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (21 – Kürzeste Wege) T. Lauer.
Geometrisches Divide and Conquer
Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.
Struktur und Funktion von Biopolymeren Elmar Lang
PG 520 Intelligence Service – gezielte Informationen aus dem Internet
Algorithmen und Komplexität
Wir suchen ‘ mit m = m    ‘ c  ‘ mod 26
Minimum Spanning Tree: MST
Inhalte und Maßnahmen eingegeben haben,
Berechnung des Osterdatums
Modellierung von Baumstrukturen mit einem einzigen Polygonnetz
Ralf KüstersDagstuhl 2008/11/30 2 Ralf KüstersDagstuhl 2008/11/30 3.
Eigenschaften der OLS-Schätzer
Effiziente Algorithmen
Ausgleichung ohne Linearisierung
Abschlussvortrag zur Studienarbeit
Effiziente Algorithmen
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Globale Interpolations- und Prädiktionsverfahren
Diskrete Mathematik II
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation II Vorlesung 7 SS 2000 Punkt-in-Polygon-Verfahren I (Trapezkarte)
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Effiziente Algorithmen
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Effiziente Algorithmen
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Effiziente Algorithmen
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Hartmut Klauck Universität Frankfurt SS
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Polynome und schnelle Fourier-Transformation
Christian Scheideler Institut für Informatik Universität Paderborn
Übung Datenbanksysteme II Index- strukturen
Auslegung eines Vorschubantriebes
… oder wie finde ich den Weg
Wie packt man Riesenmoleküle in eine kleine Schachtel?
Ein Überblick über verschiedene Verfahren
Analyseprodukte numerischer Modelle
Das Traveling Salesman Problem (TSP)
Landkarten Landkarten sind Tesselationen mit folgenden Eigenschaften:
Statistik – Regression - Korrelation
Analyse der Laufzeit von Algorithmen
Routenplanung querfeldein - Geometric Route Planning
Vortrag Relative Orientierung
Der A*-Algorithmus.
Gliederung der Vorlesung
Institut für Informationssysteme Technische Universität Braunschweig Institut für Informationssysteme Technische Universität Braunschweig Verdrängung von.
PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.
Prognose von Zeitreihen Hans Nübel Hans Nübel Prognose von Zeitreihen Aufbau 1.Motivation 2.Holt-Winters-Verfahren 3.Prognose.
 Präsentation transkript:

Docking von starren und flexiblen Proteinen Seminar Bioinformatik, „Theoretical Analysis of Protein-Protein Interactions” Docking von starren und flexiblen Proteinen Präsentation von Andreas Schlicker (andreasschlicker@web.de)

Übersicht Molecular surface recognition: Docking von starren Proteinen und Liganden mit Hilfe von Korrelation geometrischer Eigenschaften Dead-End Elimination theorem (DEE): Reduktion des Konformations-Suchraums bei flexiblem Docking Protein Docking mit flexiblen Seitenketten

Molecular surface recognition Docking von Molekülen anhand geometrischer Eigenschaften Form von Interfaces im gebundenen und freien Zustand häufig sehr ähnlich Suche im 6-dimensionalen Rotations- und Translationsraum

Repräsentation der Moleküle Projektion der 3D-Koordinaten auf ein Gitter Gitterpunkt innerhalb des Moleküls, wenn Atomkern innerhalb Radius r vorhanden [1] [1]

Matching von Oberflächen (I) Korrelation der geometrischen Form (α, β, γ) gibt die Verschiebung von Molekül b in Bezug auf Molekül a an [1] Kein Kontakt  Korrelation = 0 Kontakt  Korrelation > 0 je besser der Kontakt, desto größer die Korrelation

Matching von Oberflächen (II) Problem: auch Überlappung liefert positive Korrelation Lösung: ρ in Gleichung [2a] << 0 δ in Gleichung [2b] > 0  Überlappung wird mit negativer Korrelation bestraft [1]

Berechnung (I) Direkte Berechnung der Korrelation benötigt Zeit O(N6)  Verwende Fourier Transformation [1] Korrelation wird durch Inverse Fourier-Transformation erhalten  Benötigte Zeit liegt in O(N³ln(N³))

Berechnung (II) Molekül a wird fixiert, Molekül b wird in allen Orientierungen getestet [1]

Resultate Test mit 5 Komplexen, zwei Durchgänge mit unterschiedlichen Gitter-Größen [1] [1] [1]

Vor- und Nachteile Vorteile: Nachteile: Schnelle Berechnung Meistens korrekte Vorhersage Parameter sind universell einsetzbar Nachteile: Starre Moleküle Keine Berücksichtigung physiko-chemischer Eigenschaften

Dead-End Elimination Theorem Konformationsraum von Proteinen sehr groß, selbst bei Verwendung von Rotamer-Bibliotheken Systematische Suche nach der „global minimum energy conformation“ (GMEC) praktisch unmöglich

Energie einer Konformation Potentielle Energie eines Proteins: [2]

„Dead-Ending“ Rotamere Rotamere, die in der GMEC nicht vorkommen können Rotamer ir kann nicht vorkommen, wenn für ein Paar (ir, it) gilt: [2]

Erweiterung auf Rotamerpaare Energie eines Rotamerpaares [irjs] [2] Interaktionsenergie mit anderen Rotameren [2]  Rotamerpaar [irjs] ist „dead-ending“, wenn gilt: [2]

Algorithmus Eliminiere alle Rotamere, die offensichtlich inkompatibel sind Eliminiere „dead-ending“ Rotamere mit dem DEE Theorem Wende DEE Theorem auf alle Rotamerpaare an und markiere „dead-ending“ Paare Iteriere, bis keine weiteren Rotamere mehr entfallen

Resultate (I) Test mit dem Insulin-Dimer anfängliche Kombinationsmöglichkeiten: 2,7*1076 Nach 9 Iterationen: 7200 Modellierung des Proteins liefert 55 richtig vorhergesagte Residuen Verborgene Residuen werden mit 93% Genauigkeit vorhergesagt [2]

Resultate (II) Blind-Test an Limulus polyphemus 194 Aminosäuren, wovon 71 % richtig vorhergesagt wurden Viele Fehler durch falsche Salz- und Wasserstoffbrücken an exponierten Gruppen

Vor- und Nachteile Vorteile: Nachteile: Schnelle Berechnung (Aufwand steigt „nur“ quadratisch mit Anzahl der Aminosäuren) Starke Reduzierung des Suchraums Nachteile: Ungenauigkeiten durch verwendete Energiefunktion Benötigt relativ genaues Template Abhängig von der verwendeten Rotamer-Bibliothek

Protein Docking mit flexiblen Seitenketten Docking von rigiden Strukturen keine gute Lösung Problem des exponentiellen Wachstums des Konformationsraums bei flexiblen Seitenketten

Flexibilität Alle Residuen flexibel behandeln sehr aufwändig selbst bei Verwendung von Rotamer-Bibliotheken  Nur Interface-Residuen flexibel Interface benötigt  Rigides Docking zur Erzeugung von Anfangsstrukturen

Rigides Docking Verwendet geometrische und einfache chemische Fitness Funktionen Von den erzeugten Komplexstrukturen wurden die 60 besten weiter verfolgt Oft große Überlappung der Proteine und inkorrekt platzierte Seitenketten

Bestimmung der Bindungsstelle Residuen, die innerhalb 6 Å eines Atoms des anderen Proteins liegen Seitenketten ohne Rotamere (CYS in Disulfidbrücken, ALA, GLY) werden nicht berücksichtigt

GMEC GMEC = Kombination der Rotamere, die die niedrigste Energie liefern [3]  Anwendung des DEE-Theorems möglich

Suche nach der GMEC Zwei Strategien: Multi-Greedy Methode Branch-and-cut basierend auf einem ILP

Multi-Greedy Methode (I) Aufbau eines Enumerations-Baumes mit möglichen Kombinationen [3]

Integer Linear Program (ILP) Formulierung als Minimierungs-Problem auf einem ungerichteten Graphen Knoten v für alle Rotamere, E(v) = Etplir - Emax Kanten uv für Rotamer-Paare verschiedener Residuen, E(uv) = Epwir,js - Emax  k-partiter Graph mit negativen Kanten- und Knoten-Gewichten  GMEC entspricht Rotamer-Graph mit minimalem Gewicht

ILP (II) [3] [3]

Branch-and-cut Lösen der Relaxation des ILPs  Falls Lösung ā nicht optimal, suche nach fa <= f0, die ā als mögliche Lösung ausschließt Falls keine Ungleichung gefunden wird, aufsplitten in zwei Unterprobleme

Energieberechnung Optimierung der GMEC mit AMBER Freie Bindungsenergie: [3] ΔGES: elektrostatischer Beitrag ΔGcav: freie Cavitäts-Energie in Wasser ΔGconf: Änderung der Entropie ΔGvdW: Änderung der freien van-der-Waals Energie

Algorithmus (I) Generierung von Ausgangsstrukturen mit Hilfe von rigidem Docking Bestimmung der Aminosäuren am Interface Variation dieser Aminosäuren durch Rotamere Iterative Anwendung des DEE Theorems zur Reduktion des Konformationsraumes

Algorithmus (II) Finden der GMEC mit Hilfe der schnellen Heuristic bzw. des exakten branch-and-cut Algorithmus Optimierung der Molekülgeometrien mit Hilfe eines Molekülmechanik Kraftfeldes Berechnung der freien Bindungsenergie

Resultate (I) Test mit drei Protein Komplexen Anwendung des DEE ergibt große Vereinfachung [3]

Resultate (II) [3]

Resultate (III) [3]

Resultate (IV) [3]

Vor- und Nachteile Vorteile: Nachteile: Heuristik liefert schnell gute Annäherung an optimale Lösung Branch-and-cut liefert optimale Rotamere Nachteile: Keine perfekte Trennung von guten und schlechten Ergebnissen Ergebnisse stark von der Wahl des Kraftfeldes abhängig

Zusammenfassung Rigides Docking nur erfolgreich, wenn native und Komplexstruktur sehr ähnlich sind Rigides Docking aber guter Startpunkt für flexibles Docking Dead-End elimination starke Vereinfachung bei flexiblem Docking

Referenzen [1] Katchalski-Katzir, E., Shariv, I., et al., (1992) PNAS, 89, 2195-2199. Molecular Surface Recognition: Determination of Geometric Fit between Proteins and their Ligands by Correlation Techniques [2] Desmet, J., De Maeyer, M., Hazes, B., and Lasters, I., (1992) Nature, 356, 539-542. DEE Theorem and its Use in Protein Side Chain Positioning [3] Althaus, E., Kohlbacher, O., Lenhof, H.-P., and Muller, P., (2002) J. Comput. Biol., 9, 597-612. A Combinatorial Approach to Protein Docking with Flexible Side Chains