Docking von starren und flexiblen Proteinen

Slides:

Advertisements

Ähnliche Präsentationen

Fast Fourier Transformation

Advertisements

Punkt-in-Polygon-Verfahren III (R/R+-Baum)

PG Air Seminararbeit März 2002 Jürgen Wieners

Rekursion: Rekurrenz: Algorithmen rufen sich selbst (rekursiv) auf.

Falls Algorithmen sich selbst rekursiv aufrufen, so kann ihr Laufzeitverhalten bzw. ihr Speicherplatzbedarf in der Regel durch eine Rekursionsformel (recurrence,

Inhalt Saarbrücken,.

Algebraische Zahlen: Exaktes Rechnen mit Wurzeln

TECHNISCHE UNIVERSITÄT DARMSTADT Naive Bayes for Ranking

Genetische Algorithmen für die Variogrammanpassung

Wie lösen wir ILPs exakt?

Standortfaktoren INTERN - Ausdrucksstark präsentieren.

Anwendung und Visual Basic

Theoretical Analysis of Protein-Protein Interactions Proseminar SS 2004.

1 Proseminar Bioinformatik: Theoretical Analysis of Protein-Protein-Interactions Scoring Functions Silke Ruzek 22.Juni.2004.

Algorithmentheorie 04 –Hashing

WS Algorithmentheorie 05 - Treaps Prof. Dr. Th. Ottmann.

Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.

1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (21 – Kürzeste Wege) T. Lauer.

Geometrisches Divide and Conquer

Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.

Struktur und Funktion von Biopolymeren Elmar Lang

PG 520 Intelligence Service – gezielte Informationen aus dem Internet

Algorithmen und Komplexität

Wir suchen ‘ mit m = m    ‘ c  ‘ mod 26

Minimum Spanning Tree: MST

Inhalte und Maßnahmen eingegeben haben,

Berechnung des Osterdatums

Modellierung von Baumstrukturen mit einem einzigen Polygonnetz

Ralf KüstersDagstuhl 2008/11/30 2 Ralf KüstersDagstuhl 2008/11/30 3.

Eigenschaften der OLS-Schätzer

Effiziente Algorithmen

Ausgleichung ohne Linearisierung

Abschlussvortrag zur Studienarbeit

Effiziente Algorithmen

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Globale Interpolations- und Prädiktionsverfahren

Diskrete Mathematik II

Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation II Vorlesung 7 SS 2000 Punkt-in-Polygon-Verfahren I (Trapezkarte)

Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/

Effiziente Algorithmen

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Effiziente Algorithmen

Effiziente Algorithmen

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Effiziente Algorithmen

Effiziente Algorithmen

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Hartmut Klauck Universität Frankfurt SS

Information und Kommunikation Hartmut Klauck Universität Frankfurt SS

Polynome und schnelle Fourier-Transformation

Christian Scheideler Institut für Informatik Universität Paderborn

Übung Datenbanksysteme II Index- strukturen

Auslegung eines Vorschubantriebes

… oder wie finde ich den Weg

Wie packt man Riesenmoleküle in eine kleine Schachtel?

Ein Überblick über verschiedene Verfahren

Analyseprodukte numerischer Modelle

Das Traveling Salesman Problem (TSP)

Landkarten Landkarten sind Tesselationen mit folgenden Eigenschaften:

Statistik – Regression - Korrelation

Analyse der Laufzeit von Algorithmen

Routenplanung querfeldein - Geometric Route Planning

Vortrag Relative Orientierung

Der A*-Algorithmus.

Gliederung der Vorlesung

Institut für Informationssysteme Technische Universität Braunschweig Institut für Informationssysteme Technische Universität Braunschweig Verdrängung von.

PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.

Prognose von Zeitreihen Hans Nübel Hans Nübel Prognose von Zeitreihen Aufbau 1.Motivation 2.Holt-Winters-Verfahren 3.Prognose.

Präsentation transkript:

Docking von starren und flexiblen Proteinen Seminar Bioinformatik, „Theoretical Analysis of Protein-Protein Interactions” Docking von starren und flexiblen Proteinen Präsentation von Andreas Schlicker (andreasschlicker@web.de)

Übersicht Molecular surface recognition: Docking von starren Proteinen und Liganden mit Hilfe von Korrelation geometrischer Eigenschaften Dead-End Elimination theorem (DEE): Reduktion des Konformations-Suchraums bei flexiblem Docking Protein Docking mit flexiblen Seitenketten

Molecular surface recognition Docking von Molekülen anhand geometrischer Eigenschaften Form von Interfaces im gebundenen und freien Zustand häufig sehr ähnlich Suche im 6-dimensionalen Rotations- und Translationsraum

Repräsentation der Moleküle Projektion der 3D-Koordinaten auf ein Gitter Gitterpunkt innerhalb des Moleküls, wenn Atomkern innerhalb Radius r vorhanden [1] [1]

Matching von Oberflächen (I) Korrelation der geometrischen Form (α, β, γ) gibt die Verschiebung von Molekül b in Bezug auf Molekül a an [1] Kein Kontakt  Korrelation = 0 Kontakt  Korrelation > 0 je besser der Kontakt, desto größer die Korrelation

Matching von Oberflächen (II) Problem: auch Überlappung liefert positive Korrelation Lösung: ρ in Gleichung [2a] << 0 δ in Gleichung [2b] > 0  Überlappung wird mit negativer Korrelation bestraft [1]

Berechnung (I) Direkte Berechnung der Korrelation benötigt Zeit O(N6)  Verwende Fourier Transformation [1] Korrelation wird durch Inverse Fourier-Transformation erhalten  Benötigte Zeit liegt in O(N³ln(N³))

Berechnung (II) Molekül a wird fixiert, Molekül b wird in allen Orientierungen getestet [1]

Resultate Test mit 5 Komplexen, zwei Durchgänge mit unterschiedlichen Gitter-Größen [1] [1] [1]

Vor- und Nachteile Vorteile: Nachteile: Schnelle Berechnung Meistens korrekte Vorhersage Parameter sind universell einsetzbar Nachteile: Starre Moleküle Keine Berücksichtigung physiko-chemischer Eigenschaften

Dead-End Elimination Theorem Konformationsraum von Proteinen sehr groß, selbst bei Verwendung von Rotamer-Bibliotheken Systematische Suche nach der „global minimum energy conformation“ (GMEC) praktisch unmöglich

Energie einer Konformation Potentielle Energie eines Proteins: [2]

„Dead-Ending“ Rotamere Rotamere, die in der GMEC nicht vorkommen können Rotamer ir kann nicht vorkommen, wenn für ein Paar (ir, it) gilt: [2]

Erweiterung auf Rotamerpaare Energie eines Rotamerpaares [irjs] [2] Interaktionsenergie mit anderen Rotameren [2]  Rotamerpaar [irjs] ist „dead-ending“, wenn gilt: [2]

Algorithmus Eliminiere alle Rotamere, die offensichtlich inkompatibel sind Eliminiere „dead-ending“ Rotamere mit dem DEE Theorem Wende DEE Theorem auf alle Rotamerpaare an und markiere „dead-ending“ Paare Iteriere, bis keine weiteren Rotamere mehr entfallen

Resultate (I) Test mit dem Insulin-Dimer anfängliche Kombinationsmöglichkeiten: 2,7*1076 Nach 9 Iterationen: 7200 Modellierung des Proteins liefert 55 richtig vorhergesagte Residuen Verborgene Residuen werden mit 93% Genauigkeit vorhergesagt [2]

Resultate (II) Blind-Test an Limulus polyphemus 194 Aminosäuren, wovon 71 % richtig vorhergesagt wurden Viele Fehler durch falsche Salz- und Wasserstoffbrücken an exponierten Gruppen

Vor- und Nachteile Vorteile: Nachteile: Schnelle Berechnung (Aufwand steigt „nur“ quadratisch mit Anzahl der Aminosäuren) Starke Reduzierung des Suchraums Nachteile: Ungenauigkeiten durch verwendete Energiefunktion Benötigt relativ genaues Template Abhängig von der verwendeten Rotamer-Bibliothek

Protein Docking mit flexiblen Seitenketten Docking von rigiden Strukturen keine gute Lösung Problem des exponentiellen Wachstums des Konformationsraums bei flexiblen Seitenketten

Flexibilität Alle Residuen flexibel behandeln sehr aufwändig selbst bei Verwendung von Rotamer-Bibliotheken  Nur Interface-Residuen flexibel Interface benötigt  Rigides Docking zur Erzeugung von Anfangsstrukturen

Rigides Docking Verwendet geometrische und einfache chemische Fitness Funktionen Von den erzeugten Komplexstrukturen wurden die 60 besten weiter verfolgt Oft große Überlappung der Proteine und inkorrekt platzierte Seitenketten

Bestimmung der Bindungsstelle Residuen, die innerhalb 6 Å eines Atoms des anderen Proteins liegen Seitenketten ohne Rotamere (CYS in Disulfidbrücken, ALA, GLY) werden nicht berücksichtigt

GMEC GMEC = Kombination der Rotamere, die die niedrigste Energie liefern [3]  Anwendung des DEE-Theorems möglich

Suche nach der GMEC Zwei Strategien: Multi-Greedy Methode Branch-and-cut basierend auf einem ILP

Multi-Greedy Methode (I) Aufbau eines Enumerations-Baumes mit möglichen Kombinationen [3]

Integer Linear Program (ILP) Formulierung als Minimierungs-Problem auf einem ungerichteten Graphen Knoten v für alle Rotamere, E(v) = Etplir - Emax Kanten uv für Rotamer-Paare verschiedener Residuen, E(uv) = Epwir,js - Emax  k-partiter Graph mit negativen Kanten- und Knoten-Gewichten  GMEC entspricht Rotamer-Graph mit minimalem Gewicht

ILP (II) [3] [3]

Branch-and-cut Lösen der Relaxation des ILPs  Falls Lösung ā nicht optimal, suche nach fa <= f0, die ā als mögliche Lösung ausschließt Falls keine Ungleichung gefunden wird, aufsplitten in zwei Unterprobleme

Energieberechnung Optimierung der GMEC mit AMBER Freie Bindungsenergie: [3] ΔGES: elektrostatischer Beitrag ΔGcav: freie Cavitäts-Energie in Wasser ΔGconf: Änderung der Entropie ΔGvdW: Änderung der freien van-der-Waals Energie

Algorithmus (I) Generierung von Ausgangsstrukturen mit Hilfe von rigidem Docking Bestimmung der Aminosäuren am Interface Variation dieser Aminosäuren durch Rotamere Iterative Anwendung des DEE Theorems zur Reduktion des Konformationsraumes

Algorithmus (II) Finden der GMEC mit Hilfe der schnellen Heuristic bzw. des exakten branch-and-cut Algorithmus Optimierung der Molekülgeometrien mit Hilfe eines Molekülmechanik Kraftfeldes Berechnung der freien Bindungsenergie

Resultate (I) Test mit drei Protein Komplexen Anwendung des DEE ergibt große Vereinfachung [3]

Resultate (II) [3]

Resultate (III) [3]

Resultate (IV) [3]

Vor- und Nachteile Vorteile: Nachteile: Heuristik liefert schnell gute Annäherung an optimale Lösung Branch-and-cut liefert optimale Rotamere Nachteile: Keine perfekte Trennung von guten und schlechten Ergebnissen Ergebnisse stark von der Wahl des Kraftfeldes abhängig

Zusammenfassung Rigides Docking nur erfolgreich, wenn native und Komplexstruktur sehr ähnlich sind Rigides Docking aber guter Startpunkt für flexibles Docking Dead-End elimination starke Vereinfachung bei flexiblem Docking

Referenzen [1] Katchalski-Katzir, E., Shariv, I., et al., (1992) PNAS, 89, 2195-2199. Molecular Surface Recognition: Determination of Geometric Fit between Proteins and their Ligands by Correlation Techniques [2] Desmet, J., De Maeyer, M., Hazes, B., and Lasters, I., (1992) Nature, 356, 539-542. DEE Theorem and its Use in Protein Side Chain Positioning [3] Althaus, E., Kohlbacher, O., Lenhof, H.-P., and Muller, P., (2002) J. Comput. Biol., 9, 597-612. A Combinatorial Approach to Protein Docking with Flexible Side Chains