Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker.

Ähnliche Präsentationen


Präsentation zum Thema: "Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker."—  Präsentation transkript:

1 Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

2 2 Übersicht Molecular surface recognition: Molecular surface recognition: Docking von starren Proteinen und Liganden mit Hilfe von Korrelation geometrischer Eigenschaften Docking von starren Proteinen und Liganden mit Hilfe von Korrelation geometrischer Eigenschaften Dead-End Elimination theorem (DEE): Dead-End Elimination theorem (DEE): Reduktion des Konformations-Suchraums bei flexiblem Docking Reduktion des Konformations-Suchraums bei flexiblem Docking Protein Docking mit flexiblen Seitenketten Protein Docking mit flexiblen Seitenketten

3 3 Molecular surface recognition Docking von Molekülen anhand geometrischer Eigenschaften Docking von Molekülen anhand geometrischer Eigenschaften Form von Interfaces im gebundenen und freien Zustand häufig sehr ähnlich Form von Interfaces im gebundenen und freien Zustand häufig sehr ähnlich Suche im 6-dimensionalen Rotations- und Translationsraum Suche im 6-dimensionalen Rotations- und Translationsraum

4 4 Repräsentation der Moleküle Projektion der 3D- Koordinaten auf ein Gitter Projektion der 3D- Koordinaten auf ein Gitter Gitterpunkt innerhalb des Moleküls, wenn Atomkern innerhalb Radius r vorhanden Gitterpunkt innerhalb des Moleküls, wenn Atomkern innerhalb Radius r vorhanden [1]

5 5 Matching von Oberflächen (I) Korrelation der geometrischen Form Korrelation der geometrischen Form (α, β, γ) gibt die Verschiebung von Molekül b in Bezug auf Molekül a an (α, β, γ) gibt die Verschiebung von Molekül b in Bezug auf Molekül a an [1] Kein Kontakt Korrelation = 0 Kein Kontakt Korrelation = 0 Kontakt Korrelation > 0 Kontakt Korrelation > 0 je besser der Kontakt, desto größer die Korrelation

6 6 Matching von Oberflächen (II) Problem: auch Überlappung liefert positive Korrelation Problem: auch Überlappung liefert positive Korrelation Lösung: Lösung: ρ in Gleichung [2a] << 0 ρ in Gleichung [2a] << 0 δ in Gleichung [2b] > 0 δ in Gleichung [2b] > 0 Überlappung wird mit Überlappung wird mit negativer Korrelation bestraft [1]

7 7 Berechnung (I) Direkte Berechnung der Korrelation benötigt Zeit O(N 6 ) Direkte Berechnung der Korrelation benötigt Zeit O(N 6 ) Verwende Fourier Transformation Verwende Fourier Transformation Korrelation wird durch Inverse Fourier- Transformation erhalten Korrelation wird durch Inverse Fourier- Transformation erhalten [1] Benötigte Zeit liegt in O(N³ln(N³)) Benötigte Zeit liegt in O(N³ln(N³))

8 8 Berechnung (II) Molekül a wird fixiert, Molekül b wird in allen Orientierungen getestet Molekül a wird fixiert, Molekül b wird in allen Orientierungen getestet [1]

9 9 Resultate Test mit 5 Komplexen, zwei Durchgänge mit unterschiedlichen Gitter-Größen Test mit 5 Komplexen, zwei Durchgänge mit unterschiedlichen Gitter-Größen [1]

10 10 Vor- und Nachteile Vorteile: Vorteile: Schnelle Berechnung Schnelle Berechnung Meistens korrekte Vorhersage Meistens korrekte Vorhersage Parameter sind universell einsetzbar Parameter sind universell einsetzbar Nachteile: Nachteile: Starre Moleküle Starre Moleküle Keine Berücksichtigung physiko-chemischer Eigenschaften Keine Berücksichtigung physiko-chemischer Eigenschaften

11 11 Dead-End Elimination Theorem Konformationsraum von Proteinen sehr groß, selbst bei Verwendung von Rotamer- Bibliotheken Konformationsraum von Proteinen sehr groß, selbst bei Verwendung von Rotamer- Bibliotheken Systematische Suche nach der global minimum energy conformation (GMEC) praktisch unmöglich Systematische Suche nach der global minimum energy conformation (GMEC) praktisch unmöglich

12 12 Energie einer Konformation Potentielle Energie eines Proteins: Potentielle Energie eines Proteins: [2]

13 13 Dead-Ending Rotamere Rotamere, die in der GMEC nicht vorkommen können Rotamere, die in der GMEC nicht vorkommen können Rotamer i r kann nicht vorkommen, wenn für ein Paar (i r, i t ) gilt: Rotamer i r kann nicht vorkommen, wenn für ein Paar (i r, i t ) gilt: [2]

14 14 Erweiterung auf Rotamerpaare Energie eines Rotamerpaares [i r j s ] Energie eines Rotamerpaares [i r j s ] Interaktionsenergie mit anderen Rotameren Interaktionsenergie mit anderen Rotameren Rotamerpaar [i r j s ] ist dead-ending, wenn gilt: Rotamerpaar [i r j s ] ist dead-ending, wenn gilt: [2]

15 15 Algorithmus Eliminiere alle Rotamere, die offensichtlich inkompatibel sind Eliminiere alle Rotamere, die offensichtlich inkompatibel sind Eliminiere dead-ending Rotamere mit dem DEE Theorem Eliminiere dead-ending Rotamere mit dem DEE Theorem Wende DEE Theorem auf alle Rotamerpaare an und markiere dead-ending Paare Wende DEE Theorem auf alle Rotamerpaare an und markiere dead-ending Paare Iteriere, bis keine weiteren Rotamere mehr entfallen Iteriere, bis keine weiteren Rotamere mehr entfallen

16 16 Resultate (I) Test mit dem Insulin-Dimer Test mit dem Insulin-Dimer anfängliche Kombinationsmöglichkeiten: 2,7*10 76 anfängliche Kombinationsmöglichkeiten: 2,7*10 76 Nach 9 Iterationen: 7200 Nach 9 Iterationen: 7200 Modellierung des Proteins liefert 55 richtig vorhergesagte Residuen Modellierung des Proteins liefert 55 richtig vorhergesagte Residuen Verborgene Residuen werden mit 93% Genauigkeit vorhergesagt Verborgene Residuen werden mit 93% Genauigkeit vorhergesagt [2]

17 17 Resultate (II) Blind-Test an Limulus polyphemus Blind-Test an Limulus polyphemus 194 Aminosäuren, wovon 71 % richtig vorhergesagt wurden 194 Aminosäuren, wovon 71 % richtig vorhergesagt wurden Viele Fehler durch falsche Salz- und Wasserstoffbrücken an exponierten Gruppen Viele Fehler durch falsche Salz- und Wasserstoffbrücken an exponierten Gruppen

18 18 Vor- und Nachteile Vorteile: Vorteile: Schnelle Berechnung (Aufwand steigt nur quadratisch mit Anzahl der Aminosäuren) Schnelle Berechnung (Aufwand steigt nur quadratisch mit Anzahl der Aminosäuren) Starke Reduzierung des Suchraums Starke Reduzierung des Suchraums Nachteile: Nachteile: Ungenauigkeiten durch verwendete Energiefunktion Ungenauigkeiten durch verwendete Energiefunktion Benötigt relativ genaues Template Benötigt relativ genaues Template Abhängig von der verwendeten Rotamer-Bibliothek Abhängig von der verwendeten Rotamer-Bibliothek

19 19 Protein Docking mit flexiblen Seitenketten Docking von rigiden Strukturen keine gute Lösung Docking von rigiden Strukturen keine gute Lösung Problem des exponentiellen Wachstums des Konformationsraums bei flexiblen Seitenketten Problem des exponentiellen Wachstums des Konformationsraums bei flexiblen Seitenketten

20 20 Flexibilität Alle Residuen flexibel behandeln sehr aufwändig selbst bei Verwendung von Rotamer- Bibliotheken Alle Residuen flexibel behandeln sehr aufwändig selbst bei Verwendung von Rotamer- Bibliotheken Nur Interface-Residuen flexibel Nur Interface-Residuen flexibel Interface benötigt Interface benötigt Rigides Docking zur Erzeugung von Anfangsstrukturen Rigides Docking zur Erzeugung von Anfangsstrukturen

21 21 Rigides Docking Verwendet geometrische und einfache chemische Fitness Funktionen Verwendet geometrische und einfache chemische Fitness Funktionen Von den erzeugten Komplexstrukturen wurden die 60 besten weiter verfolgt Von den erzeugten Komplexstrukturen wurden die 60 besten weiter verfolgt Oft große Überlappung der Proteine und inkorrekt platzierte Seitenketten Oft große Überlappung der Proteine und inkorrekt platzierte Seitenketten

22 22 Bestimmung der Bindungsstelle Residuen, die innerhalb 6 Å eines Atoms des anderen Proteins liegen Residuen, die innerhalb 6 Å eines Atoms des anderen Proteins liegen Seitenketten ohne Rotamere (CYS in Disulfidbrücken, ALA, GLY) werden nicht berücksichtigt Seitenketten ohne Rotamere (CYS in Disulfidbrücken, ALA, GLY) werden nicht berücksichtigt

23 23 GMEC GMEC = Kombination der Rotamere, die die niedrigste Energie liefern GMEC = Kombination der Rotamere, die die niedrigste Energie liefern Anwendung des DEE-Theorems möglich Anwendung des DEE-Theorems möglich [3]

24 24 Suche nach der GMEC Zwei Strategien: Zwei Strategien: Multi-Greedy Methode Multi-Greedy Methode Branch-and-cut basierend auf einem ILP Branch-and-cut basierend auf einem ILP

25 25 Multi-Greedy Methode (I) Aufbau eines Enumerations-Baumes mit möglichen Kombinationen Aufbau eines Enumerations-Baumes mit möglichen Kombinationen [3]

26 26 Integer Linear Program (ILP) Formulierung als Minimierungs-Problem auf einem ungerichteten Graphen Formulierung als Minimierungs-Problem auf einem ungerichteten Graphen Knoten v für alle Rotamere, E(v) = E tpl ir - E max Knoten v für alle Rotamere, E(v) = E tpl ir - E max Kanten uv für Rotamer-Paare verschiedener Residuen, Kanten uv für Rotamer-Paare verschiedener Residuen, E(uv) = E pw ir,js - E max k-partiter Graph mit negativen Kanten- und Knoten- Gewichten k-partiter Graph mit negativen Kanten- und Knoten- Gewichten GMEC entspricht Rotamer-Graph mit minimalem Gewicht GMEC entspricht Rotamer-Graph mit minimalem Gewicht

27 27 ILP (II) [3]

28 28 Branch-and-cut Lösen der Relaxation des ILPs Lösen der Relaxation des ILPs Falls Lösung ā nicht optimal, suche nach Falls Lösung ā nicht optimal, suche nach fa <= f 0, die ā als mögliche Lösung ausschließt Falls keine Ungleichung gefunden wird, aufsplitten in zwei Unterprobleme Falls keine Ungleichung gefunden wird, aufsplitten in zwei Unterprobleme

29 29 Energieberechnung Optimierung der GMEC mit AMBER Optimierung der GMEC mit AMBER Freie Bindungsenergie: Freie Bindungsenergie: [3] ΔG ES : elektrostatischer Beitrag ΔG ES : elektrostatischer Beitrag ΔG cav : freie Cavitäts-Energie in Wasser ΔG cav : freie Cavitäts-Energie in Wasser ΔG conf : Änderung der Entropie ΔG conf : Änderung der Entropie ΔG vdW : Änderung der freien van-der-Waals Energie ΔG vdW : Änderung der freien van-der-Waals Energie

30 30 Algorithmus (I) Generierung von Ausgangsstrukturen mit Hilfe von rigidem Docking Generierung von Ausgangsstrukturen mit Hilfe von rigidem Docking Bestimmung der Aminosäuren am Interface Bestimmung der Aminosäuren am Interface Variation dieser Aminosäuren durch Rotamere Variation dieser Aminosäuren durch Rotamere Iterative Anwendung des DEE Theorems zur Reduktion des Konformationsraumes Iterative Anwendung des DEE Theorems zur Reduktion des Konformationsraumes

31 31 Algorithmus (II) Finden der GMEC mit Hilfe der schnellen Heuristic bzw. des exakten branch-and-cut Algorithmus Finden der GMEC mit Hilfe der schnellen Heuristic bzw. des exakten branch-and-cut Algorithmus Optimierung der Molekülgeometrien mit Hilfe eines Molekülmechanik Kraftfeldes Optimierung der Molekülgeometrien mit Hilfe eines Molekülmechanik Kraftfeldes Berechnung der freien Bindungsenergie Berechnung der freien Bindungsenergie

32 32 Resultate (I) Test mit drei Protein Komplexen Test mit drei Protein Komplexen Anwendung des DEE ergibt große Vereinfachung Anwendung des DEE ergibt große Vereinfachung [3]

33 33 Resultate (II) [3]

34 34 Resultate (III) [3]

35 35 Resultate (IV) [3]

36 36 Vor- und Nachteile Vorteile: Vorteile: Heuristik liefert schnell gute Annäherung an optimale Lösung Heuristik liefert schnell gute Annäherung an optimale Lösung Branch-and-cut liefert optimale Rotamere Branch-and-cut liefert optimale Rotamere Nachteile: Nachteile: Keine perfekte Trennung von guten und schlechten Ergebnissen Keine perfekte Trennung von guten und schlechten Ergebnissen Ergebnisse stark von der Wahl des Kraftfeldes abhängig Ergebnisse stark von der Wahl des Kraftfeldes abhängig

37 37 Zusammenfassung Rigides Docking nur erfolgreich, wenn native und Komplexstruktur sehr ähnlich sind Rigides Docking nur erfolgreich, wenn native und Komplexstruktur sehr ähnlich sind Rigides Docking aber guter Startpunkt für flexibles Docking Rigides Docking aber guter Startpunkt für flexibles Docking Dead-End elimination starke Vereinfachung bei flexiblem Docking Dead-End elimination starke Vereinfachung bei flexiblem Docking

38 38 Referenzen [1] [1] Katchalski-Katzir, E., Shariv, I., et al., (1992) PNAS, 89, Molecular Surface Recognition: Determination of Geometric Fit between Proteins and their Ligands by Correlation Techniques DEE Theorem and its Use in Protein Side Chain Positioning [2] Desmet, J., De Maeyer, M., Hazes, B., and Lasters, I., (1992) Nature, 356, DEE Theorem and its Use in Protein Side Chain Positioning [3] Althaus, E., Kohlbacher, O., Lenhof, H.-P., and Muller, P., (2002) J. Comput. Biol., 9, A Combinatorial Approach to Protein Docking with Flexible Side Chains


Herunterladen ppt "Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker."

Ähnliche Präsentationen


Google-Anzeigen