Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

6. Vorlesung WS 2006/07Softwarewerkzeuge1 V6: Proteinstrukturvorhersage Bedeutung von Folds. Grundsätzliches zu Struktur – Funktion Beziehung. Definition.

Ähnliche Präsentationen


Präsentation zum Thema: "6. Vorlesung WS 2006/07Softwarewerkzeuge1 V6: Proteinstrukturvorhersage Bedeutung von Folds. Grundsätzliches zu Struktur – Funktion Beziehung. Definition."—  Präsentation transkript:

1 6. Vorlesung WS 2006/07Softwarewerkzeuge1 V6: Proteinstrukturvorhersage Bedeutung von Folds. Grundsätzliches zu Struktur – Funktion Beziehung. Definition von Folds: siehe V5 Structural genomics soll die Strukturen von Proteinen vor allem mit neuen Faltungsmustern (folds) aufklären. V7Homologiemodellierung von Proteinen.

2 6. Vorlesung WS 2006/07Softwarewerkzeuge2 Analyse einer unbekannten Sequenz Suche in Sequenzdatenbanken nach identischer Sequenz bzw. ähnlichen Sequenzen Gibt es ähnliche Sequenz mit bekannter 3D-Struktur? Vorhersage der Sekundärstruktur Kann man Funktion zuordnen? Modellierung der Proteinstruktur durch Homologiemodellierung Ab inito Vorhersage der Tertiärstruktur Zuordnung eines Protein-Folds Multiples Sequenzalignment Input: neue Proteinsequenz Alignment der Sekundärstrukturen. Erkenne Domänen Analyse dieses Folds, Nachbarn? Experimentelle Daten vorhanden? 3D-Proteinstruktur Alignment der Sequenz mit einer Target-Struktur Fold erkannt? Nein Ja Nein Ja Nach Rob Russell, gtsp/flowchart2.html

3 6. Vorlesung WS 2006/07Softwarewerkzeuge3 Integrative Datenbankanalyse Gibt es Faltungsmuster, die es nur in bestimmten phylogenetischen Gruppen gibt? Diese Proteine könnte gute Targets für selektive Inhibitoren sein. Das Ziel von structural genomics könnte sein, die Lücken zwischen den bekannten Regionen zu füllen.

4 6. Vorlesung WS 2006/07Softwarewerkzeuge4 Integrative Datenbankanalyse Integrative database analysis in structural genomics M. Gerstein, Nat. Struct. Biol. 7, 960 (2000) 10 most common folds in yeast genome (= number of gene duplications); table shows ranking according to various measures. It shows how common popular folds in yeast occur in other genomes and in the PDB data base; variety of functions; level of expression. Bestimmte Faltungsmuster kommen in allen Organismen vor!

5 6. Vorlesung WS 2006/07Softwarewerkzeuge5 Beziehung zwischen Fold, Funktion, und WWs Integrative database analysis in structural genomics M. Gerstein, Nat. Struct. Biol. 7, 960 (2000) - die meisten Proteine derselben Proteinfaltung haben dieselbe (oder eine von zwei) Funktionen Kenntnis des folds ermöglicht oft Funktionszuordnung! fold prediction alleine ist bereits sehr wertvoll.

6 6. Vorlesung WS 2006/07Softwarewerkzeuge6 Proteinstrukturmodellierung für Structural Genomics Protein structure modeling for structural genomics. R. Sánchez et al. Nat. Struct. Biol. 7, (2000) Grad an Sequenzidentität zwischen den bekannten Proteinstrukturen und den Proteinen von M. Genitalium. Für 333 von 479 Sequenzen konnte mindestens für ein Stück von 30 Residuen ein Modell erstellt oder ein Fold zugeordnet werden.

7 6. Vorlesung WS 2006/07Softwarewerkzeuge7 Genomweite Strukturmodellierung R. Sánchez et al. Nat. Struct. Biol. 7, (2000) Effekt des Wachstums der PDB- Datenbank auf die Zahl der Protein des Bakteriums M. Genitalium, deren Fold und Struktur im jeweiligen Jahr vorhergesagt werden konnte. Homologie-Modellierung ist nicht aufwendig, dauert pro Struktur nur wenige Minuten. Akkurate Modellierung von Loops und Seitenketten kann jedoch erheblich aufwendiger sein. Grün: Proteine mit Modell oder fold assignment aus PSI-BLAST für mindestens 30 ihrer Residuen. Blau: nur Modell Rot: Anteil der Residuen des Genoms, die in Modell oder fold assignment vorkommen.

8 6. Vorlesung WS 2006/07Softwarewerkzeuge8 Schliesse von Struktur auf Funktion? From structure to function: Approaches and limitations J. M. Thornton et al. Nat. Struct. Biol. 7, 991 (2000)

9 6. Vorlesung WS 2006/07Softwarewerkzeuge9 Faltung homologe Superfamilie Funktion From structure to function: Approaches and limitations J. M. Thornton et al. Nat. Struct. Biol. 7, 991 (2000) Verteilung homologer Superfamilien in CATH Klassifizierung von Proteinstrukturen. Obwohl manche Folds sehr unterschiedliche Funktionen ausüben können, enthalten 556 Folds jeweils nur eine homologe Superfamilie.

10 6. Vorlesung WS 2006/07Softwarewerkzeuge10 Faltung homologe Superfamilie Funktion From structure to function: Approaches and limitations J. M.Thornton et al. Nat. Struct. Biol. 7, 991 (2000) Konservierung von Enzymfunktion (durch EC- Nummer definiert) innerhalb einer homologen Superfamilie ist relativ gut erfüllt. Dennoch gibt es eine Reihe von absoluten Ausnahmen. Ähnlichkeit der Enzymfunktion

11 6. Vorlesung WS 2006/07Softwarewerkzeuge11 Faltung homologe Superfamilie Funktion From structure to function: Approaches and limitations J. M.Thornton et al. Nat. Struct. Biol. 7, 991 (2000) Diversität der Enzymfunktion in der Familie der Typ1- Aspartat-Aminotransferasen: gezeigt sind die verschiedenen EC-Klassifizierungen von Mitgliedern dieser Superfamilie. Dies ist ein Beispiel für eine der wenigen Superfamilien, bei denen die Zuordnung Fold Funktion nicht eindeutig ist.

12 6. Vorlesung WS 2006/07Softwarewerkzeuge12 Aktives Zentrum der Aspartat Proteasen From structure to function: Approaches and limitations J. M.Thornton et al. Nat. Struct. Biol. 7, 991 (2000) Kristallstruktur des menschlichen Pepsins. Beide Domänen steuern Residuen für aktives Zentrum bei.

13 6. Vorlesung WS 2006/07Softwarewerkzeuge13 From structure to function: Approaches and limitations J. M.Thornton et al. Nat. Struct. Biol. 7, 991 (2000) Superposition der Residuen des aktiven Zentrums in 18 unterschiedlichen Aspartat- Protease Proteinfamilien das aktive Zentrum der Aspartat-Protease kann durch die Position von 8 Atomen beschrieben werden. Aktives Zentrum der Aspartat Proteasen

14 6. Vorlesung WS 2006/07Softwarewerkzeuge14 Genomweite Sequenzanalyse bzw. Sequenzvergleich: Auswahl der Target-Proteine Completeness in structural genomics D. Vitkup et al. Nat. Struct. Biol. 8, 559 (2001) Genauigkeit der CASP Proteinstrukturen als Funktion der Sequenzidentität von Ziel und Vorlage. Sobald die Identität unter 30% sinkt, nimmt die Abweichung der Modelle von der korrekten exp. Struktur schnell zu.

15 6. Vorlesung WS 2006/07Softwarewerkzeuge15 Completeness in structural genomics D. Vitkup et al. Nat. Struct. Biol. 8, 559 (2001) Korrektheit von Alignments Die Hauptursache für diesen Effekt sind Fehler im Alignment von Zielprotein und Vorlage. Hier ist der Anteil der korrekt alignierten Residuen gezeigt (bewertet anhand der 3D- Struktur).

16 6. Vorlesung WS 2006/07Softwarewerkzeuge16 Strukturelle Abdeckung der Sequenzdatenbanken Zahl an (Struktur-)Modellen, die korrekt erzeugt werden können als Funktion der Sequenzidentität (x-Achse) und des passenden Sequenzabschnitts (y-Achse). Der rechte-obere Quadrant umfasst 19% aller Proteine in Swissprot+TrEMBL, für die eine zuverlässige Vorlage in der PDB-Datenbank existiert. Completeness in structural genomics D. Vitkup et al. Nat. Struct. Biol. 8, 559 (2001)

17 6. Vorlesung WS 2006/07Softwarewerkzeuge17 Strukturelle Information für gesamte Genome Completeness in structural genomics. Vitkup et al. Nat. Struct. Biol. 8, 559 (2001)

18 6. Vorlesung WS 2006/07Softwarewerkzeuge18 Strukturelle Abdeckung der ras-Proteinfamilie Completeness in structural Genomics. D. Vitkup et al. Nat. Struct. Biol. 8, 559 (2001) Ras-Proteine in Hefe. Der Abstand zwischen den Proteinen entspricht 100% - Sequenzidentität. Mit 1 Struktur (YPT6) kann man alle Proteine aufgrund von 20% Identität modellieren (grüner Kreis), mit 5 Strukturen alle mit 30% Identität (rote Kreise).

19 6. Vorlesung WS 2006/07Softwarewerkzeuge19 Wie viele Proteinstrukturen werden benötigt? Geplante Modellierung aller Nichtmembran- proteine. Completeness in structural Genomics. D. Vitkup et al. Nat. Struct. Biol. 8, 559 (2001)

20 6. Vorlesung WS 2006/07Softwarewerkzeuge20 Wie viele Strukturen werden praktisch benötigt? Wie gut ist die strukturelle Abdeckung, wenn man Erfolgsraten von 100% (1:1) bis runter zu 10% (1:10) für die Kristallisationsprojekte ansetzt? Man kann auch für geringere Erfolgsraten eine ähnlich gute Abdeckung erwarten! Completeness in structural Genomics. D. Vitkup et al. Nat. Struct. Biol. 8, 559 (2001)

21 6. Vorlesung WS 2006/07Softwarewerkzeuge21 Blau: optimale Auswahl der Targetproteine Grün: Targetproteine werden zufällig ausgewählt. Man benötigt 7 x mehr Strukturen um 90% Abdeckung zu erreichen. Rot: Auswahl ebenfalls zufällig unter der Bedingung, dass die Ähnlichkeit zu allen anderen Strukturen < 30% liegt. Auswahl der zu kristallisierenden Proteine Completeness in structural Genomics. D. Vitkup et al. Nat. Struct. Biol. 8, 559 (2001)

22 6. Vorlesung WS 2006/07Softwarewerkzeuge22 Genomweite Sequenzanalyse bzw. Sequenzvergleich Etwa die Hälfte aller Sequenzen und damit etwa ein Viertel aller Residuen in bekannten Genomen kann einer der 2000 bekannten Pfam Proteinfamilien zugeordnet werden. Daher erwarten wir ca Proteinfamilien. Für die strukturelle Abdeckung der 2000 bekannten Proteinfamilien zu 90% sind etwa 4000 Proteinstrukturen notwendig. Damit sind bei optimaler Auswahl der Targetproteine Strukturbestim- mungen notwendig. Completeness in structural Genomics. D. Vitkup et al. Nat. Struct. Biol. 8, 559 (2001)

23 6. Vorlesung WS 2006/07Softwarewerkzeuge23 Bryngelson, Wolynes, PNAS (1987) Gradient Rauhigkeit beschleunigtbremstFaltung Frustration New view of protein folding: Faltung entlang trichterähnlichen Energielandschaften Brooks, Gruebele, Onuchic, Wolynes, PNAS 95, (1998)

24 6. Vorlesung WS 2006/07Softwarewerkzeuge24 Simulation des Faltungsprozesses Wie lang dauert Proteinfaltung? Welche Zeitskala können MD-Simulationen abdecken? Kann man einen Protein-Faltungsprozess simulieren?

25 6. Vorlesung WS 2006/07Softwarewerkzeuge25 Faltungs-Simulationen Kann man einen Faltungsprozess mit MD-Simulationen simulieren? s Simulation der 36-Residuen des Villin-Fragments exp. Faltungszeit: zwischen 10 – 100 s, T m = 70 C - enthält 3 kurze Helices (NMR), die durch Loop und Schleife verbunden sind - dicht gepackter hydrophober Kern 4 Monate CPU Zeit auf 256 Prozessor Cray T3D und T3E

26 6. Vorlesung WS 2006/07Softwarewerkzeuge26 Faltung des Villin-Fragments entfaltetteilweise gefaltet native Strukturen Duan & Kollman, Science 282, 740 (1998) Vergleich der nativen Struktur (rot) und des stabilsten clusters (blau)

27 6. Vorlesung WS 2006/07Softwarewerkzeuge27 Faltung des Villin-Fragments (A) relativer Helix-Anteil(C) Gyrationsradius und RMSD von nativer Struktur (B) relativer nativer Anteil(D) freie Solvatationsenergie (Eisenberg-Parameter) Duan & Kollman, Science 282, 740 (1998)

28 6. Vorlesung WS 2006/07Softwarewerkzeuge28 Zusammenfassung - Proteinstruktur ist Schlüssel zum Verständnis mechanistischer Details der Proteinfunktion - ab initio Vorhersage der Proteinstruktur durch Faltungssimulationen ist noch sehr problematisch; funktioniert nur für kurze Proteine

29 6. Vorlesung WS 2006/07Softwarewerkzeuge29 zusätzliche Folien

30 6. Vorlesung WS 2006/07Softwarewerkzeuge30 Fold Optimierung Einfache Gittermodelle (HP-Modelle) –Zwei Sorten von Seitenketten: hydrophob und polar –2-D oder 3-D Gitter –Treibende Kräfte: hydrophober Kollaps – es ist günstig, Kontakte zwischen hydropoben Seitenketten zu bilden –Bewertung = Anzahl an H H Kontakten

31 6. Vorlesung WS 2006/07Softwarewerkzeuge31 HP-Gittermodelle Ken Dill ~ 1997 Vorteil solch einfacher Modelle: man kann den Konformationsraum systematisch absuchen.


Herunterladen ppt "6. Vorlesung WS 2006/07Softwarewerkzeuge1 V6: Proteinstrukturvorhersage Bedeutung von Folds. Grundsätzliches zu Struktur – Funktion Beziehung. Definition."

Ähnliche Präsentationen


Google-Anzeigen