6. Vorlesung SS 2009Softwarewerkzeuge1 V6 Homologie-basierte Proteinmodellierung Idee: Sequenzähnlichkeit führt oft zu Ähnlichkeit der 3D-Struktur Lernziele:

Slides:

Advertisements

Ähnliche Präsentationen

Christian Scheideler SS 2009

Advertisements

Punkt-in-Polygon-Verfahren III (R/R+-Baum)

V8 funktionelle Annotation

V6 Homologie-basierte Proteinmodellierung

Polynomial Root Isolation

V8 funktionelle Annotation

Docking von starren und flexiblen Proteinen

SST - Sequence Search Tree

Streuungsmaß 3: absolute Abweichung vom Mittelwert

Die Umwandlung von Chorismat in Prephenat stellt

Kapitel 6: Klassifizierung von Sortiertechniken

Suche in Texten (Stringsuche )

WS 05/06Automatische Akquisition linguistischen Wissens1 Partielles Wissen erweitern 1.Zusammenhang mit bisherigen Algorithmen 2.Vom offensichtlichen zum.

Röntgenographische Phasenanalyse

Übersicht DIALIGN = DIagonal ALIGNment

Klicke Dich mit der linken Maustaste durch das Übungsprogramm!

Heuristiken und Kontexteinflüsse

Theoretical Analysis of Protein-Protein Interactions Proseminar SS 2004.

1 Proseminar Bioinformatik: Theoretical Analysis of Protein-Protein-Interactions Scoring Functions Silke Ruzek 22.Juni.2004.

Seminar: Theoretical Analysis of Protein-Protein Interactions

V7 Homologie-basierte Proteinmodellierung (SwissModel)

V5: Bioinformatische Analyse von Proteinstrukturen

Protein-Protein Bindungsstellen

V6: Proteinstrukturvorhersage

7. Vorlesung WS 2004/05Softwarewerkzeuge1 V7: Aufklärung von Proteinstrukturen in der nahen Zukunft Structural genomics soll die Strukturen von

6. Vorlesung SS 2010Softwarewerkzeuge1 V6 Homologie-basierte Proteinmodellierung Idee: Sequenzähnlichkeit führt oft zu Ähnlichkeit der 3D-Struktur Lernziele:

V5: Proteinstruktur: Sekundärstruktur

Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.

Aminosäure, Peptide und Proteine

Spezifität Warum verwenden Organismen Enzyme als Katalysatoren?

Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation II Vorlesung In welcher Masche liegt der Punkt p?

Struktur und Funktion von Biopolymeren Elmar Lang

Secondary Structure Prediction for Aligned RNA Sequences

Analyse von DNA-Sequenzen

V7: Aufklärung von Proteinstrukturen in der nahen Zukunft

V5: Proteinstruktur: Sekundärstruktur

Statistische Methoden I SS 2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.

§8 Gruppen und Körper (8.1) Definition: Eine Gruppe G ist eine Menge zusammen mit einer Verknüpfung, die jedem Paar (a,b) von Elementen aus G ein weiteres.

Kakuro Regeln und Strategien

Bindungsverhältnisse in Kristallen

Histogramm/empirische Verteilung Verteilungen

Grundgrößen der Lichttechnik

Computational Thinking Online Algorithmen [Was ist es wert, die Zukunft zu kennen?] Kurt Mehlhorn Konstantinos Panagiotou.

Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation II Vorlesung 7 SS 2000 Punkt-in-Polygon-Verfahren I (Trapezkarte)

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Effiziente Algorithmen

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Effiziente Algorithmen

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Effiziente Algorithmen

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Hartmut Klauck Universität Frankfurt SS

Information und Kommunikation Hartmut Klauck Universität Frankfurt SS

Information und Kommunikation Hartmut Klauck Universität Frankfurt SS

Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/

Information und Kommunikation Hartmut Klauck Universität Frankfurt SS

Kapitel 9 Analyse der Modellstruktur Hackl, Einführung in die Ökonometrie 2 Rekursive OLS-Schätzung Spezifiziertes Modell: y = X + u y, u:

… oder wie finde ich den Weg

Chemische Bindungen.

Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.

Multivariate Statistische Verfahren

Statistik – Regression - Korrelation

Aufgabe 1 Ein kleines Protein (siehe Sequenz) wurde mit dem Enzym Trypsin inkubiert. Typsin hydrolysiert Peptidbindungen nach Arginin und Lysin. a. Ordnen.

V6 Homologie-basierte Proteinmodellierung

Gene Prediction Marco Block Jonas Heise Nima Keshvari Michael Schreiber.

Geoinformationssysteme

V6 Homologie-basierte Proteinmodellierung

Präsentation transkript:

6. Vorlesung SS 2009Softwarewerkzeuge1 V6 Homologie-basierte Proteinmodellierung Idee: Sequenzähnlichkeit führt oft zu Ähnlichkeit der 3D-Struktur Lernziele: (1) verstehe, wie Homologiemodelle konstruiert werden (2) wie gut (genau) sind Homologiemodelle? Methode wird aus Zeitgründen (leider) nicht in der Biologen-Übung behandelt.

6. Vorlesung SS 2009Softwarewerkzeuge2 Homologie-basierte Proteinmodellierung (SwissModel) Methode: Wissensbasierter Ansatz. Erfordernis: Mindestens 1 bekannte 3D-Struktur eines verwandten Proteins, Prozedur: finde Proteine bekannter Struktur, die zu Inputsequenz verwandt sind. Erzeugung eines multiplen Sequenzalignments mit der Zielsequenz. Generierung eines Frameworks für die neue Sequenz. Konstruiere fehlende Loops. Vervollständige und korrigiere das Proteinrückgrat. Korrigiere die Seitenketten. Überprüfe die Qualität der modellierten Struktur und deren Packung. Strukturverfeinerung durch Energieminimierung und Moleküldynamik.

6. Vorlesung SS 2009Softwarewerkzeuge3 Twilight Zone Die schwarzen Diamant-Symbole kennzeichnen eine Kurve, die als Twilight Zone bezeichnet wird. Paare von Proteinsequenzen mit größerer Identität als die Kurve haben mit Sicherheit eine ähnliche Struktur. A true positives: Proteinpaare mit ähnlicher Struktur liegen sowohl oberhalb und unterhalb der Kurve, können also hohe oder niedrige Sequenzidentität haben. B: false positives: Strukturen, die keine bzw. wenig Übereinstimmung aufweisen liegen stets unter der Kurve. Rost, Prot. Eng. 12, 85 (1999)

6. Vorlesung SS 2009Softwarewerkzeuge4 Homologie/Komperative Modellierung Protein structure modeling for structural genomics. R. Sánchez et al. Nat. Struct. Biol. 7, (2000) Qualität der Modellierung hängt von Sequenzidentität mit Vorlage ab. Man sollte stets beachten, dass die Vorlage nicht aus der Twilight Zone stammt.

6. Vorlesung SS 2009Softwarewerkzeuge5 Überlagerung der 3D-Strukturen Regionen mit Sequenzähnlichkeit werden automatisch ausgewählt und ihre Residuen in 3D überlagert. Diese erste Auswahl wird weiter verfeinert. SWISS-MODEL.html

6. Vorlesung SS 2009Softwarewerkzeuge6 (a)Für alle Atome, die eine ähnliche Position besitzen und vermutlich eine strukturelle Entsprechung in der neuen Struktur besitzen, werden gemittelte Positionen als Framework-Koordinaten bestimmt. (b)Seitenketten mit völlig inkorrekter Geometrie werden entfernt. (c)Matrix mit Gewichten für lokale Ähnlichkeit. 3D Framework für die neue Sequenz SWISS-MODEL.html

6. Vorlesung SS 2009Softwarewerkzeuge7 Konformationen für strukturell abweichende Loops zu konstruieren, ist ein ernstes Problem bei der vergleichende Modellierung. Seine Lösung ist (noch) offen. Dies gilt nicht nur für lange Loops, in denen zahlreiche Mutationen auftraten, sondern auch für kurze Loops im Fall von Insertionen und Deletionen. Sobald das Alignment von Zielsequenz und der Vorlagesequenz vorliegt, sollte man überprüfen, ob die eingefügten Gaps ausserhalb von Sekundärstrukturelementen in der 3D-Struktur der Vorlage liegen. Ein paar Regeln: - bei sehr kurzen Loops können wir Daten über beta-turns verwenden Konstruktion fehlender Loops

6. Vorlesung SS 2009Softwarewerkzeuge8 Eine Aminosäurekette kann ihre Richtung dadurch umkehren, daß ein reverse turn durch Bildung einer H-Bindung zwischen C=O und H-N gebildet wird. Beta-Turns Wenn dies zwischen zwei antiparallelen beta- Strängen geschieht, nennt man diesen einen beta- Haarnadel (hairpin). Es ergeben sich folgende Diederwinkel: table 1.1 Fig. 1.9 [Tramontano book]

6. Vorlesung SS 2009Softwarewerkzeuge9 Ein paar Regeln: - falls mittellange Loops kompakte Substrukturen bilden, spielt die Ausbildung von Wasserstoffbrücken- bindungen mit den Atomen des Rückgrats die wichtigste Rolle für die Konformation - falls mittellange Loops ausgedehnte Konformationen haben, ist für ihre Stabilisierung meistens eine hydrophobe Seitenkette verantwortlich, die ins Proteininnere zeigt und zwischen die Sekundärstrukturelemente gepackt ist, zwischen denen der Loop liegt. Konstruktion fehlender Loops Fig 4.16 [Tramontano book]

6. Vorlesung SS 2009Softwarewerkzeuge10 Sehr ähnliche Konformation dreier Loops mit unterschiedlicher Sequenz. Zwei Loops enthalten ein cis- Prolin. Die stabilisierenden H- Bindungen werden mit sehr unterschiedlichen Proteingruppen ausgebildet. Konstruktion fehlender Loops Fig 4.17 [Tramontano book]

6. Vorlesung SS 2009Softwarewerkzeuge11 Basierend auf den Verankerungen der Loops (a)wird entweder eine Datenbank bekannter Loopfragmente in der PDB- Datenbank durchsucht. Für den neuen Loop verwendet man dann entweder das am besten passende Fragment oder ein Framework aus den 5 besten Fragmenten. (b)oder es wird der Torsionsraum der Loopresiduen durchsucht - 7 erlaubte Kombinationen der - Winkel - benötigter Raum für den gesamten Loop Konstruktion fehlender Loops SWISS-MODEL.html

6. Vorlesung SS 2009Softwarewerkzeuge12 Rekonstruktion von fehlendem Proteinrückgrat Das Rückgrat wird auf der Grundlage von C -Positionen konstruiert. - 7 Kombinationen der - Winkel sind erlaubt. - Durchsuche Datenbank für Backbone- Fragmente mit Fenster aus 5 Residuen, Verwende die Koordinaten der 3 zentralen Residuen des am besten passenden Fragments.

6. Vorlesung SS 2009Softwarewerkzeuge13 Ponder & Richards (1987): einige Aminosäuren bevorzugen bestimmte Winkel- bereiche für ihre Seitenkettenwinkel Rotamerbibliotheken. Verwende Bibliothek erlaubter Seitenketten-Rotamere geordnet nach der Häufigkeit des Auftretens in der PDB-Datenbank. - Erst werden verdrehte (aber komplette) Seitenketten korrigiert. - fehlende Seitenketten werden aus der Rotamer-Bibliothek ergänzt. Teste dabei, ob van-der-Waals Überlapps auftreten und ob die Torsisonswinkel in erlaubten Bereichen liegen. Konstruktion unvollständiger/fehlender Seitenketten SWISS-MODEL.html

6. Vorlesung SS 2009Softwarewerkzeuge14 Rotamer-Bibliotheken: günstige Diederwinkel Phe, Tyr, His, Trp r1 chi1 chi1-120 chi2 chi2+180 Syn-pentane (N-CA-CB-CG) (C-CA-CB-CG) (CA-CB-CG-XD1) (CA-CB-CG-XD2) interactions g C,XD N,XD C,XD N,XD1 Conformation likely to be near chi2=+90 or -90 Aromatic sidechain chi2's are perturbed by interaction between XD1 and XD2 and backbone N and C. Without perturbation, chi2 would be near +90 or -90. When r1 is trans, interaction between backbone N and XD2 and XD1 at chi2=120 or -60 pushes the average for chi2 to values below 90 or below -90 respectively. Similarly, for r1 of g-, the averages are pushed to values above chi2=90 and chi2=-90 by interactions of N and XD1 and XD2 when chi2 is 60 or For g+ rotamers, interactions at chi2=60 and 120 exert steric conflict about equally, so that chi2 averages 90 degrees.

6. Vorlesung SS 2009Softwarewerkzeuge15 Paarungs-Präferenz von Aminosäuren Bei der Orientierung der Seitenketten wird üblicherweise jede für sich betrachtet (Rotamer-Bibliothek berüchsichtigt zwar die Konformation des Rückgrats, aber nicht die Umgebung). Aminosäuren nehmen jedoch je nach Umgebung unterschiedliche Konformationen ein. Diese Packungseffekte können ebenfalls für komparative Modellierung berücksichtigt werden.

6. Vorlesung SS 2009Softwarewerkzeuge16 Salzbrücken Datenbank für statistische Präferenz für die Orientierung von Aminosäure-Seitenketten in der PDB-Datenbank: sidechains/index.html# Häufigkeit von 1845 Asp-Lys-Kontakte in PDB-Datenbank K

6. Vorlesung SS 2009Softwarewerkzeuge17 -stacking von aromatischen Ringen Aromatische Ringe (z.B. Phenol, Benzol, Seitenketten von Tyrosin, Phenylalanin, Tryptophan, Histidin …) besitzen delokalisiertes Elektronensystem ausserhalb der Ringebene. Mehrere dieser Ringe packen gerne aufeinander bzw. senkrecht zueinander. Cluster Phe-Tyr14

6. Vorlesung SS 2009Softwarewerkzeuge18 Kationen- -Wechselwirkung Die gleichen aromatischen Ringe wechselwirken gerne senkrecht zur Ringebene mit positiv geladenen Gruppen. Beispiele: Acetylcholin in Bindungstasche von Acetylcholinesterase K Tyr-Lys Cluster 6 Bevorzugte Geometrien für die Wechselwirkung von Trimethyl- Ammoniumgruppen mit Phenyl- Ringen Gohlke & Klebe, JMB 2000

6. Vorlesung SS 2009Softwarewerkzeuge19 Kationen- -Wechselwirkung Wechselwirkung der positiv geladenen Guanidinium-Gruppe von Arg mit dem -Elektronensystem von His. Fast immer planare Packung. Nur in Cluster 3 Ausbildung einer Wasserstoffbrücke N-H … N 1234 K

6. Vorlesung SS 2009Softwarewerkzeuge20 Überprüfe die Qualität der 3D-Modelle Analysiere 3D-Umgebung jeder Seitenkette. Dies erlaubt die Identifizierung mißgefalteter Regionen. WHATCHECK überprüft auch die Packungsdichte In diesem Beispiel bedeuten Werte < -1.3 ungewöhnliche Packung.

6. Vorlesung SS 2009Softwarewerkzeuge21 Berechne, welche Bereiche des Proteins für eine kleine Probe zugänglich sind (Connolly-Oberfläche bzw. Kubisches Gitter). Algorithmus entdeckt Oberflächen innerhalb und ausserhalb des Proteins. Der Vergleich von Grösse und Verteilung von internen Cavities zwischen Modell und Kristallstruktur-Vorlage erlaubt es, Fehler im Modell aufzuspüren. Analyse der Packungsdichte eines atomaren Modells SWISS-MODEL.html

6. Vorlesung SS 2009Softwarewerkzeuge22 Bewertung der Qualität eines Homologiemodells 1. Allgemeine Gesichtspunkte Ein Modell wird als falsch angesehen, wenn mindestens eines seiner strukturellen Elemente gegenüber dem Rest des Modells falsch angeordnet ist. Dies kann durch ein falsches Sequenzalignment entstehen. Das Modell kann dennoch korrekte Stereochemie besitzen. Man kann ein Modell als ungenau ansehen wenn seine atomare Koordinaten mehr als 0.5 Å von einer experimentellen Kontrollstruktur abweichen. Ungenauigkeiten können auch in der Stereochemie (Bindungslängen und – winkel auftreten). Dies kann leicht mit WhatCheck überprüft werden. Statistische Paarpotentiale für die Verteilung von Aminosäuren in bekannten Proteinen erlauben manchmal die Aufspürung von fehlerhaften Modellen.

6. Vorlesung SS 2009Softwarewerkzeuge23 2. Fehlerquellen Die Qualität eines Modells hängt von 2 Kriterien ab 1Seine Korrektheit hängt von der Qualität des Sequenzalignments ab. 2Seine Genauigkeit wird durch seine Abweichung von einer (zukünftig zu bestimmenden) experimentellen Struktur bestimmt. Strukturelle Abweichungen haben 2 Ursachen - der inherente Fehler der Modellierungsprozedur - durch Umgebung und Methoden der Datenerfassung bewirkte Variationen der experimentellen Strukturen, die als Vorlage verwendet werden. Ein durch komparative Methoden abgeleitetes Protein-Modell kann nicht genauer sein als der Unterschied zwischen einer NMR-Struktur und einer Kristallstruktur desselben Proteins.

6. Vorlesung SS 2009Softwarewerkzeuge24 3 Proteinkern und Loops Fast jedes Proteinmodell enthält nicht-konservierte Loops, die als die am wenigsten zuverlässigen Teile des Proteinmodells angesehen werden können. Andererseits sind diese Bereiche der Struktur oft auch am flexibelsten – hohe Temperaturfaktoren in Kristallstrukturen oder hohe Unterschiede zwischen verschiedenen (gleichsam gültigen) NMR-Strukturen. Die Residuen im Proteinkern werden gewöhnlich fast in der identischen Orientierung wie in experimentellen Kontrollstrukturen modelliert. Residuen an der Proteinoberfläche zeigen grössere Abweichungen.

6. Vorlesung SS 2009Softwarewerkzeuge25 Einordnung von Proteinmodellen in 3 Kategorien 1Modelle, die auf falschen Alignments zwischen Vorlage und Zielprotein basieren. Strategie: konstruiere mehrere Modelle für unterschiedliche Alignments. Wähle das am besten erscheinende Modell. 2Modelle, die auf korrekten Alignments beruhen, können für zielgerichtete Mutagenese-Experimente hilfreich sein. Sind oft nicht zuverlässig genug für detaillierte Untersuchung von Ligandenbindung. 3Modelle, die auf einer hohen Sequenzidentität (> 70%) mit der Vorlage beruhen. Solche Modelle können in Drug Design Projekten verwendet werden. Fehler sind jedoch immer, also auch bei sehr hoher Identität möglich.

6. Vorlesung SS 2009Softwarewerkzeuge26 Vergleich zweier Strukturen: RMSD Root mean square deviation: Man vergleicht zwei Proteinstrukturen 1 und 2 durch die Berechnung des mittleren quadratischen Abstands der Koordinaten der n sich entsprechenden Atome. Dann nimmt man noch die Wurzel daraus. Werte unterhalb von 0.2 nm oder 2 Å kennzeichnen eine hohe strukturelle Ähnlichkeit. Zum Vergleich: die Länge einer C-C Bindung beträgt 0.15 nm. Die Distanzen aller Atome weichen also höchstens etwa um eine Bindungslänge voneinander ab.

6. Vorlesung SS 2009Softwarewerkzeuge27 Test für die Zuverlässigkeit von SwissModell 3DCrunch-Projekt von Expasy zusammen mit SGI. Idee: Generiere Homologie-Modelle für Proteine mit bekannter 3D-Struktur um zu überprüfen, wie genau die mit Homologie-Modellierung erzeugten Strukturmodelle sind. Die Vorlagen besaßen 25 – 95 % Sequenzidentität mit dem Zielprotein Kontrolle-Modelle wurden erstellt. Grad der Identität [%]Modell innerhalb von x Å RMSD zur Vorlage /SWISS-MODEL.html

6. Vorlesung SS 2009Softwarewerkzeuge28 Zusammenfassung – Homologiemodellierung Gemeinsamer Kern von Proteinen mit 50% Sequenzidentität besitzt ca. 1 Å RMSD Dies gilt sogar für absolute identische Sequenzen. Der zuverlässigste Teil eines Proteinmodells ist der Sequenzabschnitt, den es mit der Vorlage gemeinsam hat. Die größten Abweichungen liegen in den konstruierten Schleifen. Die Wahl der Modellvorlage ist entscheidend! Die An- oder Abwesenheit von Ko-faktoren, anderen Untereinheiten oder Substraten kann Proteinkonformation sehr beeinflussen und somit alle Modelle, die von ihnen abgeleitet werden. Jeder Fehler im Alignment produziert falsche Modelle! Solche Alignment-Fehler treten bei Sequenzidentität unter 40% auf.

6. Vorlesung SS 2009Softwarewerkzeuge29 Zusätzliche Folien

6. Vorlesung SS 2009Softwarewerkzeuge30 Modellierung von Proteinstrukturen Protein structure modeling for structural genomics. R. Sánchez et al. Nat. Struct. Biol. 7, (2000)

6. Vorlesung SS 2009Softwarewerkzeuge31 Methode zur Fold-Erkennung: Threading Gegeben: –Sequenz: IVACIVSTEYDVMKAAR… –Ein Datenbank von möglichen Proteinstrukturen (folds) Bilde die Sequenz auf jeden fold ab Starte dabei bei jeder möglichen Position Bestimme anhand einer energetischen Bewertungsfunktion, welcher Fold am besten zu dieser Sequenz passt.