V6: Bioinformatische Analyse von Proteinstrukturen

Slides:



Advertisements
Ähnliche Präsentationen
Relative Clauses.
Advertisements

Geometrische Datenstrukturen Haozhe Chen Aaron Richardson.
Enthalpie, freie Enthalpie, freie Energie
Die Schulregeln (the school rules) Kein Graffiti in der Schule!
Aminosäuren bilden: Peptidbindungen
Peter Marwedel TU Dortmund, Informatik 12
Übersicht DIALIGN = DIagonal ALIGNment
1. Vorlesung WS 2006/07 Software-Werkzeuge der Bioinformatik1 Softwarewerkzeuge der Bioinformatik Inhalt dieser Veranstaltung: Softwarewerkzeuge kennenlernen.
Seminar: Theoretical Analysis of Protein-Protein Interactions
V5: Bioinformatische Analyse von Proteinstrukturen
V6: Proteinstrukturvorhersage
7. Vorlesung WS 2004/05Softwarewerkzeuge1 V7: Aufklärung von Proteinstrukturen in der nahen Zukunft Structural genomics soll die Strukturen von
6. Vorlesung SS 2010Softwarewerkzeuge1 V6 Homologie-basierte Proteinmodellierung Idee: Sequenzähnlichkeit führt oft zu Ähnlichkeit der 3D-Struktur Lernziele:
V5: Proteinstruktur: Sekundärstruktur
Aminosäure, Peptide und Proteine
Enzymbestandteile.
V5: Proteinstruktur: Sekundärstruktur
V5: Proteinstruktur: Sekundärstruktur
Abkürzungen mit Präpositionen German Prepositional Contractions
Präsentation Proteine/Eiweiße
What do you see? Looks like President Clinton and Vice President Gore, right? Wrong... It's Clinton's face twice, with two different haircuts.
Montag den 16.Dezember Lernziel: To begin stage 2 of preparation for speaking assessment.
You need to use your mouse to see this presentation © Heidi Behrens.
TEST - RECAP PRESENT PERFECT TENSE
VL Algorithmische BioInformatik (19710)
6.5 Eiweiße = Proteine.
Universität StuttgartInstitut für Wasserbau, Lehrstuhl für Hydrologie und Geohydrologie Copulas (1) András Bárdossy IWS Universität Stuttgart.
Coordinating Conjunctions Why we need them & how to use them deutschdrang.com.
Qualitätssicherung von Software Prof. Dr. Holger Schlingloff Humboldt-Universität zu Berlin und Fraunhofer FIRST.
Institut für Angewandte Mikroelektronik und Datentechnik Phase 5 Architectural impact on ASIC and FPGA Nils Büscher Selected Topics in VLSI Design (Module.
Noch mehr Funktionen Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg,
Mein Arbeitspraktikum. Today we are learning to talk about work experience we have done, giving facts, details and opinions The bigger picture: We are.
V7 Modellierung von biomolekularen Komplexen Protein-Protein-Docking Protein-DNA-Komplexe 7. Vorlesung WS 14/15Softwarewerkzeuge1.
Jonathan Harrington: "Die phonetischen Grundlagen des Lautwandels“
Synchronization: Multiversion Concurrency Control
Dr.-Ing. René Marklein - EFT I - WS 06/07 - Lecture 11 / Vorlesung 11 1 Elektromagnetische Feldtheorie I (EFT I) / Electromagnetic Field Theory I (EFT.
Stephanie Müller, Rechtswissenschaftliches Institut, Universität Zürich, Rämistrasse 74/17, 8001 Zürich, Criminal liability.
Literary Machines, zusammengestellt für ::COLLABOR:: von H. Mittendorfer Literary MACHINES 1980 bis 1987, by Theodor Holm NELSON ISBN
Welcome to Web Services & Grid Computing Jens Mache
Proteins Lennart Voß Marie Ullrich. 1. Central questions What are proteins? How does the human body produce proteins? Which functions do proteins fulfill?
GERMAN WORD ORDER ORDER s. Sentences are made up by placing a variety of words in a specific order. If the order is wrong, the sentence is difficult to.
Magnetenzephalogramm, MEG
Gregor Graf Oracle Portal (Part of the Oracle Application Server 9i) Gregor Graf (2001,2002)
Kapitel 4 Grammar INDEX 1.Ordinal Numbers 2.Relative Pronouns and Relative Clauses 3.Conditional Sentences 4.Posessive: Genitive Case.
Kapitel 2 Grammar INDEX 1.Subjects & Verbs 2.Conjugation of Verbs 3.Subject Verb Agreement 4.Person and Number 5.Present Tense 6.Word Order: Position of.
Kapitel 7 Grammar INDEX 1.Comparison 2.Adjectives 3.Adjective Endings Following Ein-Words.
Memorisation techniques
Kapitel 8 Grammar INDEX 1.Command Forms: The Du-Command Form & Ihr- Command 2.Sentences & Clauses.
Biologie Cytologie GSG
Kapitel 9 Grammar INDEX 1.Formal Sie- Command 2.There Is/There Are 3.Negation: Nicht/Klein.
1. Halbjahr 2016 Englisch am Abend (A2-2) A, Do, – Uhr Quiz – “The Hot Chair” Unit 7, 21 April 2016.
Word order: 1.In a main clause the VERB is the second idea: Helgakommteben aus der Bäckerei This may not be the second word Meiner Meinung nachsind Hobbys.
Proteine Proteine sind die eigentlichen "Arbeitstiere" der Zelle. Beispiele: Enzyme, Strukturproteine, Regulatoren der Genexpression Proteine bestehen.
B LOCKED DAY 1 OBJECTIVES: To consolidate vocabulary and structures within the theme of DIE UMWELT To further practise the techniques used in the prose.
Essay structure Example: Die fetten Jahre sind vorbei: Was passiert auf der Almhütte? Welche Bedeutung hat sie für jede der vier Personen? Intro: One or.
Interrogatives and Verbs
Sentence Structure Questions
„Unsere Kompetenz – Ihr Nutzen.“
Volume 1, Chapter 8.
Sentence Structure Connectives
Process and Impact of Re-Inspection in NRW
Dynamisch und mit Funk Samstag, 22. September 2018 Lernziele
CERN – TUD – GSI Webmeeting
Uranus. Uranus is the seventh in terms of distance from the Sun, the third in diameter and the fourth in mass of the planet of the Solar System. It was.
What do you see? Looks like President Clinton and Vice President Gore, right? Wrong... It's Clinton's face twice, with two different haircuts.
School supplies.
Zhunussova G., AA 81. Linguistic communication, i.e. the use of language, is characteristically vocal and verbal behaviour, involving the use of discrete.
 Präsentation transkript:

V6: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk Hierarchischer Aufbau der Proteinstruktur Klassifikation von Proteinstrukturen

Funktion von Proteinen Strukturproteine (Hüllenproteine von Viren, Cytoskelett) Enzyme, die chemische Reaktionen katalysieren Transport- und Speicheproteine (Hämoglobin) Regulatoren wie Hormone und Rezeptoren/Signalübertragungsproteine Proteine, die die Transkription kontrollieren oder an Erkennungsvorgängen beteiligt sind: Zelladhäsionsproteine, Antikörper

Warum sind Proteine so groß? Proteine sind große Moleküle. Ihre Funktion ist oft in einem kleinen Teil der Struktur, dem aktiven Zentrum, lokalisiert. Der Rest? Korrekte Orientierung der Aminosäuren des aktiven Zentrums Bindungsstellen für Interaktionspartner Konformationelle Dynamik Evolution der Proteine: Veränderungen der Struktur, die durch Mutationen in ihrer Aminosäuresequenz hervorgerufen werden.

Hierarchischer Aufbau Primärstruktur – Sekundärstruktur – Tertiärstruktur – Quartärnere Struktur – Komplexe Welche „Kräfte“ sind für die Ausbildung der verschiedenen „Strukturen“ wichtig?

Einleitung: Aminosäuren Aminosäuren sind die Bausteine von Proteinen: Aminogruppe Carboxylsäure Aminosäuren unterscheiden sich hinsichtlich ihrer Größe elektrischen Ladung Polarität Form und Steifigkeit 1

Einleitung: hydrophobe Aminosäuren Proteine sind aus 20 verschiedenen natürlichen Aminosäuren aufgebaut 5 sind hydrophob. Sie sind vor allem Im Proteininneren. 1

Einleitung: aromatische Aminosäuren Es gibt drei voluminöse aromatische Aminosäuren. Tyrosin und Tryptophan liegen bei Membranproteinen vor allem in der Interface-region. 1

Einleitung: Aminosäuren Es gibt 2 Schwefel enthaltende Aminosäuren und das ungewöhnliche Prolin. Cysteine können Disulfidbrücken bilden. Prolin ist ein “Helixbrecher”. 1

Einleitung: Aminosäuren Es gibt zwei Aminosäuren mit terminalen polaren Hydroxlgruppen: 1

Einleitung: Aminosäuren Es gibt 3 positiv geladene Aminosäuren. Sie liegen vor allem auf der Proteinoberflächen und in aktiven Zentren. Thermophile Organismen besitzen besonders viele Ionenpaare auf den Protein-oberflächen. 1

Einleitung: Aminosäuren Es gibt 2 negativ geladene Aminosäuren und ihre zwei neutralen Analoga. Asp und Glu haben pKa Werte von 2.8. Das heisst, erst unterhalb von pH=2.8 werden ihre Carboxylgruppe protoniert. 1

Buchstaben-Code der Aminosäuren Ein- und Drei-Buchstaben-Codes der Aminosäuren G Glycin Gly P Prolin Pro A Alanin Ala V Valin Val L Leucin Leu I Isoleucin Ile M Methionin Met C Cystein Cys F Phenylalanin Phe Y Tyrosin Tyr W Tryptophan Trp H Histidin His K Lysin Lys R Arginin Arg Q Glutamin Gln N Asparagin Asn E Glutaminsäure Glu D Asparaginsäure Asp S Serin Ser T Threonin Thr Zusätzliche Codes B Asn/Asp Z Gln/Glu X Irgendeine Aminosäure Kenntnis dieser Abkürzungen ist essentiell für Sequenzalignments und für Proteinstrukturanalyse!

Einleitung: Peptidbindung In Peptiden und Proteinen sind die Aminosäuren miteinander als lange Ketten verknüpft. Ein Paar ist jeweils über eine „Peptidbindung“ verknüpft. Die Aminosäuresequenz eines Proteins bestimmt seinen „genetischen code“. Die Kenntnis der Sequenz eines Proteins allein verrät noch nicht viel über seine Funktion. Entscheidend ist seine drei-dimensionale Struktur. 1

Eigenschaften der Peptidbindung E.J. Corey und Linus Pauling studierten die Petidbindung in den 1940‘ern und 1950‘ern. Sie fanden: die C-N Länge ist 1.33 Å. Sie liegt damit zwischen 1.52 Å und 1.25 Å, was die Werte für eine Einfach- bzw. Doppelbindung sind. Die benachbarte C=O Bindung hat eine Länge Von 1.24 Å, was etwas länger als eine typische Carbonyl- C=O Doppelbindung ist (1.215 Å). die Peptidbindung hat einen teilweise konjugierten Charakter und ist nicht frei drehbar. Es bleiben damit pro Residue 2 frei drehbare Diederwinkel des Proteinrückgrats übrig. Linus Pauling Nobelpreise für Chemie 1954 und Frieden 1963 1

Supersekundärstrukturen -Helix -Haarnadel -Element Lesk-Buch

Einleitung: Sekundärstrukturelemente Wie seit den 1950‘er Jahren bekannt, können Aminosäure-Stränge Sekundärstrukturelemente bilden: (aus Stryer, Biochemistry) -Helices und -Stränge. In diesen Konformationen bilden sich jeweils Wasserstoffbrückenbindungen zwischen den C=O und N-H Atomen des Rückgrats. Daher sind diese Einheiten strukturell stabil. 1

Diederwinkel des Proteinrückgrats Die dreidimensionale Faltung des Proteins wird vor allem durch die Diederwinkel des Proteinrückgrats bestimmt. Pro Residue gibt es 2 frei drehbare Diederwinkel, die als  und  bezeichnet werden. Lesk-Buch

Stabilität und Faltung von Proteinen Die gefaltete Struktur eines Proteins ist die Konformation, die die günstigste freie Enthalpie G für diese Aminosäuresequenz besitzt. Der Ramachandran-Plot charakterisiert die energetisch günstigen Bereiche des Aminosäurerückgrats. -Faltblatt-Region r-Helix-Region (rechtsgängige Helix)

Domänen Kompakter Bereich im Faltungsmuster einer Molekülkette, der den Anschein hat, “er könnte auch unabhängig von den anderen stabil sein”. Lesk-Buch SERCA Calcium-Pumpe cAMP-abhängige Proteinkinase

Modular aufgebaute Proteine Modular aufgebaute Proteine bestehen aus mehreren Domänen. Anwendung von SMART (www.smart.embl-heidelberg.de) für die Src-Kinase HcK ergibt Sequenz: MGGRSSCEDP GCPRDEERAP RMGCMKSKFL QVGGNTFSKT ETSASPHCPV YVPDPTSTIK PGPNSHNSNT PGIREAGSED IIVVALYDYE AIHHEDLSFQ KGDQMVVLEE SGEWWKARSL ATRKEGYIPS NYVARVDSLE TEEWFFKGIS RKDAERQLLA PGNMLGSFMI RDSETTKGSY SLSVRDYDPR QGDTVKHYKI RTLDNGGFYI SPRSTFSTLQ ELVDHYKKGN DGLCQKLSVP CMSSKPQKPW EKDAWEIPRE SLKLEKKLGA GQFGEVWMAT YNKHTKVAVK TMKPGSMSVE AFLAEANVMK TLQHDKLVKL HAVVTKEPIY IITEFMAKGS LLDFLKSDEG SKQPLPKLID FSAQIAEGMA FIEQRNYIHR DLRAANILVS ASLVCKIADF GLARVIEDNE YTAREGAKFP IKWTAPEAIN FGSFTIKSDV WSFGILLMEI VTYGRIPYPG MSNPEVIRAL ERGYRMPRPE NCPEELYNIM MRCWKNRPEE RPTFEYIQSV LDDFYTATES QYQQQP

Beispiel: Src-Kinase HcK http://jkweb.berkeley.edu/

Klassifikation von Proteinen Die Klassifikation von Proteinstrukturen nimmt in der Bioinformatik eine Schlüsselposition ein, weil sie das Bindeglied zwischen Sequenz und Funktion darstellt. Lesk-Buch

Anwendungen der Hydrophobizität Lesk-Buch

Anwendungen der Hydrophobizität: Das helikale Rad Betrachte die Residuen einer Transmembranhelix … -Helices in globulären Proteinen haben oft eine ins Innere des Proteins weisende „hydrophobe“ Seite und eine „hydrophile“ Seite, die zum Lösungsmittel gerichtet ist. In einer -Helix ist jede Aminosäure um etwa 100 Grad gegenüber ihrem Vorgänger verdreht. Damit müssen sich hydrophile und hydrophobe Residuen etwa alle 4 Positionen abwechseln. Dasselbe Verhalten zeigen amphipatische Helices, die auf der Oberfläche einer Lipid-Doppelschicht binden. 1

Topologie von Membranproteinen Im Inneren der Lipidschicht kann das Proteinrückgrat keine Wasserstoffbrücken- Bindungen mit den Lipiden ausbilden  die Atome des Rückgrats müssen miteinander Wasserstoffbrückenbindungen ausbilden, sie müssen entweder helikale oder -Faltblattkonformation annehmen. 1

Topologie von Membranproteinen Die hydrophobe Umgebung erzwingt, dass (zumindest die bisher bekannten) Strukturen von Transmembranproteinen entweder reine -Barrels (links) oder reine -helikale Bündel (rechts) sind. http://www.biologie.uni-konstanz.de/folding/Structure%20gallery%201.html 1

Superposition von Strukturen und Struktur-Alignment Vergleich von zwei Proteinstrukturen: Angabe des RMS-Werts, die Wurzel der mittleren quadratischen Abweichung, oder root-mean-square deviation Interessanterweise ist bei zwei verschiedenen Proteinen oft nicht klar, welche Atome überlagert werden sollen! di : Abstand zwischen den Koordinaten des i-ten Atompaares n : Anzahl an Atompaaren

DALI (Distance-matrix Alignment) L. Holm & C. Sander Während der Evolution eines Proteins verändert sich seine Struktur. Was häufig erhalten bleibt, ist die Verteilung der Kontakte zwischen den Aminosäuren. Konstruiere Kontaktmatrizen für beide Proteine (leicht) finde maximal übereinstimmende Untermatrizen der Kontaktmatrizen (schwierig) http://www.ebi.ac.uk/dali

Wie kann man 2 Proteinstrukturen vergleichen? Paarweise Sequenzvergleiche Paarweise Strukturvergleiche?

Partitioning protein space into homologous families Protein architecture. The tramtrack protein [2drp] is a small protein (525 heavy atoms, 63 residues, and 6 elements of secondary structure), yet it exhibits typical modular protein architecture with two compact structural domains, the so-called zinc fingers. (A) The most detailed description of atomic positions is required to understand the function of the tramtrack protein (gray and black, running left to right), which involves binding to a specific base sequence of DNA (white). Holm, Sander Science 273, 5275 (1996)

Partitioning protein space into homologous families (B) The complicated 3D shape of proteins is encoded in their linear sequence of amino acids. Side chains stripped off, the polypeptide backbone (thick) can be seen meandering from the bottom left to the upper right. Regular patterns of hydrogen bonding (thin lines) between amide and carbonyl groups of the polypeptide backbone give rise to secondary structure, shown schematically in (C) as arrows for  strands and cylinders for  helices (with zinc atoms as spheres). Holm, Sander Science 273, 5275 (1996)

Meaning of structural equivalence Shape comparison aims at the 1:1 enumeration of equivalent polymer units in 2 protein molecules. The problem and solution can be represented in 3D, as a rigid-body superimposition; - in 2D, as similar patterns in distance matrices; in 1D, as an alignment of amino acid sequences. Here, the comparison of the tramtrack protein with another zinc finger protein, the human enhancer-binding protein MBP-1 [1bbo], is used as an example. (A) In the 3D comparison, the problem is to find a translation and rotation of one molecule (red: 1bbo) onto the other (blue: 2drpA). The 3D superimposition (residue centers only, green lines join equivalenced residue centers, zinc atoms as spheres) is not exact because of an internal rotation of the two zinc finger domains relative to one another. Holm, Sander Science 273, 5275 (1996)

Ranges of similarity between proteins Holm et al. Prot Sci 1, 1691 (1992)

Surprising similarities Holm et al. Prot Sci 1, 1691 (1992)

Surprising similarities Holm et al. Prot Sci 1, 1691 (1992)

Surprising similarities Holm et al. Prot Sci 1, 1691 (1992)

Partitioning protein space into homologous families (B) The 2D distance matrices reveal the conserved structure of the zinc fingers (left: distance matrices of the whole structures; black dots are intramolecular distances less than 12 Å, 1bbo at bottom and 2drpA on top; right: distance matrices brought into register by keeping only rows or columns corresponding to structurally equivalent residues). (C) One-dimensional alignment of amino acid strings. Evolutionary comparison aligns the histidine (H) residues involved in zinc binding (bold; helices and strands of secondary structure are underlined). Holm, Sander Science 273, 5275 (1996)

Algorithms for structural alignment (A) The 3D lookup is a fast heuristic algorithm that catches easy-to-find structural similarities. The idea is that in favorable cases, 3D superimposition of only a pair of secondary structure elements (SSEs) leads to superimposition of the entire structures. Top: Structure comparison of an SH3 domain of c-Src kinase [1cskA, query structure] with the enzyme papain [1ppn, target structure] reveals similar domain folds, although there is no sequence relation between the proteins and one is much larger. The appropriate orientation of the molecules is found by exhaustive comparison of internal coordinate frames of each protein. An internal coordinate frame is defined by an ordered pair of SSEs (centering one SSE at the origin, aligning it with the y axis, and rotating the molecule around this axis so that the center of a second SSE is in the positive x-y plane). Bottom left: Target structure, papain, loaded onto the SSE lookup grid. Each pair of SSEs where the segment midpoints are within 12 Å defines a coordinate frame relative to the grid axes. The figure shows the transformed positions of the 12 SSEs of papain (dotted lines) in each of the 100 different coordinate frames defined by different pairs of SSEs. Bottom right: The target lookup grid is probed with the SH3 domain, which has four SSEs (thick continuous lines). The coordinate frames shown are the ones yielding the best 3D match of four segments. Iterative extension of a residue-wise alignment starting from the preorientation defined by the SSE match shown here leads to the equivalence of 43 C atoms with 1.7 Å root-mean-square positional deviation on an optimal least-squares superimposition. Holm, Sander Science 273, 5275 (1996)

Branch-and-bound algorithm (B) A branch-and-bound algorithm is guaranteed to yield the global optimum but may, in the worst case, need an exponential number of steps to do so. First, protein structures A and B are represented by distance matrices (bottom left and right; each point in a matrix is a residue-residue distance; an internal square is a set of contacts made by two segments; the secondary structure segments are ,, and ). The problem of shape comparison becomes one of finding a best subset of residues in each matrix (subsets of rows and columns) such that the set of residues in protein A has a similar pattern of intramolecular distances as the set in protein A, as in Fig. 2B. A single solution to the problem is given in terms of the two sets of equivalent residues (an alignment). The solution space consists of all possible placements of residues in protein B relative to the segments of residues of protein A. The key algorithmic idea is to recursively split the solution subspace (schematically shown as a circle at upper left, in which each point is a solution to the problem and the lines divide subsets of solutions) that yields the highest upper bound until there is a single alignment trace left: start with the entire circle; calculate the upper bound for the left (9) and right (17) half; choose the right half and split it into top (upper bound 10) and bottom (upper bound 16) quarters; choose the bottom part and split it (left: 14; right: 12); choose the right part; and so on until the area of solution space has shrunk to a single solution (shown as the residue-residue alignment matrix enlarged at right). The upper bound for each part of the solution space is estimated in terms of a simplified subproblem that asks for the best match of residues in protein B onto a predefined set of residues in protein A (the match is illustrated by the circle-ended line connecting the single square in matrix A with a set of candidate squares in matrix B). The best match is the one with the maximal pair score (sum of similarities of distances between the square in A and the square in B). The predefined set corresponds to residues in secondary structure elements. The upper bound for each of the segment-segment submatrices of matrix A is found by calculating the similarity scores between the submatrix in A and all accessible submatrices in B. An upper bound of the total similarity score (sum over all segment-segment submatrices in A) for one set of solutions is given by the sum of separately calculated upper bounds for each segment-segment pair of matrix A.  Holm, Sander Science 273, 5275 (1996)

Zusammenfassung Die Sekundärstrukturelemente -Helix und -Faltblatt werden durch energetisch günstige Wasserstoffbrücken zwischen Atomen des Peptidrückgrats gebildet. Sie sind sequenzunabhängig. Protein ”folds” ergeben sich durch die Assemblierung von Sekundärstrukturelementen. Der Ramachandran-Plot ist ein wichtiges Werkzeug um die Güte von Protein-strukturen (bzw. –modellen) zu beurteilen. Proteine sind oft modular aus mehreren Domänen aufgebaut. Der Vergleich mehrerer Proteinstrukturen ist nicht-trivial.