Multiples Sequenz Alignment

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Falls Algorithmen sich selbst rekursiv aufrufen, so kann ihr Laufzeitverhalten bzw. ihr Speicherplatzbedarf in der Regel durch eine Rekursionsformel (recurrence,
Proteinbiosynthese Demo-Version e-book von S.Heim.
Dynamische Seiten mit Dreamweaver Zugriff auf (mysql) Datenbank mit PHP.
TECHNISCHE UNIVERSITÄT DARMSTADT Naive Bayes for Ranking
Aminosäuren bilden: Peptidbindungen
Objektorientierter Entwurf (OOD) Teil 3: Qualitätsmodell
Übersicht DIALIGN = DIagonal ALIGNment
Universität Stuttgart Institut für Kernenergetik und Energiesysteme Was ist Refactoring? Bevor man die Integration angeht, mag es angebracht sein, den.
Sortierverfahren Richard Göbel.
Sortierverfahren Richard Göbel.
Biosynthese, chemische und technische Synthese von Aminosäuren
Softwarewerkzeuge der Bioinformatik
V3 - Multiples Sequenz Alignment und Phylogenie
1. Vorlesung WS 2006/07 Software-Werkzeuge der Bioinformatik1 Softwarewerkzeuge der Bioinformatik Inhalt dieser Veranstaltung: Softwarewerkzeuge kennenlernen.
Softwarewerkzeuge der Bioinformatik
V5: Bioinformatische Analyse von Proteinstrukturen
V5: Proteinstruktur: Sekundärstruktur
Dynamische Programmierung (2) Matrixkettenprodukt
WS Algorithmentheorie 08 – Dynamische Programmierung (2) Matrixkettenprodukt Prof. Dr. Th. Ottmann.
Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.
Bioinformatik-Seminar
Struktur und Funktion von Biopolymeren Elmar Lang
Secondary Structure Prediction for Aligned RNA Sequences
DNA - Sequenzierstrategien
Analyse von DNA-Sequenzen
Das zentrale Dogma des Lebens
V3 - Multiples Sequenz Alignment und Phylogenie
V3 - Multiples Sequenz Alignment und Phylogenie
V5: Proteinstruktur: Sekundärstruktur
V5: Proteinstruktur: Sekundärstruktur
3. Vorlesung SS 2010 Softwarewerkzeuge der Bioinformatik1 V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount.
1. Vorlesung SS 2011 Software-Werkzeuge der Bioinformatik1 Softwarewerkzeuge der Bioinformatik Inhalt dieser Veranstaltung: Softwarewerkzeuge kennenlernen.
Softwarewerkzeuge der Bioinformatik
1. Vorlesung WS 2009/10 Software-Werkzeuge der Bioinformatik1 Softwarewerkzeuge der Bioinformatik Inhalt dieser Veranstaltung: Softwarewerkzeuge kennenlernen.
zur Vorlesung Neuronale Netzwerke
Minimum Spanning Tree: MST
Hauptseminar Automaten und Formale Sprachen
Analyse eines Handballspielzuges
Folie 1 Kapitel II. Vom Raumbegriff zu algebraischen Strukturen Neubeginn: Herleitung des Begriffs Vektorraum aus intuitiven Vorstellungen über den Raumbegriff.
Phylogenetic Footprinting
Wie macht man ein Sudoku? Transformations-Methode:
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Effiziente Algorithmen
Genmutation.
Effiziente Algorithmen
Theorien, Methoden, Modelle und Praxis
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Hartmut Klauck Universität Frankfurt SS
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
… oder wie finde ich den Weg
Dynamische Webseiten-Generierung
6.5 Eiweiße = Proteine.
Rekonstruktion phylogenetischer Bäume.
Fundamente der Computational Intelligence (Vorlesung) Prof. Dr. Günter Rudolph Fachbereich Informatik Lehrstuhl für Algorithm Engineering Wintersemester.
Paarweises Sequenz-Alignment
Parallelisierung für Multiprozessor-Maschinen
Gene Prediction Marco Block Jonas Heise Nima Keshvari Michael Schreiber.
SS 2009Maschinelles Lernen und Neural Computation 133 Kapitel 7: Ensemble Methoden.
Proteine Proteine sind die eigentlichen "Arbeitstiere" der Zelle. Beispiele: Enzyme, Strukturproteine, Regulatoren der Genexpression Proteine bestehen.
3. Vorlesung WS 2015/16 Softwarewerkzeuge der Bioinformatik1 V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount.
Exenatid Aminosäuren-Sequenz
 Präsentation transkript:

Multiples Sequenz Alignment Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Alignments können einfach oder schwer sein GCGGCCCA TCAGGTACTT GGTGG GCGGCCCA TCAGGTAGTT GGTGG GCGTTCCA TCAGCTGGTT GGTGG GCGTCCCA TCAGCTAGTT GGTGG GCGGCGCA TTAGCTAGTT GGTGA ******** ********** ***** TTGACATG CCGGGG---A AACCG TTGACATG CCGGTG--GT AAGCC TTGACATG -CTAGG---A ACGCG TTGACATG -CTAGGGAAC ACGCG TTGACATC -CTCTG---A ACGCG ******** ?????????? ***** Einfach Schwierig wegen Insertionen und Deletionen (indels) 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Softwarewerkzeuge der Bioinformatik Protein-Alignment kann durch tertiäre Strukturinformationen geführt werden Escherichia coli DjlA protein Homo sapiens DjlA protein nur so kann man letztlich auch bewerten, ob ein Sequenzalignment korrekt ist. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Definition von “Homologie” Homologie: Ähnlichkeit, die durch Abstammung von einem gemeinsamen Ursprungsgen herrührt – die Identifizierung und Analyse von Homologien ist eine zentrale Aufgabe der Phylogenie. Ein Alignment ist eine Hypothese für die positionelle Homologie zwischen Basenpaaren bzw. Aminosäuren. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik http://www.cellsignal.com

MSA für Thioredoxin-Familie Farbe Aminosäuretyp Aminosäuren gelb klein, wenig polar Gly, Ala, Ser, Thr grün hydrophob Cys, Val, Ile, Leu Pro, Phe, Tyr, Met, Trp violett polar Asn, Gln, His rot negativ geladen Asp, Glu blau positiv geladen Lys, Arg 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Infos aus MSA von Thioredoxin-Familie Thioredoxin: aus 5 beta-Strängen bestehendes beta-Faltblatt, das auf beiden Seiten von alpha-Helices flankiert ist. gemeinsamer Mechanismus: Reduktion von Disulfidbrücken in Proteinen 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Infos aus MSA von Thioredoxin-Familie 1) Die am stärksten konservierten Abschnitte entsprechen wahrscheinlich dem aktiven Zentrum. Disulfidbrücke zwischen Cys32 und Cys35 gehört zu dem konservierten WCGPC[K oder R] Motiv. Andere konservierte Sequenzabschnitte, z.B. Pro76Thr77 und Gly92Gly93 sind an der Substratbindung beteiligt. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Infos aus MSA von Thioredoxin-Familie 2) Abschnitte mit vielen Insertionen und Deletionen entsprechen vermutlich Schleifen an der Oberfläche. Eine Position mit einem konservierten Gly oder Pro läßt auf eine Wendung der Kette (‚turn‘) schließen. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Infos aus MSA von Thioredoxin-Familie 3) Ein konserviertes Muster hydrophober Bausteine mit dem Abstand 2 (d.h., an jeder zweiten Position), bei dem die dazwischenliegenden Bausteine vielfältiger sind und auch hydrophil sein können, läßt auf ein -Faltblatt an der Moleküloberfläche schließen. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Infos aus MSA von Thioredoxin-Familie 4) Ein konserviertes Muster hydrophober Aminosäurereste mit dem Abstand von ungefähr 4 läßt auf eine -Helix schließen. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Infos aus MSA von Thioredoxin-Familie Die Thioredoxine sind Teil einer Superfamilie, zu der auch viele weiter entfernte homologe Protein gehören, z.B. Glutaredoxin (Wasserstoffdonor für die Reduktion von Ribonukleotiden bei der DNA-Synthese) Protein-Disulfidisomerase (katalysiert bei der Proteinfaltung den Austausch falsch gefalteter Disulfidbrücken) Phosducin (Regulator in G-Protein-abhängigen Signalübertragungswegen) Glutathion-S-Transferasen (Proteine der chemischen Abwehr). Die Tabelle des MSAs für Thioredoxinsequenzen enthält implizit auch Muster, die man zur Identifizierung dieser entfernteren Verwandten nutzen kann. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Multiples Sequenz-Alignment - Methoden Es gibt im wesentlichen 3 unterschiedliche Vorgehensweisen: (1) Manuell (2) Automatisch (3) Kombiniert 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Gründe für manuelles Alignment manuelles Alignment bietet sich an falls Alignment einfach ist. es zusätzliche (strukturelle) Information gibt. automatische Alignment –Methoden in lokalen Minima feststecken. ein automatisch erzeugtes Alignment manuell “verbessert” werden kann. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

multiples Sequenzalignment 2 Methoden: Dynamische Programmierung betrache 2 Proteinsequenzen von 100 Aminosäuren Länge. wenn es 1002 Sekunden dauert, diese beiden Sequenzen erschöpfend zu alignieren, dann wird es 1003 Sekunden dauern um 3 Sequenzen zu alignieren, 1004 Sekunden für 4 sequences und 1.90258x1034 Jahre für 20 Sequenzen. Progressives Alignment 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

dynamische Programmierung mit MSA Programm berechne zunächst paarweise Alignments für 3 Sequenzen wird Würfel aufgespannt: D.h. dynamische Programmierung hat nun Komplexität n1 * n2 * n3 mit den Sequenzlängen n1, n2, n3. Sehr aufwändig! Versuche, Suchraum einzuschränken. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

dynamische Programmierung mit MSA Programm Links: Baum für 5 Sequenzen ohne Paarung von Sequenzen. Neighbour-joining Methode: berechne Summe aller Kantenlängen S = a + b + c + d + e (Kantenlängen sind bekannt) In diesem Fall seien sich A und B am nächsten. Konstruiere daher den Baum rechts. Generell: Verbinde die Sequenzpaare mit den kürzesten Abständen …  Man erhält den Baum mit der kleinsten Summe der Kantenlängen. Konstruiere anhand phylogenetischem Baum ein versuchsweises Multiples Sequenz Alignment. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

dynamische Programmierung mit MSA Programm Dieses Alignment dient dazu, den möglichen Raum inmitten des Würfels einzugrenzen, in dem das beste MSA zu finden sein sollte. Grosse Rechenersparnis! 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Progressives Alignment wurde von Feng & Doolittle 1987 vorgestellt ist eigentlich eine heuristische Methode. Daher ist nicht garantiert, das “optimale” Alignment zu finden. benötigt (n-1) + (n-2) + (n-3) ... (n-n+1) paarweise Sequenzalignments als Ausgangspunkt. weitverbreitete Implementation in Clustal (Des Higgins) ClustalW ist eine neuere Version, in der den Parameter für Sequenzen und Programm Gewichte (weights) zugeteilt werden. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Überblick der ClustalW Prozedur Hbb_Human 1 - CLUSTAL W Hbb_Horse 2 .17 - Hba_Human 3 .59 .60 - Hba_Horse 4 .59 .59 .13 - Myg_Whale 5 .77 .77 .75 .75 - Schnelle paarweise Alignments: berechne Matrix der Abstände Hbb_Human 2 3 4 Hbb_Horse Hba_Human 1 Nachbar-Verbindungs- Baumdiagramm Hba_Horse Myg_Whale alpha-helices 1 PEEKSAVTALWGKVN--VDEVGG 2 3 4 2 GEEKAAVLALWDKVN--EEEVGG 3 PADKTNVKAAWGKVGAHAGEYGA progressive Alignments entsprechend dem Baumdiagramm 1 4 AADKTNVKAAWSKVGGHAGEYGA 5 EHEWQLVLHVWAKVEADVAGHGQ 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

ClustalW- Paarweise Alignments Berechne alle möglichen paarweisen Alignments von Sequenzpaaren. Es gibt (n-1)+(n-2)...(n-n+1) Möglichkeiten. Berechne aus diesen isolierten paarweisen Alignments den “Abstand” zwischen jedem Sequenzpaar. Erstelle eine Abstandsmatrix. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Clustal W - Nachbarschaftsbaum aus den paarweisen Distanzen wird ein Nachbarschafts-Baum erstellt Dieser Baum gibt die Reihenfolge an, in der das progressive Alignment ausgeführt werden wird. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Multiples Alignment - Erstes Paar aligniere die beiden ähnlichsten Sequenzen zuerst. dieses Alignment ist dann “fest” und wird nicht mehr angetastet. Falls später ein GAP eingeführt werden muss, wird er in beiden Sequenzen an der gleichen Stelle eingeführt. Deren relatives Alignment bleibt unverändert. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Clustal W – Zeit der Entscheidung Ziehe den Baum heran um festzulegen, welches Alignment als nächstes durchgeführt werden soll: aligniere eine dritte Sequenz zu den ersten beiden oder aligniere zwei total verschiedene Sequenzen miteinander. Option 1 Option 2 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

ClustalW- Alternative 1 Wenn beim Alignment einer dritten Sequenz mit den ersten beiden eine Lücke eingefügt werden muss um das Alignment zu verbessern, werden beide als Einzelsequenzen betrachtet. + 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

ClustalW- Alternative 2 Falls, andererseits, zwei getrennte Sequenzen aligniert werden müssen, werden diese zunächst miteinander aligniert. + 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Progressives Alignment – 1. Schritt gctcgatacgatacgatgactagcta gctcgatacaagacgatgacagcta gctcgatacacgatgactagcta gctcgatacacgatgacgagcga ctcgaacgatacgatgactagct gctcgatacgatacgatgactagcta gctcgatacaagacgatgac-agcta 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Progressives Alignment – 2. Schritt gctcgatacgatacgatgactagcta gctcgatacaagacgatgacagcta gctcgatacacgatgactagcta gctcgatacacgatgacgagcga ctcgaacgatacgatgactagct gctcgatacacgatgactagcta gctcgatacacgatgacgagcga 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Progressives Alignment – 3. Schritt gctcgatacgatacgatgactagcta gctcgatacaagacgatgac-agcta + gctcgatacacgatgactagcta gctcgatacacgatgacgagcga gctcgatacgatacgatgactagcta gctcgatacaagacgatgac-agcta Gctcgatacacga---tgactagcta Gctcgatacacga---tgacgagcga 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Progressives Alignment – letzter Schritt gctcgatacgatacgatgactagcta gctcgatacaagacgatgac-agcta gctcgatacacga---tgactagcta gctcgatacacga---tgacgagcga + ctcgaacgatacgatgactagct gctcgatacgatacgatgactagcta Gctcgatacaagacgatgac-agcta gctcgatacacga---tgactagcta gctcgatacacga---tgacgagcga -ctcga-acgatacgatgactagct- 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

ClustalW- Vor- und Nachteile Vorteil: Geschwindigkeit. Nachteile: keine objektive Funktion. Keine Möglichkeit zu quantifizieren ob Alignment gut oder schlecht ist. Keine Möglichkeit festzustellen, ob das Alignment “korrekt” ist. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

ClustalW - Lokales Minimum Mögliche Probleme: in ein lokales Minimum zu geraten. Falls zu einem frühen Zeitpunkt ein Fehler im Alignment eingebaut wird, kann dieser später nicht mehr korrigiert werden. Zufälliges Alignment. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Genauigkeit des Alignments verbessern Sollen all Sequenzen gleich behandelt werden? Obwohl manche Sequenzen eng verwandt und andere entfernt verwandt sind? Sollen alle Positionen der Sequenzen gleich behandelt werden? Obwohl sie unterschiedliche Funktionen und Positionen in der dreidimensionalen Strukturen haben können? 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

ClustalW- Besonderheiten Sequenzgewichtung Variable Substitutionsmatrizen Residuen-spezifische Gap-Penalties und verringerte Penalties in hydrophilen Regionen (externe Regionen von Proteinsequenzen), bevorzugt Gaps in Loops anstatt im Proteinkern. Positionen in frühen Alignments, an denen Gaps geöffnet wurden, erhalten lokal reduzierte Gap Penalties um in späteren Alignments Gaps an den gleichen Stellen zu bevorzugen 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

ClustalW- vom Benutzer festzulegende Parameter Zwei Parameter sind festzulegen (es gibt Default-Werte, aber man sollte sich bewusst sein, dass diese abgeändert werden können): Die GOP- Gap Opening Penalty ist aufzubringen um eine Lücke in einem Alignment zu erzeugen Die GEP- Gap Extension Penalty ist aufzubringen um diese Lücke um eine Position zu verlängern. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Positions-spezifische Gap penalties Bevor irgendein Sequenzpaar aligniert wird, wird eine Tabelle von GOPs erstellt für jede Position der beiden Sequenzen. Die GOP werden positions-spezifisch behandelt und können über die Sequenzlänge variieren. Falls ein GAP an einer Position existiert, werden die GOP und GEP penalties herabgesetzt – und alle anderen Regeln treffen nicht zu. Daher wird die Bildung von Gaps an Positionen wahrscheinlicher, an denen bereits Gaps existieren. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Softwarewerkzeuge der Bioinformatik Vermeide zu viele Gaps Solange kein GAP offen ist, wird GOP hochgesetzt falls die Position innerhalb von 8 Residuen von einem bestehenden Gap liegt. Dadurch werden Gaps vermieden, die zu eng beieinander liegen. An jeder Position innerhalb einer Reihe von hydrophilen Residuen wird GOP herabgesetzt, da diese gewöhnlich in Loop-Regionen von Proteinstrukturen liegen. Eine Reihe von 5 hydrophilen Residuen gilt als hydrophiler stretch. Die üblichen hydrophilen Residuen sind: D Asp K Lys P Pro E Glu N Asn R Arg G Gly Q Gln S Ser Dies kann durch den Benutzer geändert werden. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Softwarewerkzeuge der Bioinformatik Divergente Sequenzen Die am meisten divergenten Sequenzen (also am stärksten von allen anderen Sequenzen verschiedenen) sind gewönlich am schwierigsten zu alignieren Es ist manchmal besser, ihr Alignment auf einen späteren Zeitpunkt zu verschieben (nachdem die einfacheren Sequenzen aligniert wurden) Man kann dazu einen Cutoff wählen (der Default liegt bei 40% Identität). 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Tips für progressives Alignment Progressives Alignment ist ein mathematischer Vorgang, der völlig unabhängig von der biologischen Realität abläuft. Es kann eine sehr gute Abschätzung sein. Es kann eine unglaublich schlechte Abschätzung sein. Erfordert Input und Erfahrung des Benutzers. Sollte mit Vorsicht verwendet werden. Kann (gewöhnlich) manuell verbessert werden. Es hilft oft, farbliche Darstellungen zu wählen. Je nach Einsatzgebiet sollte der Benutzer in der Lage sein, die zuverlässigen Regionen des Alignments zu beurteilen. Für phylogenetische Rekonstruktionen sollte man nur die Positionen verwenden, für die eine zweifelsfreie Hypothese über positionelle Homologie vorliegt. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Alignment von Protein-kodierenden DNS-Sequenzen Es macht wenig Sinn, proteinkodierende DNS-Abschnitte zu alignieren! ATGCTGTTAGGG ATGCTCGTAGGG ATGCT-GTTAGGG ATGCTCGT-AGGG Das Ergebnis kann sehr unplausibel sein und entspricht eventuell nicht dem biologischen Prozess. Es ist viel sinnvoller, die Sequenzen in die entsprechenden Proteinsequenzen zu übersetzen, diese zu alignieren und dann in den DNS-Sequenzen an den Stellen Gaps einzufügen, an denen sie im Aminosäure-Alignment zu finden sind. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Software für manuelle Alignments GDE- The Genetic Data Environment (UNIX) CINEMA- Java applet available from: http://www.biochem.ucl.ac.uk Seqapp/Seqpup- Mac/PC/UNIX available from: http://iubio.bio.indiana.edu SeAl for Macintosh, available from: http://evolve.zoo.ox.ac.uk/Se-Al/Se-Al.html BioEdit for PC, available from: http://www.mbio.ncsu.edu/RNaseP/info/programs/BIOEDIT/bioedit.html 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Beispiel: Src-Kinase HcK Sequenz: MGGRSSCEDP GCPRDEERAP RMGCMKSKFL QVGGNTFSKT ETSASPHCPV YVPDPTSTIK PGPNSHNSNT PGIREAGSED IIVVALYDYE AIHHEDLSFQ KGDQMVVLEE SGEWWKARSL ATRKEGYIPS NYVARVDSLE TEEWFFKGIS RKDAERQLLA PGNMLGSFMI RDSETTKGSY SLSVRDYDPR QGDTVKHYKI RTLDNGGFYI SPRSTFSTLQ ELVDHYKKGN DGLCQKLSVP CMSSKPQKPW EKDAWEIPRE SLKLEKKLGA GQFGEVWMAT YNKHTKVAVK TMKPGSMSVE AFLAEANVMK TLQHDKLVKL HAVVTKEPIY IITEFMAKGS LLDFLKSDEG SKQPLPKLID FSAQIAEGMA FIEQRNYIHR DLRAANILVS ASLVCKIADF GLARVIEDNE YTAREGAKFP IKWTAPEAIN FGSFTIKSDV WSFGILLMEI VTYGRIPYPG MSNPEVIRAL ERGYRMPRPE NCPEELYNIM MRCWKNRPEE RPTFEYIQSV LDDFYTATES QYQQQP SMART ergibt: 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Beispiel: Src-Kinase HcK Kinase-Einheit Protein Data Bank http://www.rcsb.org 1ATP 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Beispiel: Src-Kinase HcK SH3 Domäne Src homology 3 (SH3) Domänen binden an Zielproteine mit Sequenzen, die Proline und hydrophobe Aminosäuren enthalten. Pro-enthaltende Polypeptide können an SH3 in zwei verschiedenen Orientierungen binden. SH3 Domänen sind kleine Proteinmodule von ungefähr 50 Residuen Länge. Man findet sie in vielen intrazellulären oder Membran-assoziierten Proteinen … CATH: 1abo 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Beispiel: Src-Kinase HcK SH2 Domäne Die Src homology 2 (SH2) Domäne ist eine Proteindomäne mit etwa 100 Aminosäuren. SH2 Domänen funktionieren als Regelmodule von intrazellulären Signalkaskaden indem sie mit grosser Affinität an Phospho-Tyrosin enthaltende Peptide binden. SH2 Domänen findet man oft zusammen mit SH3 Domänen … Ihre Struktur ist alpha+beta … CATH: 1g83 1fbz 1aot 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Beispiel: Src-Kinase HcK http://jkweb.berkeley.edu/ 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Was kann man mit modularem Denken erreichen? http://www.cellsignal.com 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik

Softwarewerkzeuge der Bioinformatik Zusammenfasusng Progressive Alignments sind die am weitesten verbreitete Methode für multiple Sequenzalignments. Sehr sensitive Methode ebenfalls: Hidden Markov Modelle (HMMer) Multiples Sequenzalignment ist nicht trivial. Manuelle Nacharbeit kann in Einzelfällen das Alignment verbessern. Multiples Sequenzalignment erlaubt Denken in Proteinfamilien und –funktionen. 3. Vorlesung WS 2005/2006 Softwarewerkzeuge der Bioinformatik