Sequence Alignments --- Ilka Maria Axmann - Charité-Universitätsmedizin Berlin, Institut für Theoretische Biologie.

Slides:



Advertisements
Ähnliche Präsentationen
What is E-Lit?What is E-Lit?. Michael Joyce, afternoon: a story (1990)
Advertisements

Service Oriented Architectures for Remote Instrumentation
Z-Transformation Die bilaterale Z-Transformation eines Signals x[n] ist die formale Reihe X(z): wobei n alle ganzen Zahlen durchläuft und z, im Allgemeinen,
Paarweises Sequenz Alignment
DNS-Resolver-Mechanismus
Proteinbiosynthese Demo-Version e-book von S.Heim.
The new kids on the block
Steinbeis Forschungsinstitut für solare und zukunftsfähige thermische Energiesysteme Nobelstr. 15 D Stuttgart WP 4 Developing SEC.
Tutorium AMB II Genetik.
Spezialvorlesung Suchalgorithmen Thema: External Probabilistic Planning Stefan Edelkamp.
Strukturbasiertes phage display.
1 Whole Genome Alignment mit Suffixbäumen Fortgeschrittene Algorithmische Bioinformatik SoSe 2005 Emre Kutbay.
Übersicht DIALIGN = DIagonal ALIGNment
Biosynthese, chemische und technische Synthese von Aminosäuren
V2 Paarweises Sequenzalignment
V2 Paarweises Sequenzalignment
NUMEX – Numerical experiments for the GME Fachhochschule Bonn-Rhein-Sieg Wolfgang Joppich PFTOOL - Precipitation forecast toolbox Semi-Lagrangian Mass-Integrating.
Friedhelm Meyer auf der Heide 1 HEINZ NIXDORF INSTITUTE University of Paderborn Algorithms and Complexity Algorithmen und Komplexität Teil 1: Grundlegende.
Friedhelm Meyer auf der Heide 1 HEINZ NIXDORF INSTITUTE University of Paderborn Algorithms and Complexity Algorithmen und Komplexität Teil 1: Grundlegende.
Bioinformatik-Seminar
Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.
Secondary Structure Prediction for Aligned RNA Sequences
Analyse von DNA-Sequenzen
Externe Datenstruktur lineare Liste
LHC, 11 Jul 2008 Kai Schweda Hadron Yield Ratios Fig.3.3 1) At RHIC: T ch = 160 ± 10 MeV B = 25 ± 5 MeV 2) S = 1. The hadronic system is thermalized.
Das zentrale Dogma des Lebens
2. Vorlesung WS 2004/05Softwarewerkzeuge der Bioinformatik 1 Paarweises Sequenzalignment Methoden des Sequenzalignments Áustauschmatrizen Bedeutsamkeit.
Paarweises Sequenzalignment
2. Vorlesung SS 2009Softwarewerkzeuge der Bioinformatik 1 V2 Paarweises Sequenzalignment Methoden des Sequenzalignments Austauschmatrizen Bedeutsamkeit.
PowerPoint-Folien zur 5. Vorlesung „Bionik II / Biosensorik“
Ingo Rechenberg PowerPoint-Folien zur 5. Vorlesung Evolutionsstrategie II Genetische Algorithmen versus Evolutionsstrategie Imitation der Ursache und Imitation.
Hochschulteam der Agentur für Arbeit Trier Preventing the Brainware Crisis Workshop Schloss Dagstuhl Student Enrollment in Computer Science.
Methods Fuzzy- Logic enables the modeling of rule based knowledge by the use of fuzzy criteria instead of exact measurement values or threshold values.
Phylogenetic Footprinting
T A T A C G A A T C T A A A PosACGT Wie oft matcht das Profil ?
Präsentation Proteine/Eiweiße
Own photographs Fachgebiet Schienenfahrwege und Bahnbetrieb Prof. Dr.-Ing. habil. J. Siegmann Dipl.-Ing. Helge Stuhr Technische Universität Berlin Institut.
Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Towards Automatic Composition of Processes based on Semantic.
MOL.504 Analyse von DNA- und Proteinsequenzen
Darstellungen von Molekülen
Aminosäuren Strukturen und Vorkommen
Dynamische Programmierung mit Anwendung auf Sequence Alignment Problem
Technische Universität Berlin Fakultät für Verkehrs- und Maschinensysteme, Institut für Mechanik Lehrstuhl für Kontinuumsmechanik und Materialtheorie,
drohende Menschheitsgeißel?
Felder (Arrays) und Zeiger (Pointers) - Teil II Zeichen, Texte, String Matching; Mehrdimensionale Felder; kürzeste Wege.
VL Algorithmische BioInformatik (19710)
Ein Projekt des Technischen Jugendfreizeit- und Bildungsvereins (tjfbv) e.V. kommunizieren.de Blended Learning for people with disabilities.
The Capability Approach for Poverty and Wealth Reporting: Experience from Germany Christian Arndt (HfWU and IAW) ISFOL-Conference, Rome, May, 23rd 2012.
Molekulare Genetik Gymnasium Interlaken, August 2008
1 von 10 ViS:AT Abteilung IT/3, IT – Systeme für Unterrichtszwecke ViS:AT Österreichische Bildung auf Europaniveau BM:UKK Apple.
HRM A – G. Grote ETHZ, WS 06/07 HRM A: Work process design Overview.
Rekonstruktion phylogenetischer Bäume.
KIT – die Kooperation von Forschungszentrum Karlsruhe GmbH und Universität Karlsruhe (TH) Vorlesung Knowledge Discovery - Institut AIFB Tempus fugit Towards.
Bakterielle Populationsstrukturen
Paarweises Sequenz-Alignment
Technische Universität München 1 CADUI' June FUNDP Namur G B I The FUSE-System: an Integrated User Interface Design Environment Frank Lonczewski.
High-Speed LAN Von Sven Bürklin.
Data Mining Spectral Clustering Junli Zhu SS 2005.
Aufgabe 1 Die pKa-Werte für Adenin (N-1) und Guanin (N-7) betragen ca. 3.8 bzw a. Wie hoch ist der jeweilige Prozentsatz an protonierter Form bei.
Seite 1 © 2007 Dr. Schwaiger Roland VP SW-Technologien WS 2007/2008 VP Softwaretechnologien WS2007/2008 SAP GUI Pattern und Componentry Dr.
Institut für Angewandte Mikroelektronik und Datentechnik Phase 5 Architectural impact on ASIC and FPGA Nils Büscher Selected Topics in VLSI Design (Module.
Vergleich von RNA Strukturen A General Edit Distance between RNA Structures von Sebastian Juenemann.
TRANSLATION G U C A 3` 5` Codon Kernpore Kernmembran.
Gene Prediction Marco Block Jonas Heise Nima Keshvari Michael Schreiber.
Proteine Proteine sind die eigentlichen "Arbeitstiere" der Zelle. Beispiele: Enzyme, Strukturproteine, Regulatoren der Genexpression Proteine bestehen.
1 Epigenetik Die »Gene« sind nicht Alles. 2 Vorstellung meist aufrechtgehender weitestgehend omivorer Trockennasen-Altwelt-Nackaffe mit ca. 3,5 Mrd. altem.
Exenatid Aminosäuren-Sequenz
Immunoprecipitation assay showing that romidepsin led to a dissociation of AhR from Hsp90 in the responsive cell lines. Immunoprecipitation assay showing.
Volume 20, Issue 3, Pages (March 2013)
Management System Regulatory Body Operator
 Präsentation transkript:

Sequence Alignments --- Ilka Maria Axmann - Charité-Universitätsmedizin Berlin, Institut für Theoretische Biologie

introduction Was ist ein Alignment? Anordnung 2er oder mehrerer Sequenzen zur Untersuchung funktioneller, struktureller oder evolutionärer Verwandtschaften (Homologien) von Nukleotid- und Aminosäuresequenzen Wie sieht ein Alignment aus? gap gap match - konserviertes Element Seq1 HELIKS---TRN--HELIKS mismatch - Mutation Seq2 HELIKSSCHLEIFEHELIKS gap - Deletion oder Insertion (Indel) match mismatch match für lange/viele Sequenzen Computer notwendig Ähnlichkeit der einzelnen Elemente muss berechnet werden können -> Scoring Matrix (Bewertungsmatrix)

introduction Welche Arten, Algorithmen und Software gibt es? 2 Seq paarweises Alignment mehrere Seq multiples Alignment ( 1 Seq Rückfaltung, z.B. für RNA Seq) Lokales AlignmentFinden ähnlicher Teilsequenzen, z.B. Suche nach Seq.motiven, Proteindomänen Smith-Waterman-Algorithmus (klassisch) software: BLAST basic local alignment search tool (aktuell, heuristisch) Globales AlignmentAlle Elemente werden berücksichtigt, Sequenzen oft ähnlich lang und viele Seq.homologien zu erwarten Needleman-Wunsch-Algorithmus (dynamic programming, Laufzeit ~ Länge Anzahl ) software: CLUSTALW

motivation: homology search NCBI/BLAST/blastp >query sequence in fasta format MLAGLSVLNLFPLAALEVGQQWYWEIGNLKLHGQTFATSWFVILLLVIASLAATRNVQRV PSGIQNLMEYVLEFLRDLARNQLGEKEYRPWLPFIGTLFLFIFVSNWSGALLPWKLIHIP DGAELAAPTNDINTTVALALLTSLAYFYAGLRKKGLGYFANYVQPIPVLLPIKILEDFTK PLSLSFRLFGNILADELVVAVLVLLVPLLVPLPLMALGLFTSAIQALVFATLAGAYIHEA IESEGEEH

motivation: protein structure prediction Software zum Beispiel:I-TASSER (Zhang lab) Ambrish Roy, Dong Xu, Jonathan Poisson, Yang Zhang. A Protocol for Computer-Based Protein Structure and Function Prediction. Journal of Visualized Experiments, vol 57, e3259 (2011). Figure: An example of I-TASSER result page showing tertiary structure predictions for the query proteins.

motivation: phylogenetic trees Fig. ©

tree of life

motivation: similarity of nucleotide sequences

KaiC – protein phosphorylation ¤ conserved P-sites: S427 and T428 pS/pT S/pT or pS/T S/T SDS-PAGE & NanoLC-MS/MS - + SynKaiA Hours at 18°C ProKaiC SynKaiC - + SynKaiA ¤ ProKaiC autophosphorylation without KaiA ¤ hypothesis: absence of kaiA compensated by enhanced autophosphorylation activity of KaiC A-loop (Kim et al., 2008) Fig. © Axmann et al., 2009, J Bact motivation: similarity/function of proteins

amino acids Carboxy- (-COOH) und Aminogruppe (-NH2) proteinogen (22) L-Aminosäuren kanonisch (20) Codon/Triplett (61) Fig. © Wikipedia

amino acids: physicochemical properties Carboxy- (-COOH) und Aminogruppe (-NH2) proteinogen (22) L-Aminosäuren kanonisch (20) Codon/Triplett (61) Fig. © Wikipedia

amino acids and codons # AS Codon 1 Start AUG 1 Met AUG 1 Trp UGG 2 Tyr UAU UAC 2 Phe UUU UUC 2 Cys UGU UGC 2 Asn AAU AAC 2 Asp GAU GAC 2 Gln CAA CAG 2 Glu GAA GAG 2 His CAU CAC 2 Lys AAA AAG 3 Ile AUU AUC AUA 4 Gly GGU GGC GGA GGG 4 Ala GCU GCC GCA GCG 4 Val GUU GUC GUA GUG 4 Thr ACU ACC ACA ACG 4 Pro CCU CCC CCA CCG 6 Leu CUU CUC CUA CUG UUA UUG 6 Ser UCU UCC UCA UCG AGU AGC 6 Arg CGU CGC CGA CGG AGA AGG 3 Stop UAA UAG UGA

substitution matrices 20 x 20 matrix PAM – point accepted mutations Margaret Dayhoff, 1970er Jahre Zahl substituierter Paare in nah verwandten Proteinen (Hämoglobin) PAM1: Rate der Substitution, wenn sich 1% der Aminosäuren verändern, entspricht Ähnlichkeit von 99% PAM250:höchste Stufe, Sequenzähnlichkeit von 20 % BLOSUM – BLOck Substitution Matrix Henikoff & Henikoff, 1992 Multiple Alignments evolutionär divergenter Proteine genutzt und darin Blöcke konservierter Sequenzabschnitte gefunden und ausgezählt BLOSUM62:am häufigsten genutzt, verwandte Proteinsequenz mit maximal 60% Identität

substitution matrices: PAM250

substitution matrices: BLOSUM62