Sequenzvergleiche.

Slides:



Advertisements
Ähnliche Präsentationen
Vorlesung Programmieren II
Advertisements

Paarweises Sequenz Alignment
Schnelle Matrizenoperationen von Christian Büttner
Suche in Texten (Stringsuche )
5. Sortier-Algorithmen Vorbemerkungen:
Genetische Algorithmen für die Variogrammanpassung
Übersicht DIALIGN = DIagonal ALIGNment
Sortierverfahren Richard Göbel.
V2 Paarweises Sequenzalignment
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (19 - Analyse natürlicher Bäume) Prof. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Informatik II, SS 2008 Algorithmen und Datenstrukturen Vorlesung 4 Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut für Informatik Fakultät.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (21 - AVL-Bäume: Entfernen, Bruder-Bäume) Prof. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (20 - AVL-Bäume: Entfernen, Bruder-Bäume) Prof. Th. Ottmann.
Genetische Algorithmen
Beispiele für Gleichungssysteme
Hypothesen testen: Grundidee
2. Univariate Regressionsanalyse 2.1 Das statische Regressionsmodell
PG 520 Intelligence Service – gezielte Informationen aus dem Internet
Secondary Structure Prediction for Aligned RNA Sequences
Analyse von DNA-Sequenzen
Tutorium
Vorlesung: ANOVA I
Externe Bewertung in IB-Biologie
Histogramm/empirische Verteilung Verteilungen
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Effiziente Algorithmen
Einführung in die beurteilende Statistik
Genmutation.
Chi Quadrat Test Tamara Katschnig.
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Information und Kommunikation
Information und Kommunikation
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Folie 1 Kapitel IV. Matrizen Inhalt: Matrizen als eigenständige mathematische Objekte Zusammenhang zwischen Matrizen und linearen Abbildungen Produkt von.
Schicht 0 Nr I Schicht 3 Nr III Schicht 6 Nr V Schicht 13 Nr VIII Schicht 10 Nr VII Schicht 10 Nr VI Schicht 6 Nr IV Schicht 3 Nr II Schicht 14 Nr IX Schicht.
Dynamische Programmierung mit Anwendung auf Sequence Alignment Problem
Wahrscheinlichkeitsrechnung
Multivariate Statistische Verfahren
Paarweises Sequenz-Alignment
Arne Vater Wintersemester 2006/ Vorlesung
Statistik – Regression - Korrelation
Messergebnis Das Messergebnis ist der Näherungswert für den wahren Wert der Messgröße, der durch Auswertung der mit einer Messeinrichtung gewonnenen Messwerte.
Vergleich von RNA Strukturen A General Edit Distance between RNA Structures von Sebastian Juenemann.
Der Masse auf der Spur Stand
Gene Prediction Marco Block Jonas Heise Nima Keshvari Michael Schreiber.
Gliederung der Vorlesung
Lineare Gleichungen Allgemeine Einführung Äquivalenzumformungen
Programmiersprachen II Fortsetzung Datenstrukturen Balancierte Bäume 3 Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Programmiersprachen II Fortsetzung Datenstrukturen Balancierte Bäume 1 Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Einführung in die Informationsverarbeitung Teil Thaller Stunde V: Wege und warum man sie geht Graphen. Köln 14. Januar 2016.
Arbeiten mit WordSmith 4. Inhalt 1. Arbeiten mit der Funktion Wortliste (im getaggten Korpus) 1. Arbeiten mit der Funktion Wortliste (im getaggten Korpus)
- Seite 1 TIME INTELLIGENCE ® by Zeichenrand – Löschen! Titel.
PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.
Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.
- Seite 1 TIME INTELLIGENCE ® by Titel.
Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.
 Präsentation transkript:

Sequenzvergleiche

Gliederung Überblick Dotplot Maße für Sequenzähnlichkeit Sequenzalignments Bedeutung des Alignments Multiple Alignments

Einführung (I) gegeben zwei Sequenzen gesucht: Ähnlichkeit quantitativ erfassen Entsprechungen zwischen einzelnen Bausteinen beider Sequenzen feststellen Gesetzmäßigkeiten der Konservierung und Variabilität beobachten Rückschlüsse auf entwicklungsgeschichtliche Verwandtschaftsverhältnisse ziehen Anwendung: Annotation von Genomen -> Zuordnung von Funktion und Struktur für möglichst viele Gene

Einführung (II) Wie kann man ein quantitatives Maß für Sequenzähnlichkeit definieren? -> Definition von Entsprechungen Sequenz-Alignment ist der Nachweis solcher Entsprechungen zwischen Sequenzbausteinen -> DAS GRUNDLEGENDE WERKZEUG der BIOINFORMATIK! Zuordnung von Entsprechungen, bei der Reihenfolge der Bausteine erhalten bleibt, ist ein Alignment Lücken sind dabei erlaubt! Beispiel: Folge 1 = a b c d e Folge 2 = a c d e f Alignment: a b c d e – a – c d e f

DOTPLOT (I) Dotplot = Punkteschema Ähnlichkeit von zwei Sequenzen Zusammenhang zu Alignments nicht offensichtlich Tabelle oder Matrix: Zeilen entsprechen Bausteine der ersten Sequenz Spalten entsprechen Bausteine der zweiten Sequenz wenn Übereinstimmung dann Füllen der Felder Abschnitte mit ähnlichen Bausteinen werden als Diagonalen von links oben (Nordwest) nach rechts unten (Südost) sichtbar Beispiel (engl. Proteinkristallografin): D O R O T H Y C R O W F O O T H O D G K I N D O R O T H Y H O D G K I N

DOTPLOT (II)

DOTPLOT (III) Repetitive Sequenz: A B R A C A D A B R A C A D A B R A

DOTPLOT (IV) Pallindromische Sequenz: M A X I S T A Y A W A Y A T S I X A M

JDotter: A Dot Matrix Plotter for Java

DOTPLOT und Alignment D O R O T H Y C R O W F O O T H O D G K I N D O R O T H Y - - - - - - - - H O D G K I N Jeder Pfad von links oben Nach rechts unten durch den Dotplot läuft durch eine Abfolge von Zellen, und jede dieser Zellen repräsentiert zwei Positionen- eine aus der Zeile, die andere aus der Spalte -, die einander im Alignment entsprechen, oder aber sie stellt eine Lücke in einer der Sequenzen dar!

Maße für Sequenzähnlichkeit (I) Stand: Dotplots und „Alignments nach Augenmaß“ Gesucht: quantitative Maße für Ähnlichkeiten Beispiele: Hamming-Distance: zwischen zwei per Definition gleich langen Sequenzen, ist die Zahl der Positionen mit unterschiedlichen Zeichen. agtc cgta Hamming-Abstand = 2 Levenshtein-Distance (Edit Distance): zwischen zwei Sequenzen (nicht unbedingt gleich lang), ist die Mindestzahl von Editieroperationen, die erforderlich sind, um eine Kette in die andere umzuwandeln. ag-tcc cgctca Levenshtein-Abstand = 3 Editieroperationen: Deletion, Insertion oder Punktmutation in einer Sequence Bestimmte Abfolge von Editieroperationen führt zu einem einzigen Alignment, aber umgekehrt gilt dieser Zusammenhang nicht!

Maße für Sequenzähnlichkeit (II) Problem: bestimmte Abweichungen unterschiedlich wahrscheinlich: Ähnliche Aminosäuren (physikalische, chemische Eigenschaften) häufiger ausgetauscht verschiedene Editieroperationen bekommen unterschiedliche Wichtung Computerprogramm ermittelt nicht nur Mindest-Editierabstand sondern auch optimales Alignment Wichtungen für Einzelschritte addieren und so Gesamt-SCORE ermitteln Bei Substitutionen wird Wert der Mutation addiert. Bei horizontalen und vertikalen Zügen wird „Lückenstrafe“ (gap penalty) gezählt.

Maße für Sequenzähnlichkeit: Scoring-Schemata (I) entspricht einem Bewertungssystem Handling von Substitutionen, Insertionen und Deletionen Sequenz 1 Insertion -> Sequenz 2 Deletion und umgekehrt Gewichtung der Deletion (Lücken in Sequenz) hängt von Länge ab Hamming und Leveshtein -> Maße für Unähnlichkeit!!! geringer Abstand -> ähnlich großer Abstand -> unähnlich Scores in Molekularbiologie sind Maß für Sequenzähnlichkeit: ähnliche Sequenz -> hoher Score unähnliche Sequenz -> niedriger Score Algorithmen zum Finden des optimalen Alignments suchen entweder nach geringem Wert für Unähnlichkeit oder nach möglichst hohem Score für Ähnlichkeit! Achtung Unterschied zwischen Homologie und Ähnlichkeit beachten!!!

Maße für Sequenzähnlichkeit: Scoring-Schemata (II) bei Nukleinsäuresequenzen häufig Verwendung eines einfaches Schemas für Substitutionen: Übereinstimmung: +1 Fehlpaarung: -1 komplizierte Schemata berücksichtigen folgende Tatsache: Transitionen häufiger als Transversionen Transition: Purin <-> Purin, Pyrimidin <-> Pyrimidin, z. B. a <-> g, t <-> c Transversion: Purin <-> Pyrimidin, (a, g) <-> (t, c) Beispiel: a t g c a 20 5 10 5 t 5 20 5 10 g 10 5 20 5 c 5 10 5 20

Maße für Sequenzähnlichkeit: Scoring-Schemata (III) bei Aminosäuresequenzen verschieden Bewertungssysteme: ähnliche physikalische und chemische Eigenschaften (+1 und -1) lernen der Schemata (M. O. Dayhoff): statistische Austauschhäufigkeit in bekannten Sequenzen werden ausgenutzt -> heute veraltet heute Nutzung neue Sequenzdaten und Mutationsstatistiken neue Matrizen: PAM (Percent Accepted Mutation): 2 Sequenzen mit PAM 1 zu 99% identische Sequenzen BLOSUM (BLOcks SUbstitution Matrix) von S. Henikoff und J. G. Henikoff Basis BLOCKS-Datenbank für Protein-Sequenaligments für Abschnitte sehr ähnlicher Proteine, bei denen Alignment ohne Lücken möglich, wird Verhältnis zwischen Zahl beobachteter Aminosäurenpaare an jeder einzelnen Position und der Zahl solcher Paare die man aufgrund der Gesamthäufigkeit der Aminosäuren erwartet, berechnet Verhältnis logarithmisch angeben zur Vermeidung der Übergewichtung eng verwandter Sequenzen Ersetzung der Proteingruppen über einem bestimmten Schwellenwert durch einen einzigen Vertreter oder durch gewichteten Mittelwert Beispiel Schwellwert 62 % -> BLOSUM62

Beispiel: BLOSUM62 Matrix Ala A Arg R Asn N Asp D Cys C Gln Q Glu E Gly G His H Ile I Leu L Lys K Met M Phe F Pro P Ser S Thr T Trp W Tyr Y Val V

Bewertung von Insertionen und Deletionen (Lückengewichtung) neben Substitutionsmatrizen weiteres Kriterium erforderlich Welche Bedeutung haben Insertionen und Deletionen im Verhältnis zu Substitutionen? Beispiele: aaagaaa aaa-aaa Erweiterung von Lücken: aaaggggaaa aaa----aaa Empfehlung von CLUSTAL-W für DNA-Sequenzen: +1 für Übereinstimmung 0 für Unterschied Strafe von 10 für neu eingeführte Lücken sowie 0,1 für die Lückenerweiterung um einen Baustein Empfehlung von CLUSTAL-W für AA-Sequenzen: BLOSUM-Matrix für Substitutionen Strafe von 11 für neu eingeführte Lücken sowie 1 für die Lückenerweiterung um einen Baustein

Berechnung des Alignements von zwei Sequenzen Voraussetzung: 2 Sequenzen, Scoring-Schema (Substitutionsmatrix + Gap Penalty) Gesucht: Alignment mit möglichst hohem Score Beispiel für Lösung: Dynamic Programing Verfahren für garantiert zu einem globalen Optimum: bestes Alignment mit höchstem Score wird gefunden schlecht: viele Alignments haben gleichen Optimalwert! Frage: Wie vergleichen -> Struktur! Rechenzeit: n x m Sequenzen alignen -> Zeit ist proportional zu n x m -> Effizienzproblem Abwandlungen des Verfahrens: Needleman & Wunsch oder Smith & Waterman (Verweis auf Literatur) Näherungsverfahren

Globales vs. Lokales Alignment

BLAST I BLAST (Altschul et al. 1990) = Basic Local Alignment Search Tool BLAST berechnet zu einem Datenbankstring T und Anfragestring W alle Segmentpaare, die sich mit einem Score mit einer Mindestgröße alignieren lassen. Alle diese Segmentpaare lassen sich effizient ermitteln, wenngleich dies algorithmisch nicht völlig trivial ist. Sie werden „hot-spots“ oder „hits“ genannt. Nun versucht BLAST, durch Ausdehnen der hot-spots an den beiden Enden sog. lokal maximale Segmentpaare zu erzeugen. Dabei heißt ein Segmentpaar lokal maximal, falls es weder durch Verlängern um jeweils einen Buchstaben an einem Ende noch durch Verkürzen um jeweils einen Buchstaben an einem Ende möglich ist, den Score zu vergrößern.

BLAST II Beispielsweise wäre folgendes (hell- und dunkelblau gezeichnete) Segmentpaar (bei einer einfachen Editier-Scoringfunktion) lokal maximal: Sowohl Verlängern wie Verkürzen würde den Score reduzieren! Das lokal maximale Segmentpaar aus dem (dunkelblau gezeichneten) „hot-spot“ AGT ist durch Verlängern hervor gegangen. Damit wird klar, dass bei diesem Vorgang zeitweise eine Verschlechterung des Scores hingenommen werden musste. BLAST toleriert solche zeitweiligen Verschlechterungen, aber nur bis zu einem gewissen Maß, das vom bislang schon erreichten besten Score und Voreinstellungen abhängt. Lokal maximale Segmentpaare werden sodann zu größeren lokalen Alignments kombiniert; hierbei ergeben sich nun auch InDels in den Alignments.

Verschiedene BLAST-Verfahren

Beispiel zum BLASTen Eingabe: menschliches Calmodulin: MADQLTEEQIAEFKEAFSLFDKDGDGTITTKELGTVMRSLGQNPTEAELQDMINEVDADGNGTIDFPEFLTMMARKMKDTDSEEEIREAFRVFDKDGNGYISAAELRHVMTNLGEKLTDEEVDEMIREADIDGDGQVNYEEFVQMMTAK BLASTp gegen eine Protein-Datenbank z.B. SWISS-PROT Ergebnis? Treffer bei Calmodulin der Gerste: >sp|P13565|CALM_HORVU|D82AB985CC12833C (CAM..)Calmodulin.[Hordeum vulgare] Length = 148 Score = 274 bits (701), Expect = 2e-73 Identities = 134/148 (90%), Positives = 144/148 (96%) Query: 2 ADQLTEEQIAEFKEAFSLFDKDGDGTITTKELGTVMRSLGQNPTEAELQDMINEVDADGN ADQLT++QIAEFKEAFSLFDKDGDG ITTKELGTVMRSLGQNPTEAELQDMINEVDADGN Sbjct: 1 ADQLTDDQIAEFKEAFSLFDKDGDGCITTKELGTVMRSLGQNPTEAELQDMINEVDADGN ... ADQLTEEQIAEFKEAFSLFDKDGDGTITTKELGTVMRSLGQNPTEAELQDMINEVDADGN ADQLTDDQIAEFKEAFSLFDKDGDGCITTKELGTVMRSLGQNPTEAELQDMINEVDADGN

Gersten-Calmodulin „Entdeckung“ Ende der 80er Jahre (10 Jahre später als menschliches Calmodulin) wahrscheinlich Erkenntnis durch in silico Biologie Grund ist große Übereinstimmung in der Aminosäure-Sequenz durch unterschiedlichen Codon-Usage ist Ähnlichkeit auf Nukleotid-Sequenz-Ebene nicht so groß

Detailliertes Beispiel für BLAST-Output Input im FASTA-Format: >HO03H10S CCATCACCAAAGGTGGCCCAAGAGAGCCATGGCATGATATCCATTCACGATTG GAAGGTCCAATTGCCTGGGATGTTCTTTACAATTNCGAGCNCAGATGGANAAA GCAGGGTGGCANANATCTTCTCGTGCAGCTCAGGGATCTCTCTGACATAATTA TCCCCCCATCTCCCGTCATGTTNCCAGAGGACAGAGATACATGGAATGTCCAG CTCTTCAGATCTATTGATGGTGGTGCTGCTTTTGGCTTCCCTGACACTCCCGA GGAAGCTGCCAGGGCTGGGCTTGTAAGTGGAAAGGATCAAATCATTGACAGGA GCATCCAGNATGCATACATCAATGCCATTCGGCGGGCGAAGGACTTTCATCTA CATTGAGAACCAGTACTTCCTTTGG Blast-Programm: BLASTX Ziel - “Datenbank“: NRPEP vollständiges – Resultat: Übung

Bedeutung des Alignments I Ähnlichkeit festgestellt -> neue Frage: Zufall oder Signifikanz bei Münzwurf Wahrscheinlichkeit eines Treffers leicht berechenbar schwieriger in unserem Fall, wenn es um Sequenzen geht!!! praktische Lösung des Problems: Ist die Gewichtung des tatsächlich beobachteten Alignments nicht größer als man es nach zufälliger Umstellung der Sequenz erwartet, hat man es wahrscheinlich mit einem Zufallsergebnis zu tun! Sequenz kann viele Male nach Zufallsprinzip verändert werden danach Alignment durchführen, Scores sammeln und Ergebnis analysieren wenn Zufallssequenzen gleichen Score ergeben ist ursprüngliches Alignment nicht aussagekräftig

Bedeutung des Alignments II Notwendigkeit der Definition von Maßen für Güte eines Alignments 1. Möglichkeit: Z-Score Z-Score ist ein Maß dafür, wie ungewöhnlich oder originell eine Übereinstimmung ist, gemessen am Mittelwert und der Standardabweichung für die Scores der gesamten Population. für Alignment mit Score S gilt: Beispiel: Z-Score = 0 -> beobachtete Ähnlichkeit ist nicht größer als im Durchschnitt der Kontrollpopulation und kann demnach durch „Zufall“ entstanden sein je höher Z-Score, desto höher Wahrscheinlichkeit das Alignment kein Zufallsprodukt Erfahrung Z-Score  5 -> Signifikanz

Bedeutung des Alignments III 2. Möglichkeit: P-Wert P ist Wahrscheinlichkeit, dass das Alignment nicht besser als ein Zufallsprodukt ist. Beziehung zwischen Z und P abhängig von der Verteilung der Scores in der Kontrollpopulation, entspricht aber nicht der Normalverteilung Richtlinie für die Interpretation von P-Werten: P  10-100 genaue Übereinstimmung P zwischen 10-100 und 10-50 nahezu identische Sequenzen, z. B. Allele oder SNPs P zwischen 10-50 und 10-10 eng verwandte Sequenzen, Homologie gesichert P zwischen 10-10 und 10-1 in der Regel entfernte Verwandte P > 10-1 Ähnlichkeit vermutlich nicht signifikant

Bedeutung des Alignments III 3. Möglichkeit: E-Wert E ist die voraussichtliche Zahl der Sequenzen, die den gleichen oder besseren Z-Wert liefern, wenn die Datenbank mit einer Zufallssequenz durchsucht wird. E ist Produkt aus P und der Größe der durchsuchten Datenbank -> E abhängig von der Größe der Datenbank -> P nicht abhängig von der Größe der Datenbank P liegt immer zwischen 0 und 1 E liegt zwischen 0 und Gesamtzahl der Sequenzen in der Datenbank Richtlinie für die Interpretation von E-Werten: E  0,02 Sequenzen vermutlich homolog E zwischen 0,02 und 1 Homologie ist nicht auszuschließen E > 1 Es ist damit zu rechnen, dass diese „gute“ Übereinstimmung reiner Zufall ist Achtung: Statistik liefert nur Anhaltspunkte, ist aber kein Ersatz für vernünftiges Nachdenken über die Ergebnisse und für die weitere Analyse derer, die viel versprechend aussehen!!!

Multiple Alignments Motivation: “The Holy Grail” “Pairwise alignment whispers multiple alignment shouts out loud” im Anschluss: kurzer Überblick anschließend Präsentation anhand eines speziellen Verfahrens

Multiple Alignments I : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments II : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments III : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments IV : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments V : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments VI : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments VII : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments VIII : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments IX : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments X : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments XI : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments XII : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments XIII : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments XIV : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments XV : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments XVI : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments XVII : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments XVIII : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments XIX : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments XX : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Multiple Alignments XXI : Vorlagen: Vorlesung Uni-Jena (Softwarewerkzeuge in der Bioinformatik) und EMBO-Kurs 2002

Beispiel Multiple Alignments: http://pgrc.ipk-gatersleben.de/cr-est praktischen Beispiel für multiple Alignments: Clustering von ESTs -> berechnete Consensus-Sequenzen