Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik1 Softwarewerkzeuge der Bioinformatik Inhalt dieser Veranstaltung: Softwarewerkzeuge für ISequenzanalyse.

Ähnliche Präsentationen


Präsentation zum Thema: "1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik1 Softwarewerkzeuge der Bioinformatik Inhalt dieser Veranstaltung: Softwarewerkzeuge für ISequenzanalyse."—  Präsentation transkript:

1 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik1 Softwarewerkzeuge der Bioinformatik Inhalt dieser Veranstaltung: Softwarewerkzeuge für ISequenzanalyse IIAnalyse von Proteinstruktur und Ligandenbindung IIIZell- bzw. Netzwerksimulationen

2 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik2 Lernziele Lerne aktuelle und bewährte Programme und Datenbanken der Bioinformatik kennen und erfolgreich einzusetzen um - Tools kennenzulernen, mit denen man bioinformatische Fragen bearbeiten kann - zu wissen, was auf dem Markt ist (das Rad nicht zweimal erfinden) - ein Gefühl dafür zu bekommen, wie erfolgreiche Softwareprodukte aussehen (sollen) - 3 Mini-Forschungsprojekte zu bearbeiten Wir werden in der Vorlesung anhand von Case-studies typische Fragestellungen in Pharma- oder Biotech-Unternehmen behandeln. Wie stellen Sie sich den Arbeitsalltag als Bioinformatiker in einer Pharma-Firma vor?

3 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik3 Organisatorisches Jede Woche zweistündige VorlesungFreitag 9-11, Hörsaal 1, Geb. 45 Dozent: Prof. Helms Übungen hands-on im CIP-Pool Bioinformatik Raum R 104 im Geb. 45 Freitag Uhr. Betreuer der Übungen Sequenz-AnalyseSam Ansari ProteinstrukturDr. Michael Hutter ZellsimulationenDr. Tihamer Geyer

4 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik4 Welche Bioinformatik-Software gibt es?

5 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik5

6 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik6

7 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik7

8 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik8

9 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik9

10 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik10

11 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik11 Ein paar Produkte...

12 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik12 Kommerzielle Software-Pakete sind bereits sehr mächtig Kommerzielle Software ist sehr teuer, aber sehr mächtig, da integriert. Es ist fraglich, ob man in einer universitären Umgebung (mit kostenloser Software) bei Anwendungen im Bereich Drug Development mit Firmen konkurrieren kann, die solch mächtige Tools einsetzen.

13 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik13 Einsatz von Bioinformatik in der Produkt-Pipeline

14 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik14 Organisatorisches Jeder Teilnehmer an den Übungen benötigt einen Rechneraccount für den CIP- Pool. Diese Accounts werden von der Rechnerbetriebsgruppe des FB Informatik eingerichtet. - Haben Sie bereits einen Account auf Uni-Rechnern? Dann muss dieser lediglich für den CIP-Pool freigeschaltet werden. Zugang zum CIP-Pool: Für Bioinformatik-Studenten 24/7, für alle anderen während der Übungsstunden. Bitte melden Sie sich nach dieser Stunde im Sekretariat des Zentrums für Bioinformatik bei Frau Alexandra Klasen an. Der Beginn der Übungen ist diese Woche.

15 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik15 Organisatorisches: Scheinvergabe Die Vorlesung zählt 2V + 2P = 9 Leistungspunkte. Sie kann nach der neuen Prüfungsordnung für den Bachelor-Studiengang in der Vertiefung Bioinformatics eingebracht werden. Die Scheine werden benotet. 50% der Benotung ergibt sich aus der mittleren Benotung von drei praktischen Aufgaben, die während des Semesters von jedem Studenten einzeln zu bearbeiten sind. Die Aufgaben werden etwa alle 4 Wochen ausgegeben und sind innerhalb von 2 Wochen zu bearbeiten und durch ein mindestens 5-seitiges Protokoll zu dokumentieren. Jeder Student muss mindestens zwei der drei praktischen Aufgaben mit einer Note von 4 und besser bestehen. Am Ende des Semesters wird eine 2-stündige Klausur über die Inhalte der Vorlesung und der Übungen geschrieben. Die Klausurnote geht ebenfalls mit 50% in die Scheinnote mit ein. Die Klausur muss mit einer Note von 4 und besser bestanden werden.

16 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik16 Übersicht über Vorlesungsinhalt I Sequenz 1 Einführung 2 Paarweises Sequenzalignment 3 Multiples Sequenzalignment 4 Datenbanken 5 Genomweite Sequenzanalyse II Struktur 6 Proteinstruktur 7 Proteinstrukturvorhersage 8 Liganden-Docking 9 Protein-Protein-Docking III Zellsimulationen 10 E-Cell 11 Virtual Cell 12 Microarrays 13 Protein-Netzwerke

17 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik17 Was fange ich mit diesen Daten an? Sequenz des menschlichen Genoms wurde 2001 entschlüsselt.

18 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik Analyse einer unbekannten Sequenz Suche in Sequenzdatenbanken nach identischer Sequenz bzw. ähnlichen Sequenzen Gibt es ähnliche Sequenz mit bekannter 3D-Struktur? Vorhersage der Sekundärstruktur Kann man Funktion zuordnen? Modellierung der Proteinstruktur durch Homologiemodellierung Ab inito Vorhersage der Tertiärstruktur Zuordnung eines Protein-Folds Multiples Sequenzalignment Input: neue Proteinsequenz Alignment der Sekundärstrukturen. Erkenne Domänen Analyse dieses Folds, Nachbarn? Experimentelle Daten vorhanden? 3D-Proteinstruktur Alignment der Sequenz mit einer Target-Struktur Fold erkannt? Nein Ja Nein Ja Nach Rob Russell, gtsp/flowchart2.html

19 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik19 Sequenzanalyse

20 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik20 Ziele (0) Identifiziere alle menschlichen Proteine (ORFs) und ihre Funktion Sind dies alle Proteine? Nein: post-translationelle Modifikationen möglich wie Methylierung, Phosphorylierung, Glykosilierung … (1)Identifiziere Gen-Netzwerke. Welche Proteine wechselwirken miteinander? (2)Identifiziere Module: abgeschlossene Einheiten (3) Identifiziere Sequenz-Abschnitte, in denen Mutationen für Krankheiten codieren

21 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik21 Sequenzen sind verwandt Evolution findet auf vielen verschiedenen Ebenen statt : Mutationen einzelner Aminosäuren, Domänen-Shuffling, Genduplikation, Genom-Rearrangement verwandte Moleküle besitzen in verschiedenen Organismen ähnliche Funktionen (Homologe) Phylogenetischer Baum für ribosomale RNA: Drei Bereiche des Lebens

22 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik22 Sequenzen sind verwandt, II Phylogenetischer Baum für Globin-Proteine des Menschen

23 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik23 gewinne transferierbare Information aus Sequenzvergleich Bestimme evolutionäre Beziehungen Vorhersage von Proteinfunktion und - struktur (Datenbanksuche). Protein 1: bindet Sauerstoff Sequenzähnlichkeit Protein 2: bindet Sauerstoff ?

24 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik24 Sequenzalignment Der Zweck eines Sequenzalignments ist, all die Residuen einer beliebigen Anzahl von Sequenzen untereinander anzuordnen, die von der gleichen Residuenposition in einem Gen- oder Protein- Vorfahren abstammen. gap = Insertion oder Deletion

25 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik25 Needleman-Wunsch Algorithmus - allgemeiner Algorithmus für Sequenzvergleiche - maximiert einen Ähnlichkeitsscore - bester Match = grösste Anzahl an Residuen einer Sequenz, die zu denen einer anderen Sequenz passen, wobei Deletionen erlaubt sind. - Der Algorithmus findet durch dynamische Programmierung das bestmögliche GLOBALE Alignment zweier beliebiger Sequenzen - NW beinhaltet eine iterative Matrizendarstellung alle möglichen Residuenpaare (Basen oder Aminosäuren) – je eine von jeder Sequenz – werden in einem zwei-dimensionalen Gitter dargestellt. alle möglichen Alignments werden durch Pfade durch dieses Gitter dargestellt. Der Algorithmus hat 3 Schritte: 1 Initialisierung 2 Auffüllen 3 Trace-back

26 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik26 Needleman-Wunsch Algorithm: Initialisierung Aufgabe: aligniere die Wörter COELACANTH und PELICAN der Länge m =10 und n =7. Konstruiere (m+1) (n+1) Matrix. Ordne den Elementen der ersten Zeile und Reihe die Werte – m gap und – n gap zu. Die Pointer dieser Felder zeigen zurück zum Ursprung. COELACANTH P E -2 L -3 I -4 C -5 A -6 N -7

27 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik27 Needleman-Wunsch Algorithm: Auffüllen Fülle alle Matrizenfelder mit Werten und Zeigern gemäss von simplen Operationen, die die Werte der diagonalen, vertikal, und horizontalen Nachbarzellen einschliessen. Berechne - match score: Wert der Diagonalzelle links oben + Wert des Alignments (+1 oder -1) - horizontal gap score: Wert der linken Zelle + gap score (-1) - vertical gap score: Wert der oberen Zelle + gap score (-1) ordne der Zelle das Maximum dieser 3 Werte zu. Der Pointer zeigt in Richtung des maximalen Scores. max(-1, -2, -2) = -1 max(-2, -2, -3) = -2 (Pointer soll bei gleichen Werte immer in eine bestimmte Richtung zeigen, z.B. entlang der Diagonalen. COELACANTH P -2

28 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik28 Needleman-Wunsch Algorithmus: Trace-back Trace-back ergibt das Alignment aus der Matrix. Starte in Ecke rechts unten und folge den Pfeilen bis in die Ecke links oben. COELACANTH -PELICAN-- COELACANTH P E L I C A N

29 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik29 Smith-Waterman-Algorithmus Smith-Waterman ist ein lokaler Alignment-Algorithmus. SW ist eine sehr einfache Modifikation von Needleman-Wunsch. Lediglich 3 Änderungen: - die Matrixränder werden auf 0 statt auf ansteigende Gap-Penalties gesetzt. - der maximale Wert sinkt nie unter 0. Pointer werden nur für Werte grösser als 0 eingezeichnet. - Trace-back beginnt am grösseten Wert der Matrix und endet bei dem Wert 0. ELACAN ELICAN COELACANTH P E L I C A N

30 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik30 Sequenzvergleiche: PAM250 Matrix Für Sequenzvergleiche werden Scoring-Matrizen für den Austausch von Aminosäuren verwendet.

31 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik31 Was hat nun Sequenz-Konservierung mit Proteinstrukturen zu tun? sehr viel! Die Twilight zone kennzeichnet das Mass an Sequenzidentität, bis zu der zwei Proteinstrukturen mit hoher Wkt. die gleiche Struktur besitzen. Richtlinien von Doolittle: Sequenzen mit > 150 Residuen und 25% Sequenzidentität sind wahrscheinlich verwandt mit 15-20% Sequenzidentität können sie verwandt sein bei <15% Sequenzidentität ist es schwierig zu sagen ob sie verwandt sind oder nicht ohne weitere strukturelle oder funktionelle Hinweise Proteinstruktur Sequenz TWILIGHT ZONE

32 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik32 Proteinstruktur, Wechselwirkung mit Liganden

33 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik33 Einleitung: Aminosäuren Aminosäuren sind die Bausteine von Proteinen: Carboxylsäure Aminogruppe

34 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik34 Ein- und Drei-Buchstaben-Codes der Aminosäuren G GlycinGlyP ProlinPro A AlaninAlaV ValinVal L LeucinLeuI IsoleucinIle M MethioninMetC CysteinCys F PhenylalaninPheY Tyrosin Tyr W TryptophanTrpH HistidinHis K LysinLysR ArgininArg Q GlutaminGlnN AsparaginAsn E GlutaminsäureGluD AsparaginsäureAsp S SerinSerT ThreoninThr Zusätzliche Codes B Asn/AspZ Gln/GluX Irgendeine Aminosäure Buchstaben-Code der Aminosäuren

35 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik35 In Peptiden und Proteinen sind die Aminosäuren miteinander als lange Ketten verknüpft. Ein Paar ist jeweils über eine Peptidbindung verknüpft. Die Aminosäuresequenz eines Proteins bestimmt seinen genetischen code. Die Kenntnis der Sequenz eines Proteins allein verrät noch nicht viel über seine Funktion. Entscheidend ist seine drei-dimensionale Struktur. Einleitung: Peptidbindung

36 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik36 Primärstruktur –Die lineare Sequenz der Aminosäuren eines Proteins Sekundärstruktur –Regionen lokaler Regelmässigkeit Z.B. -Helices, -Stränge, -Faltblätter & -Schleifen Grundlegende Definitionen

37 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik37 Die Anordnung (packing) von Sekundärstrukturelemente zu stabilen Einheiten wie -barrels, Einheiten, Greek keys, usw. Definition: Super-Sekundärstruktur

38 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik38 Die gesamte Faltung einer Kette, die sich aus der Packung der Sekundärstrukturelemente ergibt. Definition: Tertiärstruktur Grün Fluoreszierendes Protein. Seine zylindrische Architektur wird durch 11 -Stränge gebildet. (1emb.pdb Brejc et al. 1997)

39 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik39 cAMP-abhängige Proteinkinase Ca 2+ Pumpe (katalytische Untereinheit) (TM Protein) Einleitung: Proteinstruktur

40 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik40 Die Anordnung mehrerer Ketten eines Proteins, das mehrere Untereinheiten besitzt. Beispiel Hämoglobin Definition: Quartäre Struktur

41 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik41 >900,000 Sequenzen in öffentlichen Datenbanken zugänglich –Millionen mehr in proprietären dbs –Anstieg wird mit Sequenzierung von weiteren Genomen weitergehen –Was tun? In den Sequenzen steckt eine grosse Menge an strukturellen, funktionellen und evolutionären Informationen –Sie sind eine sehr wichtige Datenquelle Im Gegensatz dazu gibt es nur etwa 2000 unabhängige Proteinstrukturen Bedeutung von Sequenzanalyse

42 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik42 Anzahl an nicht-redundanten Sequenzen ( ) Entsprechende Zunahme der Zahl an Proteinstrukturen ( ) Sequenz-Struktur Missverhältnis

43 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik43 Der holy grail der strukturellen Bioinformatik

44 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik44 Eigenschaften der Aminosäuren Aminosäuren unterscheiden sich in ihren physikochemischen Eigenschaften.

45 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik45 Proteine sind aus 20 verschiedenen natürlichen Aminosäuren aufgebaut 5 sind hydrophob. Sie sind vor allem Im Proteininneren. Einleitung: hydrophobe Aminosäuren

46 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik46 Es gibt drei voluminöse aromatische Aminosäuren. Tyrosin und Tryptophan liegen bei Membranproteinen vor allem in der Interface-region. Einleitung: aromatische Aminosäuren

47 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik47 Es gibt 2 Schwefel enthaltende Aminosäuren und das ungewöhnliche Prolin. Cysteine können Disulfidbrücken bilden. Prolin ist ein Helixbrecher. Einleitung: Aminosäuren

48 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik48 Es gibt zwei Aminosäuren mit terminalen polaren Hydroxlgruppen: Einleitung: Aminosäuren

49 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik49 Es gibt 3 positiv geladene Aminosäuren. Sie liegen vor allem auf der Proteinoberflächen und in aktiven Zentren. Thermophile Organismen besitzen besonders viele Ionenpaare auf den Protein- oberflächen. Einleitung: Aminosäuren

50 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik50 Es gibt 2 negativ geladene Aminosäuren und ihre zwei neutralen Analoga. Asp und Glu haben pK a Werte von 2.8. Das heisst, erst unterhalb von pH=2.8 werden ihre Carboxylgruppe protoniert. Einleitung: Aminosäuren

51 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik51 Transmembrandomänen: Hydrophobizitätsskalen Stephen White group, UC Irvine

52 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik52 Helikale Räder Helikale Räder dienen zur Darstellung von Helices.

53 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik53 Analyse einer unbekannten Sequenz Suche in Sequenzdatenbanken nach identischer Sequenz bzw. ähnlichen Sequenzen Gibt es ähnliche Sequenz mit bekannter 3D-Struktur? Vorhersage der Sekundärstruktur Kann man Funktion transferieren? Modellierung der Proteinstruktur durch Homologiemodellierung Vorhersage der Tertiärstruktur Zuordnung eines Protein-Folds Multiples Sequenzalignment Input: neue Proteinsequenz Alignment der Sekundärstrukturen. Erkenne Domänen Analyse dieses Folds, Nachbarn? Experimentelle Daten vorhanden? 3D-Proteinstruktur Alignment der Sequenz mit einer Struktur. Fold erkannt? Nein Ja Nein Ja Nach Rob Russell, gtsp/flowchart2.html

54 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik54 - Konservierung von Residuen sind Indizien für den Verwandtschaftsgrad von Proteinen, für die Evolution und für die Verwandtschaft von Organismen - Konservierung von Residuen im aktiven Zentrum - Konservierung von Residuen, die die Architektur der Proteinstruktur stabilisieren - Konservierung von Residuen, die während Faltung des Proteins wichtig sind - Konservierung von Residuen an Bindungsschnittstellen für Liganden und andere Proteine Proteinstruktur Sequenz

55 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik55 Netzwerke

56 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik56 metabolische Netzwerke Formulierung von Biochemie mit Linearer Algebra

57 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik57 Zellsimulationen Ziel: verstehe metabolische Abläufe in Zellen

58 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik58 E-cell Anwendungen bisher: - Energie-Metabolismus von E.coli - e-Rice - Modell eines menschlichen Erythrozyten - Zirkadiane Rhythmen - e-Neuron - Signalübertragung in der bakteriellen Chemotaxis

59 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik59 Virtual Cell

60 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik60 Virtual Cell Left: overall mechanism of Ran-mediated nucleocytoplasmic transport. The image Right: membrane transport components within the Virtual Cell software. GTP-bound Ran shuttles between the nuclear and cytoplasmic compartments and is predominately nuclear at steady-state. The RanGTP nuclear membrane gradient is essential and required for RanGTP-dependent assembly and dissociation of transport complexes within the nucleus.

61 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik61 Virtual Cell Parameter …

62 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik62 Virtual Cell This set of images shows the spatiotemporal pattern of nuclear accumulation of fluorescently labeled Ran after microinjection into the cytosol in a confocal experiment (grayscale panels) and a Virtual Cell simulation (color scale panels).

63 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik63 Virtual Cell Calculated 3D distribution of 2 species in the pathway that are not directly visible by labeling. Injecting fluorescently labeled Ran allows you to experimentally visualize all the forms of Ran but not the individual bound and free states. Simulations help dissect what is happening to all the species.

64 1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik64 Software In den Tutorials vorgestellte Software: 0DatenbankennavigationSRS ISequenzanalyse: (FASTA) BLAST, PSI-BLAST, CLUSTALW IIProteinstruktur: VMD Ligandenbindung: FlexX mit Andreas Kämper IIIZellsimulationen: Virtual Cell Datenbanken: Sequenzdatenbanken Proteinstrukturbanken Metabolische Datenbanken


Herunterladen ppt "1. Vorlesung WS 2004/05 Software-Werkzeuge der Bioinformatik1 Softwarewerkzeuge der Bioinformatik Inhalt dieser Veranstaltung: Softwarewerkzeuge für ISequenzanalyse."

Ähnliche Präsentationen


Google-Anzeigen