Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-1 Genom- und Proteomanalyse.

Ähnliche Präsentationen


Präsentation zum Thema: "Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-1 Genom- und Proteomanalyse."—  Präsentation transkript:

1 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-1 Genom- und Proteomanalyse

2 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-2 Genom- und Proteomanalyse Begriffe (1) Genom (Hans Winkler, 1920) : -Gesamtheit der vererbbaren Informationen einer Zelle -Speichermedium DNA -Kodiert die Ausprägungen der spezifischen Eigenschaften eines Organismus Genomics: -Erforschung des Genoms OrganismusBasenpaare Escherichia coli4,7*10 6 Saccharomyces cerevisiae1,2*10 7 Drosophila melanogaster1,3*10 8 Homo sapiens sapiens3*10 9 Arabidopsis thaliana1,2*10 8 Hordeum vulgare4,8*10 9 Triticum aestivum1,6*10 10

3 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-3 Genom- und Proteomanalyse Begriffe (2) Proteom (Marc Wilkins, 1994): -Gesamtheit aller zu einem bestimmten Zeitpunkt exprimierten Proteine eines Organismus Proteomics: -Erforschung des Proteoms

4 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-4 Genom- und Proteomanalyse Genomanalyse Genomanalyse: Ermittlung von funktionellen Bereichen (Genen) von Organismen Ziel: Zuordnung von Funktionen zu genetischen Elementen Einsatz der Bioinformatik zur Identifikation und Charakterisierung genetischer Elemente -z.B. Erkennung von Promotoren, Transkriptionsfaktorbindungsstellen (TFBS) etc.

5 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-5 Genom- und Proteomanalyse Sequenzierung kompletter Genome 1995: 1. vollst. sequenziertes Bakteriengenom Haemophilus influenza neue Ära: alle Gene und regulatorische Bereiche 1998: erster Mehrzeller Caenorhabditis elegans Problem Größe der kodierenden Bereiche bei Eykaryoten: -Mensch und Maus ca. 1,4% des Gesamtgenoms Mensch und Maus: -5% der Genome hoch konserviert -aber mehr als 80% orthologe Gene bzw. Proteine Einschub (Quelle: Homologous sequences. Orthologs and Paralogs are two types of homologous sequences. Orthology describes genes in different species that derive from a common ancestor. Orthologous genes may or may not have the same function. Paralogy describes homologous genes within a single species that diverged by gene duplication.http://www.ncbi.nlm.nih.gov/Education/BLASTinfo/Orthology.html

6 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-6 Genom- und Proteomanalyse Sequenzierung kompletter Genome 1995: 1. vollst. sequenziertes Bakteriengenom Haemophilus influenza neue Ära: alle Gene und regulatorische Bereiche 1998: erster Mehrzeller Caenorhabditis elegans Problem Größe der kodierenden Bereiche bei Eykaryoten: -Mensch und Maus ca. 1,4% des Gesamtgenoms Mensch und Maus: -5% der Genome hoch konserviert -aber mehr als 80% orthologe Gene bzw. Proteine Einschub (Quelle: Homologous sequences. Orthologs and Paralogs are two types of homologous sequences. Orthology describes genes in different species that derive from a common ancestor. Orthologous genes may or may not have the same function. Paralogy describes homologous genes within a single species that diverged by gene duplication.http://www.ncbi.nlm.nih.gov/Education/BLASTinfo/Orthology.html

7 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-7 Genom- und Proteomanalyse Genomcharakterisierung mit STS STS - Sequence Tagged Sites: Orientierungspunkte z.B. im menschlichen Genom kurze DNA-Sequenzen mit Länge von 200 – 500 Basenpaaren STS kommt nur einmal im Genom vor! Ort und Basissequenz bekannt Marker für Kartierung von Chromosomen bzw. Genom Generierung von STS durch PCR DNA-Klone können durch DB-Suche auf Existenz von passenden STS durchsucht werden und anhand dieser Information auf Chromosomen bzw. in Genomen positioniert werden. -> präzise physikalische Karte seit 1994 eigene DB am NCBI: dbSTS -Name, Sequenz für Amplifikation, Größe des PCR-Produkts, Sequenz, …

8 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-8 Genom- und Proteomanalyse EST = Expressed Sequence Tags Endeckung neuer Gene durch ESTs wird 1991 erkannt cDNA-Clone stammen von exprimierten Genen ab -> Name Generierung von ESTs durch Sequenzierung der cDNA von beiden Enden viele Projekte zur EST-Sequenzierung -> Hochdurchsatz aber auch Kritik: -schlechte Qualität durch single Run und automatische Generierung: Substitutionen und Insertionen/Deletionen -> Frameshifts (Verschiebung von Basentripletts; Kodierung anderer Aminosäuren) -schlechte Qualität in internationalen Nukleotidsequenz-DBs -keine regulatorischen Elemente NCBI: dbEST und Unigene TIGR: Gene Indicies

9 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-9 Genom- und Proteomanalyse EST - Sequenzierungsprojekte ©P.M. Selzer, R.J. Marhöfer, A. Rohwer: Angewandte Bioinformatik – Eine Einführung. Berlin et al: Springer Verlag, Zellen, Gewebe, Organismus

10 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-10 Genom- und Proteomanalyse Qualitätsmerkmale Anwendung folgender Kriterien beim Trimming: -Mindestlänge der ESTs -Anzahl von Ns im Gegensatz zu eindeutig identifizierten Nukleotiden (A/T/G/C) -Quality Scores des Sequenzierautomaten Maß für Sequenzqualität jedes einzelnen Nukleotids -Kontamination mit Vektor- oder Bakterien-DNA

11 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-11 Genom- und Proteomanalyse

12 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-12 Genom- und Proteomanalyse

13 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-13 Genom- und Proteomanalyse Zwischenergebnisse Sammlung von ESTs mit -unterschiedlicher Länge und -zufälliger Auswahl von cDNA-Sequenzen aber auch ESTs von gleichen Transkripten besonders von hoch exprimierten Genen Existenz von Redundanz Reduzierung durch Assemblierung und Alignments aus ähnlichen ESTs Ergebnis sind Konsensussequenzen bei großen EST-Projekten vorher Clustern -Zusammenfassung in Gruppen von EST mit identischen Nukleotiden in einem Bereich -danach stringenteres Assemblieren und Alignen

14 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-14 Genom- und Proteomanalyse ESTs, Contigs und Konsensussequenzen ©P.M. Selzer, R.J. Marhöfer, A. Rohwer: Angewandte Bioinformatik – Eine Einführung. Berlin et al: Springer Verlag, 2004.

15 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-15 Genom- und Proteomanalyse Beispiel für Komplett-Software StackPACK

16 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-16 Genom- und Proteomanalyse StackPACK: Anwendung in CR-EST

17 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-17 Genom- und Proteomanalyse StackPACK - Ein Problemfall

18 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-18 Genom- und Proteomanalyse ESTs und die Identifizierung unbekannter Gene Annotations- und Sequenzsuchen gegen DBs BLASTX mit allen 6 Leserahmen: Achtung! Berücksichtigung von: -Scores, E-Values, Identität, … -Beispiel: siehe Übung zu Sequenzvergleichen weiterhin Motiv-Suche (Interpro): Unterscheidung der Sequenz aufgrund definierter Eigenschaften zusätzliche Methode: ab-initio-Verfahren: -suchen nach Signalen in Sequenz: Translationsstart und -stop, Exons/Introns, Poly-Adenylierungssignal 5 und 3 UTR … -Analysierung der Zusammensetzung der Sequenz ORFs G/C-Gehalt

19 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-19 Genom- und Proteomanalyse Coding and Non-Coding ©P.M. Selzer, R.J. Marhöfer, A. Rohwer: Angewandte Bioinformatik – Eine Einführung. Berlin et al: Springer Verlag, 2004.

20 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-20 Genom- und Proteomanalyse Alternatives Spleißen ©P.M. Selzer, R.J. Marhöfer, A. Rohwer: Angewandte Bioinformatik – Eine Einführung. Berlin et al: Springer Verlag, 2004.

21 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-21 Genom- und Proteomanalyse Identifizierung neuer Mitglieder von Proteinfamilien ©P.M. Selzer, R.J. Marhöfer, A. Rohwer: Angewandte Bioinformatik – Eine Einführung. Berlin et al: Springer Verlag, 2004.

22 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-22 Genom- und Proteomanalyse Hyperlinks zwischen Datenbanken © Mathias Lange, Gatersleben 2005

23 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-23 Genom- und Proteomanalyse DBOra: Eine integrierte Datenbank zur Annotation integrierte relationale Datenbank Protein – Pathway – Literatur – Krankheits – Beziehungen Import basiert auf BioDataServer GUI: Suchmöglichkeiten: Text (Wortstamm, phonetisch, fuzzy,...) AA (lokales BLASTP) NA (lokales BLASTX) Navigation verwendet Schlüssel-Fremdschlüssel- Beziehungen Erreichbarkeit ist vorberechnet © Mathias Lange, Gatersleben 2005

24 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-24 Genom- und Proteomanalyse © Mathias Lange, Gatersleben 2005

25 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-25 Genom- und Proteomanalyse DBOra: Technische Parameter Datenbank-Schema: -81 Tabellen -85 Fremdschlüssel Datenbank-Import: -SwissProt, TrEMBL, BRENDA, KEGG, OMIM -~ 35 Millionen Einträge -~ 6 GByte Daten Index: -381 Indizes -5 GByte Textindizes AA-Sequenzen für BLAST-Vergleiche © Mathias Lange, Gatersleben 2005

26 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-26 Genom- und Proteomanalyse DBOra: Datenbank-Schema (I) © Mathias Lange, Gatersleben 2005 Protein-Eigenschaften Literatur-Referenzen Krankheiten Enzymatische Funktionen Datenbank-Querverweise

27 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-27 Genom- und Proteomanalyse DBOra: Datenbank-Schema (II) © Mathias Lange, Gatersleben 2005 Enzymatische Funktionen

28 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-28 Genom- und Proteomanalyse DBOra: Prozess der automatischen EST-Annotation

29 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-29 Genom- und Proteomanalyse DBOra: Input CR-EST BLASTX Hit Description

30 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-30 Genom- und Proteomanalyse DBOra: Result KEGG Pathway Mapping

31 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-31 Genom- und Proteomanalyse DBOra: Ergebnis der automatischen EST-Annotation © Mathias Lange, Gatersleben 2005

32 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-32 Genom- und Proteomanalyse Annotationen in CR-EST

33 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-33 Genom- und Proteomanalyse Proteomanalyse Messung von mRNA für Aussagen zu Proteinen nicht ausreichend zum Verstehen von komplexen biologischen Systemen Beispiel: Stoffwechselwege werden durch Proteine und nicht durch Gene (des Genoms) oder mRNA (des Transkriptoms) gesteuert! auch Hochdurchsatzverfahren zur Proteom-Analyse: -klassische oder quantitative Proteomics: Identifizierung und Quantifizierung der Proteine -funktionelle Proteomics: Funktionen der Proteine finden

34 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-34 Genom- und Proteomanalyse Klassische Proteomics Ähnlichkeit zu Expression Profiling -> Protein Profiling exprimierte Proteine repräsentieren molekularen Fingerabdruck einer Zelle Vergleich mehrerer Fingerabdrücke -> Identifizierung differentiell exprimierter Proteine (aber auch Gene) Protein Profiling erkennt: -Proteine mit zellulären Funktionen -Messung quantitativer Veränderungen in Proteinzusammensetzung -postranslationale Veränderungen (Phosphorylierungen und Glykosylierungen) -Proteinzusammensetzung von Zellkompartimenten Protein Profiling erkennt nicht: -unlösliche Proteine -Transmembranproteine -schwach exprimierte Proteine

35 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-35 Genom- und Proteomanalyse 2D-Gelelektrophorese & Massenspektroskopie Kombination der beiden ist gängiges Verfahren zum Protein Profiling 2D-Gelelektrophorese: -Proteine eines Zellextrakts in Polyacrylamidgel (Trennmatrix) mit geignetem Puffer ladungsabhängig in elektrischem Feld auftrennen -Nutzung von 2 Eigenschaften: Ladung Masse -Bsp: Protein Cytochrom enthält viele basische Aminosäuren und ist bei neutralem pH-Wert positiv geladen -Veränderung des pH-Wertes der Umgebung -> Änderung der Nettoladung des Proteins -isolektrischer Punkt pI: negative und positive Ladungen eines Proteins sind gegenseitig aufgehoben -wenn pH dem pI entspricht -> keine Wanderung des Proteins im elektrischen Feld

36 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-36 Genom- und Proteomanalyse 2D-Gelelektrophorese jedes Protein besitzt charakteristischem pI -> Auftrennung in pH-Gradienten mit Hilfe des elektrischen Feldes -> 1. Dimension 2. Dimension: Auftrennung nach Molekulargewicht: -Peptide mit geringerem Molekulargewicht wandern schneller hoch-auflösende 2D-Gele: bis zu verschiedene Proteine nach Auftrennung Anwendung spezieller Färbeverfahren zur Sichtbarmachung: -Silberfärbung -Fluoreszensfarbstoffe Digitalisierung der Gele und Auswertung mit bioinformatischen Methoden (z.B. mit Melanie von Expasy): -Spotdetection -Vergleich mehrer Gele – Identifizierung gleicher Spots und Erkennung unterschiedlicher Intensitäten -Normalisierung -statistische Auswertung Ergebnis: Liste mit differentiell exprimierten Proteinen (Unterscheidung nach pI und Molekulargewicht)

37 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-37 Genom- und Proteomanalyse Beispiel eines 2D-Gel-Bildes ©P.M. Selzer, R.J. Marhöfer, A. Rohwer: Angewandte Bioinformatik – Eine Einführung. Berlin et al: Springer Verlag, 2004.

38 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-38 Genom- und Proteomanalyse Massenspektroskopie 2D-Gelanalyse nicht ausreichend Identifizierung eines unbekannten Proteins durch Bestimmung von Teilen der Aminosäuren-Sequenz Vergleich dieser Sequenz mit Protein-DB (aber auch DNA-DB) Anwendung bei der massenspektroskopischen Analyse von Peptiden durch Matrix-assisted Laser Desorption/Ionisation – Time of Flight (MALDI-TOF) sensitive Technik -> Proteinmengen im Pikomol-Bereich ( ) ausreichend Vorgehensweise: 1.Spots aus 2D-Gel ausschneiden 2.Inkubation mit Proteasen (z.B. Schneiden mit Trypsin) 3.Ergebnis sind spezifische Peptidmuster 4.Isolierung dieser aus Gel 5.Analyse mittels Massenspektroskopie 6.jedes Peptid wird durch spezifisches Massenspektrum repräsentiert

39 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-39 Genom- und Proteomanalyse MALDI-TOF von Bruker

40 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-40 Genom- und Proteomanalyse Identifizierung durch Vergleich von experimentell ermittelten und theoretischen Massenspektren ©P.M. Selzer, R.J. Marhöfer, A. Rohwer: Angewandte Bioinformatik – Eine Einführung. Berlin et al: Springer Verlag, 2004.

41 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-41 Genom- und Proteomanalyse Weiterentwicklung der Massenspektroskopie Nachteil bei MALDI-TOF: -zur eindeutigen Identifizierung eines Proteins sind Messungen mehrerer Massenspektren notwendig Neuentwicklungen: -Tandem-Massenspektroskopie: direkte Bestimmung eines Teils der Aminosäure-Sequenz partielle Sequenz reicht für eindeutige Identifizierung in Protein-DB aus -Elektrospray-Ionisations-Quadruploe-TOF-Spektroskopie: sensitive und akkurate Analysen von posttranslationalen Modifikationen

42 Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-42 Genom- und Proteomanalyse Funktionelle Proteomics z.B. Suche nach Protein- Protein-Interaktionen durch solche Interaktionen Vermittlung vieler zellulärer Prozesse Beispiele: -Yeast Two-Hybrid System -Protein-Arrays: a)Sandwich Assays b)Antigen Capture Assay c)direktes Assay …


Herunterladen ppt "Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #4-1 Genom- und Proteomanalyse."

Ähnliche Präsentationen


Google-Anzeigen