Genom- und Proteomanalyse

Slides:



Advertisements
Ähnliche Präsentationen
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
Advertisements

Vorteile der Online-Produkte
CPCP Institute of Clinical Pharmacology AGAH Annual Meeting, 29. Februar 2004, Berlin, Praktischer Umgang mit den Genehmigungsanträgen gemäß 12. AMG Novelle.
Thomas Zauner Nicole Jahr
Fluoreszenzpolarisation
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
Nachweis verschiedener mRNA‘s des Prostataspezifischen Membranantigens in Lymphknoten von PCa-Patienten U. Fiedler, A. Manseck, R. Kranz, J. Herrmann,
Nachweis von prostataspezifischen Transkripten in regionären Lymphknoten von Patienten mit Prostatakarzinom U. Fiedler, A. Manseck, R. Kranz, M. Wirth.
Übersicht DIALIGN = DIagonal ALIGNment
Scratch Der Einstieg in das Programmieren. Scatch: Entwicklungsumgebung Prof. Dr. Haftendorn, Leuphana Universität Lüneburg,
Java: Objektorientierte Programmierung
Isolation of cDNA clones encoding T cell- specific membrane-associated proteins Matthias Weißkopf 1 Sequence relationships between putative.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Computerkurs: Quantitative Auswertung biochemischer Experimente Tag 8 Einführung in die numerische Integration Aufgabe 18: Simulation einer Assoziationskinetik.
Biochemisches Praktikum für Biologen
© 2006 W. Oberschelp, G. Vossen Rechneraufbau & Rechnerstrukturen, Folie 2.1.
Grundkurs Theoretische Informatik, Folie 2.1 © 2006 G. Vossen,K.-U. Witt Grundkurs Theoretische Informatik Kapitel 2 Gottfried Vossen Kurt-Ulrich Witt.
Internet facts 2008-II Graphiken zu dem Berichtsband AGOF e.V. September 2008.
Online Datenbanken für Bioinformatiker Einführung Bioinformatik Einführung Bioinformatik Oktober 2003.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
PKJ 2005/1 Stefan Dissmann Rückblick auf 2005 Was zuletzt in 2005 vorgestellt wurde: Klassen mit Attributen, Methoden und Konstruktoren Referenzen auf.
PKJ 2005/1 Stefan Dissmann Zusammenfassung Bisher im Kurs erarbeitete Konzepte(1): Umgang mit einfachen Datentypen Umgang mit Feldern Umgang mit Referenzen.
Betreuerin: Kathleen Jerchel
Identifizierung von Proteinen mittels Massenspektrometrie
Anwendungen der PCR und von Hybridisierungstechniken
DNA - Sequenzierstrategien
Analyse von DNA-Sequenzen
Normalformen Normalisieren Schlüssel
6 Normalformen Normalisieren Schlüssel
EST: Expressed Sequence Tag
Vorlesung: Einführung in der Bioinformatik
Biologische Datenbanken
Rechneraufbau & Rechnerstrukturen, Folie 12.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 12.
Phylogenetic Footprinting
Termin Thema 20. Okt Microarray-Technologien, Grundlagen der Datenanalyse 27. Okt Normalisierung von Microarrays I Normalisierung von Microarrays II 3.
Bild 1.1 Copyright © Alfred Mertins | Signaltheorie, 2. Auflage Vieweg+Teubner PLUS Zusatzmaterialien Vieweg+Teubner Verlag | Wiesbaden.
20:00.
1 Fachtagung am Seniorenorientiertes Design und Marketing ThyssenKrupp Immobilien Design for all - Anpassungen im Wohnungsbestand 1.Demographie.
Thorsten Peter Daniel Kaplan
MOL.504 Analyse von DNA- und Proteinsequenzen
HORIZONT 1 XINFO ® Das IT - Informationssystem Java Scanner HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 / 540.
Polynome und schnelle Fourier-Transformation
Analyse von Ablaufdiagrammen
HORIZONT 1 XINFO ® Das IT - Informationssystem HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 /
HORIZONT 1 XINFO ® Das IT - Informationssystem HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 /
HORIZONT 1 XINFO ® Das IT - Informationssystem PL/1 Scanner HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 / 540.
Publikation auf Knopfdruck Judith Riegelnig Michael Grüebler 19. Oktober 2010 / Statistiktage Neuenburg.
PROCAM Score Alter (Jahre)
VL Algorithmische BioInformatik (19710)
NIN-Arbeitsblätter Paul-Emile Müller
Vorlesung Mai 2000 Konstruktion des Voronoi-Diagramms II
Genetik 2 Biotechnologie.
PARTENARIAT ÉDUCATIF GRUNDTVIG PARTENARIAT ÉDUCATIF GRUNDTVIG REPERES KULTURELLER ZUSAMMENHALT UND AUSDEHNUNG DER IDEEN AUF EUROPÄISCHEM.
Das IT - Informationssystem
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Analyseprodukte numerischer Modelle
Pigmentierte Läsionen der Haut
Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.
Vortrag von Rechtsanwältin Verena Nedden, Fachanwältin für Steuerrecht zur Veranstaltung Wege zum bedingungslosen Grundeinkommen der Piratenpartei Rhein-Hessen.
Paarweises Sequenz-Alignment
1 Mathematical Programming Nichtlineare Programmierung.
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
STLB-Bau – Vernetzung von Fachinformationen
Kompetenztraining Jura Martin Zwickel / Eva Julia Lohse / Matthias Schmid ISBN: © 2014 Walter de Gruyter GmbH, Berlin/Boston Abbildungsübersicht.
Das IT - Informationssystem
Qualitative Interviews Sabina Misoch ISBN: © 2015 Walter de Gruyter GmbH, Berlin/Mu ̈ nchen/Boston Abbildungsübersicht / List of Figures.
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Monatsbericht Ausgleichsenergiemarkt Gas – Oktober
 Präsentation transkript:

Genom- und Proteomanalyse

Begriffe (1) Genom (Hans Winkler, 1920): Genomics: Gesamtheit der vererbbaren Informationen einer Zelle Speichermedium DNA Kodiert die Ausprägungen der spezifischen Eigenschaften eines Organismus Genomics: Erforschung des Genoms Organismus Basenpaare Escherichia coli 4,7*106 Saccharomyces cerevisiae 1,2*107 Drosophila melanogaster 1,3*108 Homo sapiens sapiens 3*109 Arabidopsis thaliana 1,2*108 Hordeum vulgare 4,8*109 Triticum aestivum 1,6*1010

Begriffe (2) Proteom (Marc Wilkins, 1994): Proteomics: Gesamtheit aller zu einem bestimmten Zeitpunkt exprimierten Proteine eines Organismus Proteomics: Erforschung des Proteoms

Genomanalyse Genomanalyse: Ermittlung von funktionellen Bereichen (Genen) von Organismen Ziel: Zuordnung von Funktionen zu genetischen Elementen Einsatz der Bioinformatik zur Identifikation und Charakterisierung genetischer Elemente z.B. Erkennung von Promotoren, Transkriptionsfaktorbindungsstellen (TFBS) etc.

Sequenzierung kompletter Genome 1995: 1. vollst. sequenziertes Bakteriengenom Haemophilus influenza neue Ära: alle Gene und regulatorische Bereiche 1998: erster Mehrzeller Caenorhabditis elegans Problem Größe der kodierenden Bereiche bei Eykaryoten: Mensch und Maus ca. 1,4% des Gesamtgenoms Mensch und Maus: 5% der Genome hoch konserviert aber mehr als 80% orthologe Gene bzw. Proteine Einschub (Quelle: http://www.ncbi.nlm.nih.gov/Education/BLASTinfo/Orthology.html): Homologous sequences. Orthologs and Paralogs are two types of homologous sequences. Orthology describes genes in different species that derive from a common ancestor. Orthologous genes may or may not have the same function. Paralogy describes homologous genes within a single species that diverged by gene duplication.

Sequenzierung kompletter Genome 1995: 1. vollst. sequenziertes Bakteriengenom Haemophilus influenza neue Ära: alle Gene und regulatorische Bereiche 1998: erster Mehrzeller Caenorhabditis elegans Problem Größe der kodierenden Bereiche bei Eykaryoten: Mensch und Maus ca. 1,4% des Gesamtgenoms Mensch und Maus: 5% der Genome hoch konserviert aber mehr als 80% orthologe Gene bzw. Proteine Einschub (Quelle: http://www.ncbi.nlm.nih.gov/Education/BLASTinfo/Orthology.html): Homologous sequences. Orthologs and Paralogs are two types of homologous sequences. Orthology describes genes in different species that derive from a common ancestor. Orthologous genes may or may not have the same function. Paralogy describes homologous genes within a single species that diverged by gene duplication.

Genomcharakterisierung mit STS STS - Sequence Tagged Sites: Orientierungspunkte z.B. im menschlichen Genom kurze DNA-Sequenzen mit Länge von 200 – 500 Basenpaaren STS kommt nur einmal im Genom vor! Ort und Basissequenz bekannt Marker für Kartierung von Chromosomen bzw. Genom Generierung von STS durch PCR DNA-Klone können durch DB-Suche auf Existenz von passenden STS durchsucht werden und anhand dieser Information auf Chromosomen bzw. in Genomen positioniert werden. -> präzise physikalische Karte seit 1994 eigene DB am NCBI: dbSTS Name, Sequenz für Amplifikation, Größe des PCR-Produkts, Sequenz, …

EST = Expressed Sequence Tags „Endeckung“ neuer Gene durch ESTs wird 1991 erkannt cDNA-Clone stammen von exprimierten Genen ab -> Name Generierung von ESTs durch Sequenzierung der cDNA von beiden Enden viele Projekte zur EST-Sequenzierung -> Hochdurchsatz aber auch Kritik: schlechte Qualität durch single Run und automatische Generierung: Substitutionen und Insertionen/Deletionen -> Frameshifts (Verschiebung von Basentripletts; Kodierung anderer Aminosäuren) schlechte Qualität in internationalen Nukleotidsequenz-DBs keine regulatorischen Elemente NCBI: dbEST und Unigene TIGR: Gene Indicies

EST - Sequenzierungsprojekte Zellen, Gewebe, Organismus © P.M. Selzer, R.J. Marhöfer, A. Rohwer: Angewandte Bioinformatik – Eine Einführung. Berlin et al: Springer Verlag, 2004.

Qualitätsmerkmale Anwendung folgender Kriterien beim Trimming: Mindestlänge der ESTs Anzahl von Ns im Gegensatz zu eindeutig identifizierten Nukleotiden (A/T/G/C) Quality Scores des Sequenzierautomaten Maß für Sequenzqualität jedes einzelnen Nukleotids Kontamination mit Vektor- oder Bakterien-DNA

Zwischenergebnisse Sammlung von ESTs mit unterschiedlicher Länge und zufälliger Auswahl von cDNA-Sequenzen aber auch ESTs von gleichen Transkripten besonders von hoch exprimierten Genen Existenz von Redundanz Reduzierung durch Assemblierung und Alignments aus ähnlichen ESTs Ergebnis sind Konsensussequenzen bei großen EST-Projekten vorher Clustern Zusammenfassung in Gruppen von EST mit identischen Nukleotiden in einem Bereich danach stringenteres Assemblieren und Alignen

ESTs, Contigs und Konsensussequenzen © P.M. Selzer, R.J. Marhöfer, A. Rohwer: Angewandte Bioinformatik – Eine Einführung. Berlin et al: Springer Verlag, 2004.

Beispiel für Komplett-Software StackPACK™ http://www. egenetics

StackPACK™: Anwendung in CR-EST

StackPACK™ - Ein Problemfall

ESTs und die Identifizierung unbekannter Gene Annotations- und Sequenzsuchen gegen DBs BLASTX mit allen 6 Leserahmen: Achtung! Berücksichtigung von: Scores, E-Values, Identität, … Beispiel: siehe Übung zu Sequenzvergleichen weiterhin Motiv-Suche (Interpro): Unterscheidung der Sequenz aufgrund definierter Eigenschaften zusätzliche Methode: ab-initio-Verfahren: suchen nach Signalen in Sequenz: Translationsstart und -stop, Exons/Introns, Poly-Adenylierungssignal 5‘ und 3‘ UTR … Analysierung der Zusammensetzung der Sequenz ORFs G/C-Gehalt

Coding and Non-Coding © P.M. Selzer, R.J. Marhöfer, A. Rohwer: Angewandte Bioinformatik – Eine Einführung. Berlin et al: Springer Verlag, 2004.

Alternatives Spleißen © P.M. Selzer, R.J. Marhöfer, A. Rohwer: Angewandte Bioinformatik – Eine Einführung. Berlin et al: Springer Verlag, 2004.

Identifizierung neuer Mitglieder von Proteinfamilien © P.M. Selzer, R.J. Marhöfer, A. Rohwer: Angewandte Bioinformatik – Eine Einführung. Berlin et al: Springer Verlag, 2004.

Hyperlinks zwischen Datenbanken © Mathias Lange, Gatersleben 2005

DBOra: Eine integrierte Datenbank zur Annotation integrierte relationale Datenbank Protein – Pathway – Literatur – Krankheits – Beziehungen Import basiert auf BioDataServer GUI: http://pgrc.ipk-gatersleben.de/DBOraWeb/ Suchmöglichkeiten: Text (Wortstamm, phonetisch, fuzzy, ...) AA (lokales BLASTP) NA (lokales BLASTX) Navigation verwendet Schlüssel-Fremdschlüssel-Beziehungen Erreichbarkeit ist vorberechnet © Mathias Lange, Gatersleben 2005

© Mathias Lange, Gatersleben 2005

DBOra: Technische Parameter Datenbank-Schema: 81 Tabellen 85 Fremdschlüssel Datenbank-Import: SwissProt, TrEMBL, BRENDA, KEGG, OMIM ~ 35 Millionen Einträge ~ 6 GByte Daten Index: 381 Indizes 5 GByte Textindizes 836.013 AA-Sequenzen für BLAST-Vergleiche © Mathias Lange, Gatersleben 2005

DBOra: Datenbank-Schema (I) Protein-Eigenschaften Literatur-Referenzen Krankheiten Enzymatische Funktionen Datenbank-Querverweise © Mathias Lange, Gatersleben 2005

DBOra: Datenbank-Schema (II) Enzymatische Funktionen © Mathias Lange, Gatersleben 2005

DBOra: Prozess der automatischen EST-Annotation

DBOra: Input CR-EST BLASTX Hit Description

DBOra: Result KEGG Pathway Mapping

DBOra: Ergebnis der automatischen EST-Annotation © Mathias Lange, Gatersleben 2005

Annotationen in CR-EST

Proteomanalyse Messung von „mRNA“ für Aussagen zu Proteinen nicht ausreichend zum Verstehen von komplexen biologischen Systemen Beispiel: Stoffwechselwege werden durch Proteine und nicht durch Gene (des Genoms) oder mRNA (des Transkriptoms) gesteuert! auch Hochdurchsatzverfahren zur Proteom-Analyse: klassische oder quantitative Proteomics: Identifizierung und Quantifizierung der Proteine funktionelle Proteomics: Funktionen der Proteine finden

Klassische Proteomics Ähnlichkeit zu Expression Profiling -> Protein Profiling exprimierte Proteine repräsentieren molekularen Fingerabdruck einer Zelle Vergleich mehrerer „Fingerabdrücke“ -> Identifizierung differentiell exprimierter Proteine (aber auch Gene) Protein Profiling erkennt: Proteine mit zellulären Funktionen Messung quantitativer Veränderungen in Proteinzusammensetzung postranslationale Veränderungen (Phosphorylierungen und Glykosylierungen) Proteinzusammensetzung von Zellkompartimenten Protein Profiling erkennt nicht: unlösliche Proteine Transmembranproteine schwach exprimierte Proteine

2D-Gelelektrophorese & Massenspektroskopie Kombination der beiden ist gängiges Verfahren zum Protein Profiling 2D-Gelelektrophorese: Proteine eines Zellextrakts in Polyacrylamidgel (Trennmatrix) mit geignetem Puffer ladungsabhängig in elektrischem Feld auftrennen Nutzung von 2 Eigenschaften: Ladung Masse Bsp: Protein Cytochrom enthält viele basische Aminosäuren und ist bei neutralem pH-Wert positiv geladen Veränderung des pH-Wertes der Umgebung -> Änderung der Nettoladung des Proteins isolektrischer Punkt pI: negative und positive Ladungen eines Proteins sind gegenseitig aufgehoben wenn pH dem pI entspricht -> keine Wanderung des Proteins im elektrischen Feld

2D-Gelelektrophorese jedes Protein besitzt charakteristischem pI -> Auftrennung in pH-Gradienten mit Hilfe des elektrischen Feldes -> 1. Dimension 2. Dimension: Auftrennung nach Molekulargewicht: Peptide mit geringerem Molekulargewicht wandern schneller hoch-auflösende 2D-Gele: bis zu 10.000 verschiedene Proteine nach Auftrennung Anwendung spezieller Färbeverfahren zur Sichtbarmachung: Silberfärbung Fluoreszensfarbstoffe Digitalisierung der Gele und Auswertung mit bioinformatischen Methoden (z.B. mit Melanie von Expasy): Spotdetection Vergleich mehrer Gele – Identifizierung gleicher Spots und Erkennung unterschiedlicher Intensitäten Normalisierung statistische Auswertung Ergebnis: Liste mit differentiell exprimierten Proteinen (Unterscheidung nach pI und Molekulargewicht)

Beispiel eines 2D-Gel-Bildes © P.M. Selzer, R.J. Marhöfer, A. Rohwer: Angewandte Bioinformatik – Eine Einführung. Berlin et al: Springer Verlag, 2004.

Massenspektroskopie 2D-Gelanalyse nicht ausreichend Identifizierung eines unbekannten Proteins durch Bestimmung von Teilen der Aminosäuren-Sequenz Vergleich dieser Sequenz mit Protein-DB (aber auch DNA-DB) Anwendung bei der massenspektroskopischen Analyse von Peptiden durch Matrix-assisted Laser Desorption/Ionisation – Time of Flight (MALDI-TOF) sensitive Technik -> Proteinmengen im Pikomol-Bereich (10-12) ausreichend Vorgehensweise: Spots aus 2D-Gel ausschneiden Inkubation mit Proteasen (z.B. „Schneiden“ mit Trypsin) Ergebnis sind spezifische Peptidmuster Isolierung dieser aus Gel Analyse mittels Massenspektroskopie jedes Peptid wird durch spezifisches Massenspektrum repräsentiert

MALDI-TOF von Bruker

Identifizierung durch Vergleich von experimentell ermittelten und theoretischen Massenspektren © P.M. Selzer, R.J. Marhöfer, A. Rohwer: Angewandte Bioinformatik – Eine Einführung. Berlin et al: Springer Verlag, 2004.

Weiterentwicklung der Massenspektroskopie Nachteil bei MALDI-TOF: zur eindeutigen Identifizierung eines Proteins sind Messungen mehrerer Massenspektren notwendig Neuentwicklungen: Tandem-Massenspektroskopie: direkte Bestimmung eines Teils der Aminosäure-Sequenz partielle Sequenz reicht für eindeutige Identifizierung in Protein-DB aus Elektrospray-Ionisations-Quadruploe-TOF-Spektroskopie: sensitive und akkurate Analysen von posttranslationalen Modifikationen

Funktionelle Proteomics z.B. Suche nach Protein-Protein-Interaktionen durch solche Interaktionen Vermittlung vieler zellulärer Prozesse Beispiele: Yeast Two-Hybrid System Protein-Arrays: Sandwich Assays Antigen Capture Assay direktes Assay …