Struktur und Regulation von Proteinkomplexen

Slides:



Advertisements
Ähnliche Präsentationen
Steffen Maretzke October 2010 pers com
Advertisements

interdisciplinary joint projects method-oriented platforms
Routing – Routing Protokolle
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (26-Graphenalgorithmen: Wiederholung und Übung) Prof. Th. Ottmann.
Fluoreszenzpolarisation
Algorithmen und Komplexität Teil 1: Grundlegende Algorithmen
Globaler Ansatz Hough-Transformation
Secondary Structure Prediction for Aligned RNA Sequences
Minimum Spanning Tree: MST
Vorlesung: Einführung in der Bioinformatik
Termin Thema 20. Okt Microarray-Technologien, Grundlagen der Datenanalyse 27. Okt Normalisierung von Microarrays I Normalisierung von Microarrays II 3.
Don`t make me think! A Common Sense Approach to Web Usability
Chromatische Zahl.
Effiziente Algorithmen
Effiziente Algorithmen
Hartmut Klauck Universität Frankfurt SS
Shape Similarity 27. Februar 2006 Michael Keller.
VL Algorithmische BioInformatik (19710)
Alle Zellen brauchen Kohlenstoff  Konstruktionswerkstoff (1)
Universität StuttgartInstitut für Wasserbau, Lehrstuhl für Hydrologie und Geohydrologie Copulas (1) András Bárdossy IWS Universität Stuttgart.
VO D6/G6: Einführung in die Politikfeldanalyse
glucose. lipoproteins, plasma proteins, amino acids, keton bodies, urea, bile, retinol, glucoronides exported metabolies and signalling molecules DNA.
Literary Machines, zusammengestellt für ::COLLABOR:: von H. Mittendorfer Literary MACHINES 1980 bis 1987, by Theodor Holm NELSON ISBN
Nachweis von B 0 s -Oszillationen mit dem ATLAS Detektor am LHC B. Epp 1, V.M. Ghete 2, E. Kneringer 1, D. Kuhn 1, A. Nairz 3 1 Institut für Experimentalphysik,
Algorithmen und Datenstrukturen
Kleine genetische Netze: Einfache Steuerungsprogramme Von Sabine Pilari und Marvin Schulz.
Proteins Lennart Voß Marie Ullrich. 1. Central questions What are proteins? How does the human body produce proteins? Which functions do proteins fulfill?
Fakultät für Gesundheitswissenschaften Gesundheitsökonomie und Gesundheitsmanagement Universität Bielefeld WP 3.1 and WP 4.1: Macrocost.
LocoMotif Professor Dr. Katharina Zweig Wolfgang Schlauch Mareike Bockholt TU Kaiserslautern.
EIN NEUES ENSEMBLE- KLASSIFIKATIONSVERFAHREN Tim Schneider Rotation Forest.
V10 Protein-Protein-Interaktionsnetzwerke
Programmiersprachen II Graph_Algorithmen Gewichtete Graphen - Minimum Spanning Tree und shortest path aus Implementierungssicht Prof. Dr. Reiner Güttler.
CL Tree MW 31.1 Business Intelligence Wintersemester 2015 / 2016 Stanislav Prokupetz.
The PageRank Axioms Johannes Zaunschirm. Überblick / Outline  Alon Altman and Moshe Tennenholtz. “Ranking Systems: The PageRank Axioms”., 2005  Basisstruktur.
Zeitplan 2008 Teil Renkawitz-Pohl
Die toten hosen German punk rock band since thirty years With many well known hits.
Steroidhormone und ihre Rezeptoren Warum wichtig: regeln viele Entwicklungsprozesse und bei Wirbeltieren: Sexualität relevante Prozesse 1.Molekularer Mechanismus.
On the case of German has 4 cases NOMINATIVE ACCUSATIVE GENITIVE DATIVE.
Money rules the medicine?! A presentation by Jan Peter Hoffmann European healthcare systems in comparison.
Mitglied der Helmholtz-Gemeinschaft Questions to HESR 6 th March 2012 PANDA-meetingDieter Prasuhn.
Fabian Birzele Ludwig-Maximilians-University Munich Alternative Splicing and Protein Structure Evolution Fabian Birzele, Gergely Csaba and Ralf Zimmer,
Reconstructing the Topology of Protein Complexes
Linde AG : Transparent data enable efficient plant engineering
Lehrstuhl für Bioinformatik (Biol.-Pharm. Fakultät)
2-Genpanel aus Prostatakarzinom-Transkripten im Gesamtblut zur Bestimmung der Prognose und zum Therapiemonitoring beim mCRPC Matthias M. Heck1, Mark Thalgott1,
Struktur und Regulation von Proteinkomplexen
Comprehension and Production of Analogical Problems by a Chimpanzee
Scientific Reasoning in Medical Education
Sentence Structure Connectives
Dr. Caroline C. Friedel Lehr- und Forschungseinheit Bioinformatik
Das Problem des Handlungsreisenden
SWI/SNF Complex expression in unselected colorectal cancer
Bildunterschrift [Cohen, 1994]
Vortrag zur Klausurtagung Früherkennung von Stress und Stresstoleranz
Buy Permethrin Cream 5 Online
University for Health Sciences, Medical Informatics and Technology
Process and Impact of Re-Inspection in NRW
Making connections: Data integration, web services, phylogenies and high-throughput data interpretation. Heiko Schoof Crop Bioinformatics, Bonn University.
Developing Quality in Mathematics Education II
Students have revised SEIN and HABEN for homework
Prof. Thomas Dandekar Bioinformatik Prof. Thomas Dandekar
Wiederholung TexPoint fonts used in EMF.
= 8,7 m € = 121 m € Total Transnationality = 235 m € = 3,1 m €
Ferrite Material Modeling (1) : Kicker principle
eSciDoc als Plattform für die Wissenschaft Anwendungen und Szenarien
Institut für Experimentelle
Integrating Knowledge Discovery into Knowledge Management
Calorimetry as an efficiency factor for biogas plants?
Gemeinsame Ausschreibung von Abschlussarbeiten (Bachelor/Master) des markstones Institute of Marketing, Branding & Technology Wer, wie, was, warum? Das.
 Präsentation transkript:

Struktur und Regulation von Proteinkomplexen Dr. Caroline C. Friedel Lehr- und Forschungseinheit Bioinformatik Institut für Informatik LMU München

Paarweise Interaktionen Motivation Paarweise Interaktionen Friedel & Zimmer, 2006 von Brunn et al., 2007 Friedel & Zimmer, 2007 Fossum et al., 2009 Yeast two-hybrid, Co-IP, BRET Proteinkomplexe Friedel et al., 2008 Friedel & Zimmer, 2008 Krumsiek et al., 2009 Friedel et al., 2009 Friedel & Zimmer, 2009 Affinitätspurifikation Regulation von Proteinkomplexen Dölken et al., 2008 Friedel et al., 2009 Friedel & Dölken, 2009 RNA Umsatz (Halbwertszeit) Microarrays / RNA-seq

Regulation von Proteinkomplexen Motivation Proteinkomplexe Affinitätspurifikation Regulation von Proteinkomplexen RNA Umsatz (Halbwertszeit) Microarrays / RNA-seq

Proteinkomplexe

Identifikation von Proteinkomplexen Proteinkomplexe sind wichtig für alle zellulären Prozesse Können vorhergesagt werden aus Netzwerken von paarweisen Interaktionen (z.B. bestimmt mit Y2H) Affinitätspurifikation ermöglicht die direkte Purifikation von Proteinkomplexen Probleme: Unspezifische Bindungen Fehlende Interaktionen Große Datenmengen Bait Komplex Vorhersage Preys

Vorhersage von Komplexen 2 unabhängige Genom-weite Screens für Hefe: Gavin et al. + Krogan et al. (2006) Wenig Übereinstimmung zwischen ursprünglichen Vorhersagen Verbesserte Methoden angewendet auf kombinierte Daten Bekannte Komplexe notwendig als Trainingsdaten Daten über Proteinkomplexe nur begrenzt vorhanden Purifikationen Berechnung von Interaktionsgewichten Beschränkung auf konfidente Interaktionen Netzwerkclustering Identifikation von überlappenden Komplexen Komplexe

Bootstrap Algorithmus Unsupervised Vorhersage-Algorithmus Beobachtung: Manche Proteine nie als Baits verwendet Manche Baits mehrmals Frage: Wie stabil sind Interaktionen und Komplexe unter Perturbationen der Daten? Verwende Bootstrap Sampling um die Stabilität von Interaktionen und Komplexen zu bewerten Friedel et al. J Comput Biol. 16(8):971-87, 2009

Vollständig unsupervised Kombinierte Purifikationen Ziehen mit Zurücklegen, 1,000 Replikate Bootstrap sampling Komplex Identifikation Verbinde Proteine die in mindestens einem Sample im selben Komplex sind Kantengewicht = Anteil der Samples in denen sie verbunden sind Bootstrap Netzwerk Komplex Identifikation Vollständig unsupervised 8

Proteinkomplexe können mit hoher Genauigkeit Results Angewendet auf kombinierte Gavin und Krogan Daten Bootstrap Netzwerk mit 62,876 Interaktionen Höhere Vorhersagegenauigkeit als alle anderen bisher publizierten Methoden Vorhersage von Komplexen: Verschiedene Konfidenzlevels Mittlere Konfidenz: 409 Komplexe (BT-409) Vergleichbare Qualität zu besten supervised Ansätze Ähnlichkeit der Funktionen und Lokalisationen in Komplexen Vorhersagegenauigkeit von bekannten Komplexen Proteinkomplexe können mit hoher Genauigkeit nur aus Purifikationsdaten vorhergesagt werden

Vorhersage der Komplexstruktur Vorhersage von Proteinkomplexen als Mengen von Proteinen Direkte physikalischen Interaktionen unbekannt Interne Struktur wird ignoriert Die meisten Komplexvorhersagemethoden berechnen Interaktionsgewichte als Zwischenschritt Vorhersage von direkten Interaktionen (Scaffold) aus den Interaktionsgewichten

Mehr als nur Komplexe … Vorhersage der physikalischen Interaktionen basierend nur auf Purifikationsdaten Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

Finde die minimale Menge von Interaktionen Der Scaffold Idee: Finde die minimale Menge von Interaktionen mit maximaler Summe der Gewichte so dass der Komplex verbunden ist Maximaler Spannbaum (Maximum Spanning Tree) MST ist nicht eindeutig Scaffold = Vereinigung aller MSTs Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

Berechnung des Scaffolds Verwende modifizierten Kruskal-Algorithmus Kantengewichte werden in absteigender Reihenfolge betrachtet Für jedes Kantengewicht: Füge Kanten mit diesem Gewicht hinzu, die verschiedene Zusammenhangskomponenten verbinden F F 0.6 0.6 0.4 0.4 0.4 E E 0.4 0.4 0.5 0.5 0.7 0.7 A B D A B D 0.8 0.8 0.4 0.4 0.8 0.8 C C

Viele Interaktionen fehlen MST Netzwerk Baum-artige Struktur Stark vereinfacht Viele Interaktionen fehlen Erweitere das MST Netzwerk um Interaktionen, die nicht durch alternative indirekte Interaktionen erklärt werden Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

MST Erweiterung Annahme: Kantengewichte sind als Konfidenzwerte gegeben [0:1] Können als Wahrscheinlichkeiten interpretiert werden Algorithmus: Berechne MST Netzwerk Sortiere übrige Kanten nach Gewicht Für jede Kante e in nichtsteigender Sortierung Finde optimalen Pfad P im aktuellen Netzwerk (Dijkstra) Falls p(e) >= p(P) Füge die Kante zum aktuellen Netzwerk hinzu Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

MST Erweiterung 0.7 C D 0.6 0.9 0.8 E 0.6 0.4 0.4 A B p(P)=0.9 x 0.7 x 0.8 = 0.504 > 0.4

MST Erweiterung 0.7 C D 0.9 0.8 0.6 A B p(P)=0.9 x 0.7 x 0.8 = 0.504 < 0.6

 Kanten f auf einem Pfad P mit p(P) > p(e): p(f) > p(e) MST Erweiterung Unabhängig von der Reihenfolge, in der Kanten mit gleichem Gewicht betrachtet werden  Kanten f auf einem Pfad P mit p(P) > p(e): p(f) > p(e) 1 C D 0.6 1 0.6 A B

Results Angewendet auf Bootstrap Komplexe and Konfidenzwerte etwa 63,000 Interaktionen insgesamt 9,918 Interaktionen innerhalb von Komplexen MST Ansatz: 1,658 Interaktionen Erweiteter MST Ansatz: 3,085 Interaktionen Auswertung Testset: Experimentell bestimmte direkte Interaktionen (Y2H) Performanzkriterium: TPR/FPR = True Positiv Rate/False Positive Rate Ranking der Methoden kann mit hoher Konfidenz bestimmt werden trotz Meßfehlern Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

Vergleich zu anderen Ansätzen BVH: Bernard et al. RECOMB 2007 Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

Vergleich für verschiedene Referenzdaten Netzwerk der direkten Interaktionen kann nur aus den Purifikationsdaten bestimmt werden Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

RNA Halbwertszeiten

Markierung von neu transkribierter RNA RNA tagging Markierung von neu transkribierter RNA Vorher vorhandene, unmarkierte RNA Neu transkribierte, markierte RNA Gleichzeitige Messung von RNA Abbau und de novo Transkription RNA Quantifizierung mit Microarrays (oder RNA-seq) Dölken et al. RNA 14:1959-72, 2008 Friedel & Dölken. Mol. Biosyst. 5:1271-8, 2009

Vorteile Untersuche direkt Veränderungen in der Neusynthese Erhöhte Sensitivität Beobachtete Veränderungen relativ zur normalen Transkriptionsrate Unabhängig von der normalen Transkriptionsrate Veränderungen in der Halbwertszeit können zeitnah sowohl für kurz- als auch langlebige Transkripte identifiziert werden Zeitliche Entwicklung der Zellreaktion kann bestimmt werden Veränderungen in der Transkription und im RNA Abbau können unterschieden werden Friedel & Dölken. Mol. Biosyst. 5:1271-8, 2009

Bestimmung von RNA Halbwertszeit RNA Halbwertszeit = Geschwindigkeit des RNA Auf- und Abbaus im Gleichgewichtszustand Früher identifiziert durch Transkriptionsinhibition und Beobachtung des RNA Abbaus Zell invasiv Stabilisierung von Transkripten Nicht-invasive Bestimmung aus dem Verhältnis von neu transkribierter / gesamt RNA

Berechnung von RNA Halbwertszeit Berechnung der Halbwertszeiten über exponentiellem Abbau RNA Halbwertszeiten genauer wenn aus de novo Transkription bestimmt De novo Transcription RNA Abbau

Warum sind RNA Halbwertszeiten interessant ? Bestimmen den Effekt auf gesamt RNA für eine spezifische Veränderung in de novo Transkription Wie schnell können Gene transkriptionell reguliert werden ? Schneller Abbau = Schnelle Regulation Langsamer Abbau = Langsame Regulation Vorhersage der Art der Regulation für Gene transkriptionell vs. post-transkriptionell Friedel et al. Nucleic Acids Res. 37:e115, 2009

Beispiel: Hexokinasen Lange Halbwertszeit ‘House-keeping’ Gen Hexokinase I Hexokinase II Kurze Halbwertszeit Expression induziert durch Insulin, Glucose, etc. Friedel et al. Nucleic Acids Res. 37:e115, 2009

RNA Halbwertszeit in Proteinkomplexen Ähnlichkeit von RNA Halbwertszeiten in Proteinkomplexen Ähnliche Regulation der Untereinheiten Aber signifikante Abweichungen sind möglich ~100 Proteine in Mensch und Maus mit signifikant kürzerer RNA Halbwertszeit als die restlichen Untereinheiten 28% der Beobachtungen im Mensch bestätigt für Maus Konservierung der abweichenden Halbwertszeiten Friedel et al. Nucleic Acids Res. 37:e115, 2009

Regulation von Proteinkomplexen Regulation von Proteinkomplexen durch einzelne regulatorische Untereinheiten Ermöglicht schnelle und effiziente transkriptionelle Regulation “Just-in-time assembly” (de Lichtenberg et al. Science 2005) Die Analyse von RNA Halbwertszeiten identifiziert konservierte regulatorische Prinzipien in Proteinkomplexen PBRM1 9.0 / NA ACTL6A 8.2 / 6.3 SMARCA4 5.1/ 5.8 SMARCC2 9.7 / 5.6 SMARCD1 5.4 / 3.3 SMARCC1 11.9 / 6.1 ARID2 2.3 / 1.7 Common with BAF complex SMARCB1 13.3 / 13.7 9.2 / 5.7 SMARCE1 Specific for PBAF complex RNA half-lives for the PBAF (A) and ubiquitin ligase (B) complexes. Half-lives (in hours) for human/mouse are indicated and mapped to grey scales ranging from black (short RNA half-lives) to white (long RNA half-lives). For PBRM1, no transcript half-life could be obtained for murine fibroblasts. For SMARCD1, its RNA half-life in murine fibroblasts was taken from 30 min labeling experiments (14). (A) The PBAF complex consists of several proteins in common with the BAF complex and two specific proteins (ARID2 and PBRM1) (45). ARID2, the only subunit with short transcript half-life in this complex, has been found to be essential for complex stability, potentially by recruiting PBRM1 (45). As most physical interactions in the complex are not characterized, the arrangement of the proteins in this figure does not necessarily represent the true complex structure. (B) Substrate-specificity of the ubiquitin ligase containing CUL5 and RNF7 is determined by binding to different ASB proteins (46,47). TCEB1 and TCEB2 are adaptor proteins which form a heterodimeric complex (Elongin BC) and additionally link the ligase subunits (CUL5 and RNF7) and the ASB protein. Short transcript half-life of the ASB6 and ASB7 subunits allows efficient regulation of complex activity with regard to specific substrates.

Zusammenfassung

Zusammenfassung Proteinkomplexe können nur aus Affinitätspurifikations-Daten identifiziert werden keine zusätzlichen Trainings-Daten notwendig Vorhersagegenauigkeit vergleichbar mit besten supervised Ansätzen Post-Prozessierung von vorhergesagten Proteinkomplexen: identifiziert direkte physikalische Interaktionen ermöglicht die Beschreibung der Komplexstruktur RNA Halbwertszeiten Ermöglichen die Vorhersage von transkriptioneller Regulation Identifikation von konservierten regulatorischen Prinzipien in Proteinkomplexen Regulation von Proteinkomplexen durch transkriptionelle Regulation von wichtigen regulatorischen Untereinheiten

Projekte Protein-Protein Interaktionen Analyse von Virus-host Interaktionen Methoden für Experiment- design und Auswertung RNA tagging RNA-seq zur Analyse von neu transkribierter RNA Kooperation mit Applied Biosystems (SOLiD) Alternatives Splicing und RNA Abbau DFG Antrag auf Sachbeihilfe Mechanismen des RNA Abbaus Einfluß von miRNAs Halbwertszeiten von non-coding RNAs Vergleich von Protein and RNA Halbwertszeiten Proteinkomplexe Modellierung der Komplex- dynamik und -regulation Kombination von Affinitäts-purifikation mit RNA Halbwertszeiten Verbesserung der Scaffold-vorhersage

Kollaborationspartner Jürgen Haas Susanne Bailer Albrecht von Brunn Ekaterina Dall'Armi Even Fossum Lars Dölken Zsolt Ruzsics Ulrich Koszinowski Herbert Schiller Manfred Koegl Peter Ghazal Paul Dickinson Thorsten Forster Reinhard Hoffmann Ania Muntau Søren Gersting Mathias Woidy Kevin Robertson Steven Watterson

Publications 2005 (1) Caroline C. Friedel, Katharina Jahn, Selina Sommer, Stephen Rudd, Hans W. Mewes, Igor V. Tetko. Support vector machines for separation of mixed plant-pathogen EST collections based on codon usage. Bioinfomatics 2005, 21:1383-1388. (2) Caroline C. Friedel, Ralf Zimmer. Toward the complete interactome. Nature Biotechnology 2006, 24:614-615. (3) Caroline C. Friedel, Ralf Zimmer. Inferring topology from clustering coefficients in protein- protein interaction networks. BMC Bioinformatics 2006, 7:519. (4) Chad A. Davis, Fabian Gerick, Volker Hintermair, Caroline C. Friedel, Katrin Fundel, Robert Küffner, Ralf Zimmer. Reliable gene signatures for microarray classification: assessment of stability and performance. Bioinformatics 2006, 22:2356-2363. (5) Caroline C. Friedel, Ulrich Rückert, Stefan Kramer. Cost curves for abstaining classifiers. Proceedings of the third Workshop on ROC Analysis in Machine Learning, Pittsburgh, USA, 2006. (6) Caroline C. Friedel, Ralf Zimmer. Influence of degree correlations on network structure and stability in protein-protein interaction networks. BMC Bioinformatics 2007, 8:297. (7) Albrecht von Brunn, Carola Teepe, Jeremy C. Simpson, Rainer Pepperkok, Caroline C. Friedel, et al. Analysis of intraviral protein-protein interactions of the SARS coronavirus ORFeome. PLoS ONE 2007, 2:e459. (8) Caroline C. Friedel, Jan Krumsiek, Ralf Zimmer. Bootstrapping the interactome: unsupervised identification of protein complexes in yeast. RECOMB 2008, LNBI 4955, pp. 3-16. (9) Caroline C. Friedel, Ralf Zimmer. Identifying the topology of protein complexes from affinity purification assays. Proceedings of the German Conference on Bioinformatics (GCB) 2008, p. 30‑43 (10) Florian Erhard, Caroline C. Friedel, Ralf Zimmer. FERN - A Java framework for stochastic simulation and evaluation of reaction networks. BMC Bioinformatics 2008, 9:356. 2006 2007 2008

Publications 2008 (11) Jan Krumsiek, Caroline C. Friedel, Ralf Zimmer. ProCope - Protein complex prediction and evaluation. Bioinformatics 2008, 24:2115-6. (12) Lars Dölken, Zsolt Ruzsics, Bernd Rädle, Caroline C. Friedel, Ralf Zimmer, Jörg Mages, Reinhard Hoffmann, Paul Dickinson, Thorsten Forster, Peter Ghazal, Ulrich H. Koszinowski. High resolution gene expression profiling for simultaneous kinetic parameter analysis of RNA synthesis, abundance and decay. RNA 2008, 14:1959-72. (13) Caroline C. Friedel, Ralf Zimmer. Identifying the topology of protein complexes from affinity purification assays. Bioinformatics 2009, 25:2140-6. (14) Caroline C. Friedel, Jan Krumsiek, Ralf Zimmer. Bootstrapping the interactome: unsupervised identification of protein complexes in yeast. Journal of Computational Biology 2009, 16:971-87. (15) Caroline C. Friedel, Lars Dölken, Zsolt Ruzsics, Ulrich Koszinowski, Ralf Zimmer. Conserved principles of mammalian transcriptional regulation revealed by RNA half-life. Nucleic Acids Research 2009, 37:e115. (16) Caroline C. Friedel, Lars Dölken. Metabolic tagging and purification of nascent RNA: Implications for transcriptomics. Molecular BioSystems, 2009, 5:1271-8. (17) Even Fossum, Caroline C. Friedel, et al.. Evolutionarily conserved herpesviral protein interaction networks. PloS Pathogens 2009, 5:e1000570. (18) Florian Erhard, Caroline C. Friedel, Ralf Zimmer. FERN - Stochastic Simulation and Evaluation of Reaction Networks. Sangdun Choi (ed.): Systems Biology for Signaling Networks, Springer, 2010. (19) Lars Dölken, Georg Malterer, Florian Erhard, Sheila Kothe, Caroline C. Friedel et al. Systemic Analysis of Viral and Cellular miRNA Targets in Cells Latently Infected with Human γ- Herpesviruses through RISC Immunoprecipitation Assays. Cell Host & Microbe, accepted. (20) Caroline C. Friedel, Stefanie Kaufmann, Lars Dölken, Ralf Zimmer. HALO - A Java framework for precise transcript half-life determination. Bioinformatics, accepted. 2009 2010

Danke für die Aufmerksamkeit Fragen ?