Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Struktur und Regulation von Proteinkomplexen

Ähnliche Präsentationen


Präsentation zum Thema: "Struktur und Regulation von Proteinkomplexen"—  Präsentation transkript:

1 Struktur und Regulation von Proteinkomplexen
Dr. Caroline C. Friedel Lehr- und Forschungseinheit Bioinformatik Institut für Informatik LMU München

2 Paarweise Interaktionen
Motivation Paarweise Interaktionen Friedel & Zimmer, 2006 von Brunn et al., 2007 Friedel & Zimmer, 2007 Fossum et al., 2009 Yeast two-hybrid, Co-IP, BRET Proteinkomplexe Friedel et al., 2008 Friedel & Zimmer, 2008 Krumsiek et al., 2009 Friedel et al., 2009 Friedel & Zimmer, 2009 Affinitätspurifikation Regulation von Proteinkomplexen Dölken et al., 2008 Friedel et al., 2009 Friedel & Dölken, 2009 RNA Umsatz (Halbwertszeit) Microarrays / RNA-seq

3 Regulation von Proteinkomplexen
Motivation Proteinkomplexe Affinitätspurifikation Regulation von Proteinkomplexen RNA Umsatz (Halbwertszeit) Microarrays / RNA-seq

4 Proteinkomplexe

5 Identifikation von Proteinkomplexen
Proteinkomplexe sind wichtig für alle zellulären Prozesse Können vorhergesagt werden aus Netzwerken von paarweisen Interaktionen (z.B. bestimmt mit Y2H) Affinitätspurifikation ermöglicht die direkte Purifikation von Proteinkomplexen Probleme: Unspezifische Bindungen Fehlende Interaktionen Große Datenmengen Bait Komplex Vorhersage Preys

6 Vorhersage von Komplexen
2 unabhängige Genom-weite Screens für Hefe: Gavin et al. + Krogan et al. (2006) Wenig Übereinstimmung zwischen ursprünglichen Vorhersagen Verbesserte Methoden angewendet auf kombinierte Daten Bekannte Komplexe notwendig als Trainingsdaten Daten über Proteinkomplexe nur begrenzt vorhanden Purifikationen Berechnung von Interaktionsgewichten Beschränkung auf konfidente Interaktionen Netzwerkclustering Identifikation von überlappenden Komplexen Komplexe

7 Bootstrap Algorithmus
Unsupervised Vorhersagealgorithmus Beobachtung: Manche Proteine nie als Baits verwendet Manche Baits mehrmals Frage: Wie stabil sind Interaktionen und Komplexe unter Perturbationen der Daten? Verwende Bootstrap Sampling um die Stabilität von Interaktionen und Komplexen zu bewerten Friedel et al. J Comput Biol. 16(8):971-87, 2009

8 Vollständig unsupervised
Kombinierte Purifikationen Ziehen mit Zurücklegen, 1,000 Replikate Bootstrap sampling Komplex Identifikation Verbinde Proteine die in mindestens einem Sample im selben Komplex sind Kantengewicht = Anteil der Samples in denen sie verbunden sind Bootstrap Netzwerk Komplex Identifikation Vollständig unsupervised 8

9 Proteinkomplexe können mit hoher Genauigkeit
Results Angewendet auf kombinierte Gavin und Krogan Daten Bootstrap Netzwerk mit 62,876 Interaktionen Höhere Vorhersagegenauigkeit als alle anderen bisher publizierten Methoden Vorhersage von Komplexen: Verschiedene Konfidenzlevels Mittlere Konfidenz: 409 Komplexe (BT-409) Vergleichbare Qualität zu besten supervised Ansätze Ähnlichkeit der Funktionen und Lokalisationen in Komplexen Vorhersagegenauigkeit von bekannten Komplexen Proteinkomplexe können mit hoher Genauigkeit nur aus Purifikationsdaten vorhergesagt werden

10 Predictive performance
ROC curve for score/bootstrap networks True positives: interactions in same MIPS complex False positives: interactions between different MIPS complexes + different localization Friedel et al. J Comput Biol. 16(8):971-87, 2009

11 Functional and localization similarity in complexes
Complex quality Functional and localization similarity in complexes Bootstrap complexes

12 Prediction accuracy Positive predictive value: Fraction of proteins predicted for a complex which are correct Sensitivity: Fraction of proteins in a complex that are recovered Bootstrap complexes

13 Vorhersage der Komplexstruktur
Vorhersage von Proteinkomplexen als Mengen von Proteinen Direkte physikalischen Interaktionen unbekannt Interne Struktur wird ignoriert Die meisten Komplexvorhersagemethoden berechnen Interaktionsgewichte als Zwischenschritt Vorhersage von direkten Interaktionen (Scaffold) aus den Interaktionsgewichten

14 Mehr als nur Komplexe … Vorhersage der physikalischen Interaktionen basierend nur auf Purifikationsdaten Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

15 Finde die minimale Menge von Interaktionen
Der Scaffold Idee: Finde die minimale Menge von Interaktionen mit maximaler Summe der Gewichte so dass der Komplex verbunden ist Maximaler Spannbaum (Maximum Spanning Tree) MST ist nicht eindeutig Scaffold = Vereinigung aller MSTs Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

16 Viele Interaktionen fehlen
MST Netzwerk Baum-artige Struktur Stark vereinfacht Viele Interaktionen fehlen Erweitere das MST Netzwerk um Interaktionen, die nicht durch alternative indirekte Interaktionen erklärt werden Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

17 Erweiterung Annahme: Kantengewichte sind als Konfidenzwerte gegeben [0:1] Können als Wahrscheinlichkeiten interpretiert werden Algorithmus: Berechne MST Netzwerk Sortiere übrige Kanten nach Gewicht Für jede Kante e in absteigender Sortierung Finde optimalen Pfad P im aktuellen Netzwerk (Dijkstra) Falls p(e) >= p(P) Füge die Kante zum aktuellen Netzwerk hinzu Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

18 Results Angewendet auf Bootstrap Komplexe and Konfidenzwerte
etwa 63,000 Interaktionen insgesamt 9,918 Interaktionen innerhalb von Komplexen MST Ansatz: 1,658 Interaktionen Erweiteter MST Ansatz: 3,085 Interaktionen Auswertung Testset: Experimentell bestimmte direkte Interaktionen (Y2H) Performanzkriterium: TPR/FPR = True Positiv Rate/False Positive Rate Ranking der Methoden kann mit hoher Konfidenz bestimmt werden trotz Meßfehlern Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

19 Vergleich zu anderen Ansätzen
BVH: Bernard et al. RECOMB 2007 Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

20 Vergleich für verschiedene Referenzdaten
Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

21 Bestimmung von Subkomplexen
Netzwerk der direkten Interaktionen kann nur aus den Purifikationsdaten bestimmt werden Friedel & Zimmer. Bioinformatics. 15;25(16):2140-6, 2009.

22 RNA directed DNA polymerase
II III

23 The Scaffold

24 Extending the Scaffold
Pol I Pol III Pol II

25 Extending the Scaffold
Relaxing the conditions Complex scaffold can be learned from purification data alone

26 RNA Halbwertszeiten

27 Markierung von neu transkribierter RNA
RNA tagging Markierung von neu transkribierter RNA Vorher vorhandene, unmarkierte RNA Neu transkribierte, markierte RNA Gleichzeitige Messung von RNA Abbau und de novo Transkription RNA Quantifizierung mit Microarrays (oder RNA-seq) Dölken et al. RNA 14: , 2008 Friedel & Dölken. Mol. Biosyst. 5:1271-8, 2009

28 Metabolic tagging of newly transcribed RNA
4-thiouridine (4sU) Kenzelmann et al., PNAS, 2007 Tagging of newly transcribed RNA U U U U U U Dölken et al., RNA, 2008 Thiol-mediated purification Newly transcribed RNA Pre-existing RNA U U U U U U

29 Metabolic tagging of newly transcribed RNA
Pre-existing RNA U U U U U U RNA quantification Microarrays / RNA-seq Standard Workflow Normalization Detection of differentially expressed genes

30 Vorteile Untersuche direkt Veränderungen in der Neusynthese
Erhöhte Sensitivität Beobachtete Veränderungen relativ zur normalen Transkriptionsrate Unabhängig von der RNA Halbwertszeit Veränderungen in der Halbwertszeit können zeitnah sowohl für kurz- als auch langlebige Transkripte identifiziert werden Zeitliche Entwicklung der Zellreaktion kann bestimmt werden Veränderungen in der Transkription und im RNA Abbau können unterschieden werden Friedel & Dölken. Mol. Biosyst. 5:1271-8, 2009

31 Bestimmung von RNA Halbwertszeit
RNA Halbwertszeit ~ Geschwindigkeit des RNA Auf- und Abbaus Früher identifiziert durch Transkriptionsinhibition und Beobachtung des RNA Abbaus Zell invasiv Stabilisierung von Transkripten Nicht-invasive Bestimmung aus dem Verhältnis von neu transkribierter / gesamt RNA

32 Normalization Standard normalization methods assume overall equal intensities After normalization, measured newly transcribed/total and pre-existing/total ratios proportional to true ratios Estimate normalization factors with linear regression using that Normalization based on thousands of gene from one time point only Allows quality control of probe sets

33 Correction factors

34 Berechnung von RNA Halbwertszeit
RNA Halbwertszeiten bestimmt aus de novo Transkription genauer als aus RNA Abbau De novo Transcription RNA Abbau

35 Conservation of RNA half-life
Comparison of half-lives in human B-cells and murine fibroblasts Identify patterns governing RNA decay conserved across species and cell-types

36 Warum sind RNA Halbwertszeiten interessant ?
Bestimmen den Effekt auf gesamt RNA für eine spezifische Veränderung in de novo Transkription Wie schnell können Gene transkriptionell reguliert werden ? Schneller Abbau = Schnelle Regulation Langsame Abbau = Langsame Regulation Vorhersage der Art der Regulation für Gene transkriptionell vs. post-transkriptionell Friedel et al. Nucleic Acids Res. 37:e115, 2009

37 Functional analysis Transcript half-life correlated to gene function Fast transcript decay for genes regulating transcription and signal transduction

38 Response time Response time linear in half-life

39 Functional analysis Transcript half-life correlated to gene function Slow transcript decay for energy metabolism, translation and protein degradation

40 Regulation and RNA half-life
Fast transcript decay: Fast regulation possible by changes in transcription Can be reversed fast Slow transcript decay: Stable mRNA concentrations Transcriptional regulation can only be slow Cannot be reversed fast Gene regulation can be predicted from RNA half-life

41 Beispiel: Hexokinasen
Lange Halbwertszeit ‘House-keeping’ Gen Hexokinase I Hexokinase II Kurze Halbwertszeit Expression induziert durch Insulin, Glucose, etc. Friedel et al. Nucleic Acids Res. 37:e115, 2009

42 RNA Halbwertszeit in Proteinkomplexen
Ähnlichkeit von RNA Halbwertszeiten in Proteinkomplexen Ähnliche Regulation der Untereinheiten Aber signifikante Abweichungen sind möglich ~100 Proteine in Mensch und Maus mit signifikant kürzerer RNA Halbwertszeit als die restlichen Untereinheiten 28% der Beobachtungen im Mensch bestätigt für Maus Konservierung der abweichenden Untereinheiten Friedel et al. Nucleic Acids Res. 37:e115, 2009

43 Regulation von Proteinkomplexen
Regulation von Proteinkomplexen durch einzelne regulatorische Untereinheiten Ermöglicht schnelle und effiziente transkriptionelle Regulation “Just-in-time assembly” (de Lichtenberg et al. Science 2005) Die Analyse von RNA Halbwertszeiten identifiziert konservierte regulatorische Prinzipien in Proteinkomplexen ASB6 1.0 / 0.7 TCEB1 5.8 / 8.7 TCEB2 18.5 / 16 CUL5 4.5 / 2.8 RNF7 4.5 / 4.6 Substrat Erkennung Ubiquitin Ligase ASB7 0.3 / 1.7 PBRM1 9.0 / NA ACTL6A 8.2 / 6.3 SMARCA4 5.1/ 5.8 SMARCC2 9.7 / 5.6 SMARCD1 5.4 / 3.3 SMARCC1 11.9 / 6.1 ARID2 2.3 / 1.7 Gemein mit BAF Komplex SMARCB1 13.3 / 13.7 SMARCE1 9.2 / 5.7 Spezifisch für PBAF Komplex RNA half-lives for the PBAF (A) and ubiquitin ligase (B) complexes. Half-lives (in hours) for human/mouse are indicated and mapped to grey scales ranging from black (short RNA half-lives) to white (long RNA half-lives). For PBRM1, no transcript half-life could be obtained for murine fibroblasts. For SMARCD1, its RNA half-life in murine fibroblasts was taken from 30 min labeling experiments (14). (A) The PBAF complex consists of several proteins in common with the BAF complex and two specific proteins (ARID2 and PBRM1) (45). ARID2, the only subunit with short transcript half-life in this complex, has been found to be essential for complex stability, potentially by recruiting PBRM1 (45). As most physical interactions in the complex are not characterized, the arrangement of the proteins in this figure does not necessarily represent the true complex structure. (B) Substrate-specificity of the ubiquitin ligase containing CUL5 and RNF7 is determined by binding to different ASB proteins (46,47). TCEB1 and TCEB2 are adaptor proteins which form a heterodimeric complex (Elongin BC) and additionally link the ligase subunits (CUL5 and RNF7) and the ASB protein. Short transcript half-life of the ASB6 and ASB7 subunits allows efficient regulation of complex activity with regard to specific substrates. Friedel et al. Nucleic Acids Res. 37:e115, 2009

44 Zusammenfassung

45 Zusammenfassung Proteinkomplexe
können nur aus Affinitätspurifikations-Daten identifiziert werden keine zusätzlichen Trainings-Daten notwendig Vorhersagegenauigkeit vergleichbar mit besten supervised Ansätzen Post-Prozessierung von vorhergesagten Proteinkomplexen: identifiziert direkte physikalische Interaktionen ermöglicht die Beschreibung der Komplexstruktur RNA Halbwertszeiten Ermöglichen die Vorhersage von transkriptioneller Regulation Identifikation von konservierten regulatorischen Prinzipien in Proteinkomplexen Regulation von Proteinkomplexen durch transkriptionelle Regulation von wichtigen regulatorischen Untereinheiten

46 Projekte Protein-Protein Interaktionen
Analyse von Virus-host Interaktionen Methoden für Experiment- design und Auswertung RNA tagging Software für RNA Halbwertszeit- Berechnung (HALO) RNA-seq zur Analyse von neu transkribierter RNA Kooperation mit Applied Biosystems (SOLiD) Alternatives Splicing und RNA Abbau DFG Antrag auf Sachbeihilfe Mechanismen des RNA Abbaus Einfluß von miRNAs Vergleich von Protein and RNA Halbwertszeiten Proteinkomplexe Modellierung der Komplex- dynamik und -regulation Kombination von Affinitäts-purifikation mit RNA Halbwertszeiten Verbesserung der Scaffold-vorhersage

47 Kollaborationspartner
Jürgen Haas Susanne Bailer Albrecht von Brunn Ekaterina Dall'Armi Even Fossum Theo Kraus Lars Dölken Zsolt Ruzsics Ulrich Koszinowski Reinhard Hoffmann Peter Ghazal Paul Dickinson Thorsten Forster Manfred Koegl Ania Muntau Søren Gersting Mathias Woidy Kevin Robertson Steven Watterson

48 Publikationen Florian Erhard, Caroline C. Friedel, Ralf Zimmer. FERN - Stochastic Simulation and Evaluation of Reaction Networks. Sangdun Choi (ed.): Systems Biology for Signaling Networks, Springer, 2010. Caroline C. Friedel, Ralf Zimmer. Identifying the topology of protein complexes from affinity purification assays. Bioinformatics 2009, 25: Caroline C. Friedel, Jan Krumsiek, Ralf Zimmer. Bootstrapping the interactome: unsupervised identification of protein complexes in yeast. Journal of Computational Biology 2009, 16: Caroline C. Friedel, Lars Dölken, Zsolt Ruzsics, Ulrich Koszinowski, Ralf Zimmer. Conserved principles of mammalian transcriptional regulation revealed by RNA half-life. Nucleic Acids Research 2009, 37:e115. Caroline C. Friedel, Lars Dölken. Metabolic tagging and purification of nascent RNA: Implications for transcriptomics. Molecular BioSystems, 2009, 5: Even Fossum, Caroline C. Friedel, Seesandra V. Rajagopala, Björn Titz, Armin Baiker, Tina Schmidt, Theo Kraus, Thorsten Stellberger, Christiane Rutenberg, Silpa Suthram, Sourav Bandyopadhyay, Dietlinde Rose, Albrecht von Brunn, Mareike Uhlmann, Christine Zeretzke, Yu-An Dong, Hélène Boulet, Manfred Koegl, Susanne M. Bailer, Ulrich Koszinowski, Trey Ideker, Peter Uetz, Ralf Zimmer, Jürgen Haas. Evolutionarily conserved herpesviral protein interaction networks. PloS Pathogens 2009, 5:e Florian Erhard, Caroline C. Friedel, Ralf Zimmer. FERN - A Java framework for stochastic simulation and evaluation of reaction networks. BMC Bioinformatics 2008, 9:356. Jan Krumsiek, Caroline C. Friedel, Ralf Zimmer. ProCope - Protein complex prediction and evaluation. Bioinformatics 2008, 24: Lars Dölken, Zsolt Ruzsics, Bernd Rädle, Caroline C. Friedel, Ralf Zimmer, Jörg Mages, Reinhard Hoffmann, Paul Dickinson, Thorsten Forster, Peter Ghazal, Ulrich H. Koszinowski. High resolution gene expression profiling for simultaneous kinetic parameter analysis of RNA synthesis, abundance and decay. RNA 2008, 14: 2010 2009 2008

49 Publikationen Caroline C. Friedel, Jan Krumsiek, Ralf Zimmer. Bootstrapping the interactome: unsupervised identification of protein complexes in yeast. Proceedings of the 12th International Conference on Research in Computational Biology (RECOMB) 2008, LNBI 4955, pp Caroline C. Friedel, Ralf Zimmer. Identifying the topology of protein complexes from affinity purification assays. Proceedings of the German Conference on Bioinformatics (GCB) 2008, p. 30‑43 Caroline C. Friedel, Ralf Zimmer. Influence of degree correlations on network structure and stability in protein-protein interaction networks. BMC Bioinformatics 2007, 8:297. Albrecht von Brunn, Carola Teepe, Jeremy C. Simpson, Rainer Pepperkok, Caroline C. Friedel, Ralf Zimmer, Rhonda Roberts, Ralph Baric and Jürgen Haas. Analysis of intraviral protein-protein interactions of the SARS coronavirus ORFeome. PLoS ONE 2007, 2:e459. Caroline C. Friedel, Ralf Zimmer. Toward the complete interactome. Nature Biotechnology 2006, 24: Caroline C. Friedel, Ralf Zimmer. Inferring topology from clustering coefficients in protein-protein interaction networks. BMC Bioinformatics 2006, 7:519. Chad A. Davis, Fabian Gerick, Volker Hintermair, Caroline C. Friedel, Katrin Fundel, Robert Küffner, Ralf Zimmer. Reliable gene signatures for microarray classification: assessment of stability and performance. Bioinformatics 2006, 22: Caroline C. Friedel, Ulrich Rückert, Stefan Kramer. Cost curves for abstaining classifiers. Proceedings of the third Workshop on ROC Analysis in Machine Learning, Pittsburgh, USA, 2006. Caroline C. Friedel, Katharina Jahn, Selina Sommer, Stephen Rudd, Hans W. Mewes, Igor V. Tetko. Support vector machines for separation of mixed plant-pathogen EST collections based on codon usage. Bioinfomatics 2005, 21: 2008 2007 2006 2005

50 Danke für die Aufmerksamkeit
Fragen ?


Herunterladen ppt "Struktur und Regulation von Proteinkomplexen"

Ähnliche Präsentationen


Google-Anzeigen