Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Dr. Caroline C. Friedel Lehr- und Forschungseinheit Bioinformatik

Ähnliche Präsentationen


Präsentation zum Thema: "Dr. Caroline C. Friedel Lehr- und Forschungseinheit Bioinformatik"—  Präsentation transkript:

1 Analyse von Hochdurchsatzdaten Protein-Protein Interaktionen, Proteinkomplexe und RNA Halbwertszeit
Dr. Caroline C. Friedel Lehr- und Forschungseinheit Bioinformatik Institut für Informatik LMU München

2 Motivation DNA Doppelhelix Transkription mRNA Translation Proteine

3 Proteininteraktionen
Motivation DNA Doppelhelix Transkription mRNA Translation Proteine Proteininteraktionen

4 Hochdurchsatzmethoden
Ermöglichen die genomweite Analyse von biologischen Systemen DNA Doppelhelix Transkription Messung des mRNA-Levels für alle Gene Microarrays, RNA Sequenzierung mRNA Translation Bestimmung von paarweisen Interaktionen Yeast Two-Hybrid Proteine Proteininteraktionen Bestimmung von Proteinkomplexen Affinitätspurifikation

5 Hochdurchsatzmethoden
Vorteile: Hohe Abdeckung, teilweise sogar genomweit Explorativer Ansatz ohne Bias bezüglich bestimmter Gene Nachteile Hohe Abdeckung nur auf Kosten der Genauigkeit möglich Viele falsch positive Ergebnisse Unvollständige und falsch negative Ergebnisse Große Datenmengen Datenanalyse benötigt hochentwickelte und effiziente bioinformatische Methoden Unter Berücksichtigung der Meßfehler

6 Proteininteraktionen
Yeast Two-Hybrid Methoden ermöglichen Identifikation von paarweisen Interaktionen Bestimmung von großen Interaktionsnetzwerken Viele Analysen zur Netzwerkstruktur Gradverteilung Clustering Aber: Trotz Meßfehler Aussagen über zugrundeliegende zelluläre Netzwerke möglich ?

7 Analyse zellulärer und viraler Netzwerke
Modellierung von Yeast Two-Hybrid Experimenten Sowohl falsch negative und falsch positive Interaktionen Trotz Meßfehler Bestimmung der Netzwerkstruktur möglich Weitere Netzwerkeigenschaften wichtig für die Struktur Kleine virale Netzwerke können vollständig untersucht werden Analysemethoden für große zelluläre Netzwerke nur bedingt anwendbar Netzwerkvergleich für Herpesviren identifiziert einen konservierten Kern von Interaktionen wichtige virale Proteine konservierte Komplexe Friedel and Zimmer, Nat. Biotech & BMC Bioinf , BMC Bioinf Fossum et al., PloS Pathogens, 2009

8 Konservierte Hubs und Proteinkomplexe
M53 (UL31) M50 (UL34) M51(UL33)

9 Vorhersage von Proteinkomplexen
Affinitätspurifikation ermöglicht die Bestimmung von Assoziationen in Proteinkomplexen Aufgrund von Meßfehlern müssen die Proteinkomplexe aus den Purifikationsdaten vorhergesagt werden Bisher beste Methoden benötigen zusätzliche Komplexdaten  supervised Informationen zu bekannten Komplexen begrenzt Entwicklung einer Methode zur unsupervised Vorhersage Verwende Bootstrap-Algorithmus um stabile Komplexe zu bestimmen

10 Bootstrap- Algorithmus
Kombinierte Purifikationen Ziehen mit Zurücklegen, 1,000 Replikate Bootstrap sampling Komplex Identifikation Vollständig unsupervised Vorhersagegenauigkeit der besten supervised Ansätze erreicht Komplex Identifikation Friedel et al. RECOMB 2008 & J Comput Biol. 16:971-87, 2009 11

11 Vorhersage der Komplexstruktur
Vorhersage von Proteinkomplexen als Mengen von Proteinen Struktur der Komplexe nicht berücksichtigt Direkte physikalischen Interaktionen unbekannt Vorhersage von direkten Interaktionen aus berechneten Interaktionsgewichten

12 Algorithmus Annahme: Kantengewichte sind als Konfidenzwerte gegeben [0:1] Können als Wahrscheinlichkeiten interpretiert werden Algorithmus: Berechne Vereinigung aller maximalen Spannbäume Modifizierter Kruskal-Algorithmus Sortiere übrige Kanten nach Gewicht Für jede Kante e in nichtsteigender Sortierung Finde optimalen Pfad P im aktuellen Netzwerk (Dijkstra) Falls p(e) >= p(P) Füge die Kante zum aktuellen Netzwerk hinzu Friedel & Zimmer. GCB 2008 & Bioinformatics. 25:2140-6, 2009.

13 Vergleich zu anderen Ansätzen
Vollständig unsupervised Bessere Vorhersagegenauigkeit als bisherige Ansätze BVH: Bernard et al. RECOMB 2007 Friedel & Zimmer. GCB 2008 & Bioinformatics. 25:2140-6, 2009.

14 Kurze Halbwertszeit  schnelle Regulation
RNA Halbwertszeiten Interaktionsexperimente liefern statisches Bild von Interaktionen und Komplexen im Mittel Daten zur Gentranskription ermöglichen Analyse von Genregulation und Zelldynamik Neue Methoden für die Bestimmung von Transkriptions- und Abbauraten für die RNA jedes Gens Abbaurate (= RNA Halbwertszeit) beeinflußt die Geschwindigkeit der Genregulation Kurze Halbwertszeit  schnelle Regulation Lange Halbwertszeit  langsame Regulation Friedel et al. Nucleic Acids Res. 37:e115, 2009

15 Regulation von Proteinkomplexen
Regulation von Proteinkomplexen durch einzelne regulatorische Untereinheiten mit kurzer Halbwertszeit Ermöglicht schnelle und effiziente transkriptionelle Regulation “Just-in-time assembly” (de Lichtenberg et al. Science 2005) PBRM1 9.0 / NA ACTL6A 8.2 / 6.3 SMARCA4 5.1/ 5.8 SMARCC2 9.7 / 5.6 SMARCD1 5.4 / 3.3 SMARCC1 11.9 / 6.1 ARID2 2.3 / 1.7 Gemein mit BAF Komplex SMARCB1 13.3 / 13.7 9.2 / 5.7 SMARCE1 Spezifisch für PBAF Komplex Die Analyse von RNA Halbwertszeiten identifiziert konservierte regulatorische Prinzipien in Proteinkomplexen RNA half-lives for the PBAF (A) and ubiquitin ligase (B) complexes. Half-lives (in hours) for human/mouse are indicated and mapped to grey scales ranging from black (short RNA half-lives) to white (long RNA half-lives). For PBRM1, no transcript half-life could be obtained for murine fibroblasts. For SMARCD1, its RNA half-life in murine fibroblasts was taken from 30 min labeling experiments (14). (A) The PBAF complex consists of several proteins in common with the BAF complex and two specific proteins (ARID2 and PBRM1) (45). ARID2, the only subunit with short transcript half-life in this complex, has been found to be essential for complex stability, potentially by recruiting PBRM1 (45). As most physical interactions in the complex are not characterized, the arrangement of the proteins in this figure does not necessarily represent the true complex structure. (B) Substrate-specificity of the ubiquitin ligase containing CUL5 and RNF7 is determined by binding to different ASB proteins (46,47). TCEB1 and TCEB2 are adaptor proteins which form a heterodimeric complex (Elongin BC) and additionally link the ligase subunits (CUL5 and RNF7) and the ASB protein. Short transcript half-life of the ASB6 and ASB7 subunits allows efficient regulation of complex activity with regard to specific substrates. Friedel et al. Nucleic Acids Res. 37:e115, 2009

16 Zusammenfassung Hochdurchsatzexperimente ermöglichen genomweite Analysen biologischer Systeme Interessante und tiefergehende Erkenntnisse nur möglich durch geeignete bioinformatische Methoden unter Berücksichtigung von Meßfehlern Ergebnisse: Bestimmung der Topologie der zellulären Netzwerke trotz Meßfehler Erkenntnisse zum viralen Lebenszyklus durch Vergleich von Interaktionen verwandter Herpesspezies Ohne Zusatzwissen: Bestimmung von Proteinkomplexen und zugehöriger Interaktionen mit hoher Genauigkeit Charakterisierung der Genregulation und Regulation von Proteinkomplexen mithilfe von RNA Halbwertszeiten

17 Danke für die Aufmerksamkeit
Fragen ?


Herunterladen ppt "Dr. Caroline C. Friedel Lehr- und Forschungseinheit Bioinformatik"

Ähnliche Präsentationen


Google-Anzeigen