Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung.

Slides:



Advertisements
Ähnliche Präsentationen
Genexpressionsanalyse
Advertisements

Übung: Online-Belegung einer Lehrveranstaltung
Übung: Online-Belegung einer Lehrveranstaltung
On the Complexity of Fundamental Problems in Pedigree Analysis Seminar Aktuelle Themen der Bioinformatik Martin Löwer Antonio Piccolboni, Dan Gusfield.
TECHNISCHE UNIVERSITÄT DARMSTADT Naive Bayes for Ranking
<d,a,s, ,i,s,t, ,e,i,n,e, ,L,i,s,t,e>
Kapitel 3: Listen Lineare Liste: endliche Folge von Elementen eines Grundtyps (n>=0), leere Liste falls n=0 Listenelemente besitzen.
1 1. Splineglättung 1.1 Motivation 1.2 Notation 1.3 Splineglättung
Untersuchung und szenariobasierte Entwicklung von Websites zur Orientierung in Universitätsstudiengängen unter Berücksichtigung von Prinzipien des Web.
Genetische Algorithmen
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Algorithmen und Datenstrukturen
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (10 - Suchverfahren) T. Lauer.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen 09 - Weitere Sortierverfahren Heapsort-Nachtrag Prof. Th. Ottmann.
Kapitel 3 Elementare Datenstrukturen TexPoint fonts used in EMF.
2.5. Mikrocontroller-Komponenten
V7 Genexpression - Microarrays
Strukturgleichungsmodelle
Special Effects Realistischeres Rendern einer Scene.
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
Seminar: Informationstechnik in der Medizin Universität Dortmund Skin Detection Fakultät für Elektrotechnik und Informationstechnik Lehrstuhl für Kommunikationstechnik.
Maschinelles Lernen und automatische Textklassifikation
Vorlesung: ANOVA I
Vorlesung: ANOVA II.
Vorlesung: Vorverarbeitung von Affymetrix-Daten
Lernmodul Einführung Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Nutzungsbedingungen:
Effiziente Algorithmen
Telecooperation/RBG Technische Universität Darmstadt Copyrighted material; for TUD student use only Grundlagen der Informatik I Thema 14: Schrittweise.
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Johann Wolfgang Goethe Faust, Der Tragödie Erster Teil
SNP: Single Nucleotide Polymorphism
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Hartmut Klauck Universität Frankfurt WS 06/
Telecooperation/RBG Technische Universität Darmstadt Copyrighted material; for TUD student use only Grundlagen der Informatik I Thema 16: Ausnahmebehandlung.
Einführung in die Programmierung Wintersemester 2008/09 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung) (Vorlesung) Prof. Dr. Günter Rudolph Fachbereich.
Einführung in die Informatik für Naturwissenschaftler und Ingenieure
Einführung in die Programmierung
Modul Statistische Datenanalyse
1 Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Einführung Lernmodul Nutzungsbedingungen:
Dallinger Georg, 8.A BRG Schloss Wagrain
1.4. Erstellen von Diagrammen
Prof. Dr. Helmut Erdmann Flensburg University of Applied Sciences
Verteilung demethylierter (a) bzw. methylierter (b) CpGs von Genen mit
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation III Vorlesung 1 WS 2001/02 Punkt-in-Landkarte I (Streifenkarte)
Statistik – Regression - Korrelation
Was muss der Nutzer tun? Für die Projektplanung ist es essentiell, sich vorher Gedanken über folgende Punkte zu machen: experimentelles Design RNA-Isolation.
SS 2009Maschinelles Lernen und Neural Computation 133 Kapitel 7: Ensemble Methoden.
128. Januar 2003Johann Wolfgang Goethe Universität - Frankfurt am Main Qualitätsüberwachung Instrumente zur Qualitätsüberwachung im stationären Krankenhaussektor.
Systemengpässe und Strategien im Mobile Business Systemengpässe und Strategien im Mobile Business Tim Weitzel Johann Wolfgang Goethe-Universität Institut.
Johann Wolfgang von Goethe
Theory of Programming Prof. Dr. W. Reisig Was heißt „Korrektheit“? W. Reisig Workshop Modellierung Hamburg, März 2015.
Programmiersprachen II Fortsetzung Datenstrukturen Hashing Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Programmiersprachen II Vorbesprechung Klausur Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Programmiersprachen II Fortsetzung Datenstrukturen Balancierte Bäume 3 Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Programmiersprachen II Fortsetzung Datenstrukturen Einfache Bäume Übung 13 Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
„Erfahrungen eines Doktoranden im Rahmen einer experimentellen Doktorarbeit“ Sophie Schacht How to get the doctor? Part II Universitätsklinikum.
Comprehension and Production of Analogical Problems by a Chimpanzee
Willkommen! TOOLKIT – zum tagtäglichen Einsatz neuer Medien im Schulunterricht Professur für die Psychologie des Lehrens und Lernens Technische Universität.
 Präsentation transkript:

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung bei Microarrayexperimenten Klassenvergleiche und Classifier

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 2 Microarrays Dienen zur Erkennung von Expressionsprodukten. Platten aus Glas, Silizium etc. Enthalten die Gene des Organismus. Position jedes Gens auf Platte ist bekannt.

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 3 Versuchsablauf Transkriptionsprodukte (Targets) werden auf das MA gegeben. Diese sind mit Fluoreszenz-Markern versehen. Binden der Targets an den komplementären Strängen auf dem MA. Waschen um nicht oder unzureichend gebundene Targets zu entfernen.

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 4 Auswertung Farbstoffe werden durch Laser zum Leuchten gebracht. Scannen des Bildes. Normalisierung. Fehlerbeseitigung Erstellen der Genexpressionsmatrix.

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 5 Warum Versuchsgrößenbestimmung? Beschränkungen durch: –Finanzmittel –Zeit –Vorhandene Proben

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 6 Klassen-Vergleiche Vergleich von zwei Gewebetypen z.B.: - Krebsgewebe  normales Gewebe - histologisch verschiedene Krebsgewebe Ziel ist es, unterschiedliche Gen- Expressionen zu identifizieren.

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 7 Verschiedene MA-Versuchstypen Single Label/ Double Label –Pooling –Dye Swap –Nutzen von technischen Replikaten

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 8 Single Label Arrays DNA – Oligonukleotid MAs (Affymetrix) Nur Targets einer Zelle Hohe Spotdichte teuer

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 9 Notation Floureszens-Intensität: Y gadvfs –g :1,2,...G | Gen –a :1,...,n | Array –d : 1 = Single Label; 2 = double Label| Farbe –v : 1,2| Phänotypen –f : 1,2,...F| Individuen –s : 1,2,...m| Unterprobe/technisches Replikat

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 10 Single Label MAs Log (Y gadvfs ) = G g + GV gv + (GF) gf(v) +  gadvfs –G g =  Genexpression von g in der Population –GV gv = Effekt der Klasse oder des Typs –(GF) gf(v) = individueller Effekt –  gadvfs = unabh. Fehler mit Normal(0, )

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 11 Single Label MAs

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 12 Single Label MAs

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 13 Single Label MAs

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 14 Dual Label Arrays cDNA MAs Targets von 2 Zellen. Dies erleichtert einen direkten Vergleich Teilweise geringe Spotdichte

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 15 Dual Label MAs Log (Y gadvfs ) = G g + GA ga + GD gd + GV gv + (GF) gf(v) +  gadvfs –G g =  Genexpression von g in der Population –GA ga = Spot auf Array –GD gd = Effekt des Färbemittels –GV gv = Effekt der Klasse oder des Typs –(GF) gf(v) = individueller Effekt –  gadvfs = unabh. Fehler mit Normal(0, )

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 16 Dual Label MAs Referenz Design: A1A1 R A2A2 R B1B1 B2B2 RR

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 17 Dual Label MAs Reference Design Muss aus vorherigen Daten geschätzt werden.

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 18 Dual Label MAs Design mit technischen Replikaten und Dye Swap:

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 19 Dual Label MAs α = 0,001 β = 0,05 δ = 1 Varianz Verhältnis technische Replikate / Sample Anzahl benötigter Arrays Anzahl benötigter Samples

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 20 Dual Label Mas

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 21 Dual Label MAs Block Design: A2A2 A3A3 B2B2 A1A1 B1B1 A4A4 B3B3 B4B4

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 22 Dual Label MAs Balanced Block Design –Leichter Vergleich von 2 Klassen. –Weniger Arrays benötigt. –unflexibel

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 23 Dual Label MAs Single Paired Design –Natürliche biologische Paarungen ( z.B. von Individuum vor und nach einer Behandlung). –Je eine Seite mit einer Farbe pro Probe. –η an Stelle von τ. Varianz des veränderten Gewebes (z.B. Tumor) zum normalen Gewebe.

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 24 Dual Label MAs Dye-Swap Paired Design –Die gleichen Targets wie Single Paired Design. –Die gleichen Arrays werden nocheinmal mit dem jeweils anderen Fluoreszensstoff ausgewertet.

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 25 Prognostic Markers Finden von Genen oder Genklassen, die bei einer Krankheit exprimiert werden.

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 26 Prognostic Markers Effekt von Pooling Mehr Samples  weniger Arrays

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 27 Prognostic Markers α = Wahrscheinlichkeit für falsch positive Entdeckung. 1-β = Wahrscheinlichkeit richtig positive Entdeckung. Problem: Wie wählt man α?

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 28 Prognostic Markers

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 29 Prognostic Markers

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 30 Prognostic Markers

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 31 Training eines Classifiers Ein Classifier soll Gene als Prognostic Marker erkennen.

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 32 Training eines Classifiers Bedingung: Solle wenige Samples brauchen Lösung: Sequentielle Bestimmung Vorteile –Lernt durch eigene Erfahrung. –Stopp-Kriterium wird bei jedem Schritt überprüft. –Erzielen der gewünschten Signifikanz garantiert –Mit jeder Klassifikationsmethode einsetzbar.

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 33 Training eines Classifiers