Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Vorlesung: 18.11.2003 ANOVA II. Warum sollte man eine ANOVA überhaupt durchführen? Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich -

Ähnliche Präsentationen


Präsentation zum Thema: "Vorlesung: 18.11.2003 ANOVA II. Warum sollte man eine ANOVA überhaupt durchführen? Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich -"—  Präsentation transkript:

1 Vorlesung: ANOVA II

2 Warum sollte man eine ANOVA überhaupt durchführen? Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich - Beispiel 2: >2 Gruppen Vergleich Überblick: Anwendung der ANOVA bei Microarray-Datenauswertungen: 1.Beispiel: Kandidatengene 2.Beispiel: Normalisierung von Microarray Daten Übersicht

3 Warum sollte man eine ANOVA überhaupt durchführen? Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich - Beispiel 2: >2 Gruppen Vergleich Überblick: Anwendung der ANOVA bei Microarray-Datenauswertungen: 1.Beispiel: Kandidatengene 2.Beispiel: Normalisierung von Microarray Daten Übersicht

4 Angenommen, wir wollen untersuchen, ob A man bei Rauchern tendenziell ein anderes Level von Protein x mißt als bei Nichtrauchern B Raucher ein signifikant höheres Level von Protein x haben als Nichtraucher Messungen Gedankenexperiment 1: Raucher und Nichtraucher

5 Angenommen, wir wollen untersuchen, ob 4 verschiedene Laboratorien bei der Messung des Cholesterinspiegels von Patienten dieselben Ergebnisse liefern Messungen Mittelwert STD Gedankenexperiment 2: 4 Laboratorien

6 Gibt es einen Unterschied? zwischen Rauchern/Nichtrauchern 4 Laboratorien Fragestellung

7 Raucher und Nichtraucher: Zusammenfassung der Daten Median: versus /75% Quantil Min/ Max

8 Was sehen wir? Tendenziell höhere Wert bei Rauchern hohe Varianz Es gibt durchaus Nichtraucher, die einen höheren Wert haben als einige Raucher Sind die Unterschiede signifikant? Raucher und Nichtraucher: Zusammenfassung der Daten

9 Was sehen wir? Tendenziell unterschiedliche Resultate hohe Varianz Labor 2, 3: fast gleiches Mittel, unterschiedliche Varianz Sind die Unterschiede signifikant? 4 Laboratorien: Zusammenfassung der Daten x

10 T-Test oder ANOVA? T-test: Angenommen, wir haben zwei Proben. Die erste Probe X 1,..., X n umfaßt n Stichproben, die aus einer Normalverteilung mit Erwartungswert X und Varianz 2 gezogen wurden; die zweite Probe Y 1,..., Y m umfaßt m Stichproben, die aus einer Normalverteilung mit Erwartungswert Y und Varianz 2 gezogen wurden. Wenn man nun Differenzen zwischen den beiden Gruppen betrachten möchte ist das intuitive Maß die Differenz der Mittelwerte: X - Y Tatsächlich ist die Differenz normalverteilter Zufallsvariablen wieder normalverteilt, d.h. in diesem Fall mit Erwartungswert X - Y und Varianz 2 (1/n+1/m).

11 Definition: pooled sample variance Satz: Angenommen, X 1,..., X n sind n unabhängig normalverteilte Zufallsvariablen mit Erwartungswert X und Varianz 2. Ebenso seien Y 1,..., Y m m unabhängige normalverteilte Zufallsvariablen mit Erwartungswert Y und Varianz 2. Außerdem sind die X i unabhängig von den Y j für alle i,j. Dann folgt die Statistik: einer t-Verteilung mit m+n-2 Freiheitsgraden. T-Test oder ANOVA?

12 Dichte einer t-Verteilung:t-Verteilung: r=Freiheitsgrade f r (t)=F r (t)= Was ist eine t-Verteilung?

13 Raucher und Nichtraucher: t-Test Messungen x

14 Zweiseitiger Test Einseitige Tests Raucher und Nichtraucher: t-Test

15 t = ; Signifikanzlevel=0.05 P(H1) = P(H2) = P(H3) = Raucher und Nichtraucher: t-Test x

16 Raucher und Nichtraucher: ANOVA

17 Nun haben wir aber mehr als zwei Probenreihen t- Tests n 4 Laboratorien: ein neues Problem

18 t 4 Laboratorien: t-Test Laboratorien P-Wert

19 4 Laboratorien: ANOVA

20 Warum sollte man eine ANOVA überhaupt durchführen? Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich - Beispiel 2: >2 Gruppen Vergleich Überblick: Anwendung der ANOVA bei Microarray-Datenauswertungen: 1.Beispiel: Kandidatengene 2.Beispiel: Normalisierung von Microarray Daten Übersicht

21 … … Drei Behandlungen: Für welche Gene gibt es Unterschiede in den beiden Behandlungsmethoden? Anwendung der ANOVA bei Microarray-Datenauswertungen 1. Beispiel: Kandidatengene …

22 Anwendung der ANOVA bei Microarray-Datenauswertungen 1. Beispiel: Kandidatengene

23 Anwendung der ANOVA bei Microarray-Datenauswertungen 1. Beispiel: Kandidatengene Wir schauen uns erstmal nur ein Gen an x

24 Warum sollte man eine ANOVA überhaupt durchführen? Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich - Beispiel 2: >2 Gruppen Vergleich Überblick: Anwendung der ANOVA bei Microarray-Datenauswertungen: 1.Beispiel: Kandidatengene 2.Beispiel: Normalisierung von Microarray Daten

25 Patient: Grün Kontrolle: Rot Patient: Rot Kontrolle: Grün Array 1 Array 2 Anwendung der ANOVA bei Microarray-Datenauswertungen 2. Beispiel: Normalisierung von Microarray Daten

26 Anwendung der ANOVA bei Microarray-Datenauswertungen 2. Beispiel: Normalisierung von Microarray Daten ARRAY 1 oder 2 ? Variety: Patient oder Kontrolle ? Farbstoff: Grün oder Rot ? Welches Gen ? Intensität: 14527

27 Farbstoff: GrünFarbstoff: Rot Array 1 Array 2 Patient Kontrolle Anwendung der ANOVA bei Microarray-Datenauswertungen 2. Beispiel: Normalisierung von Microarray Daten - Dye Swap Setting - Latin Square Setting

28 Anwendung der ANOVA bei Microarray-Datenauswertungen 2. Beispiel: Normalisierung von Microarray Daten Array Variety Dye= Farbstoff Gen 2-Interaktionseffekte 3-Interaktionseffekte + ijkg

29 Anwendung der ANOVA bei Microarray-Datenauswertungen 2. Beispiel: Normalisierung von Microarray Daten Gesamtmittel A D V G AG DG VG ~~~~~~~~~~~~~~~~ ADV DV AV AD ADVG DVG AVG ADG

30 Anwendung der ANOVA bei Microarray-Datenauswertungen 2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr Jede Messung in einem Micoarrayexperiment wird mit einer ganz speziellen Kombination der Parameter Array, Dye (Farbstoff), Variety(Probentyp), und Gen assoziiert. Angenommen, y ijkg Bezeichnet die Intensitätsmessung des g-ten Gens auf dem i-ten Array mit dem j-ten Farbstoff im k-ten Probentyp.

31 Anwendung der ANOVA bei Microarray-Datenauswertungen 2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr Dann kann man das folgende Modell einführen: log( y ijkg ) = + A i + D j + V k + G g + (AG) ig + (VG) kg + ijkg Dabei ist der Gesamtmittelwert; A i bezeichnet den Arrayeffekt des i-ten Arrays; D j bezeichnet den Farbstoffeffekt des j-ten Farbstoffs; V k bezeichnet den k-ten Probentypeffekt; G g bezeichnet den Geneffekt des g-ten Gens; (AG) ig bezeichnet den Interaktioneffekt von Array i und Gen g und (VG) kg bezeichnet den Interaktionseffekt des k-ten Probentyps und des g-ten Gens. ijkg ist ein N(0, ) Fehlerterm.

32 Anwendung der ANOVA bei Microarray-Datenauswertungen 2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr Farbstoff: GrünFarbstoff: Rot Array 1 Array 2 Leber Muskel Welche Gene sind in Leber und Muskel unterschiedlich exprimiert?

33 Anwendung der ANOVA bei Microarray-Datenauswertungen 2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr Farbstoff: GrünFarbstoff: Rot Array 1 Array 2 Leber Muskel Arrayi=1,2 Dyej=1,2 Gewebek=1,2 Geneg=1,...,n Index Set: (i,j,k) { (1,1,1), (1,2,2), (2,1,2), (2,2,1) } d.h. jeder Clone Index (Gen) g=1,...,n erscheint genau einmal mit jeder Kombination (i,j,k)

34 log( y ijkg ) = + A i + D j + V k + G g + (AG) ig + (VG) kg + ijkg Anwendung der ANOVA bei Microarray-Datenauswertungen 2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr Quadrat der Summe der Residuen: RSQ = ijkl (log(y ijkg ) – ( + A i + D j + V k + G g + (AG) ig + (VG) kg + ijkg )) 2 Berechne die Parameter so, daß die Residuen möglichst klein sind. Dazu berechne die partiellen Ableitungen und setze diese gleich Null. RSQ / (VG) kg =0

35 Anwendung der ANOVA bei Microarray-Datenauswertungen 2. Beispiel: Normalisierung von Microarray Daten Farbstoff: GrünFarbstoff: Rot Array 1 Array 2 Leber Muskel Leber Muskel (VG) k=1g - (VG) k=2g = 0.5 log( ) – 1/2n log( g ) Y 111g y 221g Y 122g y 212g y 111g y 221g y 122g y 212g Konstant: Zentrierung Log-ratio des geometrischen Mittels der Beobachtungen für das Gen g in den beiden Gruppen

36 Anwendung der ANOVA bei Microarray-Datenauswertungen 2. Beispiel: Normalisierung von Microarray Daten (VG) k=1g - (VG) k=2g Die exponierten Differenzen exp( (VG) k=1g - (VG) k=2g ) können als Schätzer für fold changes zwischen den beiden betrachteten Gruppen angesehen werden.

37 Anwendung der ANOVA bei Microarray-Datenauswertungen 2. Beispiel: Normalisierung von Microarray Daten Mittel der Log-Produktintensität (Leber,Muskel) (VG) k=Leber g - (VG) k=Muskel g


Herunterladen ppt "Vorlesung: 18.11.2003 ANOVA II. Warum sollte man eine ANOVA überhaupt durchführen? Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich -"

Ähnliche Präsentationen


Google-Anzeigen