Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Vorlesung: 18.11.2003 ANOVA II.

Ähnliche Präsentationen


Präsentation zum Thema: "Vorlesung: 18.11.2003 ANOVA II."—  Präsentation transkript:

1 Vorlesung: ANOVA II

2 Übersicht Warum sollte man eine ANOVA überhaupt durchführen? Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich - Beispiel 2: >2 Gruppen Vergleich Überblick: Anwendung der ANOVA bei Microarray-Datenauswertungen: Beispiel: Kandidatengene Beispiel: Normalisierung von Microarray Daten

3 Übersicht Warum sollte man eine ANOVA überhaupt durchführen? Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich - Beispiel 2: >2 Gruppen Vergleich Überblick: Anwendung der ANOVA bei Microarray-Datenauswertungen: Beispiel: Kandidatengene Beispiel: Normalisierung von Microarray Daten

4 Gedankenexperiment 1: Raucher und Nichtraucher
Angenommen, wir wollen untersuchen, ob A man bei Rauchern tendenziell ein anderes Level von Protein x mißt als bei Nichtrauchern B Raucher ein signifikant höheres Level von Protein x haben als Nichtraucher Messungen

5 Gedankenexperiment 2: 4 Laboratorien
Angenommen, wir wollen untersuchen, ob 4 verschiedene Laboratorien bei der Messung des Cholesterinspiegels von Patienten dieselben Ergebnisse liefern 1 2 3 4 Messungen Mittelwert STD

6 Gibt es einen Unterschied?
Fragestellung 1 2 3 4 Gibt es einen Unterschied? zwischen Rauchern/Nichtrauchern 4 Laboratorien

7 Raucher und Nichtraucher: Zusammenfassung der Daten
Min/ Max 25/75% Quantil Median: versus 79.97

8 Raucher und Nichtraucher: Zusammenfassung der Daten
Was sehen wir? Tendenziell höhere Wert bei Rauchern hohe Varianz Es gibt durchaus Nichtraucher, die einen höheren Wert haben als einige Raucher Sind die Unterschiede signifikant?

9 4 Laboratorien: Zusammenfassung der Daten
Was sehen wir? Tendenziell unterschiedliche Resultate hohe Varianz Labor 2, 3: fast gleiches Mittel, unterschiedliche Varianz Sind die Unterschiede signifikant? 1 2 3 4 x

10 T-Test oder ANOVA? T-test: Angenommen, wir haben zwei Proben.
Die erste Probe X1, ..., Xn umfaßt n Stichproben, die aus einer Normalverteilung mit Erwartungswert X und Varianz 2 gezogen wurden; die zweite Probe Y1, ..., Ym umfaßt m Stichproben, die aus einer Normalverteilung mit Erwartungswert Y und Varianz 2 gezogen wurden. Wenn man nun Differenzen zwischen den beiden Gruppen betrachten möchte ist das intuitive Maß die Differenz der Mittelwerte: X - Y Tatsächlich ist die Differenz normalverteilter Zufallsvariablen wieder normalverteilt, d.h. in diesem Fall mit Erwartungswert X - Y und Varianz 2 (1/n+1/m).

11 T-Test oder ANOVA? Satz: Definition: „pooled sample variance“
Angenommen, X1, ..., Xn sind n unabhängig normalverteilte Zufallsvariablen mit Erwartungswert X und Varianz 2 . Ebenso seien Y1, ..., Ym m unabhängige normalverteilte Zufallsvariablen mit Erwartungswert Y und Varianz 2 . Außerdem sind die Xi unabhängig von den Yj für alle i,j. Dann folgt die Statistik: einer t-Verteilung mit m+n-2 Freiheitsgraden.

12 Was ist eine t-Verteilung?
Dichte einer t-Verteilung: t-Verteilung: fr(t)= Fr(t)= r=Freiheitsgrade

13 Raucher und Nichtraucher: t-Test
Messungen x

14 Raucher und Nichtraucher: t-Test
Zweiseitiger Test Einseitige Tests

15 Raucher und Nichtraucher: t-Test
t = ; Signifikanzlevel=0.05 P(H1) = P(H2) = P(H3) = x

16 Raucher und Nichtraucher: ANOVA

17 4 Laboratorien: ein neues Problem
Nun haben wir aber mehr als zwei Probenreihen... n 1 3 2 4 1 2 3 4 6 t- Tests

18 4 Laboratorien: t-Test 1 2 3 4 t 1 2 3 4 P-Wert Laboratorien

19 4 Laboratorien: ANOVA

20 Übersicht Warum sollte man eine ANOVA überhaupt durchführen? Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich - Beispiel 2: >2 Gruppen Vergleich Überblick: Anwendung der ANOVA bei Microarray-Datenauswertungen: Beispiel: Kandidatengene Beispiel: Normalisierung von Microarray Daten

21 Anwendung der ANOVA bei Microarray-Datenauswertungen
1. Beispiel: Kandidatengene Drei Behandlungen: Für welche Gene gibt es Unterschiede in den beiden Behandlungsmethoden?

22 Anwendung der ANOVA bei Microarray-Datenauswertungen
1. Beispiel: Kandidatengene

23 Anwendung der ANOVA bei Microarray-Datenauswertungen
1. Beispiel: Kandidatengene Wir schauen uns erstmal nur ein Gen an x

24 Warum sollte man eine ANOVA überhaupt durchführen?
Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich - Beispiel 2: >2 Gruppen Vergleich Überblick: Anwendung der ANOVA bei Microarray-Datenauswertungen: Beispiel: Kandidatengene Beispiel: Normalisierung von Microarray Daten

25 Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Array 1 Array 2 Patient: Grün Kontrolle: Rot Patient: Rot Kontrolle: Grün

26 Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten ARRAY 1 oder 2 ? Variety: Patient oder Kontrolle ? Farbstoff: Grün oder Rot ? Welches Gen ? Intensität: 14527

27 Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Farbstoff: Grün Farbstoff: Rot Kontrolle Patient Array 1 Array 2 Kontrolle Patient Dye Swap Setting Latin Square Setting

28 Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Variety Array Gen Dye= Farbstoff + ijkg 2-Interaktionseffekte 3-Interaktionseffekte

29 Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Gesamtmittel A D V G AG DG VG ~ ADV DV AV AD ADVG DVG AVG ADG

30 Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr Jede Messung in einem Micoarrayexperiment wird mit einer ganz speziellen Kombination der Parameter „Array“, „Dye (Farbstoff)“, „Variety(Probentyp)“, und „Gen“ assoziiert. Angenommen, y ijkg Bezeichnet die Intensitätsmessung des g-ten Gens auf dem i-ten Array mit dem j-ten Farbstoff im k-ten Probentyp.

31 Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr Dann kann man das folgende Modell einführen: log(y ijkg) =  + Ai + Dj + Vk + Gg + (AG)ig + (VG)kg + ijkg Dabei ist  der Gesamtmittelwert; Ai bezeichnet den Arrayeffekt des i-ten Arrays; Dj bezeichnet den Farbstoffeffekt des j-ten Farbstoffs; Vk bezeichnet den k-ten Probentypeffekt; Gg bezeichnet den Geneffekt des g-ten Gens; (AG)ig bezeichnet den Interaktioneffekt von Array i und Gen g und (VG)kg bezeichnet den Interaktionseffekt des k-ten Probentyps und des g-ten Gens. ijkg ist ein N(0,) Fehlerterm.

32 Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr Farbstoff: Grün Farbstoff: Rot Muskel Leber Array 1 Array 2 Muskel Leber Welche Gene sind in Leber und Muskel unterschiedlich exprimiert?

33 Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr Farbstoff: Grün Farbstoff: Rot Array i=1,2 Dye j=1,2 Gewebe k=1,2 Gene g=1,...,n Array 1 Array 2 Leber Muskel Muskel Leber Index Set: (i,j,k)  { (1,1,1) , (1,2,2) , (2,1,2) , (2,2,1) } d.h. jeder Clone Index (Gen) g=1,...,n erscheint genau einmal mit jeder Kombination (i,j,k)

34 Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr log(y ijkg) =  + Ai + Dj + Vk + Gg + (AG)ig + (VG)kg + ijkg Quadrat der Summe der Residuen: RSQ = ijkl (log(y ijkg) – ( + Ai + Dj + Vk + Gg + (AG)ig + (VG)kg + ijkg))2 Berechne die Parameter so, daß die Residuen möglichst klein sind. Dazu berechne die partiellen Ableitungen und setze diese gleich Null. RSQ /  (VG)kg =0

35 Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Leber Muskel Farbstoff: Grün Farbstoff: Rot Array 1 Array 2 Leber Muskel (VG)k=1g‘ - (VG)k=2g‘ = 0.5 log( ) – 1/2n log( g ) Y111g‘ y221g‘ Y122g‘ y212g‘ y111g y221g y122g y212g Log-ratio des geometrischen Mittels der Beobachtungen für das Gen g‘ in den beiden Gruppen Konstant: Zentrierung

36 Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten (VG)k=1g‘ - (VG)k=2g‘ Die exponierten Differenzen exp((VG)k=1g‘ - (VG)k=2g‘ ) können als Schätzer für „fold changes“ zwischen den beiden betrachteten Gruppen angesehen werden.

37 Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten (VG)k=Leber g - (VG)k=Muskel g Mittel der Log-Produktintensität (Leber,Muskel)


Herunterladen ppt "Vorlesung: 18.11.2003 ANOVA II."

Ähnliche Präsentationen


Google-Anzeigen