Präsentation herunterladen
1
Vorlesung: ANOVA II
2
Übersicht Warum sollte man eine ANOVA überhaupt durchführen? Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich - Beispiel 2: >2 Gruppen Vergleich Überblick: Anwendung der ANOVA bei Microarray-Datenauswertungen: Beispiel: Kandidatengene Beispiel: Normalisierung von Microarray Daten
3
Übersicht Warum sollte man eine ANOVA überhaupt durchführen? Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich - Beispiel 2: >2 Gruppen Vergleich Überblick: Anwendung der ANOVA bei Microarray-Datenauswertungen: Beispiel: Kandidatengene Beispiel: Normalisierung von Microarray Daten
4
Gedankenexperiment 1: Raucher und Nichtraucher
Angenommen, wir wollen untersuchen, ob A man bei Rauchern tendenziell ein anderes Level von Protein x mißt als bei Nichtrauchern B Raucher ein signifikant höheres Level von Protein x haben als Nichtraucher Messungen
5
Gedankenexperiment 2: 4 Laboratorien
Angenommen, wir wollen untersuchen, ob 4 verschiedene Laboratorien bei der Messung des Cholesterinspiegels von Patienten dieselben Ergebnisse liefern 1 2 3 4 Messungen Mittelwert STD
6
Gibt es einen Unterschied?
Fragestellung 1 2 3 4 Gibt es einen Unterschied? zwischen Rauchern/Nichtrauchern 4 Laboratorien
7
Raucher und Nichtraucher: Zusammenfassung der Daten
Min/ Max 25/75% Quantil Median: versus 79.97
8
Raucher und Nichtraucher: Zusammenfassung der Daten
Was sehen wir? Tendenziell höhere Wert bei Rauchern hohe Varianz Es gibt durchaus Nichtraucher, die einen höheren Wert haben als einige Raucher Sind die Unterschiede signifikant?
9
4 Laboratorien: Zusammenfassung der Daten
Was sehen wir? Tendenziell unterschiedliche Resultate hohe Varianz Labor 2, 3: fast gleiches Mittel, unterschiedliche Varianz Sind die Unterschiede signifikant? 1 2 3 4 x
10
T-Test oder ANOVA? T-test: Angenommen, wir haben zwei Proben.
Die erste Probe X1, ..., Xn umfaßt n Stichproben, die aus einer Normalverteilung mit Erwartungswert X und Varianz 2 gezogen wurden; die zweite Probe Y1, ..., Ym umfaßt m Stichproben, die aus einer Normalverteilung mit Erwartungswert Y und Varianz 2 gezogen wurden. Wenn man nun Differenzen zwischen den beiden Gruppen betrachten möchte ist das intuitive Maß die Differenz der Mittelwerte: X - Y Tatsächlich ist die Differenz normalverteilter Zufallsvariablen wieder normalverteilt, d.h. in diesem Fall mit Erwartungswert X - Y und Varianz 2 (1/n+1/m).
11
T-Test oder ANOVA? Satz: Definition: „pooled sample variance“
Angenommen, X1, ..., Xn sind n unabhängig normalverteilte Zufallsvariablen mit Erwartungswert X und Varianz 2 . Ebenso seien Y1, ..., Ym m unabhängige normalverteilte Zufallsvariablen mit Erwartungswert Y und Varianz 2 . Außerdem sind die Xi unabhängig von den Yj für alle i,j. Dann folgt die Statistik: einer t-Verteilung mit m+n-2 Freiheitsgraden.
12
Was ist eine t-Verteilung?
Dichte einer t-Verteilung: t-Verteilung: fr(t)= Fr(t)= r=Freiheitsgrade
13
Raucher und Nichtraucher: t-Test
Messungen x
14
Raucher und Nichtraucher: t-Test
Zweiseitiger Test Einseitige Tests
15
Raucher und Nichtraucher: t-Test
t = ; Signifikanzlevel=0.05 P(H1) = P(H2) = P(H3) = x
16
Raucher und Nichtraucher: ANOVA
17
4 Laboratorien: ein neues Problem
Nun haben wir aber mehr als zwei Probenreihen... n 1 3 2 4 1 2 3 4 6 t- Tests
18
4 Laboratorien: t-Test 1 2 3 4 t 1 2 3 4 P-Wert Laboratorien
19
4 Laboratorien: ANOVA
20
Übersicht Warum sollte man eine ANOVA überhaupt durchführen? Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich - Beispiel 2: >2 Gruppen Vergleich Überblick: Anwendung der ANOVA bei Microarray-Datenauswertungen: Beispiel: Kandidatengene Beispiel: Normalisierung von Microarray Daten
21
Anwendung der ANOVA bei Microarray-Datenauswertungen
1. Beispiel: Kandidatengene Drei Behandlungen: … … … Für welche Gene gibt es Unterschiede in den beiden Behandlungsmethoden?
22
Anwendung der ANOVA bei Microarray-Datenauswertungen
1. Beispiel: Kandidatengene
23
Anwendung der ANOVA bei Microarray-Datenauswertungen
1. Beispiel: Kandidatengene Wir schauen uns erstmal nur ein Gen an x
24
Warum sollte man eine ANOVA überhaupt durchführen?
Ein Vergleich mit dem t-Test - Beispiel 1: Zwei Gruppen Vergleich - Beispiel 2: >2 Gruppen Vergleich Überblick: Anwendung der ANOVA bei Microarray-Datenauswertungen: Beispiel: Kandidatengene Beispiel: Normalisierung von Microarray Daten
25
Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Array 1 Array 2 Patient: Grün Kontrolle: Rot Patient: Rot Kontrolle: Grün
26
Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten ARRAY 1 oder 2 ? Variety: Patient oder Kontrolle ? Farbstoff: Grün oder Rot ? Welches Gen ? Intensität: 14527
27
Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Farbstoff: Grün Farbstoff: Rot Kontrolle Patient Array 1 Array 2 Kontrolle Patient Dye Swap Setting Latin Square Setting
28
Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Variety Array Gen Dye= Farbstoff + ijkg 2-Interaktionseffekte 3-Interaktionseffekte
29
Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Gesamtmittel A D V G AG DG VG ~ ADV DV AV AD ADVG DVG AVG ADG
30
Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr Jede Messung in einem Micoarrayexperiment wird mit einer ganz speziellen Kombination der Parameter „Array“, „Dye (Farbstoff)“, „Variety(Probentyp)“, und „Gen“ assoziiert. Angenommen, y ijkg Bezeichnet die Intensitätsmessung des g-ten Gens auf dem i-ten Array mit dem j-ten Farbstoff im k-ten Probentyp.
31
Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr Dann kann man das folgende Modell einführen: log(y ijkg) = + Ai + Dj + Vk + Gg + (AG)ig + (VG)kg + ijkg Dabei ist der Gesamtmittelwert; Ai bezeichnet den Arrayeffekt des i-ten Arrays; Dj bezeichnet den Farbstoffeffekt des j-ten Farbstoffs; Vk bezeichnet den k-ten Probentypeffekt; Gg bezeichnet den Geneffekt des g-ten Gens; (AG)ig bezeichnet den Interaktioneffekt von Array i und Gen g und (VG)kg bezeichnet den Interaktionseffekt des k-ten Probentyps und des g-ten Gens. ijkg ist ein N(0,) Fehlerterm.
32
Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr Farbstoff: Grün Farbstoff: Rot Muskel Leber Array 1 Array 2 Muskel Leber Welche Gene sind in Leber und Muskel unterschiedlich exprimiert?
33
Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr Farbstoff: Grün Farbstoff: Rot Array i=1,2 Dye j=1,2 Gewebe k=1,2 Gene g=1,...,n Array 1 Array 2 Leber Muskel Muskel Leber Index Set: (i,j,k) { (1,1,1) , (1,2,2) , (2,1,2) , (2,2,1) } d.h. jeder Clone Index (Gen) g=1,...,n erscheint genau einmal mit jeder Kombination (i,j,k)
34
Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Modell von G.Churchill/K.Kerr log(y ijkg) = + Ai + Dj + Vk + Gg + (AG)ig + (VG)kg + ijkg Quadrat der Summe der Residuen: RSQ = ijkl (log(y ijkg) – ( + Ai + Dj + Vk + Gg + (AG)ig + (VG)kg + ijkg))2 Berechne die Parameter so, daß die Residuen möglichst klein sind. Dazu berechne die partiellen Ableitungen und setze diese gleich Null. RSQ / (VG)kg =0
35
Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten Leber Muskel Farbstoff: Grün Farbstoff: Rot Array 1 Array 2 Leber Muskel (VG)k=1g‘ - (VG)k=2g‘ = 0.5 log( ) – 1/2n log( g ) Y111g‘ y221g‘ Y122g‘ y212g‘ y111g y221g y122g y212g Log-ratio des geometrischen Mittels der Beobachtungen für das Gen g‘ in den beiden Gruppen Konstant: Zentrierung
36
Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten (VG)k=1g‘ - (VG)k=2g‘ Die exponierten Differenzen exp((VG)k=1g‘ - (VG)k=2g‘ ) können als Schätzer für „fold changes“ zwischen den beiden betrachteten Gruppen angesehen werden.
37
Anwendung der ANOVA bei Microarray-Datenauswertungen
2. Beispiel: Normalisierung von Microarray Daten (VG)k=Leber g - (VG)k=Muskel g Mittel der Log-Produktintensität (Leber,Muskel)
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.