Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Vorlesung: ANOVA I 11.11.2003. ANOVA ist eine statistische Analysemethode, um Haupteffekte und Interaktionseffekte zwischen kategorisch unabhängigen Variablen.

Ähnliche Präsentationen


Präsentation zum Thema: "Vorlesung: ANOVA I 11.11.2003. ANOVA ist eine statistische Analysemethode, um Haupteffekte und Interaktionseffekte zwischen kategorisch unabhängigen Variablen."—  Präsentation transkript:

1 Vorlesung: ANOVA I

2 ANOVA ist eine statistische Analysemethode, um Haupteffekte und Interaktionseffekte zwischen kategorisch unabhängigen Variablen bzgl. einer abhängigen Variablen aufzudecken ANOVA = Analysis of Variances Haupteffekt: Messvariable Interaktionseffekt: gemeinsame Effekte von 2 oder mehr Variablen auf eine abhängige Variable (die Messvariable) Messung: Cholesterin bekannt: Rauchen (Ja,Nein); Gewicht/Größe (dick,dünn); Alter (alt,jung) Fragen: Welche der bekannten Variablen haben einen Einfluß ? Ist der Einfluß signifikant ? Ist ev. die Interaktion von zwei Variablen signifikant ?

3 Patient: Grün Kontrolle: Rot Patient: Rot Kontrolle: Grün Array 1 Array 2 Intensität: ARRAY 1 oder 2 ? Variety: Patient oder Kontrolle ? Farbstoff: Grün oder Rot ? Welches Gen ?

4 Array Variety Dye= Farbstoff Gen Array-Dye Array-Gen Variety-Dye Variety-Gen Dye-Gen Array-Variety

5 Varianten der ANOVA (1)ANCOVA (Analysis of Covariances) Kontinuierliche Variablen statt diskrete; diese werden Covariates genannt. (2) MANOVA (Multiple Analysis of Variances) Mehrere abhängige Variablen: zB: Auswirkung der Benutzung verschiedener Lehrbücher auf die Klausurergebnisse in Mathematik UND Physik (3) MANCOVA (Multiple Analysis of Covariances) Mehrere abhängige Variablen, aber die Covarianten sind kontinuierlich

6 ANOVA Statistik F Test für Differenzen der Gruppen Mittelwerte. Test, ob der Mittelwert der Gruppen, die durch die Werte der unabhängigen Variablen oder deren Kombinationen unterschiedlich genug sind, um nicht durch Zufall aufgetreten zu sein. Der ANOVA F Test ist eine Funktion der Varianz einer Gruppe von Mittelwerten, Gesamtmittelwert aller Beobachtungen und der Varianzen der Beobachtungen in jeder Gruppe gewichtet bzgl. einer Gruppenmengengröße. Falls der Gruppenmittelwert sich nicht signifikant unterscheidet, dann heißt dies, daß die unabhängige Variable(n) keine Effekt auf die abhängige hat/haben. Wenn der F Test eine Abhängigkeit mit der abhängigen Variablen anzeigt, dann wird ein multipler Vergleichstest auf Signifikanz angewendet, um zu sehen, welche Gruppen den größten Einfluß auf die Beziehung haben.

7 Was hat das Testen auf Mittelwertdifferenzen mit Varianzen zu tun ? Im Mittelpunkt der ANOVA steht die Tatsache, daß man Varianzen partitionieren kann. Die Varianz ist die Summe der quadrierten Abweichungen vom Mittelwert dividiert durch die Anzahl der Proben minus 1. Damit ist die Varianz eine Funktion der Summe der quadrierten Standardabweichungen (SQ). Wie werden nun die Varianzen zerlegt ?

8 Beispiel: Angenommen, wir haben folgenden Datensatz Gruppe1Gruppe2 Beob.126 Beob.237 Beob.315 Mittelwert26 SQ44 Gesamtmittel4 GesamtSQ28 Beobachtungen: Die Mittelwerte der beiden Gruppen sind sehr unterschiedlich Die Summe der Quadrate ist in beiden Gruppen = 4 Insgesamt ist die Summe der Quadrate (unter Vernachlässigung der Gruppenzugehörigkeiten) = 28 Die Varianzen innerhalb der Gruppen ist wesentlich kleiner als die Gesamtvariabilität. Der Grund hierfür liegt darin, daß die Mittelwerte sehr unterschiedlich sind.

9 Gruppe1Gruppe2 Beob.126 Beob.237 Beob.315 Mittelwert26 SQ44 Gesamtmittel4 GesamtSQ28 Gesamtvariabilität - Gruppenvariabilität = 28 - (4+4) = 20 SQ Effekt Unter der Nullhypothese sollte die Varianz innerhalb der Gruppen ungefähr so groß sein wie die zwischen den Gruppen. Wir können diese Schätzer der Varianz mittels F Test vergleichen. Dieser Test überprüft, ob der Quotient der beiden Varianz Schätzer signifikant größer als 1 ist. Hier F=20 => signifikant, p<0.05 (Ausgabe in R: p= ) dh. wir können schließen, dass die zwei Gruppen signifikant unterschiedlich sind. Wie kommen wir nun zu dieser Statistik ?

10 F Statistik Definitionen und Grundbegriffe: Gamma Funktion Verteilungsfunktion, Dichte Erwartungswert, Standardabweichung und Varianz stochastische Unabhängigkeit F Verteilung p Wert

11 Gamma Funktion Definition Zunächst gilt: (n)=(n-1)! Dies gilt aber nur für natürliche Zahlen. Insbesondere gilt Gaußsche Definition

12 Verteilungsfunktion, Dichte Diskrete Zufallsvariable Bei diskreten Zufallsvariablen läßt sich jedem möglichen Ereignis genau eine bestimmte Eintrittswahrscheinlichkeit zuordnen. Beispiel: Eine Münze wird dreimal geworfen. Wie groß ist die Wahrscheinlichkeit dafür, daß xi-mal das Wappen oben liegt? 2.Wurf 3.Wurf 1.Wurf Ja Nein 3xJa = xNein = xJa,1xNein 3*0.5 3 = xNein,1xJa 3*0.5 3 = Summe: P(x 1 )+P(x 2 )+P(x 3 )+P(x 4 ) = = 1 Die Zuordnung der Wahrscheinlichkeiten P(xi) zu den möglichen Ereignissen xi erfolgt über die sogenannte Wahrscheinlichkeitsfunktion f X. P(xi)= f X (xi) Es gilt: 0 f X (xi) 1 und f X (xi) =1

13 Stetige Zufallsvariable Eine stetige Zufallsvariable weißt ein völlig anderes Verhalten auf. Da es unendlich viele mögliche Ausprägungen gibt, ist die Wahrscheinlichkeit dafür, daß genau ein bestimmtes Ereignis eintritt, gleich Null. Dies bedeutet aber nicht, daß dieses Ereignis unmöglich wäre. Anstelle von Wahrscheinlichkeiten werden bei stetigen Zufallsvariablen Dichten angegeben und zwar in Form der sogenannten Dichtefunktion f X. Die Dichte kann nicht negativ werden; kann aber Werte >1 annehmen. Das bestimmte Integral von – bis + beträgt Eins. Verteilungsfunktion, Dichte f X (x) dx = 1 f X (x) >= 0 – +

14 Verteilungsfunktion, Dichte Für viele Fragestellungen ist es von Relevanz, wie groß die Wahrscheinlichkeit dafür ist, daß eine Zufallsvariable X einen bestimmten Wert x nicht überschreitet. Gesucht ist also: P(X x) bzw P(– – F X (x) = 0 lim x-> + F X (x) = 1 Funktion, die von – kommend bei 0 beginnt und treppenförmig bis 1 ansteigt und dort bis + bleibt F X (x) = – x f X (t)dt F X ist monoton steigend F X ist stetig lim x-> – F X (x) = 0 lim x-> + F X (x) = 1 Es gilt: P(a

15 Erwartungswert, Standardabweichung und Varianz Der Erwartungswert einer Wahrscheinlichkeitsverteilung entspricht dem arithmetischen Mittel in der deskriptiven Statistik. Diskreter Fall: E(X) = i xi f X (xi) Stetiger Fall: E(X) = Die Varianz bzw. die Standardabweichung ist folgendermaßen definiert: Diskreter Fall: Varianz(X) = Var(X) = 2 = i (xi-E(X)) 2 f X (xi) = i (xi 2 f X (xi) ) – (E(X)) 2 Stetiger Fall: Varianz(X) = Var(X) = 2 = Sowohl für den diskreten wie stetigen Fall gilt: Die Standardabweichung ist definiert durch: X = + Var(X) xf X (x) dx – + ( x-E(X)) 2 f X (x) dx = – + x 2 f X (x) dx –(E(X))2 – +

16 Stochastische Unabhängigkeit Bedingte Wahrscheinlichkeit für zwei Ereignisse A und B Multiplikationssatz Stochastische Unabhängigkeit Zwei Ereignisse A, B mit der Eigenschaft heißen stochastisch unabhängig. P B (A) := P(A|B):= P(A B) /P(B) P(A B) = P(A|B)P(B) = P(B|A)P(A) P(A B) = P(A)P(B) Wie groß ist die Wahrscheinlichkeit, daß A eintreten wird, vorausgesetzt, daß B bereits eingetreten ist?

17 F-Verteilung (1) Ist X eine standard-normalverteilte Variable (N(0,1)), so wird die Verteilung der Variable X 2 ChiQuadrat Verteilung mit einem Freiheitsgrad genannt. (2) Sind X 1,...,X n unabhängige ChiQuadrat verteilte Variablen mit 1 Freiheitsgrad, so wird die Verteilung von Y = i X i 2 Verteilung mit n Freiheitsgraden genannt: 2 n Die Dichte ist gegeben durch: f(y) = 1/ [2 n/2 (n/2)] * y n/2-1 exp(-y/2) y>=0 E(Y) = n Var(Y) = 2n

18 (3) Sind X, Y zwei unabhängige ChiQuadrat verteilte Variablen mit m und n Freiheitsgraden, so wird die Verteilung von Z = X/m / Y/n F Verteilung mit m,n Freiheitsgraden genannt: F m,n Die Dichte ist gegeben durch: f(z) = [ (m+n)/2 ]/ [ (m/2) (n/2)] * m/n m/2 z m/2-1 (1+m/n z) -(m+n)/2 z>=0 E(Z) = n/(n-2)n>=2 Var(Z) = 2n 2 (m+n-2)/[m(n-2) 2 (m-4)] n>=5 SATZ: Sind X,Y zwei unabhängige normalverteilte Variablen, so ist Var(X)/Var(Y) F-verteilt. F-Verteilung

19 P-Wert Die Wahrscheinlichkeitswert (probability value, p-value) eines statistischen Hypothesentests gibt die Wahrscheinlichkeit an, aus der Teststatistik zufällig einen Wert zu erhalten, der mindestens so extrem ist wie der beobachtete unter der Voraussetzung, daß die Nullhypothese H0 wahr ist. Er gibt die Wahrscheinlichkeit an, fälschlicherweise die Nullhypothese abzulehnen, obwohl sie eigentlich richtig ist. Der p-Wert wird mit dem Signifikanzlevel verglichen (meist 0.05). Ist er kleiner, erhalten wir ein signifikantes Ergebnis. Das heißt, falls die Nullhypothese mit einem Signifikanzlevel von 5% abgelehnt wird, so gilt: p<0,05.

20 Beispiel: ANOVA Experiment: Wir messen die Konzentration eines Proteins nach Behandlung von Zellen mit vier verschiedenen Lösungen Messung Behandlung A nd B nd C nd D

21 A B C D Min: st Qu.: Mean: Median: rd Qu.: Max: Total N: NA's : Variance: Std Dev.: Sum: Beispiel: ANOVA Sind die Differenzen in den Mittelwerten/Medianen der Meßwerte der unterschiedlichen Behandlungsmethoden signifikant oder sind sie zufällig?

22 Beispiel: ANOVA V = Summe/Anzahl Können wir dies in eine Behandlungsspezifischen und Residuen-Effekt zerlegen?

23 Beispiel: ANOVA V = Gesamtmittelwert + [ Behandlungsmittelwert-Gesamtmittelwert ] + [ Datenpunkt-Behandlungsmittelwert ] + y i – y + y ij – y i

24 Beispiel: ANOVA V =

25 ANOVA Zunächst soll die Varianzanalyse und der F-Test im Falle von: I Proben je der Länge J dargestellt werden, d.h. ein Experiment mit I Behandlungen, jede J mal gemessen. Den Fall, den wir eben betrachtet haben, bei dem unterschiedlich häufig gemessen wurde, betrachten wir danach. Messung J Behandlung I …

26 ANOVA Das zugrundeliegende Modell ist das folgende: Y ij = j-te Beobachtung in der i-ten Behandlung Jede einzelne Beobachtung wird gestört durch einen möglichen zufälligen Fehler. Außerdem nimmt man an, daß der Fehler der einen Beobachtung unabhängig von demjenigen einer anderen Beobachtung. Y ij = + i + ij Gesamtmittelwert differentieller Effekt in der i-ten Behandlung Zufälliger Fehler in der j-ten Beobachtung und i-ten Behandlung Die Fehler werden als unabhängig angenommen und sind normalverteilt mit Erwartungswert 0 und Varianz 2 Außerdem sind die i normalisiert, d.h.: i i = 0 Der Erwartungswert der i-ten Behandlung und j-ten Messung beträgt: E(Y ij ) = + i

27 ANOVA Die Varianzanalyse basiert auf der folgenden Identität: i j (Y ij – Y..) 2 = i j (Y ij – Y i.) 2 + J i (Y i – Y..) 2 wobei Y i. = 1/J j Y ij das Mittel der Beobachtungen in der i-ten Behandlung beschreibt und Y.. = 1/IJ i,j Y ij das Gesamtmittel. Summe der Quadrate SQ gesamt SQ innerhalb SQ zwischen

28 ANOVA Lemma: Seien X 1,...,X n unabhängige Zufallsvariablen mit Erwartungswerten E(X i ) = i und Varianz Var(X i ) = 2. Dann gilt: E(X i – X) 2 = ( i –1/n i i ) 2 + (n-1)/n 2 Mittels dieses Lemmas läßt sich folgender Satz zeigen: Satz1: E(SQ innerhalb ) = i j E(Y ij – Y i.) 2 = i j J-1/J 2 = I(J-1) 2 E(SQ zwischen ) = J j E(Y i. – Y..) 2 = J j [ i 2 + (I-1)/IJ 2 ] = J j [ i 2 + (I-1) 2 ] Ein Schätzer für die Varianz ist gegeben durch: SQ innerhalb /I(J-1)

29 ANOVA Satz2: Wenn alle Fehler unabhängig normalverteilt sind mit Erwartungswert 0 und Varianz 2, dann gilt: SQ innerhalb / 2 folgt einer 2 Verteilung mit I/(J-1) Freiheitsgraden. Sind außerdem alle i Null, dann folgt auch SQ zwischen / 2 einer 2 Verteilung mit (I-1) Freiheitsgraden und ist unabhängig von SQ innerhalb. Die Statistik F = SQ zwischen /(I-1) / SQ innerhalb /[I(J-1)] wird benutzt, um die Nullhypothese: H0: 1 = 2 = 3 =... = i =0 zu testen. Wenn die Nullhypothese richtig ist, so sollte die F-Statistik nahe bei 1 liegen. Ist sie hingegen falsch, sollte die Statistik zu Werten größer 1 tendieren, da die Erwartung des Zählers anwächst.

30 ANOVA Nun zu dem Problem, daß nicht jede Meßreihe gleich lang sein muß, d.h. es könnte sein – wie in unserem Eingangsbeispiel – daß für jede Behandlung unterschiedlich viele Messungen durchgeführt wurden. Das bedeutet: J hängt von der i-ten Behandlung ab: J i Dann gilt: i j(i) (Y ij – Y..) 2 = i j(i) (Y ij – Y i.) 2 + J(i) i (Y i – Y..) 2 E(SQ innerhalb ) = 2 j J(i)-1 E(SQ zwischen ) = (I-1) 2 + j J(i) i 2 Die Freiheitsgrade für die Quadratsummen betragen: i J(i)-I und I-1 E(SQ innerhalb ) = I(J-1) 2 E(SQ zwischen ) = J j [ i 2 + (I-1) 2 ]

31 Zurück zu unserem Beispiel: Messung Behandlung A nd B nd C nd D

32 Zurück zu unserem Beispiel: i j(i) (Y ij – Y..) 2 = i j(i) (Y ij – Y i.) 2 + i J(i) (Y i – Y..) 2 Summe der Quadrate SQ gesamt SQ innerhalb SQ zwischen F = SQ zwischen /(I-1) / SQ innerhalb / i J(i)-I

33 VariationsquelleSQFreiheitsgradeF Zwischen2283 Behandlung76/56=13.6 innerhalb11220 SQ Total 340 n-1 23 Mittel=64 J(i)=[ ] Y i. =[ ] SQ innerhalb =112 SQ zwischen =228 Freiheitsgrade: 3; 20 Zurück zu unserem Beispiel:

34 Falls H0 (alle Mittel in allen Behandlungen sind gleich) richtig sein sollte, müßte F einer F 3;20 Verteilung folgen. Andernfalls, müßte F größer sein, also lehnen wir H0 bei hinreichend großem F ab. Zurück zu unserem Beispiel: Also müssen wir testen: P(F 3;20 > F beobachtet ) = P(F 3;20 > 13.6) In R: > pf(13.6,3,20,lower.tail=F) [1] e-5


Herunterladen ppt "Vorlesung: ANOVA I 11.11.2003. ANOVA ist eine statistische Analysemethode, um Haupteffekte und Interaktionseffekte zwischen kategorisch unabhängigen Variablen."

Ähnliche Präsentationen


Google-Anzeigen