Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Ähnliche Präsentationen


Präsentation zum Thema: "Multivariate Analysemethoden Johannes Gutenberg Universität Mainz"—  Präsentation transkript:

1 Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
und Multivariates Testen Vorlesung Günter Meinhardt Johannes Gutenberg Universität Mainz

2 Multivariate Varianzanalyse (MANOVA)
Multivariates Testen MANOVA Multivariate Varianzanalyse (MANOVA) Ziele Mehrgruppen / Mehrfaktorenvergleiche von Messungen auf mehreren abhängigen Variablen. Vermeidung von Entscheidungsfehlern durch fälschliche implizite Unabhängigkeitsannahme bei univariater Abtestung der einzelnen abhängigen Variablen. Vermeidung der Probleme durch multiples Testen durch Verwendung eines einzigen Tests für das gesamte Design. Verbesserte Teststärke und Validität bei Verwendung von Testbatterien und (mäßig) korrelierten Profilskalen. Voraussetzung Gleiche (homogene) Varianz-Kovarianz Matrizen (Sj) in allen Gruppen. Testungen der Gruppenunterschiede (Centroide), sowie der Homogenität der Sj - Matrizen erfordern die Gültigkeit der multivariaten Normalverteilung.

3 Ansatz Anwendung Nachteile Multivariates Testen MANOVA
Vergleich der Quadratsummen für „between“ und „within“ Group Varianz, erzeugt aus allen Variablenkomponenten. Statistik erhält man ebenso über über Eigenwertzerlegung einer aus B und W Komponenten zusammengesetzten Matrix. Anwendung Allgemein: Experimentelle Analyse im Rahmen von multidimen- sionalen Evaluationsstudien. Multiple Effektivitätsstudien. Nachweise der Veränderung von Profilen durch experimentelle oder therapeutische Intervention in repeated measurement Designs. Untersuchung differentieller Effekte auf mehren Ebenen (Mehrebeneanalyse). (Z.B. Arbeitszufriedenheit auf 3 Hierachieebenen untersuchen). Nachteile Restriktion gleicher Varianz-Kovarianz Matrizen in allen Gruppen. Auswirkung der Verletzung der Annahme der multivariaten Normalverteilung schwer abzuschätzen.

4 PrototypischeDatensituation
2D Beispiel MANOVA 2D-Beispiel 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 5.0 6.0 7.0 Koordination: X1 Fahrleistung: X2 Regression 0.5 Promill Regression 1 Promill 1 Promill 0.5 Promill PrototypischeDatensituation Generell: g- Gruppen gemessen auf p Variablen. Hier g=2, p=2, Koordination (X1) und Fahrleistung (X2) Gleiche Regressionssteigungen und gleiche Varianzen in den Gruppen auf beiden Variablen (Homogenität der Varianzen und Covarianzen) Stichprobendaten entstammen multivariat normalverteilten Populationen.

5 1D - Testen unzulänglich
2D Beispiel MANOVA 2D-Beispiel Fahrleistung: X2 Regression 0.5 Promill Regression 1 Promill 1 Promill 0.5 Promill Koordination: X1 1D - Testen unzulänglich Univariat sind die Rohwertverteilungen nicht gut getrennt, und daher ebenfalls nicht die Mittelwerteverteilungen (hohes N nötig für signi- fikante Gruppenunterschiede in den Kennwerteverteilungen) Signifikanzurteile sind unabhängig und führen zu p Signifikanzaus- sagen, obwohl nur eine erwünscht ist Information der gleichen Beziehung zwischen den abhängigen Variablen (gleiche Korrelation) wird nicht genutzt .

6 2D - Testen Ausgangslage
2D Beispiel MANOVA 2D-Beispiel Fahrleistung: X2 Regression 0.5 Promill Regression 1 Promill 1 Promill 0.5 Promill Koordination: X1 2D - Testen Ausgangslage 2D 95% Quantile zeigen an, daß die Mittelwerte der jeweils anderen Gruppe nicht mehr im Konfidenzbereich der Rohwerte liegen (bei den univariaten Verteilungen liegen sie darin) Orthogonal zur Hauptvarianzrichtung der Ellipsen bestehen optimale Trennbedingungen für die Mittelwerte Ein Test, in den die Korrelation der beiden Variablen eingeht, hat daher optimale Chancen, Unterschiede der Centroide aufzudecken. MANOVA

7 Problem Annahmen 1. One-Way MANOVA MANOVA
Unterscheiden sich g unabhängige Populationen in ihren auf p Variablen gemessenen Centroiden ? g = Anzahl Gruppen n = Snl = n1 + n2 +…ng p = Anzahl Variablen Population 1: Population 2: Population g: Konstanten i : Fälle (Personen) l : Gruppen Indices Annahmen Die Samples X1l, X2l,…, Xnll sind Zufallsstichproben der Größe nl mit einem Populationszentroiden ml. Die Zufallsstichproben sind unabhängig. Alle Populationen haben dieselbe wahre Varianz-Covarianzmatrix S. Jede Population ist p- variat normalverteilt.

8 xilj Datenschema Parameter- schätzer Zu prüfende Annahmen
1. One-Way MANOVA MANOVA Datenschema Population 1: Population 2: Population g: Var Group Case xilj Parameter- schätzer Zu prüfende Annahmen Homogenität der Varianz-Covarianz-Matrizen und p-variate Normalverteilung der Stichprobenwerte

9 MANOVA Modell Additive Zerlegung p x p Matrizen 1D Analog
1. One-Way MANOVA MANOVA MANOVA Modell Additives Modell zum Vergleich von Centroiden aus g Populationen mit eil unabhängigen und N(0,S) verteilten Fehlerkomponenten. Additive Zerlegung Beobachtung Grand Mean Treatmenteffekt Fehlerkomponente Grand Mean abziehen, Kreuzprodukt bilden , und summieren über Fälle ergibt: Totale QS und Kreuzprodukte Treatment QS und Kreuzprodukte Fehler QS und Kreuzprodukte p x p Matrizen 1D Analog

10 Additivität der Variation
1. One-Way MANOVA MANOVA p x p Matrizen Hierin sind die x Vektoren mit p Komponenten (Variablen): Regel Die Matrizen B und W werden als inneres Produkt (Zeilen- mal Spalten) der Variablen-Vektoren aufgebaut und dann über Fälle und Gruppen summiert. Sie sind stets p x p Matrizen. Matrix-Notation Additivität der Variation Es gilt: Within Group QS und Kreuzprodukte Totale QS und Kreuzprodukte Between Group QS und Kreuzprodukte

11 aus gepoolten S - Matrizen
1. One-Way MANOVA MANOVA W-Matrix aus gepoolten S - Matrizen mit Sl der Varianz-Covarianz Matrix in Gruppe l. B-Matrix (p=2 Vars Beispiel) Treatment (Group) Quadratsummen & Kreuzprodukte x1 x2 x1 x2 Komponenten Var Group Var

12 Alternative Berechnung
1. One-Way MANOVA MANOVA MANOVA Table Source of Variation Matrix of SS & Cross- Products (SSP) Degrees of Freedom Treatment B g - 1 Error W Total M = B + W n - 1 Test-Statistik Die H0: t1 = t2 = … = tg = 0 wird abgelehnt, wenn (Quotient der generalisierten Varianzen, „Wilk‘s Lambda“) zu klein wird. Alternative Berechnung mit s der Rang der Matrix W-1B und li ihr i-ter Eigenwert

13 c2 - Test der Wilks Statistik Simultane Kontraste Vorteil der MANOVA
1. One-Way MANOVA MANOVA Lehne H0 ab, wenn c2 - Test der Wilks Statistik (c2 Verteilung mit p(g-1) Freiheitsgraden, Bartlett) Für p < 3 und g < 3 sind F-Tests üblich. Bartletts Test ist für größere Stichproben und eine größere Anzahl Variablen exakt. Simultane Kontraste Als Kontraste sind Wilks-Tests oder Hotellings T2 gebräuchlich: ist verteilt wie mit Vorteil der MANOVA (Höhere Freiheitsgrade)

14 Voraussetzungund Probleme der Prüfung
1. One-Way MANOVA MANOVA Voraussetzung Homogene S – Matrizen Prüfgröße Box-M Test ist c2 verteilt mit p(p+1)(g-1)/2 Freiheitsgraden Voraussetzungund Probleme der Prüfung Der Test setzt g multivariat normalverteilte Populationen voraus. Ebenso sollte die Anzahl der Messungen in den Gruppen nl > 20 und die Anzahl der Variablen p < 5 sein. Testung über die Homogenität der Korrelationsmatrizen (Residualanalyse) prüft nur die Homogenität der Covarianzen, nicht der Varianzen. Diese können aber mit einem Bartlett Test Gesondert auf Homogenität geprüft werden.

15 Problem Annahmen 2. Two-Way MANOVA MANOVA Faktor A Faktor B
Gibt es Effekte in auf p Variablen gemessenen Centroiden hinsichtlich Der Stufen von Faktor A, Faktor B und ihrer Kombinationen A x B ? Faktor A Faktor B Pop 1: Pop 2: Pop g: Pop 1: Pop 2: Pop k: Annahmen Alle Samples sind Zufallsstichproben mit einem Populations-zentroiden ml. Die Zufallsstichproben sind unabhängig. Alle Populationen haben dieselbe wahre Varianz-Covarianzmatrix S. Jede Population ist p- variat normalverteilt. (gleiche Annahmen wie in der Oneway-MANOVA, aber bezogen auf alle g x k Samples)

16 A B Datenschema Mittelwerte Exkurs: Two-Way ANOVA MANOVA
Jede Messung wird nach Fall/StufeA/StufeB indiziert A Case A1 A2 A3 1 x111 x121 x131 2 x211 x221 x231 B1 3 x311 x321 x331 x.1 A: g Stufen, Index l B: k Stufen, Index r VP: n Cases, Index i 4 x411 x421 x431 5 x511 x521 x531 B x11 x21 x31 1 x112 x122 x132 2 x212 x222 x232 B2 3 x312 x322 x332 x.2 4 x412 x422 x432 5 x512 x522 x532 x12 x22 x23 x1. x2. x3. Mittelwerte Zellmittel und Faktorstufenmittel (über .-Stelle gemittelt)

17 Komponenten Modell Quadratsummen Zerlegung Varianzanteile
Exkurs: Two-Way ANOVA MANOVA Komponenten Modell Additives Modell zur Erklärung einer individuellen Messung mit eilr ein unabhängiger und N(0,s) verteilter Meßfehler. Quadratsummen Zerlegung Varianzanteile Faktor A Faktor B Fehler A x B Gesamt

18 Allgemeine Form der Quadratsumme Beispiel: QSAxB
Exkurs: Two-Way ANOVA MANOVA Allgemeine Form der Quadratsumme Erwartungswert der Bedingung Bedingung Beobachtung unter Bedingung Summe über alle Fälle der Bedingung Beispiel: QSAxB Erwartung: Beobachtung:

19 ANOVA QS Table g - 1 k - 1 (g-1) (k-1) Exkurs: Two-Way ANOVA MANOVA
SoV QS df A g - 1 B k - 1 A x B (g-1) (k-1) Error Total

20 Fehlervarianz Schätzungen F-Bruch Nullhypothese & erwarteter F-Bruch
Exkurs: Two-Way ANOVA MANOVA Fehlervarianz Schätzungen 1. Schätzung aus der Variation innerhalb Zellen: 2. Schätzung aus der Variation zwischen Zellen (Beispiel A) F-Bruch Nullhypothese & erwarteter F-Bruch Quotienten von Varianzen sind F- verteilt. Der Erwartungswert unter der Nullhypothese für den F- Quotienten ist 1.

21 Ergebnistabelle F - Tests Ergebnistabelle Varianzanteile
Exkurs: Two-Way ANOVA MANOVA Ergebnistabelle F - Tests Die F - Tabelle gibt einen Überblick über die Signifikanztestung. Ergebnistabelle Varianzanteile Die h2- Tabelle gibt einen Überblick über die Varianzaufklärung und die anteilige Verteilung auf die Quellen

22 SSPTotal = SSPA + SSPB + SSPAB + SSPError
2. Two-Way MANOVA MANOVA MANOVA Modell Additives Modell einer individuellen Messung auf p- Variablen mit eilr unabhängigen und N(0,S) verteilten Fehlerkomponenten. Additive Zerlegung Dem Komponentenmodell entspricht eine additive Zerlegung auf den p- stelligen Variablenvektoren p x p Matrizen (QS-Zerlegung) M = BA BB BAB W Die Matrizen enthalten entsprechende Sums of Squares and Cross Products (SSP), daher wird oft diese Bezeichnung verwendet: SSPTotal = SSPA + SSPB + SSPAB + SSPError

23 MANOVA SSP Table g - 1 k - 1 (g-1) (k-1) 2. Two-Way MANOVA MANOVA SoV
df A g - 1 B k - 1 A x B (g-1) (k-1) Error Total

24 Test-Statistik c2 - Tests Faktor A Faktor B A x B
2. Two-Way MANOVA MANOVA Test-Statistik Die H0 für jede Varianzquelle wird abgelehnt, wenn (Quotient der generalisierten Varianzen, „Wilk‘s Lambda“) zu klein wird. c2 - Tests Lehne H0 ab, wenn Faktor A Faktor B A x B

25 Beispiel Faktor - Plots X-Y - Plot 2. Two-Way MANOVA - Plots MANOVA
A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Geschlechtseffekt (B) auf beiden Variablen, keine Haupteffekte Alkohol (A) Faktor - Plots M W A X-Y - Plot (Standardisiert an Fehlervarianz jeder Variable)

26 Beispiel Faktor - Plots X-Y - Plot 2. Two-Way MANOVA - Plots MANOVA
A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Geschlechtseffekt (B) nur auf X, keine Haupteffekte Alkohol (A) Faktor - Plots M W A X-Y - Plot (Standardisiert an Fehlervarianz jeder Variable)

27 Beispiel Faktor - Plots X-Y - Plot 2. Two-Way MANOVA - Plots MANOVA
A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Kein Effekt (B) zwei gegenläufige Haupteffekte (A), keine Interaktionen Faktor - Plots M W A X-Y - Plot (Standardisiert an Fehlervarianz jeder Variable) 1 2 3

28 Beispiel Faktor - Plots X-Y - Plot 2. Two-Way MANOVA - Plots MANOVA
A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Keine Haupteffekte, 2 gleichgerichtete Interaktionen Faktor - Plots M W A X-Y - Plot (Standardisiert an Fehlervarianz jeder Variable) 3 2 1 3 2 1

29 Beispiel Faktor - Plots X-Y - Plot 2. Two-Way MANOVA - Plots MANOVA
A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Keine Haupteffekte, 2 gegengerichtete Interaktionen Faktor - Plots M W A X-Y - Plot (Standardisiert an Fehlervarianz jeder Variable) 3 2 1 3 2 1

30 Beispiel Faktor - Plots X-Y - Plot 2. Two-Way MANOVA - Plots MANOVA
A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Keine Haupteffekte, eine Interaktion (X) Faktor - Plots M W A X-Y - Plot (Standardisiert an Fehlervarianz jeder Variable) 3 2 1 3 2 1


Herunterladen ppt "Multivariate Analysemethoden Johannes Gutenberg Universität Mainz"

Ähnliche Präsentationen


Google-Anzeigen