Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Slides:



Advertisements
Ähnliche Präsentationen
Polynomial Root Isolation
Advertisements

Schnelle Matrizenoperationen von Christian Büttner
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Seminar „Extrapolationsmethoden für zufällige Felder“
Theorie psychometrischer Tests, III
Forschungsstrategien Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Methoden der Psychologie Multivariate Analysemethoden und Multivariates Testen Günter Meinhardt Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Thema der Stunde I. Einführung in die Varianzanalyse:
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Einfaktorielle Varianzanalyse
Forschungsstatistik II
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Klassische Testtheorie
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-28.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.
Kapitel 5 Stetigkeit.
Kapitel 6 Differenzierbarkeit. Kapitel 6: Differenzierbarkeit © Beutelspacher Juni 2005 Seite 2 Inhalt 6.1 Die Definition 6.2 Die Eigenschaften 6.3 Extremwerte.
Mehrfachregressionen
Hypothesen testen: Grundidee
Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid
Effektgrößen, Kontraste & Post-hoc-Tests
Was steht in einer ANOVA - Tabelle?
Mathematische Grundlagen und Rechnen mit algebraischen Zahlen
Tutorium
Tutorium
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
Wiederholung: Einfache Regressionsgleichung
Matrix-Algebra Grundlagen 1. Matrizen und Vektoren
Varianzanalyse IV: Messwiederholung
Effiziente Algorithmen
Sali zäma.
Chi Quadrat Test Tamara Katschnig.
Lineare Algebra Komplizierte technologische Abläufe können übersichtlich mit Matrizen dargestellt werden. Prof. Dr. E. Larek
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Folie 1 Kapitel IV. Matrizen Inhalt: Matrizen als eigenständige mathematische Objekte Zusammenhang zwischen Matrizen und linearen Abbildungen Produkt von.
§3 Allgemeine lineare Gleichungssysteme
STATISIK LV Nr.: 0028 SS Mai 2005.
Statistik: Mehr zur Regression.
Kapitel 10 Multikollinearität
Kapitel 14 Trends und Unit-root-Tests
Multivariate Statistische Verfahren
1 STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Multivariate Statistische Verfahren
Multivariate Statistische Verfahren
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
Thema der Stunde Varianzanalyse mit Messwiederholung
Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung
Forschungsstrategien Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Forschungsstrategien Johannes Gutenberg Universität Mainz
Forschungsstatistik II Johannes Gutenberg Universität Mainz
Johann D. Müller, Merlin Dwenger , Mats Böttrich
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz und Multivariates Testen Vorlesung 18.07.2007 & 25.06.2007 Günter Meinhardt Johannes Gutenberg Universität Mainz

Trendtests in ANOVA und rm ANOVA Univariates Testen ANOVA & rm ANOVA Trendtests in ANOVA und rm ANOVA Allgemeines Nach der Overall-Signifikanz die Ergebnisse der Wirkungsweise explorieren. Trends sind definierbar, wenn die Stufen der UVs metrische Levels (Dosen, Zeiten, Anzahlen) repräsentieren, nicht jedoch bei kategorialen UVs. Einfach zu interpretieren sind orthogonale Trendpolynome. Jede Ordnung des Polynoms liefert eine orthogonale Trendkompo- nente, dessen Varianzanteil getrennt bestimmt und getest werden kann. Ermöglicht Prognose des Erreichens von Kriterien. Voraussetzung Signifikanz des Faktors, unter dem Trends vermutet werden. In rm Designs die üblichen Voraussetzungen der rm ANOVA (paarweise homogene Varianz-Covarianzmatrizen (streng), bzw. Homogene Varianzen der Abweichungen von Zellen (Spherizität), Normalverteilung).

Mittelwerte mit Konfidenzintervallen Univariates Testen Trendtests Beispiel Mittelwerte mit Konfidenzintervallen 20 16 12 Anzahl Fahrfehler 8 quadratisch linear 4 0 pm 0.2 pm 0.4 pm 0.6 pm 0.8 pm 1.0 pm Alkohohl-Dosis PrototypischeDatensituation Ein Dosierungsfaktor mit k- Stufen, k > 5 oder Messwiederholungen über mind. 5 Zeitpunkte monoton steigender oder fallender Gesamtverlauf Strategie: 1. Absichern des Trends 2. Mit gezielten Einzelvergleichen Effekt gegen Baseline absichern 3. Superposition der signifikanten Trendkomponenten zur Trendberechnung und Kriteriumsvorhersage verwenden

Trendpolynom Übliche Polynome Univariates Testen Trendtests für einen Dosisfaktor mit k- Stufen beschreibt die Daten perfekt, wenn alle Komponenten bis k-1 eingehen. Übliche Polynome Lineares Polynom: Anpassungsgerade Ein quadratisches Polynom beschreibt monotones nichtlineares Wachstum oder Abfallen der Werte Ein kubisches Polynom kann auch Änderungen im Verlauf der Kurve beschreiben

Orthogonale Polynome Bedingungen Univariates Testen Trendtests Wird als Gleichung für die Mittelwerte der j Stufen geschätzt: mit usw. Für Linearkombinationen Ci werden Koeffizienten so gewählt, Daß die Trendkomponenten stets orthogonal sind: Bedingungen mit (Kontrastbedingung) (Orthogonalität der Ordnungen)

Orthogonale Polynome Univariates Testen Trendtests Die Koeffizienten cij liegen bis zu hohen Anzahlen für k in Tabellen vor.

Quadratsummen Trend-QS: Test Univariates Testen Trendtests Mit diesen Koeffizienten gilt Die Treatmentquadratsumme zerlegt sich additiv in die Quadratsummen- Anteile der einzelnen orthogonalen Trendpolynome. Trend-QS: Test Jede Trendkomponente hat einen Freiheitsgrad (df = 1). Dann gilt der F- Test: Mit dfzähler = 1 und df Nenner = dferror. In komplexeren Designs oder rm Designs ist die die jeweilige Testvarianz des Faktors einzusetzen.

Komponenten Nichtlinearer Trend-Test Linearer Trend Univariates Testen Trendtests Komponenten Man teilt oft ein in lineare Komponenten und Restkomponenten, um den nichtlinearen Anteil abzuschätzen. Diese Komponente hat k-2 Freiheitsgrade (df = k-2). Dann gilt der F- Test: Nichtlinearer Trend-Test Mit dfzähler = k-2 und df Nenner = dferror. Linearer Trend Die Polynomkoeffizienten aller Trendkomponenten erhält man wie üblich über die Methode der Normalgleichungen. Für die lineare Komponente eines aufsteigend (1,2,3…) ganzzahlig gestuf- ten Dosisfaktor gibt es einfache Beziehungen aus den Quadratsummen: (Steigung) (falls Stufen aufsteigend Integer) (Schnittpunkt)

Trendvarianz-Aufklärung Univariates Testen Trendtests h2 Das Eta Quadrat kann aufgefasst werden als das Quadrat der Korrelation von den Daten mit der einem Polynom vom Grad k-1 Entsprechend kann man die einzelnen Trendanteile bewerten: Trendvarianz-Aufklärung Damit kann man die Zunahme der Varianzaufklärung durch Hinzunahme einzelner Trendkomponenten bewerten. Man kann eine Intraklassenkorrelation von Faktorstufen und Treatment berechnen: Intra-Class Correlation mit Sie gibt den korrelativen Zusammenhang der Treatmentstufen mit den Daten an.

Einzelvergleiche F-Test Kontraste Univariates Testen Trendtests In der ANOVA prüft man Kontraste gewöhnlich über F- Tests. Wegen ist ein t- Test einem F- Test äquivalent. Es gilt Für den Standardfehler eines Vergleichs gilt F-Test Kontraste mit den Kontrastbedingungen (Kontrast über F-Test prüfen)

Vollständige Sätze von orthogonalen Univariates Testen Trendtests Orthogonale Einzelvergleiche Für orthogonale Einzelvergleiche gelten gesonderte Konstruktionsregeln Zwei Einzelvergleiche j und k sind orthogonal, wenn gilt: Vollständige Sätze von orthogonalen Kontrasten Man kann Mengen konstruieren, die k-1 orthogonale Einzelvergleiche enthalten. Für solche vollständigen Sätze von Einzelvergleichen gilt: Die Treatmentquadratsumme ist additiv aus den Quadratsummen der Einzelvergleiche eines voll- ständigen Satzes zusammengesetzt. Alle in einem vollständigen orthogonalen Satz von Einzelvergleichen enthaltenen Kontraste sind auf dem a- Niveau des gesamten F- Tests für den Treatmentfaktor abgesichert, weil sie lediglich Anteile an der Treatmentquadratsumme darstellen. [Excel-Beispiel]

Konstruktion Univariates Testen Trendtests Es gibt verschiedene Konstruktionsregeln. Z.B. Helmert-Regel: Für k=5 (Beispiel) führt dies auf die zeilenweise orthogonale (4 x 5) Koeffizientenmatrix Alle Vergleiche (Zeilen) sind orthogonal.

Paarvergleiche Strategie Univariates Testen Trendtests Für reine Paarvergleiche gilt, dass es nur bis zu orthogonale Vergleiche in einem Satz geben kann. Für mehr Paarvergleiche muss das a- Niveau gegen multiples Testen adjustiert werden (Bonferroni), um konservativ sicher zu testen. Strategie Teste Trends im Treatmentfaktor. Signifikanz des linearen Trends sichert bereits die monotone Folge der Stufen ab. Signifikanz des quadratischen Trends sicher den nichtlinearen Anstieg (Abfall). Sichere den Unterschied der letzten Faktorstufen gegen den der ersten Faktorstufen mit wenigen Einzeltests ab. Damit ist zumeist der gesamte Gehalt der inhaltliche Hypothesen über Lernverlauf oder Sättigung statistisch geprüft. Man konstruiere sich ein Set von orthogonalen Einzelvergleichen, welches viele der gewünschten a-priori Kontraste enthält. Darüber hinausgehende Vergleiche führt man mit a- Adjustage durch. A-Posteriori Vergleiche (Scheffe, Duncan) liefern meist mehr konservative kritische Differenzen für Kontraste, da in a-posteriori Tests alle möglichen Paarvergleiche eingehen. [Excel-Beispiel]

Trendtests in rm ANOVA Allgemeines Voraussetzung Univariates Testen rm ANOVA Trendtests in rm ANOVA Allgemeines Trendanalyse ist ein häufig eingesetztes Verfahren in rm ANOVA Designs, da sie die Art der Wirkverlaufes einer Intervention beurteilen lässt. Trends sind in rm Designs grundsätzlich definierbar, da die Stufen der UVs als Zeitpunkte oder Anzahlen der Wiederholung der Gabe eines Treatment grundsätzlich metrische Levels repräsentieren. Trends sind ebenfalls in Mischdesigns mit Grouping-Faktoren und rm Faktoren definierbar. Für die Testung des Trends gilt, dass der Trend immer an der Prüfvarianz des Faktors geprüft wird. Trendanalyse ermöglicht eine Prognose des Zeitpunktes, an dem ein Lern- oder Wirkkriterium voraussichtlich erreicht ist. Voraussetzung Die Testung der Signifikanz des rm Faktors, der mögliche Trends enthält, ist in der rm ANOVA an strenge Voraussetzungen gebunden. (Eigenschaften der Varianz-Covarianz Matrix). Bei Verletzungen führt der F- Test zu progressiven Entscheidungen. Verletzungen der Voraussetzungen können mit geeigneten Verfahren (Box, Greenhouse-Geisser) korrigiert werden.

Verbundene Symmetrie Homogenitäts- Voraussetzung der rm ANOVA Voraussetzungen rm ANOVA Verbundene Symmetrie Sind für insgesamt k Messzeitpunkte die Korrelationen zwischen allen Messzeitpunkten gleich und ebenfalls die Varianzen, so erhält man als Varianz-Covarianz-Matrix (verbund-symmetrische Matrix). Diese strenge Forderung an die Struktur der Daten für die rm-ANOVA ist aber nicht nötig. Statt dessen muss für die Gültigkeit der F-Statistik folgende Bedingung erfüllt sein: Homogenitäts- Voraussetzung der rm ANOVA Die Varianz der Differenz der Messwerte zweier beliebiger Messzeit- punkte j und j‘ muss dieselbe Konstante ergeben. Verletzungen dieser Voraussetzung führen zu progressiven Verfälschungen des F-Tests.

Matrix-Bedingung: Zirkularität Beispiel Voraussetzungen rm ANOVA Anders geschrieben: Varianz-Covarianz Matrizen S, die diese Bedingung erfüllen, heissen zirkulär. Beispiel Man verifiziert ebenso, dass eine verbunden symmetrische Matrix ebenfalls die Eigenschaft der Zirkularität besitzt. [Excel-Beispiel]

Generische Regel Beispiel (k=3, l=5) Test über Spherizität Voraussetzungen rm ANOVA Generische Regel Sei A eine Matrix mit gleichen Zeilenelementen, so gilt ist zirkulär. Beispiel (k=3, l=5) Test über Spherizität Die Eigenschaft der Zirkularität der Varianz-Covarianz Matrix ist über statistische Tests prüfbar. Dazu bedient man sich einer aus der Zirkularität abgeleiteten Eigenschaft von S, der Spherizität. Sei M eine (k-1) x k Matrix mit orthogonalen Zeilen. Die (k-1) x (k-1) Matrix ist sphärisch, gdw SX zirkulär ist. [Excel-Beispiel]

Sphärische Matrix SY Beispiel (k=3) Diagonalmatrix SY Folgerung Voraussetzungen rm ANOVA Sphärische Matrix SY Man verwende als Matrix M eine Matrix der c-Koeffizienten, die einen vollständigen Satz orthogonaler Einzelvergleiche definiert. Die Vektoren normiere man zeilenweise (orthonormale Matrix M) Beispiel (k=3) Diagonalmatrix SY Da A gleiche Zeilenelemente hat, und die Summe der Zeilenelemente von M Null ergibt, folgt Damit: Folgerung Wenn SX zirkulär ist, ist SY sphärisch (diagonal)

Abweichung von Spherizität Voraussetzungen rm ANOVA Abweichung von Spherizität Man definiert ein Abweichungsmaß e für die Abweichung von der Spherizität: li die Eigenwerte von SY . Range der möglichen Abweichung Damit kann man den Range der möglichen Abweichungen bewerten (Beispiel: k=4): (perfekt) (max. Abweichung) Der Range der möglichen Abweichungen ist [(k-1)-1…1]

Mauchley-Test Test-Statistik: Mauchley’s W EntscheidungsRegel c2 -Test Voraussetzungen rm ANOVA Mauchley-Test Man teste die Nullhypothese über die Stichprobenmatrizen SX und SY . Test-Statistik: Mauchley’s W mit (tr die Spur der Matrix) W ist austabelliert (e.g. Winer, Anhang D). EntscheidungsRegel Lehne die Nullhypothese (Spherizitätshypothese) ab, wenn sonst behalte Spherizitätshypothese bei. a sollte nicht konservativ gewählt werden (e.g. a = 0.25) c2 -Test Aus W berechnet man die c2 verteilte Prüfstatistik (nur approx.) mit

Voraussetzungen rm ANOVA Mauchley-Test W-Tabelle

Freiheitsgrad-korrektur Voraussetzungen rm ANOVA Freiheitsgrad-korrektur Unabhängig vom Ergebnis des Mauchley-Tests kann der F-Test durch eine Adjustage der Freiheitsgrade konservativer gemacht werden. Box-Correction Nach Box ist die F- Statistik in rm Designs verteilt wie (#) Greenhouse-Geisser Correction Da die untere Grenze für e (maximale Verletzung) 1/(k-1) ist, folgt als konservativster F- Test, der jede Spherizitätsverletzung auffängt. Huynh-Feldt-Correction Die Gültigkeit von (#) ist gut untersucht. Huynh und Feldt schlagen vor, korrigierte e in (#) zu verwenden: aber kombiniert mit der Regel: (den Abweichungswert auf 1 setzen, falls größer wird) Mit der Box Formel lässt sich nach Verwendung von ein optimales Ergebnis erreichen.