Varianzanalyse mit Messwiederholungen (Repeated-measures (M)ANOVA) Varianzanalyse mit Messwiederholungen (Repeated-measures (M)ANOVA) Jonathan Harrington.

Slides:



Advertisements
Ähnliche Präsentationen
Korrektur Tutoratsaufgaben V
Advertisements

Artikulatorische Analyse der Lippenbewegungen in Schwas:
Mixed Models Jonathan Harrington library(ez) library(lme4)
Varianzanalyse 2 Faktorielle Varianzanalysen mit Meßwiederholung
Thema der Stunde I. Einführung in die Varianzanalyse:
Quellen-Filter Theorie der Sprachproduktion
EmPra Der Einfluss und die Verarbeitung von emotionalen Reizen
Einfaktorielle Varianzanalyse
Generalised linear mixed models (GLMM) und die logistische Regression
Die Varianzanalyse ohne Messwiederholung
Mixed models Jonathan Harrington Die R-Befehle: mixed.txt
Die Varianzanalyse Jonathan Harrington.
Mixed Models Jonathan Harrington library(ez) library(lme4)
Die t-Verteilung Jonathan Harrington.
Mixed models Jonathan Harrington
Logistische Regression und die Analyse von Proportionen Jonathan Harrington library(lme4) library(lattice) library(multcomp) source(file.path(pfadu, "phoc.txt"))
Kovarianz, Korrelation, (lineare) Regression
Wahrscheinlichkeit und die Normalverteilung
Kovarianz, Korrelation, (lineare) Regression
Logistische Regression und die Analyse von Proportionen Jonathan Harrington library(lme4) library(lattice) library(multcomp) source(file.path(pfadu, "phoc.txt"))
Logistische Regression und die Analyse von Proportionen
Die Varianzanalyse Analysis of Variance (ANOVA) Jonathan Harrington
Die t-Verteilung (fortgesetzt)
Die Varianzanalyse Analysis of Variance (ANOVA) Jonathan Harrington
2 und Logistic Regression Jonathan Harrington Die Analyse von Proportionen: Befehle: proportion.txt Bitte lvoc.txt und lost.txt laden (siehe proportion.txt)
Die Varianzanalyse Jonathan Harrington Analysis of Variance (ANOVA) pfad = "Verzeichnis wo Sie anova1 gespeichert haben" attach(paste(pfad, "anova1", sep="/"))
Kovarianz, Korrelation, (lineare) Regression
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Kovarianz, Korrelation, (lineare) Regression Jonathan Harrington BITTE NOCH EINMAL dframes.zip (Webseite 4.1) herunterladen und in pfad auspacken.
Die Varianzanalyse ohne Messwiederholung Jonathan Harrington.
Logistische Regression und die Analyse von Proportionen Jonathan Harrington.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-28.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.
Ein frohes und erfolgreiches Jahr
Experimentelles Design
Fragen Was wird mit der Alphafehler-Kumulierung bzw. –inflation bezeichnet? Wie hoch ist die Wahrscheinlichkeit bei einer Untersuchung mit 4 Gruppen einen.
Unser letztes Tutorium
Tutorium
Unser zehntes Tutorium Materialien unter:
Vorlesung: ANOVA I
Varianzanalyse mit Messwiederholungen (fortgesetzt) Jonathan Harrington Befehle: anova3.txt path = "Verzeichnis wo Sie anova1 gespeichert haben" attach(paste(path,
Varianzanalyse IV: Messwiederholung
Die t-Verteilung und die Prüfstatistik
Die t-Verteilung und die Prüfstatistik
Varianzanalyse mit Messwiederholungen
Varianzanalyse mit Messwiederholungen
Varianzanalyse mit Messwiederholungen. (fortgesetzt) Jonathan Harrington Befehle: anova3.txt pfad = "Verzeichnis wo Sie anova1 gespeichert haben" attach(paste(pfad,
Die t-Verteilung Jonathan Harrington. Standard error of the mean (SE) ist die Standardabweichung von Mittelwerten Ich werfe 5 Würfel und berechne den.
Varianzanalyse mit Messwiederholungen. (fortgesetzt) Jonathan Harrington Befehle: anova3.txt pfad = "Verzeichnis wo Sie anovaobjekte gespeichert haben"
Die t-Verteilung und die Prüfstatistik
Einige Kriterien für die Durchführung einer Varianzanalyse Jonathan Harrington.
Varianzanalyse mit Messwiederholungen
Modul Statistische Datenanalyse
SStotal SStotal SStreat SSerror SStreat SSerror Biomasse (g) wenig
Soziale Urteilsbildung Lozo, Soziale Urteilsbildung, AE Sozialpsychologie, SS 2004 Laienhafte Inferenzstrategien oder „the intuitive psychologist“ 2: Urteilsheuristiken.
Mixed models Jonathan Harrington Die R-Befehle: mixed.txt pfad = "Das Verzeichnis, wo die Daten gespeichert sind" attach(paste(pfad, "anova1"), sep="")
Die einfache/multiple lineare Regression
Thema der Stunde Varianzanalyse mit Messwiederholung
Die Varianzanalyse Jonathan Harrington library(ggplot2) library(ez)
Einige Kriterien für die Durchführung einer Varianzanalyse
Die Varianzanalyse II Jonathan Harrington library(ggplot2) library(ez)
Comprehension and Production of Analogical Problems by a Chimpanzee
Die Varianzanalyse II Jonathan Harrington library(ggplot2)
Die Varianzanalyse Jonathan Harrington library(lattice) library(ez)
Die Varianzanalyse Jonathan Harrington library(ggplot2) library(dplyr)
ANOVA für unabhängige Daten.
Johann D. Müller, Merlin Dwenger , Mats Böttrich
 Präsentation transkript:

Varianzanalyse mit Messwiederholungen (Repeated-measures (M)ANOVA) Varianzanalyse mit Messwiederholungen (Repeated-measures (M)ANOVA) Jonathan Harrington Befehle: anova2.txt pfad = "Verzeichnis wo Sie anova1 gespeichert haben" attach(paste(pfad, "anova1", sep="/")) library(car)

Messwiederholungen: der gepaarte t-test 8 französische Vpn. erzeugten /pa/ und /ba/. Die VOT- Werte (ms) für diese 8 Vpn. sind wie folgt. Wir wollen prüfen, ob sich diesbezüglich /pa/ und /ba/ unterscheiden. VOT für Vpn 4 ist -10 ms für /ba/, 0 ms für /pa/. ba pa [1,] [2,] [3,] 5 15 [4,] [5,] [6,] [7,] -5 7 [8,] 0 5 Ist der VOT-Unterschied zwischen /ba, pa/ signifikant? { 8 verschiedene Vpn, zwei Messung pro Vpn, einmal fuer /pa/, einmal fuer /ba/

Vielleicht ein t-test? ba = c(10, -20, 5, -10, -25, 10, -5, 0) pa = c(20, -10, 15, 0, -20, 16, 7, 5) vot = c(ba, pa) vot.l = factor(c(rep("ba", length(ba)), rep("pa", length(pa)))) t.test(vot ~ vot.l, var.equal=T) Messwiederholungen: der gepaarte t-test ba pa [1,] [2,] [3,] 5 15 [4,] [5,] [6,] [7,] -5 7 [8,] 0 5 Nicht signifikant data: vot by vot.l t = , df = 14, p-value =

Mit einem konventionellen t-Test wird jedoch nicht berücksichtigt, dass die Werte gepaart sind, d.h. Paare von /pa, ba/ sind von derselben Vpn. Genauer: der Test vergleicht einfach den Mittelwert von /pa/ (über alle 8 Vpn) mit dem Mittelwert von /ba/, ohne zu berücksichtigen, dass z.B. VOT von Vpn. 2 insgesamt viel kleiner ist als VOT von Vpn. 6. Messwiederholungen: der gepaarte t-test ba pa [1,] [2,] [3,] 5 15 [4,] [5,] [6,] [7,] -5 7 [8,] 0 5 Two Sample t-test data: vot by vot.l t = , df = 14, p-value = alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean in group ba mean in group pa

Ein gepaarter t-test klammert die Sprechervariation aus und vergleicht innerhalb von jedem Sprecher ob sich /pa/ und /ba/ unterscheiden t.test(vot ~ vot.l, var.equal=T, paired=T) Paired t-test data: vot by vot.l t = , df = 7, p-value = 4.861e-05 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean of the differences -8.5 Signifikant, t = -8.82, df = 7, p < Messwiederholungen: der gepaarte t-test

Within- and between-subjects factors within-subject factor Für das letzte Beispiel war Voice (Stufen = ba, pa) ein within-subjects Faktor, weil es pro Versuchsperson für jede Stufe von Voice einen Wert gab (einen Wert für ba, einen Wert für pa). ba pa [1,] [2,] [3,] 5 15 [4,] [5,] [6,] [7,] -5 7 [8,] 0 5 Vpn Voicebapa w1w1 w2w2 Vpn ist ein Faktor mit 8 Stufen (die Versuchspersonen). Voice ist ein Faktor mit 2 Stufen (ba, pa). w 1, w 2 sind numerische Werte

Within- and between-subjects factors Ein Between subjects factor beschreibt meistens eine kategorische Eigenschaft pro Vpn. Z.B. Sprache (englisch oder deutsch oder französisch), Geschlecht (m oder w), Alter (jung oder alt) usw. Vpn Voicebapa w1w1 w2w2 Alterj oder a oder und between within

ba pa [1,] [2,] [3,] 5 15 [4,] [5,] [6,] [7,] -5 7 [8,] 0 5 Within- and between-subjects factors Between Within Die Kieferposition wurde in 3 Vokalen /i, e, a/ und jeweils zu 2 Sprechtempi (langsam, schnell) gemessen. Die Messungen (3 x 2 = 6 pro Vpn) sind von 16 Vpn erhoben worden, 8 mit Muttersprache spanisch, 8 mit Muttersprache englisch. Inwiefern haben Sprache, Sprechtempo, oder Vokale einen Einfluss auf die Kieferposition? Between Within Sprache Sprechtempo, Vokal keine Voice

Die Kieferposition wurde in 3 Vokalen /i, e, a/ und jeweils zu 2 Sprechtempi (langsam, schnell) gemessen. Die Messungen sind von 8 mit Muttersprache spanisch, 8 mit Muttersprache englisch aufgenommen worden. Within- and between-subjects factors Vpn iea lang.schnellSprechtempo Vokal Spracheengl. oder span. iea w1w1 w2w2 w3w3 w4w4 w5w5 w6w6 between within

ANOVA mit Messwiederholungen und der gepaarte t-test Die Generalisierung eines gepaarten t-tests ist die Varianzanalyse mit Messwiederholungen (RM-ANOVA, repeated measures ANOVA). vot.aov = aov(vot ~ vot.l + Error(Sprecher/vot.l)) Sprecher = factor(rep(1:8, 2)) ba pa [1,] [2,] [3,] 5 15 [4,] [5,] [6,] [7,] -5 7 [8,] 0 5 Between: keine Within: Voice bedeutet: vot.l ist within summary (vot.aov)

Error: Sprecher Df Sum Sq Mean Sq F value Pr(>F) Residuals Error: Sprecher:vot.l Df Sum Sq Mean Sq F value Pr(>F) vot.l e-05 *** Residuals between within ANOVA mit Messwiederholungen und der gepaarte t-test Stimmhaftigkeit hat einen signifikanten Einfluss auf VOT ( F(1, 7) = 77.8, p < 0.001). Vergleich mit dem gepaarten t-test Paired t-test data: vot by vot.l t = , df = 7, p-value = 4.861e-05 (und der F-Wert ist der t-Wert hoch 2)

MANOVA mit Messwiederholungen kann auch eingesetzt werden, um denselben Test durchzuführen. Vorteile eines RM-Manovas gegenüber einen RM-Anova* 1. Keine Probleme mit 'Sphericity' (grob: die Annahme in einem konventionallen RM-Anova, dass die Varianzen der Stufen sich voneinander nicht signifikant unterscheiden). (siehe O'Brien & Kaiser, 1985, Psychological Bulletin) 2. In einem RM-Manova können auch mehrere abhängige Variablen geprüft werden (zB ob es Unterschiede in einem F1 x F2 Raum gibt). 3. Einfacherer Interface zum Post-hoc Test

Manova mit Messwiederholungen 1. Daten vorbereiten vdaten = data.frame(vot, Sp= factor(Sprecher), Voice = factor(vot.l)) code = c("d", "s", "w") vdaten.t = Anova.prepare(vdaten, code) code: Ein Vektor der, die Spalten vom data-frame beschreibt "d": Abhängige Variable "s": Sprecher "w": within "b": between

2. RM-Manova durchführen vdaten.lm = lm(vdaten.t$d ~ 1) vdaten.aov = Anova(vdaten.lm, idata=vdaten.t$w, idesign=~Voice) vdaten = data.frame(vot, Sp= factor(Sprecher), Voice = factor(vot.l)) code = c("d", "s", "w") vdaten.t = Anova.prepare(vdaten, code) ~1 bedeutet: keine between- Faktoren bleibt gleich, also immer dataframe$w Die within-Faktoren Abhängige Variable(n)

3. Ergebnisse vdaten.aov Type III Repeated Measures MANOVA Tests: Pillai test statistic Df test stat approx F num Df den Df Pr(>F) (Intercept) e Voice e-05 *** Der Stimmhaftigeitsunterschied ist signifikant (F[1,7]=77.8, p < 0.001).

3. Ergebnisse Die Ausgabe der RM-Manova enthält auch diejenigen der RM- Anova: summary(vdaten.aov, mult=F) Univariate Type III Repeated-Measures ANOVA Assuming Sphericity SS num Df Error SS den Df F Pr(>F) (Intercept) Voice e-05 *** Diese sind immer identisch mit dem RM-Anova, den wir vorhin durchgeführt haben vot.aov = aov(vot ~ vot.l + Error(Sprecher/vot.l)) summary(vot.aov) Error: Sprecher:vot.l Df Sum Sq Mean Sq F value Pr(>F) vot.l e-05 *** Residuals

3. Ergebnisse Schließlich sind auch die Ergebnisse von einem RM-Manova und RM-Anova identisch, wenn die Anzahl der Freiheitsgrade im Zähler = 1 (also bei 2 Stufen) Type III Repeated Measures MANOVA Tests: Pillai test statistic Df test stat approx F num Df den Df Pr(>F) (Intercept) e Voice e-05 *** RM-MANOVA Univariate Type III Repeated-Measures ANOVA Assuming Sphericity SS num Df Error SS den Df F Pr(>F) (Intercept) Voice e-05 *** RM-ANOVA

RM-(M)anova: between and within Die Dauer, D, (ms) wurde gemessen zwischen dem Silbenonset und dem H* Tonakzent in äußerungsinitialen Silben (zB nächstes) und -finalen Silben (demnächst) jeweils von 10 Vpn., 5 aus Bayern (B) und 5 aus Schleswig-Holstein (SH). n H* ɛ D Dauer f0 Inwiefern wird die Dauer von der Position und/oder Dialekt beeinflusst? Die Daten: drnames(dr) attach(dr)

Abbildungen boxplot(D ~ Dialekt * Position) Position signifikant? Dialekt signifikant? Interaktion? interaction.plot(Dialekt, Position, D) RM-(M)anova: between and within

Position Dialekt between/within within between B oder SH Dialekt Vpn initialfinalPosition between within RM-(M)anova: between and within

1. Daten vorbereiten 2. RM-Manova durchführen code = c("d", "b", "s", "w") dr.t = Anova.prepare(dr, code) dr.lm = lm(dr.t$d ~ Dialekt) dr.aov = Anova(dr.lm, idata = dr.t$w, idesign = ~ Position) Zusätzlich: Alle Between-Faktoren explizit nennen Dialekt = factor(dr.t$b) Between Within

Ergebnisse* Type II Repeated Measures MANOVA Tests: Pillai test statistic Df test stat approx F num Df den Df Pr(>F) Dialekt * Position e-06 *** Dialekt:Position *** dr.aov *das selbe: Dialekt (F(1, 8)=11.08, p < 0.05) und Position (F(1, 8) = 98.56, p < 0.001) hatten einen signifikanten Einfluss auf die Dauer und es gab eine signifikante Interaktion (F(1, 8)=42.50, p < 0.001) zwischen diesen Faktoren. summary(dr.aov, mult=F) summary(aov(D ~ Dialekt * Position + Error(Vpn/Position)))

VpnSprache0 Monate6 Monate 1F F F F F E9591 7E8872 8E5461 9E E6258 Die Reaktionszeit (gemessen durch Knopfdruck) ein /x/ Phonem in deutschen Wörtern wahrzunehmen, wurde von 10 L2-Sprechern von deutsch (5 L1-französisch und 5 L1- englisch) gemessen. Die Reaktionszeiten sind zweimal erhoben: als sie nach Deutschland kamen (0 Monate) und 6 Monate nachdem sie in Deutschland waren. Werden die Reaktionszeiten von der Muttersprache und/oder der Aufenthaltsdauer beeinflusst?

post-hoc Tests Die Interaktion Dialekt x Position heißt: die Haupteffekte (Dialekt sind signifikant, Position ist signifikant) können ggf. nur eingeschränkt akzeptiert werden. (zB vielleicht ist Dialekt signifikant nur für initial, jedoch nicht für final usw). Type II Repeated Measures MANOVA Tests: Pillai test statistic Df test stat approx F num Df den Df Pr(>F) Dialekt * Position e-06 *** Dialekt:Position *** dr.aov

RM-(M)anovas und post-hoc Tests Für RM-(M)anovas lässt sich ein Tukey-Test leider kaum anwenden. Daher wird stattdessen ein post-hoc t-test mit Bonferroni Korrektur angewandt. Das Prinzip ist das gleiche: je mehr Tests wir post-hoc anwenden, um so wahrscheinlich ist es, dass wir Signifikanzen per Zufall bekommen werden. Der Tukey und Bonferroni- adjusted Tests sind Maßnahmen dagegen. Bonferroni-Korrektur: Der Wahrscheinlichkeitswert der inviduellen Tests wird mit der Anzahl der möglichen paarweise Tests multipliziert.

Mit post-hoc Tests werden alle Stufen-Kombinationen der Faktoren, die in der Interaktion signifikant waren, geprüft. SH-initial mit SH-final SH-initial mit B-initial SH-initial mit B-final SH-final mit B-initial SH-final mit B-final B-initial mit B-final Dialekt (SH, B) gekreuzt mit Position (initial, final) gibt 6 Tests Anzahl der möglichen Tests Wie viele mögliche paarweise Tests gibt es? Dialekt * Position war signifikant.

Anzahl der möglichen Tests Der allgemeine Fall Fur n Stufen-Kombinationen gibt es n!/(n-2)!2! mögliche paarweise Tests. zB Dialekt * Position * Geschlecht war signifikant. Dialekt = Hessen, Bayern, S-H Geschlecht = M, W Position = initial, medial, final Wir haben 3 x 2 x 3 = 18 Stufen-Kombinationen Das gibt 18!/16!2! = 18 x 17/2 = 153 mögliche paarweise Tests.

Anzahl der möglichen Tests SH-initial mit SH-final SH-initial mit B-initial SH-initial mit B-final SH-final mit B-initial SH-final mit B-final B-initial mit B-final Dialekt (SH, B) gekreuzt mit Position (initial, final) gibt 6 Tests Wie viele mögliche paarweise Tests gibt es? Dialekt * Position war signifikant. 2 (SH, B) x 2 (initial, final) = 4. Daher 4!/2!2! = 12/2 = 6 Tests

SH-initial mit SH-final SH-initial mit B-initial SH-initial mit B-final SH-final mit B-initial SH-final mit B-final B-initial mit B-final Bei einer Interaktion von 2 Faktoren interessieren uns jedoch nur einige Tests und zwar diejenigen, die sich auf diese Fragen beziehen. (Interaktion zwischen 2 Faktoren, dann immer 2 Fragen) 1. Unterscheiden sich die Positionen in allen Dialekten? (= Unterscheiden sich die Positionen nach gleichbleibendem Dialekt?) 2. Unterscheiden sich die Dialekte in allen Positionen? (= Unterscheiden sich die Dialekte nach gleichbleibender Position?) post-hoc Tests Wir müssen auch berücksichtigen, dass einige Tests gepaart sind (ja), und andere nicht (nein). (ja) (nein)

post-hoc Tests: within = gepaart 1. SH-initial mit SH-final 2. SH-initial mit B-initial SH-initial mit B-final SH-final mit B-initial 3. SH-final mit B-final 4. B-initial mit B-final (ja) (nein) gepaart t.test(dr.t$d[temp,1], dr.t$d[temp,2], paired=T) temp = dr.t$b == "SH" 1. t = , df = 4, p-value = Bonferroni adjusted p: *6 = , NS t.test(dr.t$d[!temp,1], dr.t$d[!temp,2], paired=T) 4. t = , df = 4, p-value = Bonferroni adjusted p: *6 = , sig

1. SH-initial mit SH-final 2. SH-initial mit B-initial SH-initial mit B-final SH-final mit B-initial 3. SH-final mit B-final 4. B-initial mit B-final (ja) (nein) gepaart t.test(dr.t$d[temp,2], dr.t$d[!temp,2]) temp = dr.t$b == "SH" 2. t = , df = 6.476, p-value = Bonferroni adjusted p: *6 = , sig t.test(dr.t$d[temp,1], dr.t$d[!temp,1]) 3. t = , df = 8, p-value = , NS post-hoc Tests: between, nicht gepaart

1. Unterscheiden sich die Positionen in allen Dialekten? 2. Unterscheiden sich die Dialekte in allen Positionen? Post-hoc Bonferroni-adjusted t-tests zeigten signifikante Unterschiede zwischen initialer und finaler Position für Bayern (p < 0.001) jedoch nicht für Schleswig-Holstein. Die Unterschiede zwischen Bayern und Schleswig-Holstein waren in initialer (p < 0.01) jedoch nicht in finaler Position signifikant. Bonferroni-adjusted t-Test nach RM-(M)anova , sigB-initial mit B-final SH-initial mit B-initial , sig

Post-hoc Bonferroni-adjusted t-tests zeigten signifikante Unterschiede zwischen initialer und finaler Position für Bayern (p < 0.001) jedoch nicht für Schleswig-Holstein. Die Unterschiede zwischen Bayern und Schleswig-Holstein waren in initialer (p < 0.01) jedoch nicht in finaler Position signifikant.