T-Tests und Varianzanalysen

Slides:



Advertisements
Ähnliche Präsentationen
T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.
Advertisements

Gliederung 1. Einführung
Korrektur Tutoratsaufgaben V
Aufgabe Analyse (Friedman-Test) von letzter Stunde wiederholen
Thema der Stunde I. Einführung in die Varianzanalyse:
EmPra Der Einfluss und die Verarbeitung von emotionalen Reizen
Einfaktorielle Varianzanalyse
Gliederung Vertrauensintervalle Arten von Hypothesen
Gliederung Definition des Wahrscheinlichkeitsbegriffes
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.
Ein frohes und erfolgreiches Jahr
Quantitative Methoden I
Hypothesen testen: Grundidee
Prüfung statistischer Hypothesen
Effektgrößen, Kontraste & Post-hoc-Tests
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Was steht in einer ANOVA - Tabelle?
Fragen Was wird mit der Alphafehler-Kumulierung bzw. –inflation bezeichnet? Wie hoch ist die Wahrscheinlichkeit bei einer Untersuchung mit 4 Gruppen einen.
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Tutorium
Tutorium
Tutorium
Tutorium
Tutorium Aufgabe 1 a) E(eIX)= 0 E(eIX)= E(Y-E(YIX)IX) = E(YIX)- E (E(YIX)IX) = E(YIX)- E(YIX) = 0 Im Mittel macht man mit seiner Schätzung keinen.
Unser siebentes Tutorium
Unser zehntes Tutorium Materialien unter:
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: ANOVA I
Wiederholung: Einfache Regressionsgleichung
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Varianzanalyse IV: Messwiederholung
Einführung in die beurteilende Statistik
Vergleich der 3 Arten des t-Tests Testergebnisse berichten
Mittelwertvergleiche (T-Test)
Ausgleichungsrechnung II
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Chi Quadrat Test Tamara Katschnig.
Seminar: Datenerhebung
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Forschungsmodell H1 – H5: Ein- und Zweifaktorielle Varianzanalysen Varianzanalyse am Beispiel des Datensatzes zur Shell-Jugendstudie 1992 Plakat vorgestellt.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Seminar: Datenerhebung
Seminar: Datenerhebung
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
STATISIK LV Nr.: 1375 SS März 2005.
Modul Statistische Datenanalyse
SStotal SStotal SStreat SSerror SStreat SSerror Biomasse (g) wenig
Foliensammlung Multivariate Analysemethoden 13. Auflage
Foliensammlung Multivariate Analysemethoden 13. Auflage
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
Veranstaltung 4.
Die einfache/multiple lineare Regression
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Varianzanalyse Teststatistik: F – Test -> vergleich zweier Varianzen -> Grundlage der Varianzanalyse Welche „Varianzen“ werden miteinander verglichen?
Soziale Urteilsbildung Lozo, Soziale Urteilsbildung, AE Sozialpsychologie, SS 2004 Laienhafte Inferenzstrategien oder „the intuitive psychologist“ 2: Urteilsheuristiken.
setzt Linearität des Zusammenhangs voraus
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Die einfache/multiple lineare Regression
Varianzanalyse und Eta²
Thema der Stunde Varianzanalyse mit Messwiederholung
Statistiken je nach Messniveau
Forschungsstrategien Johannes Gutenberg Universität Mainz
Die einfache/multiple lineare Regression
Konfidenzintervalle und Tests auf Normalverteilung
ANOVA für unabhängige Daten.
 Präsentation transkript:

T-Tests und Varianzanalysen PC-Praktikum

Allgemein Bei all diesen Tests geht es um Zusammenhänge zwischen 2 oder mehr Variablen. Dabei ist die abhängige Variable(AV) mindestens Intervallskalenniveau und die unabhängige/n Variable/n(UV) kategorial. Es werden die arithmetischen Mittel erfasst und auf signifikante Unterschiede geprüft.

T-Tests Untersuchen, ob sich die Mittelwerte zweier SP signifikant unterscheiden (außer T-Test für eine SP: Vergleich eines Mittelwertes einer SP mit beliebigen Mittelwert ) Voraussetzungen: Normalverteilung min. intervallskalierte AV dichotome UV Nicht zu große Stichprobenumfänge (neigt dann zu signifikanten Ergebnissen) und Zufallsauswahl für T-Test für unabhängige Stichproben(SP): unabhängige (Teil-)Stichproben für T-Test für gepaarte SP: abhängige (Teil-)SP

Quelle: Kähler 2006: 414.

T-Test bei einer SP Datensatz: Master_FP_2006.sav Es geht um das Alter der Befragten: Variable: alter Forschungsinteresse: Wir wollen herausfinden, ob sich der Altersdurchschnitt dieser Studie signifikant vom Altersdurchschnitt des Hochschulgesamtdatensatz unterscheidet. Hier wollen wir dazu den Ein-Stichproben-T-Test verwenden. andere Anwendungsmöglichkeiten: z.B. Vergleich des Durchschnittseinkommen der eigenen Studie mit „offiziellem“ Durchschnittseinkommen der Gesamtbevölkerung

T-Test bei einer SP AnalysierenMittelwerte vergleichenT-Test bei einer SP Hypothesen (für zweiseitig): H0: μ empir=33,8935 H1: μ empir ≠33,8935 Quelle: Janssen 2003: 306.

T-Test bei einer SP -Fenster Testvariable(n)… Variable(n) bei der der Test durchgeführt werden soll hier: alter Testwert… Wert, mit dem der empirische Mittelwert verglichen werden soll hier: 33,8935 (aus Hochschulgesamtdatensatz) Optionen: Konfidenzintervall Fehlende Werte: Fallausschluss Test für Test... nur Ausschluss der Fälle, bei denen in der gerade analysierten abhängigen oder unabhängigen Variable ein fehlender Wert auftritt Listenweiser Fallausschluss… Ausschluss aller Fälle, in denen in irgendeiner dieser Variablen ein fehlender Wert auftritt

T-Test bei einer SP -Ausgaben Streuung um den Mittelwert in diesem Bereich liegt mit 95%iger Sicherheit der wahre Wert Freiheits-grade Mittelwertsdifferenz: Differenz zum Testwert T-Wert |t|>tkrit=1,96 UND Sig.(2-seitig)* < 0,05 H0 ist abzulehnen (mit Irrtumswahrscheinlichkeit von 5%) *für 1-seitige Hypothesen: Sig.(2-seitig) durch 2 teilen

T-Test bei unabhängigen SP Datensatz: Master_FP_2006.sav Es geht um die Frage 51:

Menü Mittelwerte… Analysieren  Mittelwerte vergleichen  Mittelwerte … zum Vergleich der Mittelwerte u. a. deskriptiver Statistik sowie Kontrolle der Drittvariablen Fenster: abhängige Variablen: f51beruf unabhängige Variablen: f65gesch Optionen: Zellenstatistik…was gewünscht ANOVA-Tabelle… Varianzanalyse (ohne Einbeziehung der Kontrollvariablen) und Eta… zur Bestimmung des Anteils der erklärten Varianz Linearitätstest… prüft, ob Zusammenhang durch lineare Regression erfasst werden kann (metrische, klassifizierte UV nötig) Weiter… zur Einführung von Kontrollvariablen

Menü Mittelwerte… Forschungsinteresse: Sind die Mittelwertunterschiede signifikant oder zufällig? Prüfung mit 2-Stichproben-T-Test für unabhängige SP

T-Test bei unabhängigen SP AnalysierenMittelwerte vergleichenT-Test bei unabhängigen SP Hypothesen (für zweiseitig): H0: μweibl= μmännl H1: μ weibl ≠ μmännl Fenster: Testvariable(n) hier: f51beruf Gruppenvariable…UV hier: f65gesch Gruppen def.: Gruppe 1 hier: 1 Gruppe 2 hier: 2 Trennwert… Teilungspunkt für ordinale oder metrische UV Bildung v. 2 Gruppen Optionen: Konfidenzintervall Fehlende Werte: Fallausschluss Test für Test Listenweiser Fallausschluss

T-Test bei unabhängigen SP -Ausgaben

T-Test bei unabhängigen SP -Ausgaben Standardab-weichung der Differenz F-Wert

T-Test bei unabhängigen SP -Ausgaben Levene-Test für Varianzgleichheit: H0: Varianzen der Variablen gleich H1: Varianzen sind nicht gleich Ergebnis: Signifikanz > 0,05 “Varianzen sind nicht gleich” ablesen T-Test: |t|>tkrit=1,96 UND Sig.(2-seitig) < 0,05 H0 ist abzulehnen (mit Irrtumswahrscheinlichkeit von 5%)

T-Test bei gepaarten SP Datensatz: abm.sav Einkommen von Teilnehmern einer Arbeitsbeschaffungsmaßnahme Forschungsinteresse: Unterschiede des Einkommen der Teilnehmer vor und nach der Arbeitsbeschaffungsmaßnahme Prüfung mit 2-Stichproben-T-Test für abhängige SP AnalysierenMittelwerte vergleichenT-Test bei gepaarten SP

T-Test bei gepaarten SP Hypothesen (für zweiseitig): H0: μvar225= μvar310 H1: μvar225 ≠ μvar310 Fenster: Gepaarte Variablen… es sind mehrere Paare möglich hier: var225(Bruttoeinkommen vor ABM) Strg-Taste halten var310(erstes Bruttoeinkommen nach ABM) Optionen: Konfidenzintervall Fehlende Werte: Fallausschluss Test für Test Listenweiser Fallausschluss

T-Test bei gepaarten SP Korrelation recht hoch

T-Test bei gepaarten SP Mittelwert der Differenzen zwischen den Zeitpunkten Standard-abweichung der Differenzen zwischen den Zeitpunkten |t|<tkrit=1,994 UND Sig.(2-seitig) > 0,05  H0 kann nicht abgelehnt werden kein signifikanter Unterschied im Einkommen

Varianzanalysen Untersucht, ob sich die Mittelwerte von mehr als 2 SP signifikant unterscheiden Prüft nur, ob Unterschied zwischen min. einem der verglichenen Paare signifikant ist  zur Prüfung zwischen welchen Vergleichspaaren signifikante Differenzen: Post-Hoc-Tests Voraussetzungen: UV: alle Skalenniveaus möglich, kategorisiert AV: min. Intervallskalierung Varianzhomogenität geprüft mit Levene-Test Normalverteilung Zufallsstichproben Für ANOVA: unabhängige SP Für Varianzanalyse mit Meßwiederholung: abhängige SP

Quelle: Kähler 2006: 441.

Einfaktorielle ANOVA Hypothesen (für zweiseitig): H0: μ1=μ2=…=μi Datensatz: Master_2006_FP Forschungsinteresse: Frage 51Gibt es Unterschiede zwischen den Geburtskohorten? Prüfung mit Einfaktorieller ANOVA AnalysierenMittelwerte vergleichenEinfaktorielle ANOVA Hypothesen (für zweiseitig): H0: μ1=μ2=…=μi H1: μ1≠μ2≠…≠μi

Einfaktorielle ANOVA Fenster: Abhängige Variablen hier: f51beruf Faktor… UV hier: f66gebja_koh Kontraste: Polynomial UND Grad … Erklärung der Summe der Abweichungsquadrate zwischen den Gruppen durch Polynomterme bis zur 5.Ordnung Kontrast 1 von 1 : Koeffizienten… t-Test für a priori festgelegte Kontrastgruppen Kodierung mit -1 und +1 für zu vergleichende Gruppen und 0 für ausgeschlossene Gruppen (Koeffizientensumme… Koeffizienten müssen 0 ergeben)

Einfaktorielle ANOVA - Post-Hoc Varianz-Gleichheit angenommen: LSD Bonferroni Sidak Scheffé… Vergleich der Mittelwerte und Berechnung der kritischen Differenz hier: Scheffe-Test etc. Keine Varianzgleichheit angenommen: Tamhane-T2 Signifikanzniveau …angeben als ,05 etc.

Einfaktorielle ANOVA - Optionen Statistik: Deskriptive Statistik Feste und zufällige Effekte: Statistiken für Modell mit festen Effekten(Standardabweichung, Standardfehler, Konfidenzintervall) und zufälligen Effekten(Standardfehler, Konfidenzintervall, Varianz zwischen Komonenten) Test auf Homogenität der Varianzen… Levene-test Brown-Forsythe… Test auf Gleichheit der Mittelwerte der Gruppen für ungleiche Varianzen Welch… siehe Brown-Forsythe-Test Diagramm der Mittelwerte: Liniendiagramm aus Punkten der Mittelwerte der Gruppen Fehlende Werte: Fallauschluss Test für Test Listenweiser Testausschluss

│F│< Fkrit=2,21 UND Signifikanz >0,05 Einfaktorielle ANOVA F-Wert │F│< Fkrit=2,21 UND Signifikanz >0,05 Varianzhomogenität falls nicht: kann Varianzanalyse nicht durchgeführt werden

Einfaktorielle ANOVA │F│> Fkrit=2,21 UND Signifikanz <0,05 Zerlegung der sum-mierten Ab-weichungsquadrate in SAQzw , SAQin und SAQge Varianzen │F│> Fkrit=2,21 UND Signifikanz <0,05 signifikante Unterschiede zwischen Geburtskohorten

Signifikanz innerhalb den Gruppen Einfaktorielle ANOVA Signifikanz innerhalb den Gruppen 3 homogene Gruppen, deren Mittelwerte sich nicht signifikant unterscheiden: Gruppe 1: 1-3 und Gruppe 2: 3-5 und Gruppe 3: 4-6

Weitere Varianzanalysen AnalysierenAllgemeines lineares ModellUnivariat… für eine AV AnalysierenAllgemeines lineares ModellMultivariat… für mehrere AV AnalysierenAllgemeines lineares ModellMeßwiederholung… Varianzanalyse für abhängige SP AnalysierenAllgemeines lineares ModellVarianzkomponenten… schätzt bei Modellen mit gemischten Effekten den Beitrag jedes Zufallseffekts zur Varianz der abhängigen Variablen.

2-faktorielle Varianzanalyse Kann auch Wirkung ihrer Kombination(Interaktion) untersuchen gleiche Zellhäufigkeiten… alle Zellen mit gleicher Anzahl der Fälle besetzt wechselseitig voneinander unabhängig Gegenteil: ungleiche Zellhäufigkeiten: Effekte korrelieren miteinander Datensatz: allbus90.sav Forschungsinteresse: Welchen Einfluss hat der Schulbildung und das Geschlecht auf das Einkommen unter Kontrolle der Variablen Alter? Prüfung mit 2-faktorieller Varianzanalyse AnalysierenAllgemeines lineares ModellUnivariat

AnalysierenAllgemeines lineares ModellUnivariat Abhängige Variable hier: eink Feste Faktoren… alle relevanten Merkmale des Faktors sind durch Untersuchungsanordnung vorgegeben hier: geschl, schul2 Zufallsfaktoren… kommen durch bzgl. dieses Merkmals zufällige Zuweisung von Fällen zu Untersuchungsgruppen zustande Kovariaten… zusätzliche Einführung einer mit metrischen Variable (wichtig: keine Korrelation zu Faktoren) Kontrollvariable hier: alt WLS-Gewichtung… für Gewichtung der Fälle (vorher Gewichtungsvariable bilden)

AnalysierenAllgemeines lineares ModellUnivariat Modell: Gesättigtes Modell… alle Faktoren und Kovariate sowie Wechselwirkungen zwischen Faktoren gehen ins Modell ein hier: gesättigtes Modell Anpassen… Auswahl der Haupteffekte (Faktoren und Kovariate) und Wechselwirkungen (auch mit Kovariaten), die in Modell eingehen sollen Term(e) konstruieren: u.a. Alle ?-Weg… Wechselwirkungen der ?.Ordnung Quadratsumme… zur Berechnung der Summe der Abweichungen  Typ I… Hierarchisch: Jeder Term wird nur für die in der Liste vor ihm stehenden korrigiertReihenfolge hat Einfluss auf Ergebnis Typ II: Regressionsmodell: Berechnung der Haupteffekte um alle anderen Terme (außer Interaktionen) korrigiert Typ III: Berechnung der Quadratsumme eines Effekts um alle anderen Effekte bereinigt, die nicht im Effekt enthalten sind robust gegenüber ungleichen Zellhäufigkeiten ungeeignet für leere Zellen Typ IV: für leere Zellen

AnalysierenAllgemeines lineares ModellUnivariat Kontraste… Vergleich von Gruppen (nur 1 Faktor) über a priori definierte Kontraste (ähnlich wie bei ANOVA): Einfach… Vergleich der Mittelwerte aller Faktorstufen (außer Referenzkategorie) mit Mittelwert der Referenzkategorie Wiederholt… Vergleich des Mittelwerts jeder Faktorstufe (außer der letzten) mit dem Mittelwert der folgenden Faktorstufe Polynomial… Vergleich des linearen etc. Effekts  für Schätzung von polynomialen Trends etc. Referenzkategorie… erste oder letzte Faktorstufe

AnalysierenAllgemeines lineares ModellUnivariat Diagramme: Profilplots… stellen den Zusammenhang zwischen max. 2 Faktoren und der AV dar: Horizontale Achse… 1.Faktor hier: schul Separate Linien… 2.Faktor hier: geschl Separate Diagramme… 3.Faktor Post-Hoc… wie bei ANOVA (Speichern… Hier kann man festlegen, dass bestimmte Werte als neue Variablen gespeichert werden können)

AnalysierenAllgemeines lineares ModellUnivariat Optionen: Geschätzte Randmittel: Mittelwerte anzeigen für… Auswahl der Faktoren und – kombinationen für Ausgabe der Mittelwerte hier: (Insgesamt) Haupteffekte vergleichen UND Anpassung des Konfidenzintervalls… Auswahl von Post-Hoc-Tests Anzeigen: Deskriptive Statistik… für jede Faktorstufenkomination Schätzer der Effektgröße… partielle Eta-Werte für erklärte Varianz für jeden Faktor, Interaktion und Kovariate hier: beide ankreuzen Beobachtete Schärfe… Wahrscheinlichkeit einen tatsächlich vorhandenen Effekt auch zu entdecken etc. Signifikanzniveau

2-faktorielle Varianzanalyse

2-faktorielle Varianzanalyse

2-faktorielle Varianzanalyse Signifikanz>0,05Keine signifikante Interaktion Prüfung der Signifikanz der Haupteffekte: Geschlecht und Schulbildung haben signifikante Wirkung, weil Signifikanz<0,05; Kovariate Alter hat keine signifikante Wirkung, weil Sig. >0,05 (korrigiertes) R2=0,199 Modell erklärt ca. 20% der Gesamtvarianz: davon erklärt die Schulbildung ca. 7% und das Geschlecht ca. 15% der VarianzGeschlecht hat stärkere Wirkung als Schulbildung

2-faktorielle Varianzanalyse

2-faktorielle Varianzanalyse-Diagrammauswertung Separate Linien: Wenn Zeilenvariable keinen Einfluss besitzt, verläuft sie parallel zur x-Achse Besitzt sie Einfluss, steigt oder fällt sie hier: Einfluss des Geschlechts auf Einkommen Wenn sie Einfluss hat, kann sie in verschiedenen Abschnitten unterschiedlich verlaufen, aber nicht parallel Horizontale Achse: Wenn Spaltenvariable keinen Einfluss besitzt, fallen die einzelnen Linien zusammen Wenn sie Einfluss hat: Abstand zwischen den Linien hier: Einfluss des Geschlechts auf Einkommen vorhanden Wenn Interaktion vorliegt, verlaufen Linien zumindest in Bereichen nicht parallel hier: Linien verlaufen im Bereich Fachhochschule/Abi nicht mehr parallelleichte Interaktion Wenn keine Interaktion vorliegt, verlaufen die Linien parallel Konstanz des Abstands

Aufgaben Für diese Aufgaben wird der Datensatz Master_FP_2006 benötigt. Es geht um die Variablen studfach(1.abgeschlossenes Studienfach) und f51aufst(Berufserfolg bedeutet gute Aufstiegschancen zu haben). Es interessiert hier, ob das Studienfach beeinflusst, wie sehr der Aussage (nicht) zugestimmt wird, dass „Beruflicher Erfolg ist … gute Aufstiegschancen zu haben.“ Vergleicht zuerst die Mittelwerte der Gruppen der Variable studfach untereinander und mit dem Gesamtmittelwert der Variable studfach! Nun soll herausgefunden werden, ob sich die Mittelwerte von f51einko signifikant unterscheiden, je nachdem welches Studienfach studiert wurde. Welchen Test könnt ihr dazu verwenden? Führt den Test durch! Was ist das Ergebnis? Welchen Test müsste man verwenden, wenn man herausfinden will, ob es signifikante Mittelwertsdifferenzen bezüglich f70gesch(Haben Sie Geschwister?) bzgl. f51aufst gibt?

Literaturempfehlungen CD-Rom: Fröhlich, Romy/Wutz, Gertraud, Rossmann, Raphael(2005): Einführung in die sozialwissenschaftliche Datenanalyse, Ein multimediales Selbstlernprogramm. Wiesbaden: VS Verlag für Sozialwissenschaften/GWV Fachverlage GmbH. Lehrbuch: Janssen, Jürgen/Laatz, Wilfried(2005): Statistische Datenanalyse mit SPSS für Windows. Berlin, Heidelberg: Springer-Verlag. SPSS: Ergebnis-Assistent bei Tabellen (in Englisch) Hilfe-Taste auf den Fenstern (erklärt Vorgang und seine Bedeutung)

Quellen Backhaus, Klaus/Erichson, Bernd/Plinke, Wulff/Weiber, Rolf(2006): Multivariate Analysemethoden. Berlin/Heidelberg: Springer-Verlag. Bellgardt, Egon(2004): Statistik mit SPSS. München: Verlag Franz Vahlen GmbH. Fahrmeir, Ludwig ed.al.(2005): Arbeitsbuch Statistik. Berlin/Heidelberg: Springer-Verlag. Fröhlich, Romy/Wutz, Gertraud, Rossmann, Raphael(2005): Einführung in die sozialwissenschaftliche Datenanalyse, Ein multimediales Selbstlernprogramm. Wiesbaden: VS Verlag für Sozialwissenschaften/GWV Fachverlage GmbH. Kähler, Wolf-Michael(2006): Statistische Datenanalyse. Wiesbaden: Friedr. Vieweg & Sohn Verlag/GWV Fachverlage GmbH. Janssen, Jürgen/Laatz, Wilfried(2003): Statistische Datenanalyse mit SPSS für Windows. Berlin, Heidelberg: Springer-Verlag.