Tutorat II Multiple Korrelation Mediator- Moderatoranalyse

Slides:



Advertisements
Ähnliche Präsentationen
T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.
Advertisements

Tutorat Statistik II im SS 09 Mediator- & Moderatoranalyse
Tutorat Statistik II im SS 09 Multiple Regression
Statistik-Tutorat SS 2009 Christina
Korrektur Tutoratsaufgaben V
Was ist Testtheorie?.
Berechnung des Korrelationskoeffizienten Vorbemerkung. Der Korrelationskoeffizient ist im Grunde ein Bruch aus 3 unvollständig berechneten statistischen.
Induktive Statistik: Regressionsanalyse
Theorie psychometrischer Tests, III
Forschungsstrategien Johannes Gutenberg Universität Mainz
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Regression und Korrelation
Gliederung Vertrauensintervalle Arten von Hypothesen
Gliederung Unterschied zwischen Kriteriums- und Prädiktorvariblen
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Der Produkt-Moment- Korrelationskoeffizient Der Produkt-Moment Korrelationskoeffizient gibt Stärke und Richtung des linearen Zusammenhanges zweier Variablen.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Das Allgemeine lineare Modell (ALM) - Varianz als Schlüsselkonzept
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Der Zusammenhang metrischer Merkmale
Mehrfachregressionen
Quantitative Methoden I
Hypothesen testen: Grundidee
2. Univariate Regressionsanalyse 2.1 Das statische Regressionsmodell
Effektgrößen, Kontraste & Post-hoc-Tests
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Fragen Was wird mit der Alphafehler-Kumulierung bzw. –inflation bezeichnet? Wie hoch ist die Wahrscheinlichkeit bei einer Untersuchung mit 4 Gruppen einen.
Tutorat Deskriptive Statistik und Wahrscheinlichkeitstheorie
Tutorat Deskriptive Statistik und Wahrscheinlichkeitstheorie
Strukturgleichungsmodelle
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,
Statistische Methoden II SS 2003
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.
Tutorium
Tutorium
Tutorium
Tutorium Aufgabe 1 a) E(eIX)= 0 E(eIX)= E(Y-E(YIX)IX) = E(YIX)- E (E(YIX)IX) = E(YIX)- E(YIX) = 0 Im Mittel macht man mit seiner Schätzung keinen.
Unser siebentes Tutorium
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
Probleme der Modellspezifikation
Multikollinearität Wann spricht man von Multikollinearität?
Wiederholung: Einfache Regressionsgleichung
Semipartialkorrelation Multiple Korrelation Inkrementelle Validität
Regressionskoeffizienten Der F-Test
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Kovarianzanalyse Störvariablen Veranschaulichung der Kovarianzanalyse
Das Allgemeine Lineare Modell (ALM)
Kriterium und Prädiktor Methode der kleinsten Quadrate
Statistik: Mehr zur Regression.
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Regression und Kollokation
1 STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Lernprogramm : „Quadratische Funktionen“ von W. Liebisch
Regression Maria Morozova Lisa Ochsenhofer. Einführung Francis Galton 1886 Größe von Vater und Sohn Regression zum Mittelwert.
Forschungsmethodik II, SS 2010 Vesna Pavlovski & Julia Pichlhöfer
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
Bioinformatik Vorlesung
Statistik – Regression - Korrelation
Die einfache/multiple lineare Regression
setzt Linearität des Zusammenhangs voraus
Die einfache/multiple lineare Regression
Statistiken je nach Messniveau
Testtheorie (Vorlesung 13: ) Wiederholung: Richtigstellung
Die einfache/multiple lineare Regression
Fortgeschrittene statistische Methoden SS2020
 Präsentation transkript:

Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009

Offene Fragen Welches Diagramm entspricht am besten folgender Korrelationstabelle? y x1 x2 1 0,25 0,64 0,04

Multiple Regression Inhalt: Multiple Regression Strukturgleichung Regressionskoeffizienten Quadratsummen und F-Test Determinationskoeffizient Multiple Korrelation und multiple Regression Schrumpfungskorrektur Capitalization of Chance Selektion der Prädiktoren Einschluss Schrittweise Multiple Regression - 3

Multiple Regression - Kriterium hängt mehr als einem Prädiktor ab Zusammenhänge mit vielen Variablen Beispiel: Erfolg in Statistik II hängt ab von… - Mathematischen Fähigkeiten Anzahl der Vorlesungs- und Tutoratsbesuche Anzahl der Arbeitsstunden zu Hause - Motivation / Interesse IQ … Multiple Regression - 4

Strukturgleichungen Bivariate Regression Multivariate Regression Erweiterung der einfachen linearen Regression  mehrere Prädiktorvariablen Bestimmung über die Methode der kleinsten Quadrate Multiple Regression - 5

Ziel der Regressionsanalyse Bestimmung der Parameter der Regressionsgleichung: b1, b2, b3, a Interpretation der b-Gewichte: Das Vorzeichen gibt die Richtung des Effekts an. Der Betrag gibt an, wie stark ein Prädiktor gewichtet wird. Aber: Das Gewicht häng von der Skalierung (dem Wertebereich) von x und y ab. Einfacher zu interpretieren sind die standardisierten Gewichte (β).

Signifikanztests der multiplen Regression (1) Wird ein statistisch bedeutsamer Anteil der Varianz des Kriteriums durch alle Prädiktoren gemeinsam aufgeklärt? F-Test (2) Leisten die einzelnen Prädiktoren einen bedeutsamen Beitrag? t-Tests für alle Prädiktoren

Standardisierte Regressionsgewichte (β – Gewichte) Die Regressionsgerade kann auch in einer standardisierten Form beschrieben werden: unstandardisiert: standardisiert: Die additive Konstante (a) entfällt, da die zy einen Mittelwert von Null hat. Vorteil: Die Beta-Gewichte nehmen nur Werte zwischen -1 und +1 an. Sie können wie Korrelationskoeffizienten interpretiert werden. Multiple Regression - 8

Signifikanztest der multiplen Regression und Korrelation Multiple Regression - 9

Signifikanztest der multiplen Regression und Korrelation F soll aus R² berechnet werden! Gesucht: Bekannt: Multiple Regression - 10

Signifikanztest - Beispiel Y X1 X2 1.0 .45 .60 .30 Es besteht ein bedeut-samer Zusammenhang zwischen dem Kriterium und den Prädiktoren Zähler- Freiheitsgrade Nenner- Freiheitsgrade Multiple Regression - 11

Übung I: Eine multiple Korrelation mit 4 Prädiktoren und 47 Probanden ergibt einen Wert von r = 0.40. Ist der Zusammenhang statistisch bedeutsam? Begründet eure Antwort. R²= 0.16 Femp = 2; F(4/42)=2.61 => n.s Weil Fkrit> Femp …

Übung II Berechnet den emp. F-Wert Modell Quadrat summe df Mittel der Quadrate F Signifikanz 1Regression Residuen ges 30.198 7.661 37.859 15 46 61 2.013 .167 .000 Berechnet den emp. F-Wert Ist das Ergebnis statistisch bedeutsam? Wie viele Prädiktoren wurden verwendet? Wie viele Probanden nahmen an der Untersuchung teil?

Korrigiertes R² R überschätzt Populationszusammenhang! Die Vorhersage in einer Stichprobe überschätzt Vorhersage in anderen Stichproben bzw. in der Population Je kleiner die Stichprobe und je größer die Anzahl der Prädiktoren  desto größer die Überschätzung von R² Multiple Regression - 14

Korrigiertes R² Schrumpfungskorrektur nach Olkin & Pratt: Beispiel: k=3; N=20; R² = .50 Multiple Regression - 15

Multiple Regression - Vorgehen Problem: welche und wie viele Prädiktoren sollen für die Vorhersage ausgewählt werden? => immer ein „sparsames“ Vorgegehen wählen, weil eine große Prädiktormenge eine Überschätzung von R² fördert. Mögliche Strategien: 1. Hypothesengeleites Vorgehen: Einschluss 2. Hierarchische Regressionsanalysen Vorwärts-Selektion Rückwärts-Eliminieren Schrittweise Vorgehen Multiple Regression - 16

Multiple Regression - Vorgehen Einschluss A priori Auswahl der aufzunehmenden Prädiktoren (aufgrund von Vorwissen oder Theorie) Vorteile: Hypothesengeleitetes Vorgehen Keine Capitalization of Chance Nachteile: Möglicherweise Aufnahme von mehr Prädiktoren als unbedingt erforderlich (Prädiktoren, die keinen signifikanten Beitrag leisten) Dies kann zu einer Verringerung des F-Wertes führen (wegen der größeren Anzahl der Zähler-Freiheitsgrade), und damit die Teststärke verringern. Möglicherweise werden wichtige Prädiktoren „übersehen“ bzw. „vergessen“ Multiple Regression - 17

Multiple Regression - Vorgehen Hierarchische Regressionsanalysen Post hoc werden die am besten passenden Prädiktoren emp. bestimmt Vorteile: Minimum an Prädiktoren Exploratives Vorgehen möglich. Nachteile: Capitalization of Chance wg. Bevorzugung hoch korrelierender Prädiktoren Kein hypothesengeleitetes Vorgehen Multiple Regression - 18

Vorwärts-Selektion Aus einer Menge möglicher Prädiktoren wird der Prädiktor mit der höchsten Validität zuerst aufgenommen. Unter den verbleibenden Prädiktoren wird immer derjenige ausgewählt, der den größten Teil der verbleibenden Varianz aufklärt (=höchste inkrementelle Validität). Wenn kein Prädiktor die aufgeklärte Varianz signifikant erhöht,ist die endgültige Auswahl gefunden.

Rückwärts-Eliminierung Zunächst werden alle Prädiktoren eingeschlossen Dann wird immer der Prädiktor weglassen, der am wenigsten zur Vorhersage beiträgt Wenn der Ausschluss eines Prädiktors zu einer signifikanten Reduktion der aufgeklärten Varianz führen würde, wird der Selektionsprozess abgebrochen

Multiple Regression - Vorgehen Schrittweise Selektion: Es wird abwechseln ein Vorwärts- und ein Rückwärtsschritt durchgeführt. Dadurch werden Variablen, die im Kontext neu aufgenommener Prädiktoren keine Varianz mehr aufklären, im Nachhinein wieder entfernt. Diese Schritte werden so lange wiederholt, bis eine optimale Vorhersage gefunden ist. Multiple Regression - 21

Weitere Regressionsanalysen Mediatoranalyse: Wird der Zusammenhang von X und Y durch M vermittelt? Moderatoranalyse: Wird der Zusammenhang von X und Y durch M beeinflusst?

Mediatoranalyse Annahme zur Kausalität kann gemacht werden (wirkt etwas direkt oder indirekt) man untersucht, wie etwas wirkt Schaubild an Tafel

Mediatoranalyse Vorgehen 1. Schritt: Regression von Y auf X. (Regression der Note auf die Motivation) Y = b X + a Nur wenn sich ein signifikanter Zusammenhang zwischen Y und X zeigt (b ≠ 0), kann eine Mediation vorliegen. 2. Schritt: Regression von M auf X.(Regression der Lerndauer auf die Motivation) M = b X + a b ≠ 0, sonst keine Mediation 3. Schritt: Regression von Y auf M.(Regression der Note auf die Lerndauer) Y = b M + a 4. Schritt: Regression von Y auf X und M.(Regression der Note auf die Lerndauer und die Motivation) Y = b1X + b2 M + a

Ergebnis Mediatoranalyse = 0: „Vollständige Mediation“ | |> 0, aber kleiner als in Schritt 1: „partielle Mediation“ gleich wie in Schritt 1: Keine Mediation Man unterscheidet einen partiellen Mediator-Effekt von einem vollständigem Mediator-Effekt Ein partieller Mediator-Effekt liegt dann vor, wenn Z von X und zugleich Y von Z beeinflusst wird, aber X zudem auch einen direkten Effekt auf Y ausübt Ein totaler Mediator-Effekt liegt hingegen vor, wenn der Effekt von X auf Y komplett durch Z interveniert wird und kein direkter Effekt mehr zwischen X und Y besteht (komplette Effekt der M auf die Note wird über Lerndauer vermittelt)

Moderatoranalyse Merkmalausprägung in der Moderatorvariablen bestimmt die Stärke der Prädiktion bei der Vorhersage der Variablen Y durch eine Variable X Unterschied zur Mediatoranalyse Moderator wirkt auf b-Gewichte der Regression, nicht auf aV, oder wird auch nicht von uV beeinflusst Bsp.: Zusammenhang von verbaler Intelligenz (x) und Gedächtnisleistung (y) hängt vom Alter (z) ab (Abbildung anfertigen)

Moderatoranalyse- Vorgehen Schritt: z-Transformation von X und M Schritt: Berechnung eines neuen Prädiktors: P = z(X) ∙ z(M). 3. Schritt: Berechnung einer Regression von Y auf z(X), z(Y) und P Interpretation des Regressionsgewichts von P: b> 0 (sig): Je größer M, desto höher (positiver) die Steigung der ursprünglichen Regressionsgeraden b< 0 (sig) : Je größer M, desto geringer (negativer) die Steigung der ursprünglichen Regressionsgeraden b≈0 (n.s.): Keine Moderation des Zusammenhangs von X und Y durch M.

Übungen: Modell Quadrat summe df Mittel der Quadrate F Signifikanz 1Regression Residuen ges 24.115 ??? 38.389 3 64 8.038 .000

Lösung: Modell Quadrat summe df Mittel der Quadrate F Signifikanz 1Regression Residuen ges 24.115 14.274 38.389 3 61 64 8.038 0.234 34.350 .000