Die einfache/multiple lineare Regression

Slides:



Advertisements
Ähnliche Präsentationen
Tutorat Statistik II im SS 09 Mediator- & Moderatoranalyse
Advertisements

Tutorat Statistik II im SS 09 Multiple Regression
Statistik-Tutorat SS 2009 Christina
Korrektur Tutoratsaufgaben V
Quantitative Methoden 3
Induktive Statistik: Regressionsanalyse
Thema der Stunde I. Einführung in die Varianzanalyse:
Regression und Korrelation
Einfaktorielle Varianzanalyse
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Das Allgemeine lineare Modell (ALM) - Varianz als Schlüsselkonzept
Der Zusammenhang metrischer Merkmale
Mehrfachregressionen
Quantitative Methoden I
Quantitative Methoden I
Hypothesen testen: Grundidee
2. Univariate Regressionsanalyse 2.1 Das statische Regressionsmodell
Willkommen zum Plenum.
Mehrdeutigkeit eines positiven Effekts bei Querschnittsdaten
Effektgrößen, Kontraste & Post-hoc-Tests
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Fragen Was wird mit der Alphafehler-Kumulierung bzw. –inflation bezeichnet? Wie hoch ist die Wahrscheinlichkeit bei einer Untersuchung mit 4 Gruppen einen.
Tutorat Deskriptive Statistik und Wahrscheinlichkeitstheorie
Tutorat Deskriptive Statistik und Wahrscheinlichkeitstheorie
Tutorat II Multiple Korrelation Mediator- Moderatoranalyse
Tutorium
Tutorium
Tutorium
Tutorium
Tutorium
Unser neuntes Tutorium
Unser siebentes Tutorium
Unser zehntes Tutorium Materialien unter:
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
Unser sechstes Tutorium Materialien unter:
Analyse kategorialer Variablen
Vorlesung: ANOVA I
Einfache Regressionsgleichung
Multikollinearität Wann spricht man von Multikollinearität?
Wiederholung: Einfache Regressionsgleichung
Varianzanalyse IV: Messwiederholung
Seminar: Datenerhebung
Logistische Regression
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Kovarianzanalyse Störvariablen Veranschaulichung der Kovarianzanalyse
Das Allgemeine Lineare Modell (ALM)
Seminar: Datenerhebung
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Statistik: Mehr zur Regression.
SStotal SStotal SStreat SSerror SStreat SSerror Biomasse (g) wenig
Einfache und multiple Regression
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Regression und Kollokation
Multivariate Statistische Verfahren
1 STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Regression Maria Morozova Lisa Ochsenhofer. Einführung Francis Galton 1886 Größe von Vater und Sohn Regression zum Mittelwert.
Die einfache/multiple lineare Regression
STATISIK LV Nr.: 1852 WS 2005/ Jänner 2006.
setzt Linearität des Zusammenhangs voraus
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Varianzanalyse und Eta²
Phi-Koeffizient: Alternative Berechnungsart
Geostatistik Kriging Sarah Böckmann.
Statistiken je nach Messniveau
1)Inwieweit können die Werte in Y auf der Basis zweier unabhängiger Variablen X1 und x2 „erklärt“ werden? 2)Kann auf der Basis der vorliegenden Stichprobenergebnisse.
Die einfache/multiple lineare Regression
Die Varianzanalyse Jonathan Harrington library(lattice) library(ez)
 Präsentation transkript:

Die einfache/multiple lineare Regression

Ziel Funktionaler Zusammenhang zwischen einer oder mehreren unabhängigen Variablen (UV, X) und der abhängigen Variablen (AV, Y) Ermitteln von bestimmten Prädiktoren (X) der abhängigen Variable Y Werte prognostizieren bzw. vorhersagen Untersuchung von Unterschiedshypothesen intervallskalierter, stetiger Variablen.

Streudiagramm - Regressionsgerade Residuum byx (=Beta, =Steigung) ayx, Konstante

Differenz von AVgeschätzt und AVwahr Begriffe Residuen: sind Schätzfehler. Differenz von AVgeschätzt und AVwahr Regressionsgleichung: (wichtig für Wertschätzung!): Y = β0(Konst) + β1X1+ β2X2+….. mit: β…Regressionskoeffizient (wird geschätzt) Xn…Wert des Prädiktors Xn (ist gegeben)

(korrigiertes) R-Quadrat (=Bestimmtheitsmaß) Modellprüfung „wie gut ist die Regression“ „wie sinnvoll ist es, die Regression anzuwenden“ Zusammenhang zwischen UV(s) und AV Anteil der erklärten Varianz von Y durch die Prädiktoren (X)

F-Wert wird ebenfalls zur Modellprüfung herangezogen H0: alle Regressionskoeffizienten sind Null; sie sind nicht sinnvolle Prädiktoren H1: mindestens ein Koeffizient  ist ungleich 0; min. ein Prädiktor beschreibt die AV gut

Regressionskoeffizient (Beta) Konstante (=Intercept, ayx ): Höhenlage der Regressionsgeraden Abstand auf der Y-Achse vom Ursprung Regressionskoeffizienten (ßi) der Prädiktoren (Xi)

Beispiel 1 – Interpretation Regressionsberechung: X: Gewicht -> Y: Körpergröße R=0.634 R2korr=0.401 Konstante= 136,867 Beta (Gewicht)= 0.574

Bedeutung: Konstante (ayx): 136,867 (hier: Gewicht auf Größe) Im Ursprung des Diagramms dh. bei 0kg ist die geschätzte Größe 136,9cm (hier nicht sinnvoll, besser bei zB: Lernaufwand und Punkteanzahl) Regressionskoeffizient Beta: 0.574 „Ändert sich das Gewicht (X) um eine Einheit (also 1 kg) so ändert sich die Größe (Y) um 0.574 Einheiten (also 0.574cm) pro 1kg -> 5.7mm größer -> positiver signifikanter (p=0.03) Zusammenhang bzw. signifikanter Unterschied

Beispiel 2 multiple lineare Regression inkl. Wertschätzung Regressionsberechung: X1: Gewicht X2: Schuhgröße -> Y: Körpergröße -> 2 Prädiktoren (UVs) auf eine AV

Beispiel 2 - Wertschätzung

Streudiagramme

Körpergröße = Konstante + beta1*Gewicht + Schätzung einer neuen Person: Bekannt: Gewicht 80kg, Schuhgröße 45 Gesucht: Körpergröße -> Formel: Y = β0(Konst.) + β1X1+ β2X2 Körpergröße = Konstante + beta1*Gewicht + beta2*Schuhgröße Körpergröße = 66.05 + 0.123*80 + 2.443*45 = 185.8 cm

Varianzanalyse Eine AV (quantitativ) Ein oder mehrere Faktoren (UVs) (qualitativ oder quantitativ in Klassen) Testung von Unterschiedshypothesen auf Basis von Varianzvergleichen (mQT, mQZ, mQI, F = mQZ/mQI Verschiedene Hypothesen (Anzahl?)

Varianzanalyse Achtung auf genügend Versuchspersonen pro Zelle! (Faktorkombination (mind. 10)) -> Dies wird mit steigender Anzahl der UVs (Faktoren) immer schwieriger Post Hoc Tests: z.B. Scheffé-Test (SPSS) Alpha Kumulierung: p(k≥1 falsche H1) = 1-(1-α)m Alpha Adjustierung: α´= 1-(1- α)1/m Bonferoni Korrektur: α´= α/m α´…Alpha pro Einzeltest, m…Anzahl der Einzeltests

Rechenbeispiel: Der Einfluss von Geschlecht und Alter auf Punkte in einem Leistungstest Faktor 1: Gender Faktor 2: Alter (Ist stetig daher Klassen bilden!) 3Klassen: -19 20-22 23-

Kontrolle der Verteilung der VPN auf die Faktorkombinationen Min. 10 VPN pro Zelle

Ergebnisse: Deskriptive Statistik

Ergebnisse: Sum of Squares (mQI, mQT, mQR, mQZ)

Ergebnisse: Post Hoc nach Scheffé Post Hoc für Altersklassen (keine sign. Unterschiede) )

Ergebnisse: signifikante Wechselwirkungen Grafik der WW