Die einfache/multiple lineare Regression

Slides:



Advertisements
Ähnliche Präsentationen
Tutorat Statistik II im SS 09 Mediator- & Moderatoranalyse
Advertisements

Tutorat Statistik II im SS 09 Multiple Regression
Korrektur Tutoratsaufgaben V
Quantitative Methoden 3
Induktive Statistik: Regressionsanalyse
Thema der Stunde I. Einführung in die Varianzanalyse:
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Regression und Korrelation
Einfaktorielle Varianzanalyse
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Das Allgemeine lineare Modell (ALM) - Varianz als Schlüsselkonzept
Mehrfachregressionen
Quantitative Methoden I
Hypothesen testen: Grundidee
2. Univariate Regressionsanalyse 2.1 Das statische Regressionsmodell
Willkommen zum Plenum.
Mehrdeutigkeit eines positiven Effekts bei Querschnittsdaten
Effektgrößen, Kontraste & Post-hoc-Tests
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Tutorat Deskriptive Statistik und Wahrscheinlichkeitstheorie
Tutorat II Multiple Korrelation Mediator- Moderatoranalyse
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.
Tutorium
Tutorium
Tutorium
Tutorium
Unser zehntes Tutorium Materialien unter:
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
Einfache Regressionsgleichung
Wiederholung: Einfache Regressionsgleichung
Varianzanalyse IV: Messwiederholung
Chi Quadrat Test Tamara Katschnig.
Seminar: Datenerhebung
Logistische Regression
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Das Allgemeine Lineare Modell (ALM)
Seminar: Datenerhebung
Seminar: Datenerhebung
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Statistik: Mehr zur Regression.
SStotal SStotal SStreat SSerror SStreat SSerror Biomasse (g) wenig
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
1 STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Regression Maria Morozova Lisa Ochsenhofer. Einführung Francis Galton 1886 Größe von Vater und Sohn Regression zum Mittelwert.
Die einfache/multiple lineare Regression
STATISIK LV Nr.: 1852 WS 2005/ Jänner 2006.
setzt Linearität des Zusammenhangs voraus
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Die einfache/multiple lineare Regression
Varianzanalyse und Eta²
Verteilungen, Varianz Tamara Katschnig.
Phi-Koeffizient: Alternative Berechnungsart
Grafische Darstellung von Gruppenunterschieden.
Jennifer Staubmann 5 AK 2012/2013 Regressionsanalyse.
Die Varianzanalyse Jonathan Harrington library(ggplot2) library(ez)
Einige Kriterien für die Durchführung einer Varianzanalyse
Die Varianzanalyse II Jonathan Harrington library(ggplot2) library(ez)
Ökonometrie und Statistik Mehrfachregression
12 Das lineare Regressionsmodell
Statistik IV Statistik III
Die Varianzanalyse II Jonathan Harrington library(ggplot2)
Die Varianzanalyse Jonathan Harrington library(lattice) library(ez)
Kovarianz, Korrelation, (lineare) Regression
Kovarianz, Korrelation, (lineare) Regression
ANOVA für unabhängige Daten.
Ökonometrie und Statistik Logistische Regression
Johann D. Müller, Merlin Dwenger , Mats Böttrich
Korrelation & Skalentransformation
Fortgeschrittene statistische Methoden SS2020
 Präsentation transkript:

Die einfache/multiple lineare Regression

Ziel Funktionaler Zusammenhang zwischen einer oder mehreren unabhängigen Variablen (UV, X) und der abhängigen Variablen (AV, Y) Ermitteln von bestimmten Prädiktoren (X) der abhängigen Variable Y Werte prognostizieren bzw. vorhersagen Untersuchung von Unterschiedshypothesen intervallskalierter, stetiger Variablen.

Streudiagramm - Regressionsgerade Residuum byx (=Beta, =Steigung) ayx, Konstante

Differenz von AVgeschätzt und AVwahr Begriffe Residuen: sind Schätzfehler. Differenz von AVgeschätzt und AVwahr Regressionsgleichung: (wichtig für Wertschätzung!): Y = β0(Konst) + β1X1+ β2X2+….. mit: β…Regressionskoeffizient (wird geschätzt) Xn…Wert des Prädiktors Xn (ist gegeben)

(korrigiertes) R-Quadrat (=Bestimmtheitsmaß) Modellprüfung „wie gut ist die Regression“ „wie sinnvoll ist es, die Regression anzuwenden“ Zusammenhang zwischen UV(s) und AV Anteil der erklärten Varianz von Y durch die Prädiktoren (X)

F-Wert wird ebenfalls zur Modellprüfung herangezogen H0: alle Regressionskoeffizienten sind Null; sie sind nicht sinnvolle Prädiktoren H1: mindestens ein Koeffizient  ist ungleich 0; min. ein Prädiktor beschreibt die AV gut

Regressionskoeffizient (Beta) Konstante (=Intercept, ayx ): Höhenlage der Regressionsgeraden Abstand auf der Y-Achse vom Ursprung Regressionskoeffizienten (ßi) der Prädiktoren (Xi)

Beispiel 1 – Interpretation Regressionsberechung: X: Gewicht -> Y: Körpergröße R=0.634 R2korr=0.401 Konstante= 136,867 Beta (Gewicht)= 0.574

Bedeutung: Konstante (ayx): 136,867 (hier: Gewicht auf Größe) Im Ursprung des Diagramms dh. bei 0kg ist die geschätzte Größe 136,9cm (hier nicht sinnvoll, besser bei zB: Lernaufwand und Punkteanzahl) Regressionskoeffizient Beta: 0.574 „Ändert sich das Gewicht (X) um eine Einheit (also 1 kg) so ändert sich die Größe (Y) um 0.574 Einheiten (also 0.574cm) pro 1kg -> 5.7mm größer -> positiver signifikanter (p=0.03) Zusammenhang bzw. signifikanter Unterschied

Beispiel 2 multiple lineare Regression inkl. Wertschätzung Regressionsberechung: X1: Gewicht X2: Schuhgröße -> Y: Körpergröße -> 2 Prädiktoren (UVs) auf eine AV

Beispiel 2 - Wertschätzung

Streudiagramme

Körpergröße = Konstante + beta1*Gewicht + Schätzung einer neuen Person: Bekannt: Gewicht 80kg, Schuhgröße 45 Gesucht: Körpergröße -> Formel: Y = β0(Konst.) + β1X1+ β2X2 Körpergröße = Konstante + beta1*Gewicht + beta2*Schuhgröße Körpergröße = 66.05 + 0.123*80 + 2.443*45 = 185.8 cm

Varianzanalyse Eine AV (quantitativ) Ein oder mehrere Faktoren (UVs) (qualitativ oder quantitativ in Klassen) Testung von Unterschiedshypothesen auf Basis von Varianzvergleichen (mQT, mQZ, mQI, F = mQZ/mQI Verschiedene Hypothesen (Anzahl?)

Varianzanalyse Achtung auf genügend Versuchspersonen pro Zelle! (Faktorkombination (mind. 10)) -> Dies wird mit steigender Anzahl der UVs (Faktoren) immer schwieriger Post Hoc Tests: z.B. Scheffé-Test (SPSS) Alpha Kumulierung: p(k≥1 falsche H1) = 1-(1-α)m Alpha Adjustierung: α´= 1-(1- α)1/m Bonferoni Korrektur: α´= α/m α´…Alpha pro Einzeltest, m…Anzahl der Einzeltests

Rechenbeispiel: Der Einfluss von Geschlecht und Alter auf Punkte in einem Leistungstest Faktor 1: Gender Faktor 2: Alter (Ist stetig daher Klassen bilden!) 3Klassen: -19 20-22 23-

Kontrolle der Verteilung der VPN auf die Faktorkombinationen Min. 10 VPN pro Zelle

Ergebnisse: Deskriptive Statistik

Ergebnisse: Sum of Squares (mQI, mQT, mQR, mQZ)

Ergebnisse: Post Hoc nach Scheffé Post Hoc für Altersklassen (keine sign. Unterschiede) )

Ergebnisse: signifikante Wechselwirkungen Grafik der WW