Regression Maria Morozova Lisa Ochsenhofer. Einführung Francis Galton 1886 Größe von Vater und Sohn Regression zum Mittelwert.

Slides:



Advertisements
Ähnliche Präsentationen
Tutorat Statistik II im SS 09 Mediator- & Moderatoranalyse
Advertisements

Tutorat Statistik II im SS 09 Multiple Regression
Statistik-Tutorat SS 2009 Christina
Quantitative Methoden 3
Modellprämissen der linearen Regression
Sind Geraden Ihre Zuordnungsvorschrift: y = m·x + n
Theorie psychometrischer Tests, III
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Regression und Korrelation
Gliederung Vertrauensintervalle Arten von Hypothesen
Gliederung Unterschied zwischen Kriteriums- und Prädiktorvariblen
Methode 1. Konvertierung der Hz-Werte in log-Hz Die Sprecherunterschiede werden reduziert Die Wahrnehmung der Frequenzunterschiede ist eher logarithmisch.
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Mehrfachregressionen
Quantitative Methoden I
2. Univariate Regressionsanalyse 2.1 Das statische Regressionsmodell
K. Desch - Statistik und Datenanalyse SS05
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Tutorat Deskriptive Statistik und Wahrscheinlichkeitstheorie
Tutorat Deskriptive Statistik und Wahrscheinlichkeitstheorie
Tutorat II Multiple Korrelation Mediator- Moderatoranalyse
Studienverlauf im Ausländerstudium
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Mögliche Funktionenklassen
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Rechenregeln für Mittelwert, Varianz und Streuung.
Datenmatrix.
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.
Datentabelle für 2 Merkmale
Prof. Dr. Bernhard Wasmayr VWL 2. Semester
Tutorium
Unser siebentes Tutorium
(Gini-Koeffizient, Lorenz-Kurve)
Eigenschaften der OLS-Schätzer
Einfache Regressionsgleichung
Probleme der Modellspezifikation
Multikollinearität Wann spricht man von Multikollinearität?
Wiederholung: Einfache Regressionsgleichung
20:00.
Semipartialkorrelation Multiple Korrelation Inkrementelle Validität
Logistische Regression
Wir üben die Malsätzchen
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Das Allgemeine Lineare Modell (ALM)
Kriterium und Prädiktor Methode der kleinsten Quadrate
Statistik: Mehr zur Regression.
Kapitel 13 Zeitreihen und Zeitreihen-Modelle
Kapitel 18 Dynamische Modelle: Schätzen der Parameter
Kapitel 14 Trends und Unit-root-Tests
Kapitel 13 Zeitreihen und Zeitreihen-Modelle
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
Bivariate Statistik M. Kresken.
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
Kapitel 14 Trends und Unit-root-Tests
1 STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
Forschungsmethodik II, SS 2010 Vesna Pavlovski & Julia Pichlhöfer
Statistik Typen statistischer Zusammenhänge: Statistik I
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
Folie Einzelauswertung der Gemeindedaten
Statistik – Regression - Korrelation
Die einfache/multiple lineare Regression
setzt Linearität des Zusammenhangs voraus
Die einfache/multiple lineare Regression
Varianzanalyse und Eta²
Außenhandelsbeziehungen zwischen China, USA, EU Makroökonometrie Vorlesung Dr. Oliver Bode.
Die einfache/multiple lineare Regression
 Präsentation transkript:

Regression Maria Morozova Lisa Ochsenhofer

Einführung Francis Galton 1886 Größe von Vater und Sohn Regression zum Mittelwert

Unterschied zu Korrelation Funktionale Zusammenhänge Stochastische (zufallsabhängige) Zusammenhänge

Prädiktorvariable vs. Kriteriumsvariable Einfacher Billiger Zu einem früheren Zeitpunkt messbar

Lineare Regression Regressionsgleichung ŷ=a+b·x ŷ = Kriteriumsvariable x = Prädiktorvariable b = Steigung Regressions- a = Schnittpunkt der Geraden mit y-Achse koeffizienten

Kovarianz ŷ i = vorhergesagter Wert (y i – ŷ i ) = Vorhersagefehler alternativ: b=r·sy/sx a = - b ·

Vorhersage Standardfehler: s yx = s y (1-r ²) · (n-1/n-2) Konfidenzintervall: CI ŷ = ŷ +/- z crit · s yx

Vorhersagegenauigkeit hängt von Stichprobengröße ab hängt von Schwankungen der vorhergesagten y Wert zu den echten y Werten ab Standardschätzfehler ist Gütemaß für die Genauigkeit je kleiner umso genauer je stärker der verwendete x-Wert vom Mittelwert der x-Werte abweicht desto unsicherer

Multiple Regression Vorhersage eines Kriteriums durch mehrere Prädiktoren Multiple Regressionsgleichung Varianzaufklärung der Prädiktoren: Standard Multiple Regression Hierarchische Multiple Regression Statistische Multiple Regression

Nonlineare Regression gelegentlich nichtlineare Beziehung bessere Vorhersage exponentieller Zusammenhang funktionaler Zusammenhang logarithmischer Zusammenhang umgekehrt U-förmige Beziehung (parabolisch) Polynome höherer Ordnung (S-förmig)

Beispiel lineare Regression Frau Knakal, eine Sekretärin in einem Magistratsbüro, erzielt in einem Test zur Erfassung der Rechtschreibkenntnisse 35 Punkte (Prädiktor) und liegt eine STAB unter dem Mittelwert. Im Durchschnitt machen Sekretärinnen in gleichen Positionen 30 Fehler/Monat (Kriterium) mit einer Varianz von 36. Der Rechtschreibtest hat eine Varianz von 49. Gemeinsame aufgeklärte Varianz von Prädiktor und Kriterium ist 72,25%. N=1000

Standardfehler Prädiktor: x=35 Punkte, Varianz s x ²=49 49= 7 ist s x (eine STAB) 35+7 = 42= Kriterium: =30 Fehler, Varianz s y ²=36 36 = 6 ist s y r² = 72,25% 0,7225 = r = 0.85 Standardfehler = s y (1-r ²) · (n-1/n-2) s yx = 6· (1-72,25)· (999/998) s yx = 3,18

Regressionsgerade und CI b= r·sy/sx 0.85·6/7= 0,73 a= -b· 30-0,73·42= -0,66 ŷ= a+b·x -0,66+0,73·35= 24,89 CI ŷ = ŷ+/-z crit ·s yx 1,96 ·3,18 = 6,23 24,89+6,23= 31,12 31 Fehler 24,89-6,23= 18,66 19 Fehler

Wie viele Fehler wird Frau Knakal nächsten Monat machen? Frau Knakal wird mit einer Wahrscheinlichkeit von 95% im nächsten Monat zwischen 19 und 31 Tippfehler bei der Arbeit machen!

Noch Fragen?!?

Danke an die, die aufgepasst haben!