Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

4. Sitzung Alexander Spermann Universität Freiburg 1 Wiederholung: Einfache Regressionsgleichung Interpretation des ß-Koeffizienten: (Da semilog. Spezifizierung)

Ähnliche Präsentationen


Präsentation zum Thema: "4. Sitzung Alexander Spermann Universität Freiburg 1 Wiederholung: Einfache Regressionsgleichung Interpretation des ß-Koeffizienten: (Da semilog. Spezifizierung)"—  Präsentation transkript:

1 4. Sitzung Alexander Spermann Universität Freiburg 1 Wiederholung: Einfache Regressionsgleichung Interpretation des ß-Koeffizienten: (Da semilog. Spezifizierung) Verlängert sich die Schuldauer um 1 Jahr, steigt der Lohn um 7,6%

2 4. Sitzung Alexander Spermann Universität Freiburg 2 1. Schritt: Interpretation des Regressionskoeffizienten (s.o.) 2. Schritt: Ist der Koeffizient signifikant? Blick auf den t-Test Daumenregel: Betrag des t-Werts größer als 2 entspricht signifikantem Ergebnis 3. Schritt: Wie sieht das Bestimmtheitmaß R 2 aus? Analyseschritte bei der Interpretation von Einfachregressionen

3 4. Sitzung Alexander Spermann Universität Freiburg 3 2a. t-Test a) Schuljahre: b) const. c: 2b. p-Wert (implizites Signifikanzniveau) = Type-I-Error a) hoch signifikant b) 0,000 hoch signifikant Ausführliche Analyse der Regressionsgleichung

4 4. Sitzung Alexander Spermann Universität Freiburg 4 Beispiel für multiple (multivariate) Regression Aufnahme der Variable Berufserfahrung in die Lohngleichung aus der 2. Sitzung: y =log(Lohn), x 1 = Schuljahre, x 2 = Berufserfahrung in Jahren y = + ß 1 ·x 1 + ß 2 ·x 2 + u Multiple Regressionsanalysen

5 4. Sitzung Alexander Spermann Universität Freiburg 5 Multiple Regressionsanalysen

6 4. Sitzung Alexander Spermann Universität Freiburg 6 Gegeben ist ein Regressionsmodell mit k erklärenden Variablen: y = + ß 1 ·x 1 + ß 2 ·x 2 + …+ ß k ·x k +u y = + ß 1 ·x 1 + ß 2 ·x 2 + …+ ß k ·x k + ß k+1 ·x k+1 +u Modell k+1: Frage:Ist das Bestimmtheitsmaß R 2 als Gütekriterium geeignet, um die Erklärungskraft beider Modelle zu vergleichen? Antwort: Nein, denn das Bestimmtheitsmaß kann per constructionem durch Hinzufügen weiterer erklärender Variablen nie sinken, auch wenn diese nicht zur Erklärungskraft des Modells beitragen. Vergleich: R k 2 = versus R k+1 2 = Korrigiertes R 2

7 4. Sitzung Alexander Spermann Universität Freiburg 7 Korrigiertes Bestimmtheitsmaß bestraft weitere Aufnahme erklärender Variablen: Erinnerung: Je größer K (Anzahl erklärender Variablen), desto kleiner ist das korrigierte Bestimmtheitsmaß! Beispiel: Daher korr. Bestimmtheitsmaß relevantes Gütekriterium !! Korrigiertes R 2

8 4. Sitzung Alexander Spermann Universität Freiburg 8 Gegeben ist ein Regressionsmodell mit k Variablen: y = + ß 1 ·x 1 + ß 2 ·x 2 + …+ ß k ·x k +u Die Nullhypothese H 0 lautet: H 0 : ß 1 = ß 2 =…= ß k =0 Aussage: Sind alle Regressionskoeffizienten (außer ) simultan gleich Null? (Gesamtsignifikanztest des Modells) Alternativhypothese H 1 : Nicht alle Regressionskoeffizienten sind gleichzeitig null. Der F-Test

9 4. Sitzung Alexander Spermann Universität Freiburg 9 Teststatistik ist H 0 wird abgelehnt, wenn F>F 1- (k, n-k-1), wobei das Signifikanzniveau darstellt. Intuition: Je größer der F-Wert, desto größer ist der Anteil der durch das Modell erklärten Varianz im Verhältnis zur Varianz der Residuen. Der F-Test

10 4. Sitzung Alexander Spermann Universität Freiburg 10 Unser Beispiel: F= F crit : F 0,99 =4,61 siehe Tabelle zum F-Test, = 0,01) Da F >F crit, wird die Nullhypothese H 0 abgelehnt. Interpretation: Wenn Nullypothese wahr ist (also das Modell tatsächlich keine Erklärungskraft besitzt), dann wird nur mit 1-prozentiger Wahrscheinlichkeit fälschlicherweise geschlossen, dass es doch Erklärungskraft besitzt. Der F-Test

11 4. Sitzung Alexander Spermann Universität Freiburg 11 Wichtige Beziehung zwischen R² und F Bei einer Normalverteilung des Störterms u und bei H 0 : ß 1 = ß 2 =…= ß k =0 ist F-verteilt mit k und (n-k-1) Freiheitsgraden. Dies kann auch so geschrieben werden: wobei R²=ESS/TSS Diese zwei Statistiken sind also miteinander verknüpft: Wenn R²=0, dann F=0. Je größer R², desto höher der F-Wert Bei R²=1, F Unser Bsp.:

12 4. Sitzung Alexander Spermann Universität Freiburg 12 y = + ß 1 ·x 1 + ß 2 ·x 2 + u y = Lohn, x 1 = Schuljahre, x 2 = Berufserfahrung in Jahren Ergebnis der Interpretation des Outputs: ß 1 und ß 2 sind signifikant von Null verschieden F-Test signifikant Korrigiertes gegenüber Regression aus Sitzung 2 gestiegen Multiple Regressionsanalysen

13 4. Sitzung Alexander Spermann Universität Freiburg 13 y = + ß 1 ·x 1 + ß 2 ·x 2 + u y = log(Lohn), x 1 = Schuljahre, x 2 = Berufserfahrung in Jahren Wie werden Koeffizienten ß 1 und ß 2 interpretiert? und ß 1 gibt an, um wie viele Einheiten sich y verändert, wenn sich x 1 um eine Einheit verändert und x 2 konstant gehalten wird (=Ertragsrate eines zusätzlichen Schuljahres bei sonst gleicher Berufserfahrung). ß 2 gibt an, um wie viele Einheiten sich y verändert, wenn sich x 2 um eine Einheit verändert und x 1 konstant gehalten wird (= Ertragsrate eines weiteren Jahres Berufserfahrung bei gleichen Schuljahren). Multiple Regressionsanalysen

14 4. Sitzung Alexander Spermann Universität Freiburg 14 Bislang: Einfluss der Berufserfahrung auf Lohnsatz linear, denn: mit y = + ß 1 ·x 1 + ß 2 ·x 2 + u ist also konstant (und pos.) Hypothese: Einfluss der Berufserfahrung auf Lohn nimmt mit zunehmender Berufserfahrung ab und wird unter Umständen negativ. Warum? In jungen Jahren wird mehr Humankapital gebildet (je älter man wird, desto schwieriger wird die Bildung von Humankapital, außerdem ist in jungen Jahren das Gehalt noch niedrig und somit die Opportunitätskosten gering!) Außerdem entwertet sich mit zunehmendem Alter das in jungen Jahren gebildete Humankapital. Multiple Regressionsanalysen

15 4. Sitzung Alexander Spermann Universität Freiburg 15 Hypothese: nicht-lineare Beziehung zwischen Berufserfahrung x 2 und Lohn y y = Lohn x 2 = Berufserfahrung Multiple Regressionsanalysen

16 4. Sitzung Alexander Spermann Universität Freiburg 16 Wie kann diese Hypothese getestet werden? y = + ß 1 ·x 1 + ß 2 ·x 2 + ß 3 ·x u Dann ist der Einfluss von x 2 auf y : d.h. durch Aufnahme des quadratischen Terms x 2 2 hängt der Einfluss von x 2 auf y vom Niveau von x 2 ab! Wir vermuten, dass der Koeffizient ß 3 negativ ist, d.h. je größer x 2, desto kleiner der Effekt auf y, d.h. desto kleiner ist der Zuwachs von y, wenn x 2 sich um eine Einheit verändert. Multiple Regressionsanalysen

17 4. Sitzung Alexander Spermann Universität Freiburg 17 Multiple Regressionsanalysen

18 4. Sitzung Alexander Spermann Universität Freiburg 18 Ergebnis der Interpretation des Outputs : ß 1, ß 2 sowie ß 3 sind signifikant von Null verschieden d.h. Hypothese eines nicht-linearen Verlaufs wird nicht abgelehnt F-Test signifikant Korrigiertes gegenüber Regression y = + ß 1 ·x 1 + ß 2 ·x 2 + u gestiegen. Multiple Regressionsanalysen


Herunterladen ppt "4. Sitzung Alexander Spermann Universität Freiburg 1 Wiederholung: Einfache Regressionsgleichung Interpretation des ß-Koeffizienten: (Da semilog. Spezifizierung)"

Ähnliche Präsentationen


Google-Anzeigen