Fortgeschrittene statistische Methoden SS2020

Slides:



Advertisements
Ähnliche Präsentationen
Tutorat Statistik II im SS 09 Mediator- & Moderatoranalyse
Advertisements

Tutorat Statistik II im SS 09 Multiple Regression
Statistik-Tutorat SS 2009 Christina
Modellprämissen der linearen Regression
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Regression und Korrelation
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Hypothesen testen: Grundidee
Tutorat Deskriptive Statistik und Wahrscheinlichkeitstheorie
Tutorat II Multiple Korrelation Mediator- Moderatoranalyse
Tutorium
Tutorium
Wiederholung: Einfache Regressionsgleichung
Bestimmung der Regressionsgewichte in der multiplen Regression
Semipartialkorrelation Multiple Korrelation Inkrementelle Validität
Kapitel 10 Multikollinearität
Multivariate Statistische Verfahren
Die einfache/multiple lineare Regression
setzt Linearität des Zusammenhangs voraus
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Testtheorie (Vorlesung 12: ) Wiederholung: Reliabilität
Angebot sucht Nachfrage und/oder Nachfrage sucht Angebot (Von welchen Größen ist der Preis abhängig?) Mag. Gottfried Kögler.
Signifikanzprüfung Peter Wilhelm Herbstsemester 2015.
Lehrstuhl für Arbeits- und Kognitionspsychologie - RWTH Aachen Univ.-Prof. Dr. Jochen Müsseler Laszlo Bardos Kolloquium: Untersuchung von Effekten.
Außenhandelsbeziehungen zwischen China, USA, EU Makroökonometrie Vorlesung Dr. Oliver Bode.
Kapitel 2: Testtheorie / Testmodelle  Multivariate (p-variate) Normalverteil- ung :  Mittelwertstruktur: p Mittelwerte  Kovarianzstruktur: p·(p+1)/2.
Seminarvortrag Statistische und numerische Auswertung von Schwingfestigkeits- und Ermüdungsversuchen mit SAFD Lan Tran Aachen,
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
7.2 Theoretische Kennwerte
Ernährung, Lebensmittel und Umwelt 2017 Präsentation zentraler Umfrageergebnisse Christoph Hofinger Christian Glantschnigg Evelyn Hacker Juni 2017.
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Die einfache/multiple lineare Regression
Lineare Algebra II (MAVT)
Reliabilität.
Transformationskurve und Opportunitätskosten
Abiturprüfung Mathematik 2017 Baden-Württemberg Allgemeinbildende Gymnasien Wahlteil Analysis A 1 Lösungen der Aufgaben A 1.1 und A 1.2
Transformationskurve und Opportunitätskosten
Kovarianz, Korrelation, (lineare) Regression
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Grundlagen des vollst. Streckenbeobachters
Ökonometrie und Statistik Logistische Regression
Ökonometrie und Statistik Mehrfachregression
abH ausbildungsbegleitende Hilfen
Kapitel 2: Testtheorie / Testmodelle
SS 04 Christiane Rauh Christian Hellinger
10 Statistisches Schätzen
12 Das lineare Regressionsmodell
Forschungsstrategien Johannes Gutenberg Universität Mainz
Forschungsstatistik II Johannes Gutenberg Universität Mainz
Ökonometrie und Statistik Prüfungsthemen
Wir lösen Bruchgleichungen, deren Nenner eine Variable enthalten
Pflichtteil 2016 Aufgabe 6: Gegeben ist die Gerade
Lage, Schnitte und Schnittwinkel
Kapitel 2: Testtheorie / Testmodelle
Abiturprüfung Mathematik 2015 Baden-Württemberg Allgemeinbildende Gymnasien Wahlteil Analytische Geometrie / Stochastik Aufgabe B 2.1 und B Lösungen.
Übersicht Etwas Mathematik (ganz ohne geht es nicht).
Konfidenzintervalle und Tests auf Normalverteilung
Ökonometrie und Statistik Mehrfachregression
Fortgeschrittene Statistische Methoden Cordula Hunt
Abiturprüfung Mathematik 2015 Baden-Württemberg Allgemeinbildende Gymnasien Wahlteil Analysis A 2 Lösungen der Aufgaben A 2.1 und A 2.2
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Ökonometrie und Statistik Unabhängigkeitstest, c² - Test (Chi Quadrat Test) Dr. Bertram Wassermann.
 Präsentation transkript:

Fortgeschrittene statistische Methoden SS2020 Multiple Regression Fortgeschrittene statistische Methoden SS2020

Multiple Regression Ziele Schätzung eines Kriteriums aus einer Linearkombination von Prädiktoren Mit konkreten Meßvariablen Schätzung des Zusammenhanges in der Grundgesamtheit Information über die Wichtigkeit einzelner Einflußgrößen im Kontext von Multikollinearität Ermittlung suzessiver Kriteriumsaufklärung durch unabhängige Prädiktoranteile

Allgemeine Schätzgleichung

Vorgehen Schätzung der Regressionsgewichte Prüfung der Gleichung in der Grundgesamtheit (statistische Absicherung) Interpretation der Koeffizienten, Rolle der Prädiktoren in der Vorhersagegleichung

Modellformulierung Schätzfehler: Optimierungskriterium für die Regressionsgewichte: wobei 1. Schätzung der Regressionsgewichte

Modellformulierung, standardisiert die additive Konstante fällt weg, nur Gewichte für Prädiktoren 1. Schätzung der Regressionsgewichte

Lösung: Normalgleichungen Für Multipliziere nacheinander mit jedem Prädiktor, summiere über Fälle und teile durch n, führt auf: 1. Schätzung der Regressionsgewichte

Normalgleichungen in Matrix Notation System: wobei: Lösung: mit Inverser Prädiktorkorrelationsmatrix vormultiplizieren 1. Schätzung der Regressionsgewichte

Multipler Korrelationskoeffizient Bedeutung aus Varianzzerlegung: 1. Schätzung der Regressionsgewichte

Statistische Absicherung Ist der Zusammenhang zwischen dem Kriterium und den Prädiktoren statistisch signifikant? (Läßt sich die gefundene multiple Korrelation mit der Annahme vereinbaren, daß die ’wahre’ multiple Korrelation zwischen dem Kriterium und den Prädiktoren gleich Null ist ?) Welche Regressionskoeffizienten leisten einen statistisch bedeutsamen Beitrag zur Schätzung des Kriteriums (ist ihr „wahrer“ Regressionskoeffizient ungleich Null? 2. Statistische Absicherung

Statistische Absicherung 1. Muliple Korrelation mit F- Test absichern: mit df1= k df2 = n-k-1 2. Regressionskoeffizienten mit t- Test prüfen: mit df = n-k-1 Hierin ist rjj das jj-te Element der invertierten Korrelationsmatrix 2. Statistische Absicherung

Interpretation der Lösung 1. Unabhängige Prädiktoren Bei rein unabhängigen Prädiktoren sind die b- Gewichte identisch mit den Kriteriumskorrelationen Der multiple Determinationskoeffizient ist dann einfach die Summe der quadrierten Kriteriumskorrelationen (=erklärter Varianzanteil) 3. Interpretation

Interpretation: abhängige Prädiktoren Untersuchung der Abhängigkeit im Kontext von Multikollinearität Bedeutet die Abhängigkeit Redundanz, d.h. messen die vielen Variablen Aspekte gemeinsam, so daß man prinzipiell weniger (latente) Variablen benötigt? (unerwünschter Aspekt) Erfassen die Abhängigkeiten Teile der Kontamination der Variablen und wirken so optimierend auf die gesamte Schätz- gleichung (Suppressionseffekt, erwünscht)? 3. Interpretation

Partialkorrelation Die Korrelation zweier Variablen, die vom Effekt anderer (spezifizierter) Variablen bereinigt wurden. Prüfung einer Kausalvermutung: rxy komme dadurch zustande, daß z ursächlich auf x und y einwirkt: z x y rzy rzx rxy G 3. Interpretation

Partialkorrelation Prüfung: Sage x aus z voraus und berechne Residuen ex Sage y aus z voraus und berechne Residuen ey Berechne die Korrelation rexey x y rexey z rxy Ist Partialkorrelation Korrelation rexeyNull, so beruht die Korrelation rxy tatsächlich nur auf der Einwirkung von z. 3. Interpretation

Suppression r12 X0 X1 X2 r10=0 r20 X1 „bindet“ irrelevante Kriteriumsinformation Partialkorrelation r20.1 ist erheblich größer als r20 3. Interpretation

Identifikation von Suppressionseffekten Über die Nützlichkeit: Variable Xj ist Suppressor, wenn gilt wobei Uj meint den Betrag, um den der multiple Determinations- Koeffizient zunimmt durch Aufnahme von Xj in die Gleichung 3. Interpretation

Semipartialkorrelation Reihe von Semipartialkorrelationen: Die aufgeklärte Kriteriumsvarianz wird zerlegt in eine Reihe von Semipartialkorrelationen. Jeder neu hinzukommende Prädiktor bindet einen neuen Aspekt des Kriteriums, der nicht in den vorherigen Prädiktoren enthalten ist. Quadrierte Semipartialkorrelation: Anteil des Prädiktors an der gesamten Kriteriumsvarianz: 3. Interpretation

Voraussetzungen Normalverteilung der Residuen Unkorreliertheit der Residuen Varianzhomogenität der Fehlerkomponenten, die durch alle k-1 Prädiktoren im Kriterium eingeführt werden Q-Q Plots der Residuen und Plot der Residuen gegen die vorhergesagten Werte zur Feststellung von Ausreißern 3. Interpretation