Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.

Slides:



Advertisements
Ähnliche Präsentationen
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Advertisements

Theorie psychometrischer Tests, III
Forschungsstrategien Johannes Gutenberg Universität Mainz
Forschungsstatistik I
Regression und Korrelation
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-23.
Heute Prüfung der Produkt-Moment Korrelation
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Der Produkt-Moment- Korrelationskoeffizient Der Produkt-Moment Korrelationskoeffizient gibt Stärke und Richtung des linearen Zusammenhanges zweier Variablen.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Mehrfachregressionen
Quantitative Methoden I
2. Univariate Regressionsanalyse 2.1 Das statische Regressionsmodell
Latente Variablen – Kennwerte zur Beurteilung von Modellen
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Strukturgleichungsmodelle
F FnFn z Prof. Dr. Johann Graf Lambsdorff Universität Passau SS a. Anhang zur Bestimmung der optimalen Taylor-Regel.
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Mögliche Funktionenklassen
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Streuungsparameter Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Rechenregeln für Mittelwert, Varianz und Streuung.
Datenmatrix.
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Datentabelle für 2 Merkmale
Streuungsparameter Median Mittlere Abweichung vom Median
Tutorium
Tutorium
(Gini-Koeffizient, Lorenz-Kurve)
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Wiederholung: Einfache Regressionsgleichung
Bestimmung der Regressionsgewichte in der multiplen Regression
Sali zäma.
Ausgleichungsrechnung II
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
STATISIK LV Nr.: 0028 SS Mai 2005.
Statistik: Mehr zur Regression.
Kapitel 16 Ökonometrische Modelle
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Bivariate Statistik M. Kresken.
Regression Maria Morozova Lisa Ochsenhofer. Einführung Francis Galton 1886 Größe von Vater und Sohn Regression zum Mittelwert.
Forschungsmethodik II, SS 2010 Vesna Pavlovski & Julia Pichlhöfer
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Statistik Typen statistischer Zusammenhänge: Statistik I
Statistik – Regression - Korrelation
Veranstaltung 4.
Mathematik für BiologInnen WS 05
setzt Linearität des Zusammenhangs voraus
Die einfache/multiple lineare Regression
Varianzanalyse und Eta²
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Außenhandelsbeziehungen zwischen China, USA, EU Makroökonometrie Vorlesung Dr. Oliver Bode.
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz Stunde

Themen der Stunde Merkmalszusammenhänge: Überblick und Gegenstand Zurückführen der Werte einer Variable auf eine andere: Regression Lineare Regression: Y = a X + b

Merkmalszusammenhänge Univariate Statistik: Beschreibung von einzelnen statistischen Größen Bivariate Statistik: Beziehung zwischen 2 statistischen Variablen Merkmalszusammenhang: Es besteht ein Zusammenhang zwischen 2 Variablen X und Y, wenn die Werte von X mit den Werten von Y einhergehen, bzw. in gewissem Grad korrespondieren.

Beispiele Gibt es einen Zusammenhang von Drogenkonsum und mentaler Leistungsfähigkeit? Kann man aus der Abinote die Note des Examens vorhersagen? Haben Raucher häufiger Lungenkrebs als Nichtraucher? Hängt der Therapieerfolg ab von einer positiven Einstellung zur Psychotherapie? [Beispiel: Schuh-und Körpergröße, Test-Retest]

Beispiel: Zusammenhang bei metrischen Daten Zusammenhänge von X und Y : Vorhersagbarkeit von Y aus X

Beispiel: Zusammenhang bei Nominaldaten (Häufigkeiten) Kein Zusammenhang der beiden Variablen Lungenkrebs (LK) und Rauchen (R) ! R+R- LK LK

Beispiel: Zusammenhang bei Nominaldaten (Häufigkeiten) Maximaler Zusammenhang der beiden Variablen Lungenkrebs (LK) und Rauchen (R) ! R+R- LK+2500 LK

Themengebiet Regression & Korrelation Lineare Regression & Korrelation Ausgleichspolynome n-ter Ordnung Nichtlineare Regression: a) auf lineare Regression zurückführbare Modelle b) echte nichtlineare Modelle Mehr als 2 Variablen: Multiple Regression & Korrelation

Merkmalszusammenhänge Kein Zusammenhangpositiver Zusammenhangnegativer Zusammenhang Für mindestens intervallskalierte Variablen erkennt man eine mögliche Beziehung im Scatterplot

Näherungskurven Näherungskurven können linear oder nichtlinear sein. Je mehr Parameter sie haben, desto schmiegsamer sind die Kurven

Zur Modellwahl Regressionsmodelle können exploratorisch oder prüfend gewählt werden Die Entscheidung über die Güte der Modellpassung wird anhand von Kennziffern der Vorhersageleistung getroffen Je mehr Parameter ein Modell hat, desto eher kann es komplizierteren Verläufen der Daten folgen und verschiedene Trends abbilden Vorhersageleistungen sind daher relativ zur Anzahl der freien Parameter zu bewerten

Lineare Näherungskurve Lineare Näherung ist oft die zunächst einfachste Gibt recht gut einen Trend der Beziehung an: mehr geht oft nicht Unterscheidung zwischen empirischer und theoretischer Näherungskurve

Lineare Näherungskurve: Modellansatz Die lineare Näherungskurve (Regressionsgerade) wird so bestimmt, daß die Summe der quadrierten Abweichungen der Y Werte von der Geraden minimal werden (Kleinstquadratkriterium) Modell: Fehler: Datenerklärung: Kriterium für die Parameterbestimmung [Tafelrechnung: Bestimmung der Normalgleichungen für die Parameter a 0 und a 1 ]

Die Normalgleichungen Die Normalgleichungsregel führt für Polynome k-ter Ordnung stets auf dasselbe Gleichungssystem wie die Behandlung des Minimierungsproblems Modell: Regel: Multipliziere jede Seite der Gleichung nacheinander mit 1, x, x 2,...,x k und summiere über die N- Fälle Für k = 1 (lineare Regression) ergibt das:

Die Koeffizienten a 0 und a 1 Die Steigungskonstante a 1 ergibt sich als Quotient der sog. Kovarianz und der Varianz der Variable x. Auflösen des Normalgleichungssystems nach a 1 ergibt: [Tafelbehandlung]

Die Koeffizienten a 0 und a 1 Der Schnittpunkt a 0 läßt sich direkt aus der Steigungskonstanten und den beiden Mittelwerten errechnen Auflösen des Normalgleichungssystems nach a 0 :

Varianzzerlegung Für die lineare Regression gilt die additive Varianzzerlegung Die Kriteriumsvarianz ist die Summe aus Vorhersagevarianz und Fehlervarianz

Determinationskoeffizient Wegen der Varianzzerlegung Der Determinationskoeffizient gibt den Anteil der erklärten Varianz an der gesamten Kriteriumsvarianz an. gilt Man definiert als Determinationskoeffizient

Determinationskoeffizient Der Anteil der erklärten Varianz ist der Anteil der quadrierten Kovarianz an dem Produkt der beiden Varianzen. Ferner gilt (s. Steigungsdreieck) Und daher Woraus man für den Determinationskoeffizienten erhält

Standardschätzfehler Der Standardschätzfehler beschreibt die Streuung um die Regressionsgerade. Er ist definiert als Anteil an der Streuung des Kriteriums, der zulasten der Unzuverlässigkeit geht. gilt Wegen und daher

Regression X aus Y AnsatzKoeffizienten Die Regressionsgerade X aus Y (grau) minimiert den Vorhersagefehler in X- Richtung. Man erhält die Koeffizienten der Geraden durch Vertauschen von X und Y und Lösen den Normalgleichungen. Beide Geraden schneiden sich im Punkt [Tafel]

Abweichungswerte AnsatzGeraden Bei Abweichungswerten fällt die additive Konstante weg. Beide Geraden schneiden sich im Nullpunkt [Tafel]

z - Werte Die Covarianz von z- standardisierten Variablen ist der sog. Pearson – Produkt – Moment Korrelationskoeffizient Die Covarianz von z- Werten ist: [Tafel] Geraden:

z - Werte Die Geradensteigung bei z- standardisierten Variablen ist der Pearson – Produkt – Moment Korrelationskoeffizient. Beide Regressionsgeraden fallen zusammen, es gibt nur noch eine. Die Geradensteigung bei z- Werten ist:

Der Produkt-Moment- Korrelationskoeffizient Der Produkt-Moment Korrelationskoeffizient gibt Stärke und Richtung des linearen Zusammenhanges zweier Variablen an. für seinen Wertebereich. Es gilt: Er ist invariant gegenüber linearen Transformationen