Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Forschungsstatistik I

Kopien: 1
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.

Ähnliche Präsentationen


Präsentation zum Thema: "Forschungsstatistik I"—  Präsentation transkript:

1 Forschungsstatistik I
Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz Stunde

2 Themen der Woche Korrelation bei Binärdaten: Phi-Korrelation
Korrelation von Binärdaten und intervallskalierten Daten: biseriale und punktbiseriale Korrelation Partialkorrelation Multiple Korrelation und Regression

3 Binärdaten: Dichotome Variablen
Binäre Kodierungen können natürlich sein oder künstlich erzeugt durch Definition einer Schranke auf den beiden metrischen Ausgangsvariablen.

4 Der Phi-Koeffizient Der Phi- Koeffizient gibt eine Korrelation von dichotomen Variablen an, die der Produkt-Moment Korrelation über die zugrundeliegenden Binärdaten entspricht.

5 Der Phi-Koeffizient Der Phi- Koeffizient muss an der maximal möglichen Korrelation korrigiert werden, wenn schiefe Randverteilungen vorliegen. pt ist die größte auftretende Randfeldproportion, ps die dazu korrespondierende im Feld der anderen Variable mit gleichem Vorzeichen. [Tafelbetrachtung+Rechenbeispiele+Zusammenhang mit CHI-Quadrat]

6 Phi-Koeffizient aus Chi-Quadrat
beobachtet erwartet Erwartete Häufigkeit, wenn beide Merkmale unabhängig sind:

7 Phi-Koeffizient aus Chi-Quadrat
Die Abweichung von der Unabhängigkeitserwartung drückt ein Chi-Quadrat Maß aus: Ferner gilt: Die Phi-Korrelation erhält man aus dem Chi-Quadrat, gerechnet nach der Annahme der Unabhängigkeit der Merkmale [Tafelbeispiel]

8 Kontingenz von Attributen
Zwei Merkmale können mehrfach gestuft sein. Die Abweichung von der Unabhängigkeitserwartung drückt wieder ein Chi-Quadrat Maß aus: beobachtet erwartet

9 Kontingenz von Attributen
Cramer‘s Index: Ist besser geeignet als der Kontingenzkoeffizient: da dieser stets beschränkt ist durch [Tafelrechnung des Beispiels]

10 Die punkt-biseriale-Korrelation
Die Korrelation einer metrischen Variable und einer dichotomen wird bestimmt durch den Mittelwertsunterschied, den die Gruppen mit den den Merkmalen X=0 und X=1 in der Variable Y haben. [Tafelbetrachtung]

11 Die (punkt)-biseriale-Korrelation
oder (Gesamtmittelformeln) Hierin ist p der Anteil der Personen für die X=1 gilt. w ist der Ordinatenabschnitt der Standardnormalverteilung für die Stelle der Dichotomisierung. Die biseriale Korrelation gilt bei begründeter Vermutung, dass die dichotome Variable latent normalverteilt ist. [Rechenbeispiel aus Script]

12 Die (punkt)-biseriale-Korrelation
-3 -2 -1 1 2 3 z 0.1 0.2 0.3 0.4 f(z) z0 = p = 0.538 q = 0.462 w = 0.397 X = 1 X = 0 Korrelation wird durch Gültigkeit der Normalverteilung aufgewertet!

13 Deutungsmöglichkeiten der bivariaten Korrelation
Kausalität: X1 ® X2 Latente Drittvariable: Direkte und indirekte Kausalität: x x1 x2 x x1 x2

14 Partialkorrelation Die Korrelation zweier Variablen, die vom Effekt anderer (spezifizierter) Variablen bereinigt wurden. Prüfung einer Kausalvermutung: rxy komme dadurch zustande, daß z ursächlich auf x und y einwirkt: z x y rzy rzx rxy G

15 Partialkorrelation Prüfung
Sage x aus z voraus und berechne Residuen ex Sage y aus z voraus und berechne Residuen ey Berechne die Korrelation rexey x y rexey z rxy Ist Partialkorrelation (Korrelation rexey) Null, so beruht die Korrelation rxy tatsächlich nur auf der Einwirkung von z.

16 Partialkorrelation Y aus Z X aus Z ex und ey korrelieren:
[Tafelbeispiele]

17 Datenbeispiel X: Rechnen Y: Sprache Z: Förderdauer rxy=.56 rxz=.72
ryz=.73 Korreliert Rechen und Sprache nur, weil die Kinder Frühförderung erhalten haben?

18 Datenbeispiel: Korr. der Residuen
rxy.z=.07 X: Rechnen Y: Sprache Z: Förderdauer Residuen: Korrelation der Residuen: Ja: Ohne die Frühförderung sind Rechen- und Sprachleistung unabhängig! [Tafelbetrachtung]

19 Multiple Korrelation & Regression
Variable X, Y, Z: Sage Z aus X und Y vorher ! Die ß- Koeffizienten müssen nach dem Kleinstquadratkriterium bestimmt werden!

20 Multiple Korrelation & Regression
Kleinstquadratkriterium: Für den 3 Variablenfall bequem nach Standardisierung über Normalgleichungen zu lösen! führt auf: [Tafelrechnung]

21 Multiple Korrelation & Regression
Multipler Korrelationskoeffizient Ist die Korrelation der vorhergesagten Werte mit den beobachteten Werten Z 1) Ist immer größer oder gleich die größte Einzelkorrelation 2) Sein Quadrat gibt wieder den Anteil der Vorhersagevarianz an der Gesamtvarianz an: 3)

22 Multiple Korrelation & Regression
Interpretation Sind die Prädiktoren unabhängig, so sind die ß-Gewichte gleich den Kriteriumskorrelationen und die aufgeklärte Varianz ist die Summe der Quadrate der ß-Gewichte 1) Sind die Prädiktoren abhängig (interkorreliert), so unterscheiden wir 3 Fälle: 2) Der Pädiktor enthält Information, die schon der andere Prädiktor enthält: er ist redundant Der Prädiktor unterdrückt irrelevante Varianzanteile in dem anderen Prädiktor: er ist ein Suppressor Der Prädiktor besitzt Kriteriumsvarianz, die der andere Prädiktor nicht besitzt und unterdrückt irrelevante Varianz des anderen Prädiktors: er ist valide und nützlich. [Tafelbeispiele]

23 Multiple Korrelation & Regression
Redundanz Die Variable y ist redundant zur Vorhersage von z, wenn: Nützlichkeit der Variable y zur Vorhersage von z: Gilt so existieren Suppressionseffekte. [Tafelbeispiele]

24 Multiple Korrelation & Regression
Suppression rxz ryz=0 rxy X Y Z Y „bindet“ irrelevante Kriteriumsinformation Partialkorrelation rxz.y ist erheblich größer als rxz [Tafelbeispiele]


Herunterladen ppt "Forschungsstatistik I"

Ähnliche Präsentationen


Google-Anzeigen