Überblick Teil 1 Überblick empirische Forschung

Slides:



Advertisements
Ähnliche Präsentationen
Kurze Geschichte der Statistik
Advertisements

Berechnung des Korrelationskoeffizienten Vorbemerkung. Der Korrelationskoeffizient ist im Grunde ein Bruch aus 3 unvollständig berechneten statistischen.
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Bewegungswissenschaft
Theorie psychometrischer Tests, III
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
EmPra Der Einfluss und die Verarbeitung von emotionalen Reizen
Einfaktorielle Varianzanalyse
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Gliederung Voraussetzungen für die Berechnung der Produkt-Moment- Korrelation Spearman‘sche Rangkorrelation Beispielrechnung ohne Verbundkorrektur Beispielrechnung.
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Der Produkt-Moment- Korrelationskoeffizient Der Produkt-Moment Korrelationskoeffizient gibt Stärke und Richtung des linearen Zusammenhanges zweier Variablen.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Quantitative Methoden I
Hypothesen testen: Grundidee
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Mögliche Funktionenklassen
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Streuungsparameter Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Datenmatrix.
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Datentabelle für 2 Merkmale
Streuungsparameter Median Mittlere Abweichung vom Median
Univariate Statistik M. Kresken.
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Tutorium
Tutorium
(Gini-Koeffizient, Lorenz-Kurve)
Multikollinearität Wann spricht man von Multikollinearität?
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Chi Quadrat Test Tamara Katschnig.
Seminar: Datenerhebung
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
SPSS für Windows Auswertung von Marktforschungsdaten mit SPSS für Windows WINDER Thomas Porzellangasse 32, 1090 Wien.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Seminar: Datenerhebung
Seminar: Datenerhebung
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) 3. Ausgaben ( ) Wiederholung Tabellen,
Seminar: Datenerhebung
Seminar: Datenerhebung
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Theorie psychometrischer Tests, IV
Deskriptive Statistik
Forschungsmethodik II, SS 2010 Vesna Pavlovski & Julia Pichlhöfer
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Statistik – Regression - Korrelation
Veranstaltung 4.
Erheben, berechnen und darstellen von Daten
Die einfache/multiple lineare Regression
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
setzt Linearität des Zusammenhangs voraus
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Die einfache/multiple lineare Regression
Überblick empirische Forschung
Faktorenanalyse Tamara Katschnig.
Verteilungen, Varianz Tamara Katschnig.
Phi-Koeffizient: Alternative Berechnungsart
Statistik für die Erziehungswissenschaft
Skalenniveaus Tamara Katschnig.
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Auswertung analytischer Daten - Auswertungsziele.
Statistik III Statistik III 2. Streuungsmaße (Dispersionsmaße)
Grafische Darstellung von Gruppenunterschieden.
Die einfache/multiple lineare Regression
Ökonometrie und Statistik Wiederholung
Korrelation & Skalentransformation
 Präsentation transkript:

Überblick Teil 1 Überblick empirische Forschung Einführung: Neopositivismus Stichprobe (n), Variable(n) Skalenniveaus Hauptgütekriterien: Objektivität, Reliabilität, Validität Hypothesen u. Hypothesenbildung Versuchsplanung und Fehlerquellen Testinstrumente insbesondere Fragebogen Mittelwert, Median, Modalwert, Varianz, Streuungsmaße Normalverteilung Chi-Quadrat-Test

Überblick Statistik Deskriptive Statistik=beschreibende Statistik Inferenzstatistik=schließende Statistik 2 Arten von Hypothesenprüfungen möglich 1) Zusammenhänge: Korrelation, Regression 2) Unterschiede: X2, T-Test, U-Test, Wilcoxon, KS-Test, Varianzanalysen etc.

KORRELATION Tamara Katschnig

Definition Korrelation bezeichnet den Zusammenhang zwischen zwei Variablen; „Korrelationskoeffizienten informieren über den Zusammenhang zwischen zwei Variablen.“ (Clauss u. Ebner 1974, 115)

Korrelationskoeffizienten Variable x Intervall- skaliert Variable x Ordinal/ Rangskaliert Variable x Nominal Variable y Intervall- Maßkorrelations-Koeffizient r (Pearson) lineare Korrelation Produkt-Moment-Korrelation Ordinal/Rang-skaliert Rangkorrelations-Koeffizient R (Spearman) oder Kendall Tau τ Nominal Vierfelder-korrela-tion: Φ Phi-Koeffizient

r= -1 starker negativer Zusammenhang Werte der Korrelation r= +1 starker positiver Zusammenhang z.B. Leistung und Intelligenz r= -1 starker negativer Zusammenhang z.B. Leistung und Angst r= 0 kein Zusammenhang z.B. Schuhgröße und Haarfarbe

Werte der Korrelation r= 0,00000001 bis 0,3 geringer Zus.hang r= 0,4 bis 0,7 mittlerer Zusammenhang r= 0,8 bis 1 starker Zusammenhang

Vierfelderkorrelation rΦ Zus.hang zw. zwei dichotomen Variablen rΦ= a.d-b.c √(a+c).(b+d).(a+b).(c+d) A1 A2 Zeilensumme B1 a b a+b B2 c d C+d Spaltensumme a+c b+d a+b+c+d=N

Vierfelderkorrelation rΦ Bspl. Zusammenhang zwischen Geschlecht + Essensgewohnheiten (normalesser vs. Vegetarier) HO: Es gibt keinen Zusammenhang zwischen Geschlecht+Essgewohnheiten H1: Es gibt einen Zus. hang. Zwischen Geschlecht+Essgewohnheiten Vege-tarier Normalesser Zeilensumme weiblich 35 90 125 männlich 15 110 Spaltensumme 50 200 250=N

Vierfelderkorrelation rΦ √(50.200.125.125) = 12500 =0,2 Ergebnis : rΦ=0,2 d. h. es besteht nur ein sehr geringer Zusammenhang zw. G+E H1 gilt: Es gibt einen Zusammenhang zwischen Geschlecht+Essgewohnheiten

Pearson-Korrelation r Zus.hang zw. zwei intervallskalierten Variablen Berechnung erfolgt durch Mittelwert und Standardabweichung Maß, das über die Enge des Zusammenhangs zwischen Variable x und y unterrichtet = Kovarianz =“gemeinsame Varianz von x und y“ Das daraus resultierende Maß wird als Korrelationskoeffizient (r) bezeichnet

Pearson-Korrelation r Um zu bestimmen, ob es sich dabei um einen hohen Zusammenhang handelt, muss man den Korelationskoeffizienzen quadrieren und mit 100 multiplizieren. Der daraus resultierende Wert wird als Bestimmtheitsmaß/Determinationskoeffizient bezeichnet und gibt uns den gemeinsamen Varianzanteil von x und y an: B=rxy2.100

Pearson-Korrelation r Beispiel für B r=0,3 9% erklärte Varianz r=0,6 36% erklärte Varianz r=0,8 64% erklärte Varianz r=0,9 81% erklärte Varianz

Spearmann-Korrelation R Zus.hang zw. zwei rangskalierten Variablen Berechnung erfolgt durch Rangreihen der Werte Dabei werden allen vorkommenden Werten Rangplätze zugeordnet. Der kleinste Wert bekommt den Rangwert 1, der zweitkleinste 2 usw., der größte Wert erhält den Rangplatz n. Um den Zusammenhang zwischen zwei rangskalierten Variablen zu ermitteln, muss man jede Variable für sich rangreihen. Es muss dann für jede Versuchsperson die Rangreihendifferenz gebildet werden: d

Spearmann-Korrelation R Bspl.: 13 Personen wurden auf einer zehnstufigen Skala bzgl. ihrer Ängstlichkeit eingeschätzt, dies sind die Rohdaten: 1 2 3 4 4 5 6 7 8 8 8 9 10 1 2 3 4,5 4,5 6 7 8 10 10 10 12 13 Rangplätze Der kleinste Wert 1 hat den Rangplatz 1, der zweitkleinste 2 den Rangplatz 2, der drittkleinste hat Rangplatz 3, der viertkleinste Wert 4 kommt zweimal vor, würde man Rang 4 und 5 vergeben würde dies das Bild verzerren, daher bekommen beide den Mittelwert aus 4+5/2=4,5, fortgesetzt wird die Reihe mit Rangplatz 6, den Wert 5 einnimmt, Rangplatz 7 ist Wert 6, Rangplatz 8 ist Wert 7, Rangplatz 9, 10 und 11 ist 8 und zwar 3x (9+10+11/3=10) ist 10, Rangplatz 12 ist 9, Rangplatz 13 (=n) ist 10.

Kendall Tau τ Zus.hang zw. zwei rangskalierten Variablen Berechnung erfolgt durch Rangreihen der Werte Voraussetzung hierfür ist, dass mindestens eine der Variablen x oder y Rangskalenniveau hat. xi und yi werden gerangreiht R(xi) und R(yi). Für jede Rangzahl wird die Anzahl von Rangzahlen (qi) von R (yi) ausgezählt, die kleiner oder gleich sind und in der Rangordnung hinter R (yi) stehen.

Partielle Korrelation Korrelationen zwischen x und y ist durch eine sogenannte Störvariable z verschmutzt. Mittels Partieller Korrelation lässt sich dieser Störeinfluss herausfiltern. Bspl. x…..Berühmtheit eines Chirurgen y....Überlebenswahrscheinlichkeit eines Patienten z……..Schwere der Krankheit

Signifikanzniveau sozialwiss. p<0,05 Ergebnis ist signifikant H1 gilt: Es gibt einen Zusammenhang zwischen den berechneten Variablen. p>0,05 Ergebnis ist nicht signifikant H0 gilt: Es gibt keinen Zusammenhang zwischen den berechneten Variablen. 95% Sicherheit, 5% Irrtumswahrscheinlichkeit

Signifikanzniveau Medizin p<0,01 Ergebnis ist signifikant H1 gilt: Es gibt einen Zusammenhang zwischen den berechneten Variablen. p>0,01 Ergebnis ist nicht signifikant H0 gilt: Es gibt keinen Zusammenhang zwischen den berechneten Variablen. 99% Sicherheit, 1% Irrtumswahrscheinlichkeit

KORRELATION Übung Tamara Katschnig

Vierfelderkorrelation Beispiel 0 In einer Klasse von 10 SchülerInnen soll der Zusammenhang von Englisch- und Deutschkenntnissen überprüft werden. Es liegen folgende Daten vor: r=???? Englisch gut Englisch schlecht Zeilensumme Deutsch gut 5 2 Deutsch schlecht 1 Spaltensumme 10=N

Pearsonkorrelation Test A 2 1 9 5 3 Test B 6 4 Beispiel 1 5 Personen erreichten jeweils bei einem Test A xi und bei einem Test B yi Punkte, die in untenstehender Tabelle zu finden sind: Zeichen Sie die zugehörige „Punktwolke“ und interpretieren Sie den Korrelationskoeffizient r nach Pearson von r=0,94 Berechnen Sie B=? Drücken Sie in eigenen Worten aus, was der berechnete Wert des Korrelationskoeffizienten besagt. Test A 2 1 9 5 3 Test B 6 4

Pearsonkorrelation xi 2 4 7 9 10 12 13 15 16 19 yi 3 14 17 18 20 Beispiel 2 10 SchülerInnen erreichten jeweils bei einem Rechtschreibtest xi und bei einem Lesetest yi Punkte, die in untenstehender Tabelle zu finden sind: Zeichen Sie die zugehörige „Punktwolke“ und interpretieren Sie den Korrelationskoeffizient r nach Pearson r=0,988 B=? Drücken Sie in eigenen Worten aus, was der berechnete Wert des Korrelationskoeffizienten besagt. xi 2 4 7 9 10 12 13 15 16 19 yi 3 14 17 18 20

Spearmann-Korrelation Beispiel 3 Zwei KunstkritikerInnen bringen 12 Gemälde nach ihrem Wert in eine Rangreihe (siehe nachstehende Tabelle). Stimmen die Urteile der beiden KritikerInnen überein? Interpretieren Sie die Rangkorrelation R nach Spearman von R=0.83 Berechnen Sie B=??. Drücken Sie in eigenen Worten aus, was der berechnete Wert des Korrelationskoeffizienten besagt. Gemälde 1 2 3 4 5 6 7 8 9 10 11 12 Kritikerin 1 Kritikerin 2

Kendall Tau-Korrelation Beispiel 4 Zwei Personen bewerten neun Produkte derselben Produktpalette, indem sie diese in eine Rangreihe bringen müssen (siehe nachstehende Tabelle). Es stellt sich nun die Frage, ob die beiden Personen die Produkte in etwa gleichwertig einschätzen. R=0,72; Berechnen und interpretieren Sie B=??? Produktnummer 1 2 3 4 5 6 7 8 9 Rangreihe Person 1 Rangreihe Person 2

Vierfelderkorrelation-Lösung Beispiel 0 In einer Klasse von 10 SchülerInnen soll der Zusammenhang von Englisch- und Deutschkenntnissen überprüft werden. Es liegen folgende Daten vor: rΦ= 0,36 B=12,9% Es besteht ein sehr geringer Zus.hang zw. Englisch und Deutschkenntnissen Englisch gut Englisch schlecht Zeilensumme Deutsch gut 5 2 Deutsch schlecht 1 Spaltensumme 10=N

Pearsonkorrelation-Lösung Beispiel 1 5 Personen erreichten jeweils bei einem Test A xi und bei einem Test B yi Punkte, die in untenstehender Tabelle zu finden sind: Pearson von r=0,94 B=88,4% Es besteht ein hoher Zus.hang zwischen Test A und Test B. Test A 2 1 9 5 3 Test B 6 4

Pearsonkorrelation-Lösung Beispiel 2 10 SchülerInnen erreichten jeweils bei einem Rechtschreibtest xi und bei einem Lesetest yi Punkte, die in untenstehender Tabelle zu finden sind: r=0,988 B= 97,6% Es besteht ein hoher Zusammenhang zwischen dem Rechtschreib- und dem Lesetest. xi 2 4 7 9 10 12 13 15 16 19 yi 3 14 17 18 20

Spearmann-Korrelation-Lösung Beispiel 3 Zwei KunstkritikerInnen bringen 12 Gemälde nach ihrem Wert in eine Rangreihe (siehe nachstehende Tabelle). R=0,83 B=68,8% Es besteht ein relativ hoher Zusammenhang zwischen den Urteilen der KunstkritikerInnen bzw. die beiden KunstkritikerInnen stimmen zu 68,8% (ca. 2/3) bei der Beurteilung der Gemälde überein. Gemälde 1 2 3 4 5 6 7 8 9 10 11 12 Kritikerin 1 Kritikerin 2

Kendall Tau-Korrelation-Lösung Beispiel 4 Zwei Personen bewerten neun Produkte derselben Produktpalette, indem sie diese in eine Rangreihe bringen müssen τ=0,72; B=51,8% Es besteht ein hoher Zus.hang zwischen der Einschätzung der beiden Personen bzw. die beiden Personen schätzen die Produkte zu 51,8% oder die Hälfte in etwa gleichwertig ein. Produktnummer 1 2 3 4 5 6 7 8 9 Rangreihe Person 1 Rangreihe Person 2

Korrelation Bspl. SPSS Cholesterin, Ausgangswert Cholesterin, nach 1 Monat Korrelation nach Pearson 1 ,861 Signifikanz (2-seitig) , ,000 N 174 Cholesterin, nach 1 Monat