Korrelation & Skalentransformation

Slides:



Advertisements
Ähnliche Präsentationen
Messung, Skalen und Indizes
Advertisements

Quanti Tutorium
Deskriptive Statistik und Explorative Datenanalyse
CATI-Übung 6. Begleitveranstaltung WS 09/10
Was ist Testtheorie?.
Lagemaße kritische Fragen
Berechnung des Korrelationskoeffizienten Vorbemerkung. Der Korrelationskoeffizient ist im Grunde ein Bruch aus 3 unvollständig berechneten statistischen.
Theorie psychometrischer Tests, III
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.
Gliederung Voraussetzungen für die Berechnung der Produkt-Moment- Korrelation Spearman‘sche Rangkorrelation Beispielrechnung ohne Verbundkorrektur Beispielrechnung.
Gliederung Allgemeine Arten von Zusammenhängen Kovarianzen
Forschungsstatistik II
Heute Prüfung der Produkt-Moment Korrelation
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I
Der Produkt-Moment- Korrelationskoeffizient Der Produkt-Moment Korrelationskoeffizient gibt Stärke und Richtung des linearen Zusammenhanges zweier Variablen.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Der Zusammenhang metrischer Merkmale
Quantitative Methoden I
Hypothesen testen: Grundidee
Forschungsmethoden und Diagnostik
Diskurs Fragebögen Auswertung.
Statistiktutorat Sitzung 1: Grundbegriffe der Statistik
Deskriptive Statistik und Wahrscheinlichkeitstheorie
Grundbegriffe M. Kresken.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Stetige Zufallsgrößen
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Diagramme für Häufigkeiten und Prozentwerte
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
Bivariate Statistik M. Kresken.
Data Mining Georg Pölzlbauer.
Forschungsmethodik II, SS 2010 Vesna Pavlovski & Julia Pichlhöfer
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Veranstaltung 4.
Empirische Sozialforschung am Beispiel der Limburger Nordstadt
Messen Zuordnung von Zahlen zu Objekten/Ereignissen gemäß Regeln
setzt Linearität des Zusammenhangs voraus
Die einfache/multiple lineare Regression
Überblick Teil 1 Überblick empirische Forschung
Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.
Skalenniveaus Tamara Katschnig.
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Grafische Darstellung von Gruppenunterschieden.
SPSS – Kurs Lösungen. Lösung 1 2) z.B. über Transformieren  Werte in Fällen zählen dann noch bei der Schalt- fläche „Werte definieren“ die „1“ angeben.
4 Spezifizierende Beschreibung
5 Beschreibung und Analyse
8 Ergänzungen und Verallgemeinerungen.
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
► Zahlen kleiner 0 heissen negative Zahlen.
Die einfache/multiple lineare Regression
- mal + = - + mal - = - + mal + = + - mal - = +
Grundlagen und Grundbegriffe
Grundbegriffe M. Kresken.
Ökonometrie und Statistik Wiederholung
Statistik III Statistik III Der Phi-Koeffizient
Statistik IV Statistik III
Ökonometrie und Statistik Wiederholung
ReduSoft Ltd. Kurzbeschreibungen zu einigen Modulen, die im Programm MathProf 5.0 unter dem Themenbereich Stochastik implementiert sind.
Zufallsgrößen und Zufallsprozesse
Ökonometrie und Statistik Wiederholung
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Ökonometrie und Statistik Wiederholung
 Präsentation transkript:

Korrelation & Skalentransformation Präsentation von Mohamad Sadeh, Sofia Kleinstück und Leonie Schreiber

Agenda Skalenniveaus Z-Transformation Korrelationskoeffizienten

Die Skala Eine Skala hat den Anspruch Item-Ausprägungen abzubilden. Sie dient hierbei als statistisches Messinstrument und stellt die Relation der Messwerte strukturiert dar.

Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala Absolutskala

Nominalskala Diskrete Variablen (Dichtome & Polytome Variablen ) Werte der Variablen enthalten Äquivalenzrelation Eindeutigkeit Transformationen (Qualitative Informationen ) Trifft Aussage über Gleichheit bzw. Ungleichheit Beispiele: (Familienstand ,Geschlecht, Farben, Automarken, etc.)

Ordinalskala Stetige Variablen Werte der Variablen haben Äquivalenzrelation Rangordnung Transformationen (qualitative und quantitative) Trifft Aussage über Gleichheit bzw. Ungleichheit und Größe der Variablen Beispiel: Rangplätze ( Schulnoten, militärische Ränge, Windstärke, etc.)

Intervallskala Diskrete Variablen und stetige variablen Werte der variablen erhalten Äquivalenzrelation Linearen Transformation Zeigt Gleichheit/ Ungleichheit, relative Größe und Differenzen Beispiele: (Temperatur ,Intelligenzquotient etc.)

Verhältnisskala und Absolutskala Verhältinsskala Alle Relationen der bisherigen Skalenniveaus Zahlen interpretierbar Natürlicher Nullpunkt Multiplikative Transformation Keine feste Einheit Beispiele (Längenmaße, Gewicht .etc.) Absolutskala Natürlicher Nullpunkt Natürliche Maßeinheit Keine Transformationen zulässig

Warum werden Verhältnis- und Absolutskalen in der Psychologie so selten angewandt? In der Psychologie können die Anforderungen, die solche strengen Messungen stellen, nicht erfüllt werden.

Z-Transformation Ziel ist Angabe der relativen Lage von Werten in einer Verteilung. Bei Normalverteilung ist die Standardabweichung 1 und Mittelwert 0.

Z-Transformation Der Verteilung der Werte bleibt bei der Z- Transformation gleich. xneu=(z*sneu)+ xquer neu

Erste Gruppenaufgabe (Excel Workshop) Bildet Kleingruppen mit euren Sitznachbarn und bearbeitet die Aufgaben zu den Skalen! Zeit: 10 Minuten

https://tylervigen.com/spurious-correlations

KORRELATION IST KEINE KAUSALITÄT!

KORRELATION Der Kennwert, der genutzt wird um statistische Zusammenhänge zwischen Daten auf Intervallskalenniveau anzuzeigen. Z.B. um Kennwerte hinterher auf Nominal- oder Ordinalskalenniveau miteinander in Zusammenhang zu bringen Darstellungsmöglichkeit für Übersicht ob Daten Zusammenhang haben

SCATTERPLOT – GRAPHISCHE BESCHREIBUNG Graphische Beschreibung zweier intervallskalierter Variablen Jeder Merkmalsträger i ist über ein Messwertpaar (Xi, Yi) gekennzeichnet Diese Messwertpaare werden in einem Koordinatensystem abgetragen Merkmalsträger Nr. Variable X Variable Y 1 Xi Y1 2 X2 Y2 3 X3 Y3 ... n Xn Yn

SCATTERPLOT Einfügen – Punkt (X, Y) - Punktwolke Einfügen – Punkt (X, Y) - Punktwolke Es ergibt sich eine Punktwolke, auf der jeder Merkmalsträger durch einen Punkt abgebildet ist.

Zweite Aufgabe Bitte bearbeitet auf eurem Excel Worksheet die Aufgabe 2) zum Scatterplot und seiner Interpretation. Zeit: 10 Minuten

NUMERISCHE BESCHREIBUNG Anforderungen, die ein Zusammenhangskoeffizient erfüllen sollte: Zusammenhangsstärke numerisch ausdrücken Richtung des Zusammenhangs darstellen (positiv o. negativ) Invariant gegenüber für Intervallskala zulässige Transformationen sein Einfach interpretierbar sein

KOVARIANZ Die relative Größe des Wertes wird über die Differenz des Wertes relativ zum Mittelwert berechnet. Erfüllt die Kovarianz die zuvor besprochenen Anforderungen? Nicht invariant gegenüber erlaubter Transformationen Addition einer Konstante hat noch keine Auswirkungen Multiplikation mit einer Konstante: Kovarianz ändert sich äquivariant  keine eindeutige Interpretation möglich!

Produkt-Moment-Korrelation (Pearson) Zähler: Kovarianz Nenner: Standartabweichung von x und y Invariant gegenüber linearer Transformation Liegt immer zwischen -1 und 1 r=1  perfekter positiver Zusammenhang r>1  gleichsinniger Zusammenhang r<1  ungleichsinniger Zusammenhang r=0  kein Zusammenhang

FAUSTREGELN NACH COHEN Vorsicht: Ist die Stichprobe zu klein, wird der Zusammenhang überschätzt und eine sinnvolle Interpretation nach Cohen ist nicht möglich!

Dritte Aufgabe Bitte bearbeitet auf eurem Excel Worksheet die Aufgabe 3) zur Punkt- Moment-Korrelation und der Interpretation nach Pearson. Zeit: 5 Minuten

Punktbiseriale Korrelation Biseriale Korrelation Anwendung: Korrelation einer natürlich dichotomen Variable mit einer intervallskalierten Variable Sonderfall der Produkt-Moment-Korrelation Die dichotome Variable muss mit den Werten 0 und 1 codiert werden Anwendung: Korrelation einer künstlich dichotomisierten Variable mit einer intervallskalierten Variable Verhindert, dass das Setzen eines künstlichen Kriteriums zu beliebigen Ergebnissen führt Annahme der Normalverteilung

Tetrachorische Korrelation

Spearman‘s r Anwendung: Korrelation zweier ordinalskalierten Variablen 1. Schritt: Ordinalskalierte Werte werden zu intervallskalierten Werten durch Bilden von Rängen =RANG.MITTELW 2. Schritt: Anwendung der Produkt-Moment-Korrelation Robust gegenüber Ausreißern  Wird auch bei intervallskalierten Daten mit extremen Ausreißern verwendet Interpretation: Wertebereich von -1 bis +1

Phi-Koeffizient Interpretation: Wertebereich zwischen 0 und 1 Anwendung: Korrelation zweier natürlich dichotomer Variablen Interpretation: Wertebereich zwischen 0 und 1 1. Schritt: Berechnung des Phi-Koeffizienten aus 2x2 Kontingenztabelle: Problem: Bei schiefen Randverteilungen kann der Koeffizient die Werte 1 und -1 gar nicht erreichen. Lösung: Normierung am größtmöglichen Phi. 2. Schritt: Berechnung von Phi max 3. Schritt: Berechnung von Phi norm

& Cramérs V: Chi²-Koeffizient: Anwendung: Korrelation von zwei oder mehr nominalskalierten Variablen 1. Schritt: Kontingenztabelle der erwarteten Häufigkeiten 2. Schritt: Interpretation: Null bei perfekter Unabhängigkeit, ansonsten größer Null kann beliebig große Werte annehmen Cramérs V: Anwendung: Macht den Chi²-Koeffizienten interpretierbar Interpretation: Kann zwischen 0 und 1 liegen, interpretierbar nach Cohen &

4. Aufgabe Jetzt ist Zeit für den letzten Aufgabenteil 

QUELLEN https://scheinkorrelation.jimdo.com https://www.methodenberatung.uzh.ch/de/datenanalyse_spss/deskuniv.html https://matheguru.com/stochastik/korrelation-korrelationskoeffizient.html https://iversity.org/de/my/courses/primer-deskriptive-statistik/lesson_units/5280