Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
1
Skalentransformation & Korrelation
Von Sophia Rosar, Jan Schmitz, Hannah Kölle, Theresa Nix
2
Ablauf Variablen Skalen Skalentransformation Korrelationen
Übungsaufgaben
3
Vom Merkmal zur Variable
Merkmalsträger: Statistische Einheit (z.B. Personen) Merkmal: Eigenschaft einer statistischen Einheit (z.B. X=Haarfarbe) Merkmalsausprägung: Wert/Ausprägung, die ein Merkmal annehmen kann (z.B. blond) Variable: Eindeutige Zuordnung von Zahlen (Realisationen) zu Merkmalen (z.B. x1=0, wenn Haarfarbe blond)
4
Variablen-Definitionen
Extensionale Definition: Zählt alle Realisationen der Variable Kann jede beliebige Zahl sein z.B. Liste der Studenten im ersten Semester Intensionale Definition Gibt Vorschrift an, die die Variable eindeutig spezifiziert (Nennung der Grenzen des Wertebereichs) Sinnvoll, wenn Merkmal zu viele Ausprägungen hat z.B. Größen (alle reellen Zahlen)
5
Arten von Variablen Diskrete Variablen
Endlich und feste Variablen -> begrenzte Anzahl von Werten Dichotom: 2 mögliche, diskrete Werte Polytom: Mehr als 2 diskrete Werte Stetige Variablen Kann unendlich viele beliebige Werte annehmen (reelle Zahlen) Z.B. Körpergröße
6
Die Skala „…ein Messinstrument, mit dem man empirischen Gegenständen Zahlenwerte zuordnet, die der Stärke bestimmter Eigenschaften dieser Gegenstände entsprechen.“ Definition „Skala“ nach DORSCH, Lexikon der Psychologie
7
Skalen 5 verschiedene Skalenniveaus
Qualitativ: Nominalskala & Ordinalskala Quantitativ: Intervall-, Verhältnis- & Absolutskala Direkte Vergleichbarkeit nur bei Variablen, die auf selbiger Skala gemessen werden -> Sonst: Skalentransformation
8
Nominalskala Unterscheidung von Kategorien
Zahlen arbiträr, nicht interpretierbar Zulässige Operationen: Äquivalenzrelation Zulässige Transformationen: in eindeutige Abbildungen Kennwerte: Modus, Häufigkeiten, Chi² Beispiel: Geschlecht/ Wohnort etc.
9
Nominalskala- Grafische Darstellung
Säulendiagramm Kreisdiagramm
10
Ordinalskala Realisationen können (natürlich) geordnet werden
->Objekte können gemäß der Skalenwerte in eine Rangreihe gebracht werden Numerische Abstände nicht interpretierbar/ quantifizierbar
11
Operationen: Äquivalenzrelation, Ordnungsrelation
Operationen: Äquivalenzrelation, Ordnungsrelation Transformationen: streng monotone Transformationen, die die Ordnung der Rangreihe erhalten -> Transitivität darf nicht verletzt werden! Kennwerte: Modalwert, Median, Extrema, Quantile, Quantilsrang -> Fragestellung: Wie viele waren besser? Beispiel: Schulnoten, Tabellenplätze bei Sportveranstaltungen
12
Ordinalskala-Grafische Darstellung
Empirische Häufigkeitsverteilung Empirische Verteilungsfunktion
13
Intervallskala Differenzen von Werten vergleichbar, nicht Werte selbst
Einheit wird definiert, kein natürlicher Nullpunkt Operationen: Äquivalenzrelation, Vergleichsrelation Transformationen: alle linearen Transformationen (Grundrechenarten) -> Differenzverhältnisse müssen erhalten bleiben! Kennwerte: Mittelwerte, Streuungsmaße: Spannweite& Interquartilsabstand, Mittlere Abweichung zum Median, Abweichungsquadratsumme, Varianz, Standardabweichung Beispiel: Temperatur in Celsius
14
Intervallskala-Grafische Darstellung
Fehlerbalkendiagramm Box-Whisker-Plot x.25 = 1. Quartil x.75 = 3. Quartil X_quer = Mittelwert dq = Interquartilsabstand
15
Skalentransformation- Z-Standardisierung
Umwandlung von einer Skala in eine Andere Ziel: Merkmalsverteilungen mit unterschiedlichen Mittelwerten und Streuungen vergleichbar machen Beurteilung der Werte bezüglich ihrer relativen Lage in der Verteilung
16
Skalentransformation
Schritt 1: z-Standardisierung jedes Datenpunktes Z = transformierter Stichprobenwert, auch z-Wert X = Stichprobenwert μ = Mittelwert σ = Standardabweichung Schritt 2: (lineare) Transformation jedes Datenpunktes in die neue Skala
17
Z-Standardisierung Eigenschaften
Für normalverteilte z-Werte gilt: µ = 0 σ= 1 (Bzw. Festlegung eines neuen Mittelwerten & Standardabweichung) Der Wert z gibt an, wie viele Standardabweichungen und in welche Richtung ein Messwert xi vom Mittelwert entfernt ist Durch die z-Transformation wird die Form der Verteilung nicht beeinflusst!
18
Beispiele: Hamburg-Wechsler IQ-Test (MW=100, s=15), IQ-Skala laut IST (MW=100, s=10), Stanine-Skala (MW=5, s=2)
19
Korrelationen Kovarianz Korrelation Punktbiseriale Korrelation
Bisereale Korrelation Tetrachorische Korrelation Rangkorrelation nach Spearman (Ordinaldaten) Phi-Koeffizient (bivariante Nominaldaten) Chi2 Koeffizient -> Cramers V (Vergleich Kontingenztabelle mit Indifferenztabelle
20
Kovarianz Bivariate Intervalldaten
Positiver oder negativer Zusammenhang zwischen 2 Datenreihen Positiv wenn gleichsinniger Zusammenhang/ negativ wenn gegensinnig Erfüllt nicht Forderung der Invarianz Äquivarianz keine gute Eigenschaft
21
Produkt-Moment-Korrelation (Pearson)
X & Y z-standardisieren -> befreit von Äquivarianz Korrelationskoeffizient Eigenschaften: Ab Intervallskala Zwischen -1 & 1 r= 0 -> kein Zusammenhang neg. r = gegensinniger Zusammenhang / pos. R = gleichsinnig Ausreißer abhängig Lineare Transformationen keine Auswirkung
22
Faustregeln Cohen 1988 Vorsicht bei Interpretation -> hohe Korrelation nur wegen Ausreißer? -> Scatterplot betrachten In experimentellen Studien erst r=.75 hoch Zufallskorrelation wegen zu kleiner Stichproben
23
Voraussetzung für Kausalität
KORRELATION IST NICHT GLEICH KAUSALITÄT Korrelation ungleich Null Ursache vor Wirkung Andere Erklärung für Kovariation ausgeschlossen Raum-zeitlich indifferent
24
Grafische Beschreibung
Scatterplot: Zusammenhang von Messwertpaar in Punktwolke abgebildet Einfach interpretierbar
25
Punktbiseriale Korrelation
X = dichotom & nominalskaliert / Y = intervallskaliert wie 2 intervallskalierte Variablen betrachten Dichotomisieren von Variablen gibt nicht wahren Zusammenhang an X‘ X Y Selben Eigenschaften wie PMK
26
Biseriale Korrelation
Korrektur der kriteriumsabhängigen Veränderung (dichotomisieren) Selben Eigenschaften wie PMK Normalverteilungsannahme der stetigen Variable rpbis vorzuziehen, da keine Normalverteilungsannahme
27
Tetrachorische Korrelation
2 künstlich dichotomisierte Variablen 2x2 Kontingenztabelle Überschätzt Korrelation wenn Randverteilung stark asymmetrisch oder nxy < 5 Selten in Praxis genutzt
28
Rangkorrelation nach Spearman
Bivariante Ordinaldaten Abstände nicht interpretierbar -> Rangordnung nutzen Rangbildung Ties bilden bei mehreren gleichen Werten von X PMK der Ränge berechnen
29
Spearman‘s rs Wertebereich: -1 bis 1 (Vorzeichen = Richtung des Zusammenhangs) Robust bezüglich Ausreißern Invariant bei streng monotonen Transformationen
30
Phi-Koeffizient Bivariante Nominaldaten
Unabhängigkeit in Kontingenztabellen Variable X sagt nichts über Y aus Randhäufigkeiten bleiben gleich Abhängigkeit in Kontingenztabellen Variable X sagt etwas über Y aus Verbundhäufigkeiten betrachten
31
Phi-Koeffizient 1. Weg: 1) Variablen numerisch beschreiben
2) Datentabellen erstellen 3) PMK berechnen 2. Weg: 1) Phi-Koeffizient-Formel anhand 2x2 Kontingenztabelle
32
Phi-Koeffizient Gleiches Maß wie r
Positives Phi: Kombination auf Hauptdiagonale hoch Negatives Phi: Kombination auf Nebendiagonale hoch Selbe Eigenschaften wie PMK Nur interpretierbar in Bezug auf Kontingenztabelle
33
Phi Koeffizient Nur interpretierbar in Bezug auf Kontingenztabelle & Vorzeichen Wegen schiefen Randhäufigkeiten Phi = -1 & +1 nicht erreichbar Phi Max + & - berechnen Hauptdiagonale / Nebendiagonale auf 0 setzen Phi an maximal mögliche Korrelation normieren = Phi norm
34
Phi Koeffizient Interpretation:
Phi & Phinorm sehr unterschiedlich -> Phi max sehr klein 2 Gruppen in Daten Für Mehrheit stimmt schwacher Zusammenhang
35
Chi² Koeffizient Beobachtete Kontingenztabelle mit erwarteter (fiktiver) vergleichen Indifferenztabelle berechnen = Verbundhäufigkeiten unter Unabhängigkeit
36
Chi² Koeffizient Chi² = 0 bei perfekter Unabhängigkeit
beliebig große Werte Normieren um zu interpretieren
37
Cramers V Als Korrelationskoeffizient interpretierbar
V = 0 bei perfekter Unabhängigkeit Zwischen 0 & 1 Sagt ob Zusammenhang da, aber nicht wo
38
Quellen (Scatterplot Bild, ) (Beispielbilder zu Nominalskala und Ordinalskala, ) (Bild zur Normalverteilung, ) Iversity: Kapitel 2-6; Markus Wirtz, Christof Nachtigall: Deskriptive Statistik-Statistische Methoden für Psychologen Teil 1, 4. überarbeitete Auflage 2006, Juventa Verlag Weinheim und München, Kapitel 2: S.43-55; S.88-93 (Bild Kreisdiagramm, ) (Bild Säulendiagramm, )
Ähnliche Präsentationen
© 2025 SlidePlayer.org Inc.
All rights reserved.