Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Regression und Korrelation. Ziel: Vorhersage Unabhängige Variable X (quantitativ) Abhängige Variable Y Wie genau erlaubt die Kenntnis von X, den Wert.

Ähnliche Präsentationen


Präsentation zum Thema: "Regression und Korrelation. Ziel: Vorhersage Unabhängige Variable X (quantitativ) Abhängige Variable Y Wie genau erlaubt die Kenntnis von X, den Wert."—  Präsentation transkript:

1 Regression und Korrelation

2 Ziel: Vorhersage Unabhängige Variable X (quantitativ) Abhängige Variable Y Wie genau erlaubt die Kenntnis von X, den Wert von Y vorherzusagen, und welcher Wert wäre das? Vorhergesagter Wert Y ' = F (X) (wieso Vorhersage? Wir kennen Y doch!) Vereinfachung: Existiert ein linearer Zusammenhang? Y ' = a + b X

3 Linearität Fast jeder Zusammenhang ist –lokal linear –global nichtlinear

4 Das lineare Modell y' i = a + b · x i y i = y' i + e i = a + b · x i + e i e i = y i – y' i Y X Y' = a + b X eiei Ziel: minimieren. = a + b · a = – b · b = V xy / V xx

5 Varianz und Kovarianz V xx = ) ² > = + ² > = – 2 + ² = – ² S x = V xx V yy = – ² V xy = ) (y – ) > = – V yx = V xy

6 Kovarianz V xy = ) (y – ) > = – V xy ist positiv, wenn positive Abweichungen in X mit positiven Abweichungen in Y einhergehen, und negative mit negativen. V xy ist negativ, wenn positive Abweichungen in X mit negativen Abweichungen in Y einhergehen, und negative mit positiven. V xy ist Null, wenn positive Abweichungen in X gleich häufig mit positiven wie mit negativen Abweichungen in Y einhergehen (und dasselbe für negative Abweichungen in X).

7 z-transformierte Daten Ziel: minimieren. = a + b · a = – b · b = V xy / V xx = = 0, V xx = V yy = 1. a = 0 b = V xy = – =

8 Vertauschung von X und Y Y X Y' = b X eiei Y X X' = (1/b) Y eiei Ziel: minimieren. b = [–1,1] eiei X' = b Y

9 Steigung und Korrelationskoeffizient b y·x = V xy / V xx b x·y = V xy / V yy 1 / b y·x = V xx / V xy r xy = V xy / (V xx V yy ) b y·x = r xy (V yy /V xx ) = r xy S y /S x b x·y = r xy (V xx /V yy ) = r xy S x /S y r xy ²= V xy ² / (V xx V yy ) = V yy ( 1 – r xy ² ) = ( 1 – r xy ² ) für z-transformierte Daten

10 r xy ²= V xy ² / (V xx V yy ) = V yy ( 1 – r xy ² ) = der Anteil von V yy, der nicht durch X erklärt wird V yy r xy ² = der Anteil von V yy, der durch X erklärt wird y i = a + b · x i + e i Varianz und Korrelationskoeffizient V yy (1–r xy ²) ·V yy r xy ²·V yy V xx r xy ²·V xx (1–r xy ²) ·V yy

11 Bei Schulkindern korreliert Lesefähigkeit X mit Sprungweite Y. Verdacht: Beides korreliert mit Alter Z. Scheinkorrelation... (echte Korrelation, Verdacht: nicht kausal) Test: Alter konstant halten... oder: Lesefähigkeit und/oder Sprungweite vom Alter bereinigen. bereinigte Variablen: X* = X – b x.z · Z, Y* = Y – b y.z · Z. Partialkorrelation: r x*y* = r xy.z = (r xy – r xz ·r yz ) / ( (1 – r xz ²) · (1 – r yz ²)). Semipartialkorrelation: r xy* = r x(y.z) = (r xy – r xz ·r yz ) / (1 – r yz ²). Frage: Wie korrelieren X und Y bei konstantem Z? Frage: Wieviel trägt Y zu X bei über das hinaus, was Z beiträgt? Partial- und Semipartialkorrelation Z Y X

12 r x(y.z) ²·V xx Partialkorrelation: r xy.z ² = (r xy – r xz ·r yz )² / ((1 – r xz ²) · (1 – r yz ²)). Semipartialkorrelation: r x(y.z) ² = (r xy – r xz ·r yz )² / (1 – r yz ²). SemiPartialkorrelation und Varianz V xx (1–r xz ²) ·V xx r xz ²·V xx

13 Multiple Regression y i = a + b · x i + e i, y' i = a + b · x i y i = a + b 1 · x 1i + b 2 · x 2i + b 3 · x 3i + … + e i y' i = a + b 1 · x 1i + b 2 · x 2i + b 3 · x 3i + … standardisierte (z-transformierte) Variablen: n :Standardpartialregressionskoeffizienten n r yx n, z.B. 2 Prädikatoren: 1 = (r y1 –r y2 ·r 12 ) / (1–r 12 ²) r y(1.2) = (r y1 –r y2 ·r 12 ) / (1–r 12 ²) nicht standardisierte Variablen: b n = n · S y / S x n Multiple Korrelation: R y, = r yy' R²= Anteil der insgesamt erklärten Varianz R² y, = r² y1 + r² y(2.1) + r² y(3.21) + r² y(4.321) +... bivariat: R y,x = r yy' = |r xy |

14 Schrittweise Regression Y wird vorhergesagt aus k Prädiktoren X n. Die Prädiktoren sind unterschiedlich nützlich: zur Erhöhung von R². U j = R² mit j – R² ohne j (hängt von den anderen eingeschlossenen Prädikatoren ab). Vorwärts-Technik: Beginne mit 0 Prädikatoren, nimm denjenigen hinzu, der R² am meisten erhöht, bis Beitrag von X j unterhalb eines Kriteriums. Rückwärts-Technik: Beginne mit k Prädikatoren, laß denjenigen weg, der R² am wenigsten schadet, solange Beitrag von X j unterhalb eines Kriteriums. Kombinierte Vorwärts/Rückwärts-Technik. Abhängig von der Abfolge....

15 kontraintuitiv: Suppression X 1 korreliert mäßig mit Y... X 2 korreliert gar nicht mit Y. Trotzdem verbessert sich R², wenn X 2 hinzugenommen wird. Y wird durch Merkmal A bestimmt, X 1 zu 30% durch Merkmal A, zu 70% durch Merkmal B, (und korreliert daher auch nur mäßig mit Y) X 2 wird durch Merkmal B bestimmt. Es gibt eine Linearkombination von X 1 und X 2, die allein durch Merkmal A bestimmt wird.


Herunterladen ppt "Regression und Korrelation. Ziel: Vorhersage Unabhängige Variable X (quantitativ) Abhängige Variable Y Wie genau erlaubt die Kenntnis von X, den Wert."

Ähnliche Präsentationen


Google-Anzeigen