Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistik: 28.10.04 Relationen zwischen metrischen Merkmalen.

Ähnliche Präsentationen


Präsentation zum Thema: "Statistik: 28.10.04 Relationen zwischen metrischen Merkmalen."—  Präsentation transkript:

1 Statistik: Relationen zwischen metrischen Merkmalen

2 PI Statistik, WS 2004/05 (5)2 Beispiel: Wohnungsmarkt Fläche Preis Fläche Preis Für 16 Angebote von Eigentumswohnungen wurden registriert: Fläche der Wohnung (m 2 ) Angebotspreis (1000 EUR)

3 PI Statistik, WS 2004/05 (5)3 Wohnungsmarkt Punkte- oder Streudiagramm (scatterplot)

4 PI Statistik, WS 2004/05 (5)4 Randverteilungen Fläche der Wohnung (m 2 ) Preis (1000 EUR)

5 PI Statistik, WS 2004/05 (5)5 Randverteilungen FlächePreis Mittelwert99,3513,1 Standardfehler10,854,8 Median92,5447,5 Standardabweichung43,3219,3 Stichprobenvarianz1870,648109,6 Kurtosis-0,049-0,547 Schiefe0,6510,663 Wertebereich Minimum40170 Maximum Anzahl16 Kenngrößen

6 PI Statistik, WS 2004/05 (5)6 Standardisieren Merkmal X : x 1, …, x n Stichprobenkennzahlen: Standardisieren: Standardisierte Daten: z 1, …, z n Stichprobenkennzahlen:

7 PI Statistik, WS 2004/05 (5)7 Beispiel: Wohnungsmarkt Standardisierte Daten: Fläche Preis

8 PI Statistik, WS 2004/05 (5)8 Korrelationskoeffizient Produkt-Moment Korrelationskoeffizient: oder mit der Kovarianz Beispiel: Fläche (X) und Preis (Y) von angebotenen Wohnungen: s xy = , s x = 43.3, s y = r = 0.826

9 PI Statistik, WS 2004/05 (5)9 Korrelationskoeffizient Korrelationskoeffizient ist ein (durch das Standardi- sieren) normiertes Maß für den linearen Zusam- menhang Eigenschaften: -1 r 1 |r| ist Maß für die Stärke des linearen Zusammenhanges |r|=1: perfekte lineare Abhängigkeit |r|<1: Punkte streuen stark (|r|~0) oder schwach (|r|~1) um Gerade Sign(r) ist Maß für Richtung des linearen Zusammenhanges Sign(r)=1: steigende Gerade Sign(r)=-1: fallende Gerade

10 PI Statistik, WS 2004/05 (5)10 Beziehungen: Beispiele

11 PI Statistik, WS 2004/05 (5)11 Rang Korrelationskoeffizient nach Spearman Korrelationsmaß für ordinale Merkmale Auch anwendbar auf Rangzahlen für metrische Merkmale Definition wie Produkt-Moment Korrelationskoeffizient r xy, angewendet auf die Ränge der Beobachtungen

12 PI Statistik, WS 2004/05 (5)12 Berechnung von r sp 1. Sortieren der Stichprobenpaare (x i, y i ) nach steigenden Werten von X 2. Ersetzen der Beobachtungen (x i, y i ) durch die Rangzahlen (i, R i ) 3. Einsetzen in Formel für Produkt-Moment Korrelationskoeffizient r : 4. Alternative Schreibweise:

13 PI Statistik, WS 2004/05 (5)13 Beispiel: Schulnoten MathEngl MathEngl 1121,53,5 2131,56, , , , , , , , ,5 r sp = 0.430

14 PI Statistik, WS 2004/05 (5)14 Typen von Beziehungen zwischen Merkmalen Kausaler Zusammenhang Wenn es kalt ist, steigen die Heizkosten Rauchen macht Lungenkrebs Gemeinsame Response Die fleißige Studentin bekommt viele gute Noten Zahl der Babys und der Störche wird weniger Vermengung (confounding) Sloppy lifestyle Hypothese und Lungenkrebs

15 PI Statistik, WS 2004/05 (5)15 Typen von Beziehungen yx x ist kausal für y x, y sind gemeinsame Response auf z y: Effekte von x und z sind vermengt xy z xy z zwischen zwei Merkmalen x und y

16 PI Statistik, WS 2004/05 (5)16 Vorsicht! Die Interpretation von Korrelation als kausale Beziehung ist oft eine Fehlinterpretation! Zahl der Babys und der Störche sind hoch positiv korreliert!? Einkommen und Konsum sind hoch positiv korreliert Ausreißer haben großen Effekt auf den Wert des Korrelationskoeffizienten Nicht-lineare Beziehungen!

17 PI Statistik, WS 2004/05 (5)17 Lineare Regression Gerade, die die Datenwolke im Streudiagramm bzw. die Beziehung zwischen den dargestellten Merkmalen möglichst gut repräsentiert Wohnungsmarkt: Daten und Regressionsgerade

18 PI Statistik, WS 2004/05 (5)18 Lineare Regression, Forts. Abhängiges Merkmal: Y Unabhängiges Merkmal: X Regressionsgerade: Y = a + b X a, b: Regressionskoeffizienten (b: Anstieg, a: Interzept) Methode der kleinsten Quadrate: Wähle die Koeffizienten so, dass die Summe der quadrierten Abstände zwischen Beobachtungen und der Geraden minimiert werden Schätzer:

19 PI Statistik, WS 2004/05 (5)19 Wohnungsmarkt, Forts. Geschätzte Regressionsgerade

20 PI Statistik, WS 2004/05 (5)20 Wohnungsmarkt Geschätzte Regressionsgerade Je m 2 muss man im Durchschnitt mit Kosten von Euro rechnen; dazu kommt ein fixer Betrag von im Durchschnitt Euro Residuen: zur Beurteilung der Qualität der Erklärung der Daten durch die Regressionsgerade, insb. des Effekts von einzelnen Beobachtungen

21 PI Statistik, WS 2004/05 (5)21 Regression in EXCEL Analysefunktion Regression Statistische Funktionen RGP: liefert die Koeffizienten der linearen Regression SCHÄTZER: Liefert einen Y-Wert zu einem X-Wert nach Anpassen der linearen Regression Und andere

22 PI Statistik, WS 2004/05 (5)22 Regression in EXCEL: Ausgabe: Zusammenfassung Regressions-Statistik Multipler Korrela- tionskoeffizient0,826 Bestimmtheitsmaß0,682 Adj. Bestimmt- heitsmaß0,659 Standardfehler128,12 Beobachtungen16 Koeffizi enten Standard fehlert-StatistikP-Wert Schnittpunkt97,5982,391,180,256 X Variable 14,190,765,478,2E-05


Herunterladen ppt "Statistik: 28.10.04 Relationen zwischen metrischen Merkmalen."

Ähnliche Präsentationen


Google-Anzeigen