Relationen zwischen qualitativen Merkmalen

Slides:



Advertisements
Ähnliche Präsentationen
Beispiel: Grundbegriffe Statistik/Stochastik
Advertisements

Statistik-Tutorat SS 2009 Christina
Der F - Test Man prüft, ob sich 2 Varianzen unterscheiden, mit dem F-Quotienten: Geprüft werden stets die Schätzungen der Populationsvarianzen aufgrund.
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
B-Bäume.
Standortfaktoren INTERN - Ausdrucksstark präsentieren.
Forschungsstatistik II
Heute Prüfung der Produkt-Moment Korrelation
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Der Binomialtest Man habe einen wahren Anteil P.
Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.
Ein frohes und erfolgreiches Jahr
SoSe 06, Statistik mit SPSS
Quantitative Methoden I
Hypothesen testen: Grundidee
Mittelwert, Median, Quantil
Kapitel 19 Astronomie Autor: Bennett et al. Unsere Galaxis, die Milchstraße Kapitel 19 Unsere Galaxis, die Milchstraße © Pearson Studium 2010 Folie: 1.
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Datenmatrix.
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung.
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Datentabelle für 2 Merkmale
Streuungsparameter Median Mittlere Abweichung vom Median
Univariate Statistik M. Kresken.
Ralf KüstersDagstuhl 2008/11/30 2 Ralf KüstersDagstuhl 2008/11/30 3.
Das wars!.
(Gini-Koeffizient, Lorenz-Kurve)
Rechneraufbau & Rechnerstrukturen, Folie 12.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 12.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Relationen zwischen metrischen Merkmalen
Galip Turan 5 ITK. Bsp.: Untersuchen Sie aus der folgenden Erhebung in einem Kaufhaus: Hängt die Zahlungsweise vom Geschlecht ab? ( Alpha =1%)
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Definitionen für Wahrscheinlichkeiten
Auslegung eines Vorschubantriebes
Wiederholung BSP 2.1.
STATISIK LV Nr.: 0028 SS Mai 2005.
Statistik: Mehr zur Regression.
Kapitel 9 Analyse der Modellstruktur Hackl, Einführung in die Ökonometrie 2 Rekursive OLS-Schätzung Spezifiziertes Modell: y = X + u y, u:
Konfidenzintervall und Testen für den Mittelwert und Anteile
Ökonometrie I Analyse der Modellstruktur Ökonometrie I2 Rekursive OLS-Schätzung Spezifiziertes Modell: y = X + u y, u: n-Vektoren; X: Ordnung.
Erheben von Daten kategoriale Merkmale
Arbeiten mit der Normalverteilung
Mehr zum Testen von Hypothesen
DVR-Presseseminar „Alkohol und Drogen“ 04. September 2006
PROCAM Score Alter (Jahre)
Referat über das Thema STOCHASTIK.
Großer Altersunterschied bei Paaren fällt nicht auf!
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
Determinanten und Cramer‘sche Regel
1 (C) 2002, Hermann Knoll, HTW Chur, Fachhochschule Ostschweiz Wahrscheinlichkeitsverteilung Lernziele: Wahrscheinlichkeitsverteilung und der Wahrscheinlichkeitsdichte.
Analyseprodukte numerischer Modelle
1 Zukunftsfaktor Wissen Perspektiven für wissensintensive Unternehmen und hoch qualifizierte Fachkräfte in der Region Osnabrück-Emsland Pressegespräch.

Pflanzenlernkartei 3 Autor: Rudolf Arnold. Pflanze 1 Gattung Merkmale Schädigung Bekämpfung.
Pflanzenlernkartei 2 Autor: Rudolf Arnold. Pflanze 1 Gattung Merkmale Schädigung Bekämpfung.
Zusammengestellt von OE3DSB
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
Folie Einzelauswertung der Gemeindedaten
1.6.3 Test auf Verlustfreiheit (Verbundtreue) (4|10)
Zusammenhänge von Variablen ab Nominalskalenniveau
K. Desch - Statistik und Datenanalyse SS05 1 Zusammenfassung 2. Vorlesung (22.4.) Schiefe (Skewness): Maß für die Asymmetrie der Verteilung um den Mittelwert.
Der Binomialtest Man habe einen wahren Anteil P. Kann man aufgrund von p sagen, daß in der Population tatsächlich der Anteil P zugrunde liegt? [Beispiele]
STATISIK LV Nr.: 1375 SS März 2005.
K. Desch - Statistik und Datenanalyse SS05
Statistik I Statistik I Statistische Grundbegriffe
 Präsentation transkript:

Relationen zwischen qualitativen Merkmalen Statistik: 3.3.04 Relationen zwischen qualitativen Merkmalen

Beispiel: Unfälle Für 165 Unfälle wurden registriert: P-Schaden Stadt Ort des Unfalls: (innner-/außerhalb) Stadtgebiet Personenschaden: ja/nein P-Schaden Stadt Land Summe ja 17 35 52 nein 65 48 113 82 83 165 3.3.04 PI Statistik, SS 2004 (4)

Unfälle: Häufigkeitsverteilung 3D-Säulen Gruppiertes Säulendiagramm 3.3.04 PI Statistik, SS 2004 (4)

Kontingenztafel X Y y1 … ys Summe x1 n11 n1s n1. xr nr1 nrs nr. n.1 Tabellierung von gemeinsamen Häufigkeiten zweier (oder mehrerer) qualitativer Merkmale, Häufigkeitsverteilung Auch Kreuztabellen oder Kreuzklassifikation genannt X Y y1 … ys Summe x1 n11 n1s n1. xr nr1 nrs nr. n.1 n.r n Zelle Randverteilungen 3.3.04 PI Statistik, SS 2004 (4)

Unfälle: Häufigkeitsverteilungen Randverteilung nach Personenschaden Stadt/Land (bedingte) Verteilung nach Personen- schäden von Unfällen in der Stadt 3.3.04 PI Statistik, SS 2004 (4)

Rand- und bedingte Verteilungen ni., i =1,…,r: (Rand)Verteilung des (Zeilen-) Merkmals X n.j, j =1,…,s: (Rand)Verteilung des (Spalten-) Merkmals Y „.“ gibt an, dass über alle möglichen Werte des Index summiert wurde ni. = j nij ni|j, i =1,…,r : bedingte Verteilung des (Zeilen-) Merkmals X für Y =yj nj|i, j =1,…,s : bedingte Verteilung des (Spalten-) MerkmalsY für X =xi 3.3.04 PI Statistik, SS 2004 (4)

Unfälle: Häufigkeitsverteilungen Gemeinsame Verteilung P-Schaden Stadt Land Summe ja 17 35 52 nein 65 48 113 82 83 165 (bedingte) Verteilung nach Personen- schäden von (82!) Unfällen in der Stadt Randverteilung nach Personenschaden Stadt/Land 3.3.04 PI Statistik, SS 2004 (4)

Relative Häufigkeiten Gemeinsame relative Häufigkeiten z.B.: Anteil der (65) Unfälle ohne Personenschaden in der Stadt an allen (165) Unfällen Bedingte relative Häufigkeiten z.B.: Anteil der (65) Unfälle ohne Personenschaden (in der Stadt) an den (82) Unfällen in der Stadt 3.3.04 PI Statistik, SS 2004 (4)

Unfälle: Relative Häufigkeiten Randverteilung nach Stadt/Land Personenschaden Gemeinsame Verteilung P-Schaden Stadt Land Summe ja 10.3 21.2 31.5 nein 39.4 29.1 68.5 49.7 50.3 100.0 3.3.04 PI Statistik, SS 2004 (4)

Unfälle: Bedingte relative Häufigkeiten Bedingte Verteilungen für Unfälle mit ohne Personenschaden P-Schaden Stadt Land Summe ja 32.7 67.3 100.0 nein 57.5 42.5 49.7 50.3 Analog bedingte Verteilungen für Unfälle in Stadt und Land nach Personenschaden 3.3.04 PI Statistik, SS 2004 (4)

Bedingte Verteilungen Bedingte Verteilung für Unfälle in Stadt und Land nach Personenschaden Gestapeltes Säulendiagramm 3.3.04 PI Statistik, SS 2004 (4)

Beziehung zwischen Merkmalen Das Wissen über die Ausprägung eines Merkmals hilft, die Ausprägung des anderen Merkmals vorherzusagen Beispiel: Unfall passierte auf Autobahn; Personenschäden sind wahrscheinlicher als wenn der Unfall im Stadtgebiet stattgefunden hätte 3.3.04 PI Statistik, SS 2004 (4)

Merkmale: Unabhängigkeit Zwei Merkmale X und Y werden als unabhängig bezeichnet, wenn die bedingten Verteilungen pi|j, i =1, …, r, für alle (j =1,… ,s) Merkmalsausprägungen von Y übereinstimmen 3.3.04 PI Statistik, SS 2004 (4)

Sind Ort und Personenschäden bei Unfällen unabhängig? Was sagen uns: bedingte Verteilungen für Unfälle mit und ohne Personenschäden bedingte Verteilungen für Unfälle in Stadt und Land nach Personenschaden P-Schaden Stadt Land Summe ja 32.7 67.3 100.0 nein 57.5 42.5 49.7 50.3 3.3.04 PI Statistik, SS 2004 (4)

Erwartete Häufigkeiten Sind X und Y unabhängige Merkmale, so erwarten wir die Häufigkeiten Die erwarteten Häufigkeiten sind durch die Randverteilungen bestimmt 3.3.04 PI Statistik, SS 2004 (4)

Unfälle: Erwartete Häufigkeiten Beobachtet: P-Schaden Stadt Land Summe ja 17 35 52 nein 65 48 113 82 83 165 Bei Unabhängig- keit erwartet: P-Schaden Stadt Land Summe ja 25,8 26,2 52 nein 56,2 56,8 113 82 83 165 3.3.04 PI Statistik, SS 2004 (4)

Chiquadrat-Statistik Assoziationsmaß, d.h. Maß für Abhängigkeit zwischen Merkmalen Bei Unabhängigkeit der Merkmale: T = 0 Bei Abhängigkeit: T ist wesentlich größer als 0 Bei Unabhängigkeit folgt die Chiquadrat-Statistik der Chiquadrat-Verteilung 3.3.04 PI Statistik, SS 2004 (4)

Unfälle Chiquadrat-Statistik: T = 8.78 p-Wert (Wahrscheinlichkeit, dass T ≥ 8.78, wenn Unabhängigkeit der Merkmale zutrifft): 0.003 Unabhängigkeit der Merkmale ist unplausibel 3.3.04 PI Statistik, SS 2004 (4)

(r x s) - Kontingenztafel Verallgemeinerung der 2x2-Tafel Chiquadrat-Statistik: Bei Unabhängigkeit folgt die Chiquadrat-Statistik der Chiquadrat-Verteilung mit (r-1)(s-1) Freiheitsgraden 3.3.04 PI Statistik, SS 2004 (4)

Homogenität Das Merkmal Y charakterisiert die Population Homogenität: die bedingten Verteilungen pi|j, i =1, …, r sind für alle j Populationen gleich Zum Überprüfen der Homogenität: Chiquadrat-Statistik 3.3.04 PI Statistik, SS 2004 (4)

Kontingentzkoeffizienten Von der Chiquadrat -Statistik abgeleitete Assoziationsmaße: Pearson´scher Kontingenzkoeffizient Cramér´scher Kontingenzkoeffizient bei Unabhängigkeit: P = 0, C = 0 Maximalwert: P < 1, C ≤ 0 3.3.04 PI Statistik, SS 2004 (4)

Unfälle Für die Kontingenzkoeffizienten erhalten wir 3.3.04 PI Statistik, SS 2004 (4)

Beispiel: Nochmals Unfälle Für 165 Unfälle wurden registriert: Ort des Unfalls: Ortsgebiet, Landstraße, Autobahn Personenschaden: ja/nein P-Schaden Orts-Geb. Land-Staße A-Bahn Summe ja 17 23 12 52 nein 65 44 4 113 82 67 16 165 2x3 Kontingenztafel 3.3.04 PI Statistik, SS 2004 (4)

Beispiel, Forts. Chiquadrat-Statistik: T = 18.68 Bei Unabhängigkeit folgt T der Chiquadrat-Verteilung mit (r-1)(s-1) = 2 Freiheitsgraden Der p-Wert beträgt 0.000088 ! Pearson´scher Kontingenzkoeffizient: P = 0.319 Cramér'scher Kontingenzkoeffizient: C = 0.336 3.3.04 PI Statistik, SS 2004 (4)