Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

1 Wie lässt sich die Stärke eines Zusammenhanges bei kategorialen Werten (nominalskalierten Werten) auf Basis einer Kreuztabelle, Kontingenz- tafel bewerten?

Ähnliche Präsentationen


Präsentation zum Thema: "1 Wie lässt sich die Stärke eines Zusammenhanges bei kategorialen Werten (nominalskalierten Werten) auf Basis einer Kreuztabelle, Kontingenz- tafel bewerten?"—  Präsentation transkript:

1 1 Wie lässt sich die Stärke eines Zusammenhanges bei kategorialen Werten (nominalskalierten Werten) auf Basis einer Kreuztabelle, Kontingenz- tafel bewerten? Mit Hilfe der Differenz zwischen beobachteten und erwarteten Anzahlen

2 2 Brunnen A ErkranktNicht-erkrankt Brunnen B

3 3 Mädchen und gut Mädchen und schlecht Junge und gut Junge und schlecht Vier Felder Matrix

4 4 Mädchen und gut 345 Mädchen und schlecht 2 Junge und gut 8 Junge und schlecht 366 N = 721 Mädchen 347 Jungen 374 gut = 353 schlecht = 368

5 5 Eine Dreisatzaufgabe: Wenn von 721 Schülerinnen und Schülern 353 gut sind, wie viele müssten dann von 374 (Jungen) gut sein? 721 = = ? 353 mal = 183

6 6 Mädchen und gut 345 Mädchen und schlecht 2 Junge und gut 8 [erwartet 183] Junge und schlecht 366 N = 721 Mädchen 347 Jungen 374 gut = 353 schlecht = 368

7 7 Sie können diese Berechnung selbstverständlich auch als Dreisatz formulieren: von 80 (Gesamt) sind in Gram gut 32 von 40 (Gesamt in Geo gut) sind in Geo gut X Gerechnet wird:32 mal 40 = 1280 geteilt durch 80 = 16 Gibt es einen Zusammenhang zwischen den Leistungen in den Fächern Geographie und Grammatik?

8 8 Die Stärke des Zusammenhangs ergibt sich logisch aus der Größe der Differenz zwischen erwartet und beobachtet. Berechnet werden kann diese Stärke bspw. durch das sog. Chi-Quadrat.

9 9 Konvention über den Aufbau: abhängige Variable in die Spalte, unabhängige in Zeile

10 10 Summary Table: Expected Frequencies (Titanic) Marked cells have counts > 10 Pearson Chi-square: 190,401, df=3, p=0,00000 class survival - Survival survival - Missing Row - Totals First Class104, ,014325,000 Second Class92, ,935285,000 Third Class228, ,937706,000 Crew285, ,114885,000 All Grps711, , ,000

11 11 Berechnet werden die Zahlen Erwartet wie folgt: In der ersten Zeile wurden 203 Gerettete beobachtet. Die Gesamtzahl der Passagiere in der ersten Klasse betrug 325. Ingesamt wurden 711 Personen gerettet, an Bord waren insgesamt 2201 Personen. Die Rechnung lautet jetzt: 711 mal 325 = , geteilt durch 2201 macht 104,98 (~ 105) Sie können diese Berechnung selbstverständlich auch als Dreisatz formulieren: von 2201 (Gesamt) überlebten 711 von 325 (erste Klasse) überlebten X

12 12 Der Chi-Quadrat-Test zur Überprüfung der Unabhängigkeit von zwei Variablen Mit diesem Test kann die Unabhängigkeit von zwei Variablen, und damit indirekt auch die Größe des Zusammenhangs zwischen zwei Variablen geprüft werden. Von Bedeutung ist dieser Test bspw. wenn der Frage nachgegangen werden soll, ob – um bei dem Beispiel der Titanic zu bleiben – das Alter oder das Geschlecht eine größere Rolle bei der Frage des Überlebens gespielt hat. Dazu rufen wir wieder die Dialogbox Kreuztabelle auf und setzen wieder, wie auf der nächsten Folie ersichtlich, class in die Zeile und survival in die Spalte. Jetzt klicken wir das Fenster Statistik an und erhalten die folgende Dialogbox. Chi-Quadrat = (Wert beobachtet – Wert erwartet) 2 Wert erwartet

13 13

14 14

15 15 Chi-Quadrat

16 16 Betrachten wie nun die Tabellen und Werte des Chi-Quadrats: Damit haben wir für die Variablen Überleben/Klasse einen Chi-Quadrat-Test Wert von 190,401 und für die Variablen Überleben/Alter einen Wert von 20,956 Was sagen diese Werte aus?

17 17 Um diese Frage zu beantworten soll erläutert werden, wie die Werte errechnet werden. Aus der Kreuztabelle werden die Werte für Beobachtet und Erwartet jeder Zeile wie in der unteren Tabelle zu sehen voneinander abgezogen. Anschließend wird dieser Wert quadriert, (um nur positive Werte zu erhalten) und durch die erwarteten Werte dividiert. Diese Werte werden schließlich aufaddiert und wir erhalten den Wert des Chi-Quadrat-Tests! Beobachtet B Erwartet E B-E(B-E) ²(B-E)² /E , , , , , , , ,14 189,48

18 18 Um diese Frage zu beantworten soll erläutert werden, wie die Werte errechnet werden. Aus der Kreuztabelle werden die Werte für Beobachtet und Erwartet jeder Zeile wie in der unteren Tabelle zu sehen voneinander abgezogen. Anschließend wird die Wurzel aus dem Wert E gezogen, denn B-E durch die Wurzel E geteilt und schließlich wird das Ganze quadriert (um nur positive Werte zu erhalten). Diese Werte werden schließlich aufaddiert und wir erhalten den Wert des Chi-Quadrat-Tests! Beobachtet B Erwartet E B-ESQRT(E)B-E/SQRT(E)(B-E/SQRT (E))² ,24 9,5791, ,83-6,6043, ,59 2,71 7, ,89-1,87 3, ,09-3,3110, ,86 2,28 5, ,91-4,3719, ,47 3,02 9,12 190,32 Einige Lehrbücher berechnen den Wert so:

19 19 Um einen Aspekt zu verstehen, der diesem Wert entnommen werden kann, verdeutlichen wir uns einmal den Fall, bei dem der beobachtetet Wert nahezu dem erwarteten Wert entspricht: Beobachtet BErwartet EB-ESQRT(E)B-E/SQRT(E)(B-E/SQRT (E))² ,58 0,0640,00411 Beobachtet BErwartet EB-ESQRT(E)B-E/SQRT(E)(B-E/SQRT (E))² ,58 -15,53241,18 Anschließend den Wert, der einer maximal möglichen Abweichung entspricht: Dieser Vergleich zeigt (hoffentlich) deutlich (einen der) hier zugrunde liegenden Aspekte: Je höher der Chi-Quadrat-Test Wert, desto größer der Zusammenhang zwischen den betrachteten Variablen. Zurück zu der gestellten Frage ergibt sich folglich, dass die Variablen Klasse mit dem Chi-Quadrat-Test Wert von 190,401 einen höheren Zusammenhang zwischen dieser Variablen und dem Überleben aufweist, als die Variable Alter mit einem Wert von nur 20,956. Kurz: Mit Hilfe des Chi-Quadrat-Test Wertes kann die Stärke des Zusammen- hang zwischen verschiedenen Variablen vergleichend beurteilt werden.

20 20 Es ist auch möglich, um eine weitere Variante zu zeigen, sich die Chi- Quadrat-Werte geschichtet anzeigen zu lassen – eine ggf. übersichtlichere Darstellungsform. Es zeigt sich, dass von den hier vorliegenden Variablen die Kombination Female/Adult den größten Einfluss auf die Frage Überleben oder Nicht-Überleben hatte.

21 21 Wie lässt sich die Stärke eines Zusammenhanges bei numerischen Werten (intervallskalierten Werten) auf Basis einer Korrelationsanalyse bewerten? Mit Hilfe des sog. Korrelationskoeffizienten

22 22 Ausgangspunkt: Ein Streudiagramm oder Scatterplot Körperlänge Gewicht Für jede Person, jedes Objekt wird ein Wert erhoben oder gemessen und am Schnittpunkt der beiden Werte wird eine Markierung eingetragen

23 23 Ausgangspunkt: Ein Streudiagramm oder Scatterplot Körperlänge Gewicht

24 24 Ausgangspunkt: Ein Streudiagramm oder Scatterplot Körperlänge Gewicht

25 25 Ausgangspunkt: Ein Streudiagramm oder Scatterplot Körperlänge Gewicht Sog. Regressionsgrade

26 26 Ausgangspunkt: Ein Streudiagramm oder Scatterplot Körperlänge Gewicht Summe der kleinsten Quadrate

27 27 Ausgangspunkt: Ein Streudiagramm oder Scatterplot Korrelation: Je kleiner die Summe der kleinsten Quadrate, desto stärker der Zusammenhang Körperlänge Gewicht Summe der kleinsten Quadrate

28 28 Einzelwerte für Variable A Einzelwerte für Variable B Korrelationskoeffizient 0

29 29 Einzelwerte für Variable A Einzelwerte für Variable B Korrelationskoeffizient hoch, positiv

30 30 Einzelwerte für Variable A Einzelwerte für Variable B Korrelationskoeffizient hoch, negativ

31 31 Positiver korrelativer Zusammenhang: Je mehr, desto mehr Negativer korrelativer Zusammenhang: Je mehr, desto weniger Korrelationskoeffizient +1.0 Korrelationskoeffizient -1.0

32 32 Verlauf über die Zeit Leistungen in Klasse A und in Klasse B A B A A A A A A A A A A A B B B B B B B B B B B B B

33 33 Verlauf über die Zeit Leistungen in Klasse A und in Klasse B A B A A A A A A A A A A A B B B B B B B B B B B B B

34 34 Verlauf über die Zeit Leistungen in Klasse A und in Klasse B A B A A A A A A A A A A A B B B B B B B B B B B B B Ausreißer

35 35 Leistungen in Klasse B A A A A A A A A A A A A Böse Falle Null: Missing Value: Für eine Person liegen keine Angaben zu der Leistung in Klasse B vor 0 Leistungen in Klasse A

36 36 Scores of 12th graders on standardized tests (index for average: 100 pts) GEOMETRYREADINGGRAMMARDRAWINGCALCULUSHISTORYWRITINGSPELLING 198,65598,48398,09499,16397,85399,98796,85898, ,701100,39498,87097,872100,313103,135100,48098, ,39997,79998,82296,94996,796101,65796,90098, ,032100,207101,87698,15199,570102,063101,03599, ,96299,14798,88699,318100,372101,45798,85098, ,981102,662103,54498,11698,054102,774102,450104, ,02498,12497,37792,90492,288101,82698,89096, ,410106,941108,10998,65199,025107,434104,996106, ,32798,22897,282101,636102,193100,00497,96498, ,01499,28499,63498,33998,468101,214100,687101, ,35899,54899,599103,473103,778102,09199,77697, ,47099,21298,04797,71099,04799,46597,63295, ,689103,773104,64996,52495,386105,934103,168103, ,65796,93598,332102,945103,42897,20398,07699, ,58694,36794,817100,865102,70295,99096,30593, ,20297,45099,258101,766102,481100,47196,75699, ,536100,45599,534100,06099,558103,421100,778100, ,469100,80499,32297,41297,612103,92599,504101, ,98099,12897,710102,023103,068102,57998,05198, ,450103,106103,938100,84499,197106,890102,378103, ,607103,657103,662101,333100,136105,343103,572104,477

37 37 Beachten Sie den Korrelationsquotienten!

38 38 Beachten Sie den Korrelationsquotienten!

39 39 Welche Möglichkeiten des Umgangs mit fehlenden Werten gibt es? Y X Y X Bei kategorialen Merkmalen häufigste Ausprägung der k nächsten Nachbarn Bei metrischen Merkmalen durchschnittlicher Wert der k nächsten Nachbarn Aber auch: Missing Values rauswerfen!

40 40

41 41 Wie kann der Befund von Snow transformiert werden und wozu? Um Vergleiche zwischen den Stärken des Effekts möglich zu machen Um die wirkungsvollsten Interventionsansatz zu bestimmen Um die Wirkungen von Interventionen abschätzen zu können …..

42 42

43 43 Snow enthält kategoriale Daten: Brunnen An Cholera Verstorbene Wie ließen sich diese kategorialen Daten in numerische übertragen?

44 44 Beispiel:

45 45 Distanz Anzahl der Erkrankten

46 46 Distanz Anzahl der Erkrankten

47 47 Distanz Anzahl der Erkrankten

48 48 Distanz Anzahl der Erkrankten Schwelle

49 49 Distanz Anzahl der Erkrankten

50 50

51 51

52 52

53 53

54 54 schlecht gut

55 55 Unterschiede messen MedianMean Median ist der Punkt, bei dem die eine Hälfte der Werte oberhalb und die andere unterhalb dieses Punktes liegt Der Mittelwert wird berechnet durch die Summe aller Werte geteilt durch die Anzahl der Werte

56 56 X = xixi n Mathematisch wird die Berechnung des Mittelwertes so dargestellt: X ausgesprochen: X Strich oder x quer ist das Symbol für den Mittelwert dies ist der griechische Großbuchstabe für Sigma und das sog. Summenzeichen, d.h. alle Messwerte müssen addiert werden xixi dieses Zeichen steht für sämtliche Einzelmesswerte n und n steht schließlich für die Anzahl der durchgeführten Messungen

57 57 Unterschiede messen Zwei weit verbreite, einfache Methoden: Zwischen zwei Klassen unterscheiden: Gut Schlecht Zwischen vier (oder einer anderen Anzahl von) Perzentilen unterscheiden

58 58 Unterschiede messen Keine Variation vorhanden

59 59 Unterschiede messen In welchem Maß ist Variation vorhanden? Erste Ebene: Spannbreite (R für range) R = X max – X min

60 60 Unterschiede messen In welchem Maß ist Variation vorhanden? Zweite Ebene: Summe der quadrierten Fehler (Abweichungen) Mean σ² = xixi X - () n - 1 2

61 61 Unterschiede messen In welchem Maß ist Variation vorhanden? Dritte Ebene: Standardabweichung Mean σ = xixi X - () n - 1 2

62 62 Unterschiede messen In welchem Maß ist Variation vorhanden? Vierte Ebene: z-Transformation Abstand jeder Messung zum Mittelwert, geteilt durch die Standardabweichung z = xixi X - σxσx Alle Mittelwerte werden Null, die Abstände werden standardisiert; die relative Lage jeder Messung kann verglichen werden Mean 0

63 63

64 64 (leicht hinkender Vergleich) Sie wollen verschieden formatige, verschieden große Bilder auf eine Seite bringen

65 65 (leicht hinkender Vergleich) Sie wollen verschieden formatige, verschieden große Bilder auf eine Seite bringen

66 66 Mittelwerte: 64,55 49,26 Std.-Abw.: 11,623 29,831

67 67 Wirkung der Z-Transformation:

68 Mit Hilfe dieser Grafik wird erkennbar, was die Prozentränge im Unterschied zu den Z-standardisierten Werten angeben: Am linken Rand sind die Rohwerte abgetragen, am oberen Rand die Prozentränge und am unteren Rand die z-standardisierten Werte. Wie ersichtlich, hat der höchste Rohwert den Prozentrang 100 und den Z-Wert +3. Der niedrigste Rohwert hingegen den Prozentrang 1,25 und den Z-Wert -2.

69 69 Prozentränge cum f % = 100 cum f N RohwertFällefcum fcum f %PR , , , , ,03 (N = 300) 300 = 100 % 9 = x %

70 70 sog. Absoluter Rangwert: 1. Rang + 2. Rang/2 = 1,5 Werte mal 100/Max-Wert: 2*100 = 200/30 = 6,66666 Relative Rangfolge in %: 20 = 100 % 1,5 = x % Z-Transformation

71 71

72 72

73 73

74 74

75 75

76 76

77 77

78 78

79 79

80 80

81 81

82 82

83 Rangreihe: Einfache Aussage über Reihenfolge Hohe Reliabilität, etwa durch Paarvergleich Keine Informationen über Abstände Vergleichbarkeit nur bei identischen Ns

84 Quartile: Grobe Aussage über die Stellung in einer Reihe Hohe Reliabilität, weil recht simpel Sehr grobe Informationen über Abstände Einfache Vergleichbarkeit über verschiedene Bereiche hinweg I. QuartilII. QuartilIII. QuartilVI. Quartil

85 85 Prozentrang: Aussage über die Stellung in einer Reihe Reliabilität von der Messung abhängig Keine Informationen über Abstände Einfache Vergleichbar- keit über verschiedene Bereiche hinweg WerteQuartilProzentrang , , , , , , , , , ,00

86 86 Relativer Prozentrang: (100*Wert)/MaxWert Genaue Aussage über die Stellung in einer Reihe Reliabilität von der Messung abhängig Informationen über Abstände Einfache Vergleichbar- keit über verschiedene Bereiche hinweg WerteRelativer Prozentrang 30100, , , , , ,67 620,00 516,67 13,33 0,00

87 87

88 88 WerteRel. %Z-WerteNote 30100,001, ,331, ,00, ,33, ,00-, ,67-, ,00-, ,67-, ,33-1, ,00-1,222345

89 89 Umwandlung eines numerischen Wertes in einen kategorialen Wert

90 90 Deskriptive Statistik (School perfomance) Gült. NMittelw.MedianMinimumMaximumStdabw. WRITING8099, , , ,11183,377652

91 91 Mittelwert: Arithmetisches Mittel = Summe aller beobachteten Merkmalswerte dividiert durch die Anzahl der Beobachtungen Median (auch Zentral- oder 50% Wert): Der Median ist der Wert für den gilt, dass 50% aller Werte größer oder gleich sind. Der Median halbiert die Stichprobenverteilung

92 92 Deskriptive Statistik (School perfomance) Gült. NMittelw.MedianMinimumMaximumStdabw. WRITING90121, ,194493, ,000066,48269

93 93 Gült. NMittelw.MedianMinimumMaximumStdabw. WRITING8099, , , ,11183, Gült. NMittelw.MedianMinimumMaximumStdabw. WRITING90121, ,194493, ,000066,48269

94 94

95 95 Gruppenzugehörigkeit: A Gruppenzugehörigkeit: B Gruppenzugehörigkeit: C

96 96 Gibt es Muster in der Verteilung?

97 97

98 98

99 99

100 100 Fisher (1936) Irisdaten: Länge und Breite von Blättern und Kelchen für 3 Iristypen KelchlängeKelchbreiteBlattlängeBlattbreiteIristyp 153,31,40,2Setosa 26,42,85,62,2Virginic 36,52,84,61,5Versicol 46,73,15,62,4Virginic 56,32,85,11,5Virginic 64,63,41,40,3Setosa 76,93,15,12,3Virginic 86,22,24,51,5Versicol 95,93,24,81,8Versicol 104,63,610,2Setosa 116,134,61,4Versicol 1262,75,11,6Versicol 136,535,22Virginic 145,62,53,91,1Versicol 156,535,51,8Virginic 165,82,75,11,9Virginic 176,83,25,92,3Virginic 185,13,31,70,5Setosa 195,72,84,51,3Versicol 206,23,45,42,3Virginic 217,73,86,72,2Virginic 226,33,34,71,6Versicol 236,73,35,72,5Virginic 247,636,62,1Virginic 254,92,54,51,7Virginic Durch was unterscheiden sich die drei Iristypen?

101 101 Kategoriale Werte (gut/schlecht) Metrische Werte (1, 2, 3, 4,..) [Nominale, Ordinale Werte] Split: Welche Variable trennt am besten bei welchem Wert? CART (classification and regression trees)

102 102

103 103

104 104

105 105

106 106

107 107

108 108

109 109

110 110

111 111

112 112

113 113

114 114

115 115

116 116

117 117

118 118 Fehlklassifikationsmatrix Lernstichprobe (Irisdat) Matrix progn. (Zeile) x beob. (Spalte) Lernstichprobe N = 150 Klasse - SetosaKlasse - VersicolKlasse - Virginic Setosa00 Versicol04 Virginic02 Prognost. Klasse x Beob. Klasse n's (Irisdat) Matrix progn. (Zeile) x beob. (Spalte) Lernstichprobe N = 150 Klasse - SetosaKlasse - VersicolKlasse - Virginic Setosa5000 Versicol0484 Virginic0246

119 119 Split-Bedingung (Irisdat) Split-Bedingung je Knoten Split - Konst.Split - Variable 1-2,09578Blattlänge 2 3-1,64421Blattbreite

120 120

121 121

122 122

123 123 Zwei, von vielen Problemen: Feature Choise Overfitting, Underfitting

124 124 Zwei, von vielen Problemen: Feature Choise Overfitting, Underfitting

125 125 a b Kategoriale Splits < 0,5 > 0,5 < 0,5> 0,5, < 1,8> 1,8 Bivariate Splits Multivariate Splits

126 126 Wie kann man dieses Problem lösen? Etwa mit Hilfe einer sog. Kreuzvalidierung: Alle Daten Teilmenge Analyse und Modellbildung Anwendung auf andere Teilmenge

127 127 Daten teilen Trainings- daten Validierungs- daten Modell- bewertung

128 128 Vierter Schritt: Wovon ist gut oder schlecht abhängig? Güte der erreichten Aufklärung überprüfen

129 129

130 130 Practical Significance Statistical Significance

131 131 Practical Significance Statistical Significance Datensatz 50% Datensatz Modell/Zusammenhang Zufall Modell/Zusammenhang = Zufall? Modell/Zusammenhang >/< Zufall? Was, wenn kein Zusammenhang?

132 132 Zusammenfassung der behandelten methodischen Ansätze: Eine bislang unbehandelte Frage lautet: Wie aussagekräftig sind die jeweils gewonnenen Befunde?

133 133 Folgende Hypothese soll geprüft werden: H 0 Person A besitzt keine hellseherischen Fähigkeiten H 1 Person A verfügt über hellseherische Fähigkeiten Unter welchen Bedingungen kann H 0 bestätigt/verworfen werden? Unter welchen Bedingungen kann H 1 bestätigt/verworfen werden? Es gibt Konventionen, die als Grundlage der Entscheidung genutzt werden können/sollten: Das Signifikanzniveau. IrrtumswahrscheinlichkeitBedeutungSymbolisierung p > 0,05nicht signifikantns p <= 0,05signifikant* p <= 0,01sehr signifikant** p <= 0,001höchst signifikant***

134 134 Wie groß ist die Wahrscheinlichkeit dreimal Kopf zu erhalten, wenn drei mal eine Münze geworfen wird? Dazu müssen wir uns die Möglichkeiten vor Augen führen: (K = Kopf; W = Wappen) WWW, WWK, WKW, KWW, WKK, KWK, KKW und KKK Wir haben folglich 8 Möglichkeiten, davon erfüllt eine unsere Bedingung. Die Wahrscheinlichkeit p ist demnach 1/8 oder 0,125.

135 135 Wahrscheinlichkeit p bei drei Würfen

136 136 Wie groß ist die Wahrscheinlichkeit viermal Kopf zu erhalten, wenn vier mal eine Münze geworfen wird? Dazu erneut die Möglichkeiten: (K = Kopf; W = Wappen) W W W WK K K KW W K KK W K W W W W KK K K WW K K WW K W K W W K WK K W KK K W W W K W WK W K KK W W K K W W WW K K K Wir haben folglich 16 Möglichkeiten, davon erfüllt eine unsere Bedingung. Die Wahrscheinlichkeit p ist demnach 1/16 oder 0,0625.

137 137 Signifikanzstufen IrrtumswahrscheinlichkeitBedeutungSymbolisierung p > 0,05nicht signifikantns p <= 0,05signifikant* p <= 0,01sehr signifikant** p <= 0,001höchst signifikant***

138 138 Ein Wert von p = 0.05 besagt unter der Annahme, dass kein Effekt existiert, dass – vereinfacht aus- gedrückt, puristische Methodiker mögen mit der Stirn runzeln – bei dieser Stichprobengröße ein mindestens so großer Effekt nur in 5% aller vergleichbar angelegter Studien beobachtet werden kann. Rost 2007, 81

139 139 Irrtumswahrscheinlichkeit: Ein p = 0,03 bedeutet: Die Wahrscheinlichkeit, dass unter der Annahme, die Nullhypothese sei richtig, das gegebene Untersuchungsergebnis oder ein noch extremeres auftritt, beträgt 0,03 oder 3%. Signifikanzstufen p <= 0,05signifikant* p <= 0,01sehr signifikant** p <= 0,001höchst signifikant***

140 140 Ergebnis einer hypothetischen Studie, in der die Ausbildung von Paaren verglichen wird (aus: Sedlmeier & Renkewitz 2008, 370): PartnerPartnerinVorzeichen StudiumRealschule + GymnasiumRealschule + Gymnasium = Es finden sich somit 7 positive Vorzeichen. Ist das Ergebnis auf dem 5% Niveau signifikant? Wie hoch ist die Wahrscheinlichkeit für 0, 1, 2 etc. positive Vorzeichen? Vorzeichentest nach Fischer

141 141

142 142 Wenn, wie im vorliegenden Fall, von zehn Paaren sieben ein positives Vorzeichen aufweisen (Bildungsabschluss des männlichen Partners höher als der des weiblich), dann liegt die Wahrscheinlichkeit dafür: 0,1 % + 1,0 % + 4,4 % + 11,7 % = 17,2 % Es wäre gemäß der Konvention also falsch, daraus irgendwelche Schlussfolgerungen zu ziehen.

143 143 Erstellen einer einfachen Probedatei mit folgendem Inhalt:

144 144 Bei zwei Beobachtungen pro Schulform ergeben sich damit 3 mal 8 = 24 Kombinationsmöglichkeiten: SchulformAbschluss

145 145 Die Wahrscheinlichkeit p ist demnach für eine Abweichung von einem Fall bei sechs Beobachtungen 01/06 entspricht der Wahrscheinlichkeit vom 8/24 p = 0,33333

146 146

147 147

148 148

149 149

150 150

151 151

152 152

153 153

154 154

155 155 N = 80

156 156 N = 4

157 157 N = 8

158 158 N = 16

159 159

160 160 N = 80

161 161 N = 4

162 162 N = 4

163 163 N = 8

164 164 N = 16


Herunterladen ppt "1 Wie lässt sich die Stärke eines Zusammenhanges bei kategorialen Werten (nominalskalierten Werten) auf Basis einer Kreuztabelle, Kontingenz- tafel bewerten?"

Ähnliche Präsentationen


Google-Anzeigen