Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistik für die Erziehungswissenschaft

Ähnliche Präsentationen


Präsentation zum Thema: "Statistik für die Erziehungswissenschaft"—  Präsentation transkript:

1 Statistik für die Erziehungswissenschaft
Lösungen zu allen Übungsteilen Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

2 Kapitel 1 - Lösungen I Was steht am Anfang jedes Forschungsprojektes? Problemwahl, Forschungsfrage Was ist empirische Sozialforschung? Systematische (= nach Regeln) Erfassung und Deutung sozialer Tatbestände (= beobachtbares, menschliches Verhalten, von Menschen geschaffene Gegenstände sowie durch Sprache vermittelte Meinungen, Informationen über Erfahrungen, Einstellungen, Werturteile, Absichten u.a.m.) empirisch = erfahrungsgemäß, bzw. theoretisch formulierte Annahmen, die an spezifischen Wirklichkeiten überprüft werden. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

3 Kapitel 1 - Lösungen II Für welche Form der Definition gilt die folgende Aussage: „Solche Definitionen können weder wahr noch falsch sein.“  a) Nominaldefinition  b) Realdefinition Was ist eine Hypothese?  a) eine Behauptung, die sich auf subjektiver Erfahrung begründet  b) eine allgemeine Aussagen über Zusammenhänge zweier Variablen  c) eine wissenschaftliche Aussagen mit Anspruch auf Richtigkeit Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

4 Kapitel 1 - Lösungen III Erläutern sie den Unterschied zwischen einer unabhängigen und einer abhängigen Variable Eine unabhängige Variable kann im Design der Forschungsfrage durch den Versuchsleiter beeinflusst werden. Die abhängige Variable wird in Abhängigkeit von der unabhängigen Variable untersucht und mit dieser in Zusammenhang gebracht. In einem Experiment wird untersucht, inwiefern sich überhöhter Kaffeegenuss auf die Nervosität auswirkt. Was ist in diesem Setting die unabhängige, was die abhängige Variable? Unabhängige Variable: Kaffeegenuss Abhängige Variable: Nervosität Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

5 Kapitel 1 - Lösungen IV Was bedeutet „Falsifikationsprinzip“?  a) Aussagen werden überprüft und bewahrheitet.  b) Aussagen werden überprüft und gegebenenfalls widerlegt, können aber nicht bewahrheitet werden.  c) Aussagen werden überprüft und unabhängig von dem Ergebnis als wahr angenommen. Bringen Sie die Schritte des Forschungsprozesses in die richtige Reihenfolge. A) Analysephase B) Definitionsphase C) Disseminationsphase D) Durchführungsphase Reihenfolge:___B D A C_____________________________ Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

6 Kapitel 2 - Lösungen I Nennen Sie mindestens drei verschiedene Forschungsdesigns. Querschnittuntersuchungen Längsschnittuntersuchungen prospektive / retrospektive Studien experimentelle Untersuchungen Quasiexperimentelle Untersuchungen Wie viele Messzeitpunkte hat eine Längsschnittstudie mindestens? Sie muss mindestens zwei Messzeitpunkte haben. Was ist der Unterschied zwischen einer Panelstudie und einer Trendanalyse und was ihre Gemeinsamkeit? Eine Panelstudie befragt die gleichen Personen zu unterschiedlichen Zeitpunkten und eine Trendanalyse befragt unterschiedliche Personen zu unterschiedlichen Zeitpunkten. Bei beiden Designs handelt es sich um Längsschnittuntersuchungen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

7 Kapitel 2 - Lösungen II In einer experimentellen Untersuchung wird gewöhnlich eine Gruppe von Probanden gebildet, die nicht dem Treatment ausgesetzt werden. Wie bezeichnet man diese Gruppe?  a) Doppel-Blind-Gruppe  b) Versuchsgruppe  c) Kontrollgruppe Beschreiben Sie den Aufbau eines Doppel-Blind-Versuchs. Weder der wissenschaftliche Personal, das die Versuche durchführt, noch die Versuchspersonen wissen, wer zur Versuchs- und wer zur Kontrollgruppe gehört. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

8 Kapitel 2 - Lösungen III Versuchen sie, mindestens zwei Indikatoren zu benennen für: - Verwahrlosung: Wohnungssituation, Bindungsverhalten - Medieneinsatz in Seminaren: Beamereinsatz, Flipchartbenutzung - Aufmerksamkeit von StudentInnen: Gesichtausdruck, Beteiligung - gesunde Lebensweise: regelmäßige sportliche Betätigung, Essverhalten Betrachten sie die folgende Aussage: „Im weitesten Sinne ist Messen die Zuordnung von Zahlen zu Objekten / Ereignissen anhand bestimmter Regeln.“ Welcher Begriff dieser Aussage beschreibt das empirische Relativ?  a) Objekte / Ereignisse  b) bestimmte Regeln  c) Zahlen Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

9 Kapitel 2 - Lösungen IV Welches Gütekriterium wird durch die folgende Definition beschrieben: „??? bezeichnet die Gültigkeit eines Indikators. Dies ist der Fall, wenn der Indikator tatsächlich den Sachverhalt anzeigt, der mit dem definierten Begriff bezeichnet worden ist.“  a) Validität  b) Objektivität  c) Relativität Was versteht man unter Reliabilität? Reliabilität ist die Reproduzierbarkeit von Ergebnissen unter den gleichen intersubjektiven Bedingungen, also insbesondere die Forderung, dass andere Forscher bei Anwendung desselben Erhebungsinstruments in Interaktion mit demselben Untersuchungsgegenstand zu demselben Ergebnis gelangen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

10 Kapitel 2 - Lösungen V Welche Aussagen sind aufgrund des Skalenniveaus der Daten möglich bei: Bsp: Nominalskalenniveau: Gleichheit / Verschiedenheit (= / ≠) Ordinalskalenniveau: Relationen (= / ≠; < / >) Intervallskalenniveau: Gleichheit von Differenzen (= / ≠; < / >; + / -) Verhältnisskalenniveau: Verhältnisaussagen (= / ≠; < / >; + / -; doppelt so groß, halb so groß o.ä.) Nennen Sie je zwei Beispiele für nominale, ordinale und intervallskalierte Merkmale. nominal: Geschlecht, Religionszugehörigkeit ordinal: BAT Gehaltsgruppen, Militärrang intervall: Einstufen auf einer Skala, Zeugnisnoten Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

11 Kapitel 2 - Lösungen VI Um welches Skalenniveau handelt es sich bei den folgenden Daten: (Auszüge aus Fragebögen zum Ankreuzen) Raucher/Nichtraucher Skalenniveau: Nominal Ich mag Statistik sehr gerne / gerne / teils-teils / nicht so / gar nicht Skalenniveau: Intervall Ich mag am liebsten bis am wenigsten (bringen sie die Aussagen in eine Reihenfolge) Bücher lesen / Fahrrad fahren / segeln / Radio hören / Kino / Theater / Fernsehen Skalenniveau: Ordinal Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

12 Kapitel 3 – Lösungen I Man hat 25 Studenten nach der Anzahl der von ihnen gelesenen Zeitschriften/Periodika befragt und folgende Daten ermittelt: 1,1,1,1,1,1, 2,2,2, 3,3,3,3,3,3, 4,4, 5,5,5,5, 8, 9,9, 10 Erstellen Sie eine Häufigkeitstabelle nach folgendem Muster Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

13 Kapitel 3 – Lösungen II Kreuzen Sie an:
Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

14 Kapitel 3 – Lösungen III Zeichnen Sie zu folgender Häufigkeitsverteilung, welche die Anzahl der abonnierten Zeitschrift von 25 Studierenden wiedergibt, ein vertikales Balkendiagramm. Erstellen Sie zu den gleichen Daten ein so genanntes Histogramm (Balkendiagramm mit kategorisierten Daten), indem Sie 5 Kategorien bilden. Wählen Sie dabei eine Kategorienbreite von 2. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

15 Kapitel 3 – Lösungen IV Wodurch unterscheidet sich das Histogramm vom Balkendiagramm? Der wesentliche Unterschied ist die Einteilung der x-Achse: Während bei einem Balkendiagramm meist nur die vorkommenden Kategorien abgetragen werden, deckt die Einteilung beim Histogramm die gesamte Breite zwischen der minimalsten und maximalsten Kategorie mit gleichen Abständen ab. Ein Histogramm gibt detaillierte Informationen über die Verteilung der erhobenen Variablen. Aus einem Balkendiagramm können detaillierte Informationen über die Häufigkeiten abgelesen werden. Bei einem Histogramm werden zwecks Übersicht oftmals Kategorien zusammengefasst. Im obigen Histogramm entstanden aus den Kategorien 1-2, 3-4, 5-6, 7-8 und 9-10 fünf neue Kategorien, wobei die jeweiligen Balkenhöhen/Häufigkeiten addiert wurden. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

16 Kapitel 3 – Lösungen V Bilden Sie Kategorien über die folgenden Daten:
Körpergröße 1,22 m, 1,27m, 1,38m, 1,45m, 1,67m, 1,90m Es sollen 4 bzw. 2 Kategorien gebildet werden und dazu jeweils die Häufigkeiten der Kategorie in der Tabelle aufgeführt werden. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

17 Kapitel 4 – Lösungen I Kreuzen Sie an, welches Maß der zentralen Tendenz mit den Daten des jeweiligen Skalenniveaus berechnet werden darf. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

18 Kapitel 4 – Lösungen II Ordnen Sie die Aussagen einem Maß der zentralen Tendenz zu. a) Modus b) Median c) Mittelwert Der Wert liegt genau in der Mitte aller Werte und teilt somit alle Daten in zwei Hälften. 50% der Werte liegen unterhalb des Wertes, 50% der Werte liegen oberhalb dieses Wertes  a  b  c Der Wert gibt die numerische Mitte aller Einzelwerte an. Es müssen nicht notwendigerweise 50% der Daten unter- bzw. oberhalb dieses Wertes liegen.  a  b  c Der Wert gibt an, welcher Wert am häufigsten in den Daten vorkommt.  a  b  c Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

19 Kapitel 4 – Lösungen III Was sagt der Wert des arithmetischen Mittels (Mittelwert) aus, wenn ich von der Normalverteilung ausgehe? Ausgehend von der Normalverteilung liegen 50% der Testpersonen über, und 50% unter dem arithmetischen Mittel (Mittelwert). In diesem Fall entspricht der Mittelwert dem Median (s. Aufgabe 2, Kapitel 4). Bei einem kognitiven Test für Kleinkinder (Zusammenlegen eines Puzzles in einer bestimmten Zeit) seien die Werte normalverteilt, der Mittelwert betrage 120 Sekunden, die Standardabweichung sei 10 Sek. Wie viele Messwerte liegen dann zwischen 110 und 130 Sekunden?  a) etwa 95%  b) etwa 68%  c) etwa 50%  d) etwa 33% Eine Verteilung, bei der der Modus rechts vom arithmetischen Mittel liegt, bezeichnet man als ...  a) symmetrisch  b) bimodal  c) rechtssteil  d) glockenförmig Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

20 Kapitel 4 – Lösungen IV Die folgenden Daten geben an, wie viele richtige Antworten in einem Test gegeben wurden. Berechnen Sie die Varianz und die Standardabweichung. N= 9 20,11 = 4,34 S = 2,08 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

21 Kapitel 4 – Lösungen V 6.a) Welche Aussagen kann man anhand der berechneten Daten machen? Unter Annahme der Normalverteilung der Daten kann man sagen: Zwischen 18,03 und 22,19 liegen 68% der Werte. Zwischen 15,95 und 24,27 liegen 95% der Werte. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

22 Kapitel 4 – Lösungen VI Der Mittelwert eines Tests betrage 50, die Standardabweichung 7,5. Eine Person habe den Test mit 57,5 Punkten abgeschlossen. Berechnen Sie den z-Wert mithilfe der z-Transformation. Wozu dient die z-Transformation? Zum transformieren der Daten in die Standardnormalverteilung. So werden zum Beispiel Testwerte zweier Personen aus verschiedenen Tests vergleichbar gemacht. Welche Aussagen kann man aufgrund des oben berechneten z-Wertes machen? 84,13 % sind schlechter oder gleich unserer Versuchsperson. nur 15,87 % sind besser als unsere Versuchsperson. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

23 Kapitel 4 – Lösungen VII Folgende Häufigkeitstabelle gibt die Anzahl der abonnierten Zeitschrift im Monat von 25 Studierenden wieder. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

24 Kapitel 5 - Lösungen I Wie wahrscheinlich ist es, dass
a) beim Münzwurf 4 mal hintereinander Zahl kommt. n= 4 k= 4 p= 0,  P=0,0625 b) beim Münzwurf bei 7 Würfen 5 mal Kopf zu werfen n= 7 k= 5 p= 0,  P=0,1641 c) bei 4 Münzwürfen 2 mal Zahl zu werfen n= 4 k= 2 p= 0,  P=0,3750 d) beim Würfeln von 6 Würfen 3mal hintereinander eine 6 zu bekommen. n= 6 k= 3 p= 1/6  0,  P=0,0415 e) beim Würfeln von 5 Würfen 4mal hintereinander eine 1 zu bekommen. n= 5 k= 4 p= 1/6  0,  P=0,0022 Benutzen Sie zur Lösung die Tabelle der Binomialverteilung. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

25 Kapitel 5 - Lösungen II Was ist der Unterschied zwischen der Normalverteilung und der Standardnormalverteilung? Die Normalverteilung geht davon aus, dass der Mittelwert genau die Mitte der Daten abbildet (also 50% der Daten unter- bzw. oberhalb des Mittelwertes liegen. Bei der Standardnormalverteilung ist dieser Mittelwert genau auf den Wert festgelegt, die Standardabweichung auf den Wert S = 1. Mit der z-Transformation kann jeder beliebige Wert in einen Wert der Standardnormalverteilung „übersetzt“ (transformiert) werden. Was bildet die folgende Grafik ab? Eine Normalverteilung oder eine Standardnormalverteilung? Begründen Sie ihre Antwort. Da auf der Grafik der Mittelwert nicht mit der Wert 0 gekennzeichnet ist, handelt es sich lediglich um eine beliebige Normalverteilung. Die Regel, 68% der Werte liegen zwischen -1 bis 1 Standardabweichung (bzw. 95,5% der Werte zwischen -2 bis 2 Standardab-weichungen) gilt für alle Normalverteilungen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

26 Kapitel 5 - Lösungen III Was ist ein Elementarereignis? Ein Elementarereignis ist ein bestimmtes Ereignis, dass bei einem Zufallsexperiment auftreten kann. Z.B. beim Würfeln eine 1 zu würfeln ist ein Elementarereignis. Was ist der Ereignisraum eines Zufallsexperiments? Der Ereignisraum eines Zufallsexperiments umfasst alle möglichen Elementarereignisse, die während des Experiments eintreten können. z.B. ist das Elementarereignis, eine 1 zu würfeln nur eins von sechs möglichen Elementarereignissen. Möglich wäre auch eine 2, 3 usw. zu würfeln. Der Mittelwert eines Tests betrage 10, die Standardabweichung 2. Eine Person habe den Test mit dem Wert 8 abgeschlossen, bestimmen Sie den z-Wert. z = (8-10) / 2 = -2 / 2 = -1 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

27 Kapitel 5 - Lösungen IV Andreas hat im Untertest I eines Intelligenztest den Punktwert 70 erreicht und im Untertest II den Punktwert 8. Das Testmanual weist folgende Normwerte für die beiden Untertests auf; für beide Untertests liegt Normalverteilung vor: Norm für Untertest I: arithm. Mittel = 65 Standardabweichung = 5 Norm für Untertest II: arithm. Mittel = 6 Standardabweichung = 1 a) Hat Andreas in Untertest I oder in Untertest II besser abgeschnitten? Die Standardisierung mit z-Transformation ergibt folgende Werte: z(I) = (70-65)/5 = 1 z(II) = (8-6)/1 = 2 Aus z(II) > z(I) folgt, dass Andreas im Untertest II besser abgeschnitten hat. b) Wie hoch ist die Wahrscheinlichkeit für die in den beiden Untertests erreichten und alle kleineren Punktwerte? Benutzen Sie zur Lösung die Tabelle der Normalverteilung. p(z2) = 0,9772 p(z1) = 0,8413 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

28 Kapitel 6 - Lösungen I Formulieren Sie eine Alternativ- und eine Nullhypothese zu den Variablen: V1: Männer/Frauen V2: Pädagogik als Studienfach ja/nein H0: Männer und Frauen unterscheiden sich nicht in ihrer Entscheidung, ob sie Pädagogik als Studienfach wählen oder nicht H1: Männer und Frauen unterscheiden sich in ihrer Entscheidung, Pädagogik zu studieren oder nicht. Was ist der Unterschied zwischen einer gerichteten und einer ungerichteten Hypothese? Eine gerichtete Hypothese gibt bereits die Richtung des Zusammenhangs an. Bsp.: Männer wählen eher Pädagogik als Studienfach als Frauen. Ungerichtete Hypothesen geben keine Richtung des Zusammenhangs an. Bsp.: Männer und Frauen unterscheiden sich in ihrer Entscheidung, Pädagogik als Studienfach zu wählen. Wie ist die Nullhypothese formuliert? Es ist immer die Hypothese, die von keinem Unterschied / Zusammenhang zwischen den untersuchten Variablen ausgeht oder (bei gerichteten Hypothesen) von keinem Zusammenhang UND der anderen Richtung des Zusammenhangs als die Alternativhypothese. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

29 Kapitel 6 - Lösungen II Was ist die Irrtumswahrscheinlichkeit?
 a) die Wahrscheinlichkeit, mit einer Entscheidung für die Alternativhypothese (aufgrund der Stichprobe) zu irren, da in der Population die Nullhypothese gilt.  b) die Wahrscheinlichkeit, mit einer Entscheidung für die Nullhypothese zu irren, da in der Population die Alternativhypothese gilt.  c) die Wahrscheinlichkeit, dass die Nullhypothese zutrifft (in der Population)  d) die Wahrscheinlichkeit, dass die Alternativhypothese zutrifft (in der Population) Warum ist die Nullhypothese so wichtig? Bevor die Ergebnisse einer Untersuchung vorliegen, gilt immer die Nullhypothese. Sie ist somit die Forschungsbasis. Im Verlauf der Studie kann auch lediglich die Wahrscheinlichkeit minimiert werden, dass die Nullhypothese zutrifft und somit die Alternativhypothese gilt. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

30 Kapitel 6 - Lösungen III In der Forschung können Fehler begangen werden, die möglichst vermieden werden sollten. Einen α-Fehler begeht man, wenn  man sich aufgrund der Stichprobe für die H0 entscheidet, obwohl in der Population die H1 gilt.  man sich aufgrund der Population für eine zu große Stichprobe entscheidet.  man sich aufgrund der Stichprobe für die H1 entscheidet, obwohl in der Population die H0 gilt.  man sich aufgrund der Stichprobe für eine zu große Population entscheidet. 6a. Die Irrtumswahrscheinlichkeit ist somit die Wahrscheinlichkeit, einen α-Fehler zu begehen wahr  falsch  Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

31 Kapitel 6 - Lösungen IV Welche Signifikanzniveaus werden in der Statistik üblicherweise verwendet?  a) das 5%- und das 1%-Niveau  b) das 95%- und das 99%-Niveau  c) das 0,5%- und das 0,1%-Niveau Was sagen die %-Zahlen des Signifikanzniveaus aus?  sie geben die Irrtumswahrscheinlichkeit an.  sie geben den Anteil der Leute an, die in der Studie falsche Antworten gegeben haben  sie geben den Prozentsatz an, zu dem das Ergebnis signifikant (=bedeutend) ist. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

32 Kapitel 7 - Lösungen I Der T-Test dient (richtige Lösung bitte ankreuzen)  zum Testen eines Stichprobenmittelwertes auf Abweichungen von der Grundgesamtheit  zum Testen von Unterschieden von Stichprobenmittelwerten  zum Testen der Güte von Getränken (Tee, Kaffee etc.) Lesen Sie die Werte in der Tabelle ab. Welcher T-Wert ist zu überschreiten für: df=12 5% Niveau einseitige Fragestellung Das einseitige 5% Niveau entspricht der Wahrscheinlichkeit (Fläche unter der t-Kurve): p = 1- = = 0.95 t (df=12, p=0.95) = 1,782 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

33 Kapitel 7 – Lösungen II Fortsetzung
df=12 5% Niveau zweiseitige Fragestellung Das zweiseitige 5% Niveau entspricht p = 1-/2 = = 0.975 t (df=12, p=0.975) = 2,179 df=20 1% Niveau einseitige Fragestellung t (df=20, p=0.99) = 2,528 df=29 1% Niveau zweiseitige Fragestellung t (df=29, p=0.995) = 2,756 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

34 Kapitel 7 – Lösungen III In der Studentenstudie 2000 ergaben sich folgende Altersmittelwerte von Männern und Frauen: Mit einem geeigneten Test (t-Test) wurde überprüft, ob sich Männer und Frauen bezüglich ihres Alters unterscheiden. Es ergab sich eine 2-seitige Irrtumswahrscheinlichkeit von p=0,664. a) Formulieren Sie eine geeignete Nullhypothese und eine Alternativhypothese. H0: Männliche und weibliche Besucher der Statistik-VL unterscheiden sich in ihrem Durchschnittsalter. H1: Männliche und weibliche Besucher der Statistik-VL unterscheiden sich nicht in ihrem Durchschnittsalter. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

35 Kapitel 7 – Lösungen IV b) Spricht die Irrtumswahrscheinlichkeit von p=0,664 für oder gegen die Alternativhypothese? Was bedeutet das inhaltlich? Das spricht eindeutig für die Nullhypothese, weil die Irrtumswahrscheinlichkeit 66,4% größer als 5% ist. Also unterscheiden sich die Studenten nicht signifikant von den Studentinnen, welche die Statistik-VL besuchen, hinsichtlich ihres Alters. c) Formulieren Sie eine geeignete gerichtete Alternativhypothese. Betrachten Sie dazu die in der Tabelle angegebenen Werte. H1: Männliche Besucher der Statistik-VL sind durchschnittlich älter als weibliche. d) Wie groß darf grundsätzlich die Irrtumswahrscheinlichkeit p höchstens sein, damit Sie ein hochsignifikantes Ergebnis erhalten? p muss echt kleiner als 1% sein. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

36 Kapitel 7 – Lösungen V Sie haben in einer Studie mit zwei Gruppen zu je 21 Probanden eine Prüfgröße t von 2,2 ermittelt. Nun schlagen Sie in der Tabelle nach und entnehmen dieser für df=40 auf dem 5% Niveau einen Wert von 1,68. Entscheiden Sie sich a) bei einseitiger Fragestellung für die Alternativhypothese oder für die Nullhypothese? Für die Alternativhypothese, weil der empirisch in der Studie gewonnene Wert von 2,2 größer ist als der zugehörige kritische t-Wert von 1,68. b) bei zweiseitiger Fragestellung für die Alternativhypothese oder für die Nullhypothese? Für den t-Wert ergibt sich bei 2-seitiger Fragestellung statt 1,68 der neue Wert t (df=40, p=0.975) = 2,021 => Auch für die Alternativhypothese, weil der empirisch in der Studie gewonnene Wert von 2,2 immer noch höher ist als 2,021. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

37 Kapitel 7 – Lösungen VI c) Was bedeutet das Ergebnis inhaltlich? (bitte für beide Fälle formulieren) Bei einer Entscheidung für die Alternativhypothese liegt ein auf dem 5%-Niveau signifikanter Unterschied der beiden Gruppen vor. Bei einer Entscheidung für die Nullhypothese lässt sich ein signifikanter Unterschied zwischen den Gruppen nicht feststellen. Bringen Sie die Schritte des t-Testes in die richtige Reihenfolge a) Mittelwerte und Varianzen der beiden Variablen berechnen b) Kritischen t-Wert für (, df) ermitteln c) Prüfgröße t berechnen d) Vergleich der Prüfgröße t mit dem Tabellenwert: wenn t < t,df, dann Beibehaltung der H0 e) Standardfehler der Differenz berechnen f) Anzahl der Freiheitsgrade ermitteln Reihenfolge:____a) e) c) f) b) d)______________ Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

38 Kapitel 8 - Lösungen I Mit Daten auf welchem Skalenniveau kann man den Chi-Quadrat-Test durchführen? Der Chi-Quadrat-Test kann mit Daten ab Nominalskalen-Niveau (also auch mit ordinal- und intervallskalierten Daten) durchgeführt werden. In einer Vorlesung der Pädagogik mit 105 Teilnehmenden ermitteln Sie folgende Verteilung der Geschlechter. Untersuchen Sie mittels eines Chi-Quadrat-Testes, ob diese Teilnehmerzusammensetzung mit der Annahme einer Gleichverteilung der Geschlechter (50:50) vereinbar ist. Wählen Sie das 5% Signifikanzniveau, berechnen Sie die erwarteten Häufigkeiten und Chi-Quadrat. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

39 Kapitel 8 - Lösungen II Lösungsweg bitte hier aufschreiben:
Chi-Quadrat (empirisch) = [ (80-52,5)² + (25-52,5)² ] : 52,5 = [ 27,5² + 27,5² ] : 52,5 = 1512,5 : 52,5 = 28,8 > Chi-Quadrat (df=1, 0.95) = 3,84 => signifikantes Ergebnis; die Teilnehmerzusammensetzung ist nicht mit einer Gleichverteilung vereinbar Angenommen Sie hätten für eine Vierfeldertafel den empirischen Chi-Quadrat-Wert berechnet. Dieser sei größer als der Chi-Quadrat-Wert, den Sie für das 5% Niveau und die entsprechende Zahl von Freiheitsgraden in der Tabelle ablesen. Wie entscheiden Sie sich?  a) für die Nullhypothese  b) für die Alternativhypothese Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

40 Kapitel 8 - Lösungen III Berechnen Sie Chi-Quadrat.
Studienrichtung Wahlpflichtfach 1 2 3 4 Summe 20 (15) 30 (22,5) 0 (18,75) 25 (18,75) 75 0 (22,5) 30 (18,75) 0 (10) 30 (15) 20 (12,5) 0 (12,5) 50 40 60 200 in Klammern sind die Erwartungswerte angegeben c2 = (20-15)2 + (30-22,5)2 + (0-18,75) (0-12,5)2 = 99,87 , ,5 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

41 Kapitel 8 - Lösungen IV Berechnen Sie wieder Chi-Quadrat
Studienrichtung Wahlpflichtfach 1 2 3 4 Summe 40 (30) 25 (25) 2 (4) 33 (41) 100 10 (12) 15 (10) 2 (1,6) 13 (16,4) 40 10 (18) 10 (15) 4 (2,4) 36 (24,6) 60 50 8 82 200 Chi-Quadrat (empirisch) = = 21,057 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

42 Kapitel 8 - Lösungen V Sind die Tabellen aus Aufgabe 4 und 5 gleich gut für einen Chi-Quadrat-Test geeignet? Dürfen die Ergebnisse für Aussagen über Zusammenhänge herangezogen werden? Die Tabelle aus Aufgabe 5 kann nicht für Aussagen über Zusammenhänge zwischen den Variablen Studienrichtung und Wahlpflichtfach herangezogen werden, da mehr als 20% der Tabellenfelder eine erwartete Häufigkeit kleiner 5 haben. Die Tabelle ist somit weniger geeignet für einen Chi-Quadrat-Test. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

43 Kapitel 9 - Lösungen I 200 Studenten wurden nach ihrem Geschlecht (männlich, weiblich) und danach geordnet, ob sie alleine leben (single) oder nicht (non single). Ein unvollständiger Auszug der Daten sieht so aus: a) Ergänze die Tabelle an den entsprechenden Stellen b) Berechne Chi-Quadrat Chi-Quadrat = 1,587 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

44 Kapitel 9 - Lösungen II Fortsetzung c) Berechne den Phi-Koeffizienten Phi-Koeffizient = - 0,089 d) Was gibt das Ergebnis des Phi-Koeffizienten an? Der Phi-Koeffizient gibt den Grad des Zusammenhangs an. In diesem Fall ist der Wert nahe 0 und der Zusammenhang ist damit nicht erwähnenswert. Ein Phi-Koeffizient von 0,3 gibt beispielsweise einen mittleren, ein Wert von 0,6 einen großen Zusammenhang an. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

45 Kapitel 9 - Lösungen III Die folgende Tabelle ist von Aufgabe 4, Kapitel 8 übernommen. Berechnen Sie nun den Phi-Koeffizienten und interpretieren Sie das Ergebnis. Chi-Quadrat (emprisch) = 21,0595 Phi-Koeffizient = 0,071 Der Zusammenhang zwischen der Studienrichtung und dem Wahlpflichtfach, die von den Testpersonen angeben wurden, ist gering. Da der Wert nahe an 0 liegt, ist ein Zusammenhang fast nicht vorhanden. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

46 Kapitel 9 - Lösungen IV Die Teilnehmer/innen der Statistikvorlesung wurden danach befragt, a) ob sie planen, eventuell ein oder mehrere Semester im Ausland zu studieren und b) in welcher Region sie Abitur gemacht haben. Der Chi-Quadrat-Test ergab folgende Tabellen. Beschreiben und interpretieren Sie die Ergebnisse. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

47 Kapitel 9 - Lösungen V Fortsetzung
Der Chi-Quadrat-Test lieferte eine Irrtumswahrscheinlichkeit von 0,4% und war damit auf dem 1%-Niveau signifikant. Demnach wird die Ho (Es besteht kein Zusammenhang zwischen den Variablen) verworfen und die Entscheidung fällt für die Alternativhypothese H1: Es besteht ein signifikanter Zusammenhang zwischen der Region, in der die Studierenden ihr Abitur gemacht haben, und der Planung, ein oder mehrere Semester im Ausland zu studierenden. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

48 Kapitel 9 - Lösungen VI Fortsetzung II
Aus der Verteilungstabelle ist zu entnehmen, dass die Studierenden, die in der näheren und weiteren Umgebung von Marburg Abitur machten (n=38+17=55), weniger Interesse haben im Ausland zu studieren als diejenigen aus Hessen und anderen Bundesländern (n=17+50=67). Der standardisierte Koeffizient Cramers V von 0,333 lässt auf einen mittelgroßen Zusammenhang zwischen Region des Abiturs und Planung Auslandssemester schließen. Es ist zu vermuten, dass die Studierenden, die nicht aus der Umgebung Marburg kommen, und deshalb schon einmal zu Studienbeginn den Schritt in ein neues Lebens- und Studierumfeld gegangen sind, weniger Schwierigkeiten haben, sich ein Semester im Ausland vorzustellen. Darüber hinaus sind vermutlich die regionalen Bezüge und Bindungen zur Familie, zum Elternhaus, zu Freunden und zur Region bei den Studierenden aus der Umgebung Marburgs größer. Der „Schritt ins Ausland“ stellt dadurch sicherlich eine größere Hemmschwelle dar. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

49 Kapitel 10 - Lösungen I In der Studienanfängerstudie 2002/03 wurde gefragt „Wir oft üben Sie die folgenden Freizeitbeschäftigungen aus“ (Skala 1 (nie) bis 5 (sehr oft)). Die folgende Korrelationsmatrix gibt die bivariaten Korrelationen für vier Beschäftigungen wieder. Lösung Aufgabe 1 a) und b) siehe Tabelle Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

50 Kapitel 10 - Lösungen II c) welche der folgenden Aussagen ist richtig?  A) Seltenes Sporttreiben geht mit seltenem fernsehen einher.  B) Häufiges Sporttreiben geht mit seltenem fernsehen einher.  C) Zwischen der Häufigkeit des Sporttreibens und des Fernsehens gibt es keinen Zusammen- hang. d) Versuchen Sie die Matrix inhaltlich zu interpretieren, beachten Sie dabei die Höhe der Korrelationen, die Vorzeichen sowie die Signifikanzen. siehe nächste Folie Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

51 Kapitel 10 – Lösungen III 1. d) Die größte, auf dem 1%-Niveau signifikante, Korrelation besteht zwischen Fernsehen und Beschäftigung mit Computer mit r = Studierende, die häufig fernsehen, beschäftigen sich auch häufig mit dem Computer. Alle Korrelationen liegen unter r = .5, wobei zwischen Fernsehen und Künstlerischen Aktivitäten die höchste negative Korrelation mit r = besteht. Ein weiterer negativer Zusammenhang auf dem 5% Signifikanzniveau mit r =-.192 besteht zwischen „Sport treiben“ und „Fernsehen“. Interessant ist, dass dieser negative Zusammenhang nicht auf „Sport treiben“ und die „Beschäftigung mit dem Computer“ übertragen werden kann. Zwischen „Beschäftigung mit dem Computer“ und „Sport treiben“ und „Beschäftigung mit dem Computer“ und „Künstlerische Aktivitäten“ sowie zwischen „Sport treiben“ und „Künstlerische Aktivitäten“ besteht jeweils kein Zusammenhang. Bei den negativen Zusammenhängen können „je mehr, desto weniger“ – und bei den positiven Zusammenhänge „je mehr, desto mehr“ – Aussagen getroffen werden. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

52 Kapitel 10 - Lösungen IV Die Korrelationsanalyse mit dem Korrelationskoeffizienten r (Pearson) besteht aus 7 Schritten (Entscheidung für oder gegen H1 soll getroffen werden können). Schreiben sie diese in der richtigen Reihenfolge auf. a) Mittelwerte von x und y bestimmen b) Standardabweichung von x und y bestimmen c) Kovarianz bestimmen d) Korrelationskoeffizient r bestimmen e) Prüfgröße t bestimmen. f) Vergleich der Prüfgröße mit dem kritischen t-Wert der Tabelle g) Entscheidung Nullhypothese oder Alternativhypothese Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

53 Kapitel 10 - Lösungen V Berechnen Sie die Kovarianz zwischen den Merkmalen x (Anzahl der richtigen Lösungen in Test A) und y (Anzahl der richtigen Lösungen in Test B) cov(x,y) = 18/4 = 4,5 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

54 Kapitel 11 - Lösungen I Was ist der Unterschied zwischen den Korrelationskoeffizienten nach Spearman und nach Pearson? Spearmans rho wird ab ordinalskalierten Daten eingesetzt, Pearsons r ab intervallskalierten. Zählen Sie alle Korrelationskoeffizienten auf, die sie kennen. Spearmans rho, Pearsons r, Cramers V, Phi-Koeffizient, Kontingenzkoeffizient C Wann spricht man von einer geringen, einer mittleren bzw. hohen Korrelation. 0,1 -  geringe Korrelation 0,3 -  mittlere Korrelation 0,5 -  hohe Korrelation Mit dem Signifikanzwert hängen sie durch das Bilden der Prüfgröße t zusammen. Je höher die Korrelation, umso eher besteht die Chance ein signifikantes Ergebnis zu erzielen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

55 Kapitel 11 - Lösungen II Die StudentInnen der Vorlesung „Einführung in die sozialwissenschaftliche Statistik“ wurden nach ihrer persönlichen Einschätzung zu verschiedenen Berufsgruppen befragt. Hier sind die Rangreihenfolgen von zwei der befragten Personen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

56 Kapitel 11 - Lösungen III Und interpretieren Sie das Ergebnis.
Fortsetzung Berechnen Sie den Rangkorrelationskoeffizienten nach Spearman! Und interpretieren Sie das Ergebnis. Es liegt eine geringe, negative Korrelation vor. Das heisst, dass die Berufe, die von Person 1 höher eingeschätzt wurden von Person 2 eher niedriger eingeschätzt wurden und umgekehrt (welcher Beruf bei Person 2 einen hohen Stellenwert hatte, der hat bei Person 1 einen niedrigeren.) Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

57 Kapitel 11 - Lösungen IV Tragen Sie ein, welcher Korrelationskoeffizient in Abhängigkeit vom Skalenniveau der Daten berechnet werden darf. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

58 Kapitel 11 - Lösungen V Was wäre der adäquate Korrelationskoeffizient zwischen den folgenden Merkmalen? Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

59 Kapitel 12 - Lösungen I Cronbachs Koeffizient Alpha ist ein Maß  a für die Trennschärfe von Items  b für den Zusammenhang zweier Items  c für die Reliabilität einer Skala Eine Skala ist  a ein Messinstrument  b eine Sammlung von Variablen  c ein Koeffizient für den Zusammenhang zweier intervallskalierter Variablen Wie kann man eine Skala gegebenenfalls verbessern? Items mit niedriger Trennschärfe aus der Skala entfernen. Evtl. Items neu formulieren. Evtl. Items hinzunehmen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

60 Kapitel 12 - Lösungen II Zur Messung des räumlichen Vorstellungsvermögens von Studierenden wurden zwei Skalen entwickelt. Skala A weist einen Reliabilitätskoeffizient Alpha=.52 auf, Skala B einen Koeffizienten Alpha = .77. Welche Skala ist besser geeignet:  a Skala A  b Skala B  c beide gleich gut  d beide sind nicht geeignet Wie wird bei der Likert-Skala der Gesamtpunktwert der Probanden berechnet.  a durch Ordnen der Items nach Schwierigkeit und Zuordnung der Personen zu dieser Rangskala  b durch Summierung der Messwerte der einzelnen Items  c durch Bildung des Mittelwertes der trennschärfsten Items Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

61 Kapitel 13 - Lösungen I Was bedeutet die Signifikanz des F-Wertes bei der Varianzanalyse?  a) Die Wahrscheinlichkeit für das zufällige Zustandekommen des Ergebnisses  b) Die Wahrscheinlichkeit für die Geltung der H1  c) Die Wahrscheinlichkeit für die Wirkung des Treatments Geben sie die sechs Schritte der Varianzanalyse an: a) Bestimmung der QS total (Gesamtsumme der Abweichungsquadrate) b) Bestimmung der QS treatment und der Treatment-Varianz c) Bestimmung der QS fehler und der Varianz des Fehlers d) Bildung der Prüßgröße F e) Wahl des Signifikanzniveaus, Vergleich des empirischen F-Wertes mit dem kritischen F-Wert der Tabelle f) Entscheidung für Null- und Alternativhypothese Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

62 Kapitel 13 - Lösungen II Die Varianzanalyse will:  a) Den Zusammenhang zwischen zwei nominalskalierten Daten untersuchen  b) Die Varianz einer abhängigen Variablen durch unabhängige Variable(n) erklären  c) Den Mittelwerte einer Stichprobe mit dem Mittelwert der Grundgesamtheit vergleichen  d) Die Varianz einer Variablen bestimmen Welches Skalenniveau muss die abhängige Variable bei der Varianzanalyse besitzen?  a) spielt keine Rolle  b) Nominalskalenniveau  c) Intervallskalenniveau  d) Ordinalskalenniveau Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

63 Kapitel 13 - Lösungen III Es wurde eine einfaktorielle Varianzanalyse durchgeführt mit der abhängigen Variable Umweltbewusstsein und der unabhängigen Variable Bildung. Das Umweltbewusstsein wurde mittels einer aus 14 Itemsbestehenden Skala gemessen: Je höher der Skalenwert ist, desto höher ist das Umweltbewusstsein. Es wurden drei Stufen des Bildungsniveaus unterschieden: niedrig, mittel und hoch. Interpretieren Sie die folgenden, von SPSS berechneten Ergebnisse dieser Analyse. Hat Bildung einen Einfluss auf das Umweltbewusstsein? Wenn ja, in welcher Weise? Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

64 Kapitel 13 - Lösungen IV Fortsetzung
Das Ergebnis ist signifikant (F=15,69, p=.000), d.h. die Gruppen unterscheiden sich: Bildung hat einen Effekt auf das Umweltbewusstsein. Dieses steigt mit dem Bildungsniveau an, die erste Gruppe „Bildung niedrig“ weist durchschnittlich das geringste Umweltbewusstsein auf (Skalenmittelwert= 50,0), die Gruppe mit dem höchsten Bildungsniveau zeigt sich im Mittel am umweltbewusstesten (Skalenmittelwert 52,1). Mit zwei Skalenpunkten sind die Unterschiede allerdings nicht sehr groß. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

65 Kapitel 13 - Lösungen V Berechnen einer Varianzanalyse: Je 10 Schüler werden zufällig auf drei verschiedene Lernmethoden des Englischunterrichts verteilt. Nach 10 Unterrichtsstunden wird ein Englisch-Test geschrieben, dessen Werte in der unten stehenden Tabelle wiedergegeben sind. Berechnen Sie eine Varianzanalyse! Unterschieden sich die Gruppen signifikant? Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen

66 Kapitel 13 - Lösungen VI Fortsetzung Gesamtmittelwert= 24,66
Berechnen Sie zunächst die Fehlerquadratsumme QS Fehler= 126 und die Fehlervarianz (df hier= 27) = 126/27= 4,66 Berechnen Sie nun die Treatmentquadratsummer QS Treat=10*(23-24,66)²+10*(25-24,66)²+10*(26-24,66)² = 46,66 und die Treatmentvarianz (df hier = 2)= 46,66/2=23,33 Bilden Sie nun die Prüfgröße F= = 23,33 / 4,66= 5 Der kritische F-Wert für 2 Zählerfreiheitsgrade, 27 Nennerfreiheitsgrade und 5% Irrtumswahrscheinlichkeit lautet 3,35. Treffen Sie die Entscheidung Nullhypothese versus Alternativhypothese! Da der kritische F-Wert der Tabelle unter dem berechneten F-Wert bleibt, wird die H0 verworfen und die H1 angenommen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Lösungen


Herunterladen ppt "Statistik für die Erziehungswissenschaft"

Ähnliche Präsentationen


Google-Anzeigen