Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistik I demnächst in Hörsaal 16 !!.

Ähnliche Präsentationen


Präsentation zum Thema: "Statistik I demnächst in Hörsaal 16 !!."—  Präsentation transkript:

1 Statistik I demnächst in Hörsaal 16 !!

2 PD Dr. Ina Grau Termin der Vorlesung Fr in Hörsaal 16 erster Termin letzter Termin Sprechstunde Di in Raum T4-134 Telefon

3 Vorgehen bei einer wissenschaftlichen Studie
Themen der Vorlesung Einführung Vorgehen bei einer wissenschaftlichen Studie Möglichkeiten der Datenerhebung Grafische Darstellung von Variablen Analyse einzelner Variablen (z.B. Mittelwert) Zusammenhänge zwischen mehreren Variablen SPSS (Statistik II: Schlussfolgerungen aus einer Stichprobe auf die Population; Testverfahren)

4 Säulendiagramm

5

6 Häufigkeitsverteilung einer Variable
Altersangaben Häufigkeit 20 19 21 25 22 30 23 29 24 15 > 25 9

7 Bivariate Verteilung zweier kontinuierlicher Variablen

8 Namen und E-mail der Tutoren
Cemil Sahinöz Kjell Hoffmann Floris van Veen Sonja Schulz

9 Termine und Räume der Tutorien
Mo in E01-108 Di in T2-214 Mi in L3-108 Mi in C01-148 Do in U2-147 teilweise im Cip-Pool U4-114 (auch in der ersten Sitzung)

10 Dringend empfohlene Literatur
Benninghaus, H. (2001): Einführung in die sozialwissenschaftliche Datenanalyse. 6. Aufl., München, Wien: Oldenbourg. Gehring, U.W./ Weins, C. (2002): Grundkurs Statistik für Politologen. 3., überarbeitete Auflage. Opladen: Westdeutscher Verlag.

11 Weiterführende Literatur
Diekmann, A. (1995): Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen. Hamburg: Rowohlt. Schnell, R.; Hill, P.B.; Esser, E. (1993): Methoden der empirischen Sozialforschung. 4., überarb. Aufl., München, Wien: Oldenbourg. Wright, D.B. (1997): Understanding statistics. An introduction for the social sciences. 1st edition. London et al.: Sage. Kühnel, S.M./ Krebs, D. (2001): Statistik für die Sozialwissenschaften. Grundlagen, Methoden, Anwendungen. Reinbek: Rowohlt Knoke, D. / Bohrnstedt, G.W. / Potter Mee, A. (2002): Statistics for social data analysis. 4th edition. Itasca, Ill: Peacock. Bleymüller, J./ Gehlert, G./ Gülicher, H. (2002): Statistik für Wirtschaftswissenschaftler. 13. Aufl. München: Vahlen. Fahrmeir, L./ Künstler, R./ Pigeot, I./ Tutz, G. (2003): Statistik: der Weg zur Datenanalyse. 4., verbesserte Auflage. Berlin et al.: Springer. Bortz, J. (1999): Statistik für Sozialwissenschaftler. 5. Auflage Berlin/ Heidelberg: Springer.

12 in Tutoriumsliste eintragen
Für Sie zu tun: in Tutoriumsliste eintragen zum Tutorium Disketten mitbringen, wenn es im Cip-Pool stattfindet Cip-Pool-Account im Internet beantragen und dann mit Vorlage der Immatrikulations-bescheinigung in Raum T4-142 freischalten lassen, Sprechst. Mo-Fr 11-12).

13 Curriculum „Methoden der empirischen Sozialforschung“
Das Curriculum sieht im Grund- und Hauptstudium eine Folge von aufeinander aufbauenden Vorlesungen, Übungen und Seminaren vor. Über die Veranstaltungen und die notwendigen Leistungsnachweise informiert die folgende Überblickstabelle.

14 Curriculum „Methoden der empirischen Sozialforschung“
Studienphase Semester Veranstaltung Leistungsnachweis Grundstudium 1 Einführung in die Methoden der emp. Sozial-forschung (Do 18-20, H4) Statistik I (Deskriptivstatistik) mit Tutorium 2 Statistik II (Inferenzstatistik) mit Tutorium Klausur 3 Grundkurs "Methoden der emp. Sozialforschung" 4 Aufbaukurs "Methoden der emp. Sozialforschung" Schein Hauptstudium 5-8 Seminar im Wahlpflichtfach "Methoden" Schein

15 Curriculum „Methoden der empirischen Sozialforschung“
Wahlpflichtfach „Methoden der empirischen Sozialforschung“ Im Hauptstudium ist mindestens eine der scheinfähigen Wahlpflichtveranstaltungen erfolgreich zu absolvieren. Ein Leistungsnachweis wird durch eine schriftliche Arbeit im Rahmen einer der regelmäßig angebotenen Wahlpflichtveranstaltungen erworben. Im Bereich der Quantitativen Methoden wird erwartet, dass in den scheinfähigen Wahlpflichtveranstaltungen entweder ein Leistungsnachweis für den Themenbereich "Datenerhebungsverfahren" oder den Themenbereich "Datenanalyse (Statistik)" erworben wird. Der jeweils andere Themenbereich ist dann Gegenstand der Diplom-Fachprüfung.

16 Was ist empirische Sozialforschung?
"Empirische Sozialforschung ist die systematische Erfassung und Deutung sozialer Erscheinungen. Empirisch bedeutet, dass theoretisch formulierte Annahmen an spezifischen Wirklichkeiten überprüft werden. Systematisch weist darauf hin, dass dies nach Regeln vor sich gehen muss. Theoretische Annahmen und die Beschaffenheit der zu untersuchenden Realität sowie die zur Verfügung stehenden Mittel bedingen den Forschungsablauf." (Atteslander 1991: 16)

17 Was sind Methoden? (1) "Unter Methoden der empirischen Sozialforschung versteht man die geregelte und nachvollziehbare Anwendung von Erfassungsinstrumenten wie Befragung, Beobachtung, Inhaltsanalyse. Je nach dem Grad der Kontrolle des Forschungsablaufs spricht man von Experimenten." (Atteslander 1991: 16)

18 Was sind Methoden? (2) "... sind erstens Mittel, um Realität zu erfassen - und damit auch zu schaffen, geleitet von Theorien, seien sie nun expliziert, bekannt oder nur 'background ignorance'. Zweitens, alle Methoden führen zu Aussagen, die auf bestimmten Stichproben von Objekten, von Räumen und von Zeiten beruhen. Immer wird die Wahrnehmung codiert, d.h. Erscheinungen werden Merkmale und ihre Ausprägungen zugeordnet. Die zentrale Frage ist, wie die vermuteten Regelmäßigkeiten, die unterstellte Struktur sozialer Prozesse, in der Sprache abgebildet und die Zusammenhänge als Gesetze formuliert werden." (Friedrichs 1973: 189)

19 Theoriegewinnung und Theorieprüfung (1)
Quelle: Schnell et al. 1989, 110/Schnell et al. 1993, 118 Auswahl des Forschungsproblems Theoriebildung Konzeptspezifikation Operationalisierung Bestimmung der Untersuchungsform Auswahl der Untersuchungseinheiten Datenerfassung Datenanalyse Publikation Datenerhebung

20 Theoriegewinnung und Theorieprüfung (2)
Verallgemeinerungen Hypothesen Theorien Beobachtungen

21 Stellenwert von Statistik im Forschungsprozeß (1)
1. Heutzutage werden empirische Informationen zu allen möglichen Sachverhalten erhoben, nicht jede Datenerhebung erlaubt jedoch inhaltlich valide Schlußfolgerungen. Dieser Mangel kann auch nur begrenzt durch statistische (oder andere) Auswertungsverfahren ausgeglichen werden. Die Aussagekraft der erhobenen Daten hängt entscheidend von den verwendeten sozialwissenschaftlichen Theorien, Untersuchungsdesigns, Erhebungsinstrumenten und Auswahlverfahren ab. 3. Es gibt keine "theoriefreie" empirische Beobachtung, auch wenn Theorien durch Konfrontation mit "neuen" empirischen Informationen "lernen".

22 Stellenwert von Statistik im Forschungsprozeß (2)
4. Statistik ist eine wichtige wissenschaftliche Disziplin, aber die Relevanz einer Untersuchung hängt in erster Linie vom Inhalt und den verwendeten Methoden (s. Punkt 2) ab, nicht vom verwendeten statistischen Auswertungsverfahren. Gleichwohl helfen statistische Kenntnisse, empirische Untersuchungen so durchzuführen, daß gültige und zuverlässige Ergebnisse möglich sind. In den Sozialwissenschaften gibt es neben statistischen auch andere Auswertungsmethoden für empirische Informationen. Eines der Hauptziele von Statistik besteht darin, eine Vielzahl von Daten auf ihre wesentlichen Strukturen zu reduzieren. Die Annahmen über das, was als "wesentlich" betrachtet wird, werden in Form eines statistischen Modells zusammengefaßt. Dementsprechend sind die folgenden Ergebnisse modellabhängig (vgl. Stadtplanbeispiel). Ihre Verallgemeinerbarkeit steht und fällt daher mit der Angemessenheit des verwendeten Modells, die in jedem Anwendungsfall geprüft werden muß.

23 Stellenwert von Statistik im Forschungsprozeß (3)
7. Bei der Auswertung und Interpretation empirischer Informationen dürfen drei Dinge nicht vergessen werden: Theoretische Konstrukte, wie z.B. soziale Schicht oder Intelligenz, sind nicht direkt, sondern nur mittels bestimmter Indikatoren (z.B. Schichtindizes oder Intelligenztests) beobachtbar. Das verweist auf die Notwendigkeit der Entwicklung von validen Meßinstrumenten. Erhebungsmethoden sind mit Meßfehlern verbunden. Daraus ergibt sich die Notwendigkeit der Entwicklung von zuverlässigen Meßinstrumenten bzw. der Verwendung geeigneter statistischer Methoden zur Kontrolle mangelnder Reliabilität. Empirische Informationen bestehen in der Regel aus einer Auswahl von Objekten, Räumen und Zeiten. Daraus ergibt sich die Frage, ob und in welcher Weise die Auswertungsergebnisse über diese Auswahl hinaus verallgemeinert werden können.

24 Begriffsdefinition "Eine notwendige Voraussetzung zur Beschreibung und Erklärung eines sozialen Zustandes oder eines sozialen Ereignisses ist seine begriffliche Präzisierung. Wissenschaften - gleich welcher Richtung - arbeiten nie mit konkreten Ereignissen an sich, sondern immer mit in Sprache gefasster Realität, mit Aussagen über die Realität. Wenn solche Aussagen nicht nur von einer einzigen oder einigen ausgewählten Personen verstanden werden, sondern allen Interessierten zugänglich sein sollen, dann ist es unumgänglich, dass der 'gemeinte Sinn' der verwendeten Begriffe von allen erfasst und geteilt werden kann: Man muss wissen, worüber geredet wird. Die am Kommunikationsprozess Beteiligten sollen den verwendeten Begriffen weitestgehend die gleichen Bedeutungen, die gleichen Vorstellungsinhalte zuschreiben." (SN89: 38, SN93: 38, Herv. HJA)

25 Operationalisierung (1)
Theorien beschreiben Zusammenhänge zwischen theoretischen Begriffen. Theoretische Begriffe als Bestandteile von Theorien (oder 'Konstrukte ') sind nicht direkt beobachtbar. Zur Überprüfung einer Theorie ist die Angabe von Korrespondenzregeln für theoretische Begriffe notwendig. Diese sog. Operationalisierung beinhaltet Angaben darüber, wie die theoretischen Konstrukte gemessen werden sollen.

26 Operationalisierung (2)
Dimensionale Analyse, Konzeptspezifikation "Die meisten allgemeinen Konzepte sind viel zu unklar, als dass direkt Messanweisungen gegeben werden können. Aus diesem Grund beginnt die Operationalisierung eines theoretischen Begriffs meist mit der Klärung, welche theoretischen Aspekte eines bestimmten Gegenstandsbereichs ('Dimensionen') durch den theoretischen Begriff bezeichnet werden, bzw. welche Dimensionen das Konzept anspricht." (SN89: 120, SN93: 130, Herv. im Original) Operationalisierung "Die 'Operationalisierung' eines theoretischen Begriffs besteht aus der Angabe einer Anweisung, wie Objekten mit Eigenschaften (Merkmalen), die der theoretische Begriff bezeichnet, beobachtbare Sachverhalte zugeordnet werden können." (SN89: 122, SN93: 132, Herv. im Original)

27 Hypothese: Aussage über Zusammenhang zwischen Variablen Forschung
Grundbegriffe Theorie: Aussage über Zusammenhang zwischen theoretischen Begriffen (hypothetischen Konstrukten), die zuvor definiert wurden Operationalisierung: Messbarmachen der Begriffe, Umwandlung von theoretischen Begriffen in Variablen (Variablen, die für ein hypothetisches Konstrukt stehen, nennt man Indikatoren) Hypothese: Aussage über Zusammenhang zwischen Variablen Forschung

28 Beispiel für die genannten Begriffe
Theorie: Frustration führt zu Aggression Begriffsdefinition: Frustration ist eine Hinderung an der Erreichung eines Ziels, Aggression ist das absichtliche Austeilen schädigender Reize an eine Person. Operationalisierung Frustration: Personen, die gerade eine Aufgabe lösen, werden kurz vor dem Ziel gestört. Aggression: Sie haben dann die Gelegenheit, einer anderen Person Elektroschocks zu verabreichen. Hypothese: Personen, die soeben gestört wurden, teilen mehr Elektroschocks aus als Personen, die nicht gestört wurden.

29 Hypothesen (1) Beispiele
Wenn der Entscheidungsspielraum (im Beruf) einer Person umfangreich ist, ist ihr Selbstwertgefühl hoch. anders formuliert: Je größer der Entscheidungsspielraum einer Person ist, desto höher ist ihr Selbstwertgefühl. Die zweite Formulierung berücksichtigt, dass beide Variablen viele Ausprägungen haben können.

30 Definition von „Hypothese“
Hypothesen (2) Definition von „Hypothese“ "Noch unbewiesene Annahme als Hilfsmittel für wissenschaftliche Erkenntnisse." (Wahrig 1991: Deutsches Wörterbuch) Eine Hypothese ist empirisch falsifizierbar. Behauptungen, die die Formulierung „Wenn-dann“ enthalten, sind widerlegt, sobald ein Gegenbeispiel vorliegt. In den Sozialwissenschaften wird üblicherweise eine bestimmte Anzahl von Gegenbeispielen zugelassen, ohne dass die Hypothese als widerlegt gilt.

31 Hypothesen (3) Eine Hypothese ist eine Aussage, keine Frage…
Die Aussage enthält mindestens zwei semantisch gehaltvolle Begriffe [...] Die Begriffe sind durch den logischen Operator 'wenn-dann' verbunden. [...] Die Aussage ist nicht tautologisch, d.h. ein Begriff deckt den anderen semantisch nicht ab. [...] Die Aussage ist widerspruchsfrei, d.h. ein Begriff schließt den anderen semantisch nicht aus. Die empirischen Geltungsbedingungen sind implizit oder explizit im einzelnen aufgezählt. [...] Die Begriffe sind auf Wirklichkeitsphänomene hin operationalisierbar. Die Aussage ist falsifizierbar." (Atteslander 1991: 65f.) 0

32 Häufige Formulierungen von Hypothesen
Zusammenhangshypothesen Schuhgröße und Körpergröße hängen positiv miteinander zusammen. Unterschiedshypothesen Frauen sind sprachlich begabter als Männer. Beides ist häufig austauschbar: Das Geschlecht hängt mit der Sprachbegabung zusammen.

33 Typen von Hypothesen Symmetrische Hypothesen: Schuhgröße und Körpergröße hängen zusammen (die wenn-dann-Beziehung kann in beide Richtungen formuliert werden) Asymmetrische Hypothesen: Alter und Rückenbeschwerden hängen zusammen (die wenn-dann Beziehung ist nur in eine Richtung sinnvoll zu formulieren); eine Variable gilt als Ursache, die andere als Wirkung.

34 Hypothesen können positiv oder negativ sein. Je ein Beispiel:
Typen von Hypothesen Hypothesen können positiv oder negativ sein. Je ein Beispiel: Je höher die Semesterzahl von Soziologiestudenten, desto größer ist das Wissen über soziologische Theorien. Je länger ein Mitarbeiter in einer Firma beschäftigt ist, desto niedriger ist seine Motivation

35 Für asymmetrische Hypothesen gilt:
Typen von Variablen Für asymmetrische Hypothesen gilt: Die Variable, in der man die Ursache vermutet: unabhängige Variable Die Variable, in der man die Wirkung vermutet: abhängige Variable statistisch können kausale Zusammenhänge (Ursache – Wirkungs – Zusammenhänge) nicht bewiesen werden, sondern nur, dass überhaupt ein Zusammenhang besteht. Ein kausaler Beweis ist mit Experimenten möglich.

36 Experiment Ein Experiment unterscheidet sich durch andere Arten empirischer Untersuchungen dadurch, dass die unabhängige Variable nicht gemessen, sondern vom Versuchsleiter hergestellt wird (wie im Beispiel Frustration: Störung oder keine Störung bei der Erledigung einer Aufgabe. Anderes Beispiel: Medikament oder Placebo) Um die Wirkung von Störvariablen zu kontrollieren, müssen die Personen zufällig auf die Ausprägungen der UV aufgeteilt werden.

37 Messen: schematische Darstellung
1 Hauptschule Realschule 2 1 Hauptschule 3 Gymnasium Numerisches Relativ Empirisches Relativ

38 Messen und Messniveau (1)
"Unter 'Messen' wird allgemein die Zuordnung von Zahlen ('Messwerten') zu Objekten gemäß festgelegten Regeln verstanden. Die Mängel dieser Definition werden bereits dadurch deutlich, dass die Zuweisung von Schulnoten durch Würfeln eine definitionsgemäße Messung wäre. Eine brauchbare Definition muss für eine Messung fordern, dass die Messwerte zueinander Beziehungen aufweisen, die den Beziehungen der gemessenen Objekte entsprechen. So wird z.B. für eine sinnvolle Längenmessung gefordert, dass der 'größte' Messwert dem 'längsten' Objekt entspricht, der 'kleinste' Messwert dem 'kürzesten' Objekt. Eine Messung in diesem Sinne ist eine 'strukturtreue Abbildung': Die Beziehungen der Objekte ('kürzer' - 'länger') werden durch die Beziehungen der zugeordneten Zahlen ('kleiner' - 'größer') korrekt wiedergegeben." (Schnell et al. 1993: 143, Herv. im Original)

39 Messen und Messniveau (2)
"Die Verwendung eines bestimmten Kriteriums, z.B. Länge, definiert eine bestimmte Beziehung ('Relation') der Objekte zueinander. Eine Menge von Objekten, über die eine Relation definiert wurde, bezeichnet man als 'empirisches Relativ', eine Menge von Zahlen, über die eine Relation definiert wurde, als 'numerisches Relativ'. [...] Das Problem der Messung besteht nun darin, eine Zuordnung der Zahlen zu den Objekten zu finden, so dass die Ordnung im numerischen Relativ der Ordnung im empirischen Relativ entspricht: Das Problem besteht in der Angabe einer Regel, die eine strukturtreue Abbildung ermöglicht." (Schnell et al. 1993: 143f., Herv. im Original)

40 Die codierten Werte werden dann in eine Datenmatrix eingegeben
Codieren Bei einigen Variablen ergibt sich die Zuordnung von Zahlen zu Variablenausprägungen unproblematisch, z.B. Alter in Jahren – 20 Bei anderen Variablen muss man Entscheidungen treffen, z.B. beim Geschlecht Mann=1, Frau=2 Die codierten Werte werden dann in eine Datenmatrix eingegeben

41 Alter Geschlecht Vp 1 20 1 Vp 2 Vp 3 Vp 4 Vp 5 Vp 6 Vp 7 Vp 8 …
Datenmatrix Alter Geschlecht Vp 1 20 1 Vp 2 Vp 3 Vp 4 Vp 5 Vp 6 Vp 7 Vp 8

42 Skalenniveaus Skalenniveaus Nominal-skala Name Geschlecht = 
Eigenschaft: Beispiel: erlaubte Rechenoperationen Nominal-skala Name Geschlecht =  Ordinal-skala Rangfolge Schulnoten < > Intervall-skala mit gleichen Intervallabständen Temperatur (Celsius) + - Verhältnis-skala mit absolutem Nullpunkt Länge (Meter), Alter * /

43 Diskrete Variablen haben begrenzte Ausprägungen, z.B. Zahl der Kinder
Arten von Variablen Diskrete Variablen haben begrenzte Ausprägungen, z.B. Zahl der Kinder Kontinuierliche Variablen: zwischen zwei Werten ist jeder Zwischenwert möglich, z.B. Alter, Größe für die Statistik reicht folgende Unterscheidung: Kategoriale Variablen: wenige Ausprägungen Kontinuierliche Variablen: viele Ausprägungen

44 Anzahl der Ausprägungen
Arten von Variablen Unterscheidung nach... Bezeichnungen Messniveau nominal ordinal intervall-, verhältnisskaliert nicht-metrisch metrisch Anzahl der Ausprägungen diskret kontinuierlich Art der Datenanalyse kategorial

45 Mittelwerte und Streuungsmaße nach Messniveau (1)
Zentrale Tendenz (Mittelwerte) Nominal Ordinal Intervall Verhältnis Modus ja Median nein Ja Arithm. Mittel Geom. Mittel

46 Mittelwerte und Streuungsmaße nach Messniveau (2)
Streuung (Streuungsmaße) Nominal Ordinal Intervall Verhältnis Spannweite nein (ja) ja Quartilsabstand Mittl. absolute Abweichung Varianz Standardabweichung Variationskoeffizient

47 Skalierung Häufig werden mehrere Variablen gemessen, die gemeinsam eine neue Variable ergeben: Index: eine Variable (soziale Schicht) ergibt sich aus mehreren anderen Variablen (Einkommen, Bildung, Berufsprestige). Die Berechnung der neuen aus den alten Variablen erfolgt nach definierten Rechenoperationen; im Beispiel ergibt sich das Problem unterschiedlicher Einheiten

48 Ich bin ganz ruhig. nein 1 2 3 4 5 ja
Skalierung Skala: die Summe oder der Mittelwert aus mehreren Items (Fragen), die dasselbe Konstrukt messen sollen. Die Einheiten sind bei allen Items gleich. Es werden mehrere Items vorgelegt, um die Messgenauigkeit zu erhöhen. Wenn einige Items gegensinnig formuliert sind, müssen sie umgepolt werden, z.B. Ich habe Angst. nein ja Ich bin ganz ruhig. nein ja recode It2 (1=5) (2=4) (3=3) (4=2) (5=1).

49 Der Skalenwert ergibt sich aus dem Mittelwert der einzelnen Items.
Skalierung Der Skalenwert ergibt sich aus dem Mittelwert der einzelnen Items. Die Mittelung hat gegenüber einer Summierung zwei Vorteile: Das Minimum und das Maximum der Werte, die auftreten können, sind wie bei den Items, die Werte sind leichter interpretierbar. Fehlende Werte werden ausgeglichen, da nur durch die Anzahl vorhandener Werte geteilt wird.


Herunterladen ppt "Statistik I demnächst in Hörsaal 16 !!."

Ähnliche Präsentationen


Google-Anzeigen