Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006.

Ähnliche Präsentationen


Präsentation zum Thema: "Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006."—  Präsentation transkript:

1 Statistik I demnächst in Hörsaal 16 !!

2 PD Dr. Ina Grau Termin der Vorlesung Fr in Hörsaal 16 erster Termin letzter Termin Sprechstunde Di in Raum T4-134 Telefon

3 Themen der Vorlesung Einführung Vorgehen bei einer wissenschaftlichen Studie Möglichkeiten der Datenerhebung Grafische Darstellung von Variablen Analyse einzelner Variablen (z.B. Mittelwert) Zusammenhänge zwischen mehreren Variablen SPSS (Statistik II: Schlussfolgerungen aus einer Stichprobe auf die Population; Testverfahren)

4 Säulendiagramm

5

6 Häufigkeitsverteilung einer Variable AltersangabenHäufigkeit > 259

7 Bivariate Verteilung zweier kontinuierlicher Variablen

8 Namen und der Tutoren Cemil Sahinöz Kjell Hoffmann Floris van Veen Sonja

9 Termine und Räume der Tutorien Mo in E Di in T2-214 Mi in L3-108 Mi in C Do in U2-147 teilweise im Cip-Pool U4-114 (auch in der ersten Sitzung)

10 Dringend empfohlene Literatur Benninghaus, H. (2001): Einführung in die sozialwissenschaftliche Datenanalyse. 6. Aufl., München, Wien: Oldenbourg. Gehring, U.W./ Weins, C. (2002): Grundkurs Statistik für Politologen. 3., überarbeitete Auflage. Opladen: Westdeutscher Verlag.

11 Weiterführende Literatur Diekmann, A. (1995): Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen. Hamburg: Rowohlt. Schnell, R.; Hill, P.B.; Esser, E. (1993): Methoden der empirischen Sozialforschung. 4., überarb. Aufl., München, Wien: Oldenbourg. Wright, D.B. (1997): Understanding statistics. An introduction for the social sciences. 1st edition. London et al.: Sage. Kühnel, S.M./ Krebs, D. (2001): Statistik für die Sozialwissenschaften. Grundlagen, Methoden, Anwendungen. Reinbek: Rowohlt Knoke, D. / Bohrnstedt, G.W. / Potter Mee, A. (2002): Statistics for social data analysis. 4th edition. Itasca, Ill: Peacock. Bleymüller, J./ Gehlert, G./ Gülicher, H. (2002): Statistik für Wirtschaftswissenschaftler. 13. Aufl. München: Vahlen. Fahrmeir, L./ Künstler, R./ Pigeot, I./ Tutz, G. (2003): Statistik: der Weg zur Datenanalyse. 4., verbesserte Auflage. Berlin et al.: Springer. Bortz, J. (1999): Statistik für Sozialwissenschaftler. 5. Auflage Berlin/ Heidelberg: Springer.

12 Für Sie zu tun: in Tutoriumsliste eintragen zum Tutorium Disketten mitbringen, wenn es im Cip-Pool stattfindet Cip-Pool-Account im Internet beantragen https://www.cipux.uni-bielefeld.de/antrag und dann mit Vorlage der Immatrikulations- bescheinigung in Raum T4-142 freischalten lassen, Sprechst. Mo-Fr 11-12).

13 Das Curriculum sieht im Grund- und Hauptstudium eine Folge von aufeinander aufbauenden Vorlesungen, Übungen und Seminaren vor. Über die Veranstaltungen und die notwendigen Leistungsnachweise informiert die folgende Überblickstabelle. Curriculum „Methoden der empirischen Sozialforschung“

14 StudienphaseSemesterVeranstaltungLeistungsnachweis Grundstudium 1 Einführung in die Methoden der emp. Sozial- forschung (Do 18-20, H4) Statistik I (Deskriptivstatistik) mit Tutorium 2 Statistik II (Inferenzstatistik) mit Tutorium Klausur 3Grundkurs "Methoden der emp. Sozialforschung" 4 Aufbaukurs "Methoden der emp. Sozialforschung"Schein Hauptstudium5-8Seminar im Wahlpflichtfach "Methoden" Schein Curriculum „Methoden der empirischen Sozialforschung“

15 Wahlpflichtfach „Methoden der empirischen Sozialforschung“ Im Hauptstudium ist mindestens eine der scheinfähigen Wahlpflichtveranstaltungen erfolgreich zu absolvieren. Ein Leistungsnachweis wird durch eine schriftliche Arbeit im Rahmen einer der regelmäßig angebotenen Wahlpflichtveranstaltungen erworben. Im Bereich der Quantitativen Methoden wird erwartet, dass in den scheinfähigen Wahlpflichtveranstaltungen entweder ein Leistungsnachweis für den Themenbereich "Datenerhebungsverfahren" oder den Themenbereich "Datenanalyse (Statistik)" erworben wird. Der jeweils andere Themenbereich ist dann Gegenstand der Diplom-Fachprüfung.

16 "Empirische Sozialforschung ist die systematische Erfassung und Deutung sozialer Erscheinungen. Empirisch bedeutet, dass theoretisch formulierte Annahmen an spezifischen Wirklichkeiten überprüft werden. Systematisch weist darauf hin, dass dies nach Regeln vor sich gehen muss. Theoretische Annahmen und die Beschaffenheit der zu untersuchenden Realität sowie die zur Verfügung stehenden Mittel bedingen den Forschungsablauf." (Atteslander 1991: 16) Was ist empirische Sozialforschung?

17 "Unter Methoden der empirischen Sozialforschung versteht man die geregelte und nachvollziehbare Anwendung von Erfassungsinstrumenten wie Befragung, Beobachtung, Inhaltsanalyse. Je nach dem Grad der Kontrolle des Forschungsablaufs spricht man von Experimenten." (Atteslander 1991: 16) Was sind Methoden? (1)

18 Was sind Methoden? (2) "... sind erstens Mittel, um Realität zu erfassen - und damit auch zu schaffen, geleitet von Theorien, seien sie nun expliziert, bekannt oder nur 'background ignorance'. Zweitens, alle Methoden führen zu Aussagen, die auf bestimmten Stichproben von Objekten, von Räumen und von Zeiten beruhen. Immer wird die Wahrnehmung codiert, d.h. Erscheinungen werden Merkmale und ihre Ausprägungen zugeordnet. Die zentrale Frage ist, wie die vermuteten Regelmäßigkeiten, die unterstellte Struktur sozialer Prozesse, in der Sprache abgebildet und die Zusammenhänge als Gesetze formuliert werden." (Friedrichs 1973: 189)

19 Quelle:Schnell et al. 1989, 110/Schnell et al. 1993, 118 Auswahl des Forschungsproblems Theoriebildung Konzeptspezifikation Operationalisierung Bestimmung der Untersuchungsform Auswahl der Untersuchungseinheiten Datenerfassung Datenanalyse Publikation Datenerhebung Theoriegewinnung und Theorieprüfung (1)

20 VerallgemeinerungenHypothesen Theorien Beobachtungen Theoriegewinnung und Theorieprüfung (2)

21 1.Heutzutage werden empirische Informationen zu allen möglichen Sachverhalten erhoben, nicht jede Datenerhebung erlaubt jedoch inhaltlich valide Schlußfolgerungen. 2.Dieser Mangel kann auch nur begrenzt durch statistische (oder andere) Auswertungsverfahren ausgeglichen werden. Die Aussagekraft der erhobenen Daten hängt entscheidend von den verwendeten sozialwissenschaftlichen Theorien, Untersuchungsdesigns, Erhebungsinstrumenten und Auswahlverfahren ab. 3. Es gibt keine "theoriefreie" empirische Beobachtung, auch wenn Theorien durch Konfrontation mit "neuen" empirischen Informationen "lernen". Stellenwert von Statistik im Forschungsprozeß (1)

22 4. Statistik ist eine wichtige wissenschaftliche Disziplin, aber die Relevanz einer Untersuchung hängt in erster Linie vom Inhalt und den verwendeten Methoden (s. Punkt 2) ab, nicht vom verwendeten statistischen Auswertungsverfahren. Gleichwohl helfen statistische Kenntnisse, empirische Untersuchungen so durchzuführen, daß gültige und zuverlässige Ergebnisse möglich sind. 5.In den Sozialwissenschaften gibt es neben statistischen auch andere Auswertungsmethoden für empirische Informationen. 6.Eines der Hauptziele von Statistik besteht darin, eine Vielzahl von Daten auf ihre wesentlichen Strukturen zu reduzieren. Die Annahmen über das, was als "wesentlich" betrachtet wird, werden in Form eines statistischen Modells zusammengefaßt. Dementsprechend sind die folgenden Ergebnisse modellabhängig (vgl. Stadtplanbeispiel). Ihre Verallgemeinerbarkeit steht und fällt daher mit der Angemessenheit des verwendeten Modells, die in jedem Anwendungsfall geprüft werden muß. Stellenwert von Statistik im Forschungsprozeß (2)

23 7. Bei der Auswertung und Interpretation empirischer Informationen dürfen drei Dinge nicht vergessen werden: a.Theoretische Konstrukte, wie z.B. soziale Schicht oder Intelligenz, sind nicht direkt, sondern nur mittels bestimmter Indikatoren (z.B. Schichtindizes oder Intelligenztests) beobachtbar. Das verweist auf die Notwendigkeit der Entwicklung von validen Meßinstrumenten. b.Erhebungsmethoden sind mit Meßfehlern verbunden. Daraus ergibt sich die Notwendigkeit der Entwicklung von zuverlässigen Meßinstrumenten bzw. der Verwendung geeigneter statistischer Methoden zur Kontrolle mangelnder Reliabilität. c.Empirische Informationen bestehen in der Regel aus einer Auswahl von Objekten, Räumen und Zeiten. Daraus ergibt sich die Frage, ob und in welcher Weise die Auswertungsergebnisse über diese Auswahl hinaus verallgemeinert werden können. Stellenwert von Statistik im Forschungsprozeß (3)

24 "Eine notwendige Voraussetzung zur Beschreibung und Erklärung eines sozialen Zustandes oder eines sozialen Ereignisses ist seine begriffliche Präzisierung. Wissenschaften - gleich welcher Richtung - arbeiten nie mit konkreten Ereignissen an sich, sondern immer mit in Sprache gefasster Realität, mit Aussagen über die Realität. Wenn solche Aussagen nicht nur von einer einzigen oder einigen ausgewählten Personen verstanden werden, sondern allen Interessierten zugänglich sein sollen, dann ist es unumgänglich, dass der 'gemeinte Sinn' der verwendeten Begriffe von allen erfasst und geteilt werden kann: Man muss wissen, worüber geredet wird. Die am Kommunikationsprozess Beteiligten sollen den verwendeten Begriffen weitestgehend die gleichen Bedeutungen, die gleichen Vorstellungsinhalte zuschreiben." (SN89: 38, SN93: 38, Herv. HJA) Begriffsdefinition

25 Theorien beschreiben Zusammenhänge zwischen theoretischen Begriffen. Theoretische Begriffe als Bestandteile von Theorien (oder 'Konstrukte ') sind nicht direkt beobachtbar. Zur Überprüfung einer Theorie ist die Angabe von Korrespondenzregeln für theoretische Begriffe notwendig. Diese sog. Operationalisierung beinhaltet Angaben darüber, wie die theoretischen Konstrukte gemessen werden sollen. Operationalisierung (1)

26 Dimensionale Analyse, Konzeptspezifikation "Die meisten allgemeinen Konzepte sind viel zu unklar, als dass direkt Messanweisungen gegeben werden können. Aus diesem Grund beginnt die Operationalisierung eines theoretischen Begriffs meist mit der Klärung, welche theoretischen Aspekte eines bestimmten Gegenstandsbereichs ('Dimensionen') durch den theoretischen Begriff bezeichnet werden, bzw. welche Dimensionen das Konzept anspricht." (SN89: 120, SN93: 130, Herv. im Original) Operationalisierung "Die 'Operationalisierung' eines theoretischen Begriffs besteht aus der Angabe einer Anweisung, wie Objekten mit Eigenschaften (Merkmalen), die der theoretische Begriff bezeichnet, beobachtbare Sachverhalte zugeordnet werden können." (SN89: 122, SN93: 132, Herv. im Original) Operationalisierung (2)

27 Grundbegriffe Theorie: Aussage über Zusammenhang zwischen theoretischen Begriffen (hypothetischen Konstrukten), die zuvor definiert wurden Operationalisierung: Messbarmachen der Begriffe, Umwandlung von theoretischen Begriffen in Variablen (Variablen, die für ein hypothetisches Konstrukt stehen, nennt man Indikatoren) Hypothese: Aussage über Zusammenhang zwischen Variablen Forschung

28 Beispiel für die genannten Begriffe Theorie: Frustration führt zu Aggression Begriffsdefinition: Frustration ist eine Hinderung an der Erreichung eines Ziels, Aggression ist das absichtliche Austeilen schädigender Reize an eine Person. Operationalisierung Frustration: Personen, die gerade eine Aufgabe lösen, werden kurz vor dem Ziel gestört. Aggression: Sie haben dann die Gelegenheit, einer anderen Person Elektroschocks zu verabreichen. Hypothese: Personen, die soeben gestört wurden, teilen mehr Elektroschocks aus als Personen, die nicht gestört wurden.

29 Beispiele 1.Wenn der Entscheidungsspielraum (im Beruf) einer Person umfangreich ist, ist ihr Selbstwertgefühl hoch. 2.anders formuliert: Je größer der Entscheidungsspielraum einer Person ist, desto höher ist ihr Selbstwertgefühl. Die zweite Formulierung berücksichtigt, dass beide Variablen viele Ausprägungen haben können. Hypothesen (1)

30 Hypothesen (2) Definition von „Hypothese“ "Noch unbewiesene Annahme als Hilfsmittel für wissenschaftliche Erkenntnisse." (Wahrig 1991: Deutsches Wörterbuch) Eine Hypothese ist empirisch falsifizierbar. Behauptungen, die die Formulierung „Wenn-dann“ enthalten, sind widerlegt, sobald ein Gegenbeispiel vorliegt. In den Sozialwissenschaften wird üblicherweise eine bestimmte Anzahl von Gegenbeispielen zugelassen, ohne dass die Hypothese als widerlegt gilt.

31 1.Eine Hypothese ist eine Aussage, keine Frage… 2.Die Aussage enthält mindestens zwei semantisch gehaltvolle Begriffe [...] 3.Die Begriffe sind durch den logischen Operator 'wenn-dann' verbunden. [...] 4.Die Aussage ist nicht tautologisch, d.h. ein Begriff deckt den anderen semantisch nicht ab. [...] 5.Die Aussage ist widerspruchsfrei, d.h. ein Begriff schließt den anderen semantisch nicht aus. 6.Die empirischen Geltungsbedingungen sind implizit oder explizit im einzelnen aufgezählt. [...] 7.Die Begriffe sind auf Wirklichkeitsphänomene hin operationalisierbar. 8.Die Aussage ist falsifizierbar." (Atteslander 1991: 65f.) 0 Hypothesen (3)

32 Häufige Formulierungen von Hypothesen Zusammenhangshypothesen Schuhgröße und Körpergröße hängen positiv miteinander zusammen. Unterschiedshypothesen Frauen sind sprachlich begabter als Männer. Beides ist häufig austauschbar: Das Geschlecht hängt mit der Sprachbegabung zusammen.

33 Typen von Hypothesen Symmetrische Hypothesen: Schuhgröße und Körpergröße hängen zusammen (die wenn- dann-Beziehung kann in beide Richtungen formuliert werden) Asymmetrische Hypothesen: Alter und Rückenbeschwerden hängen zusammen (die wenn-dann Beziehung ist nur in eine Richtung sinnvoll zu formulieren); eine Variable gilt als Ursache, die andere als Wirkung.

34 Typen von Hypothesen Hypothesen können positiv oder negativ sein. Je ein Beispiel: Je höher die Semesterzahl von Soziologiestudenten, desto größer ist das Wissen über soziologische Theorien. Je länger ein Mitarbeiter in einer Firma beschäftigt ist, desto niedriger ist seine Motivation

35 Typen von Variablen Für asymmetrische Hypothesen gilt: Die Variable, in der man die Ursache vermutet: unabhängige Variable Die Variable, in der man die Wirkung vermutet: abhängige Variable statistisch können kausale Zusammenhänge (Ursache – Wirkungs – Zusammenhänge) nicht bewiesen werden, sondern nur, dass überhaupt ein Zusammenhang besteht. Ein kausaler Beweis ist mit Experimenten möglich.

36 Experiment Ein Experiment unterscheidet sich durch andere Arten empirischer Untersuchungen dadurch, dass die unabhängige Variable nicht gemessen, sondern vom Versuchsleiter hergestellt wird (wie im Beispiel Frustration: Störung oder keine Störung bei der Erledigung einer Aufgabe. Anderes Beispiel: Medikament oder Placebo) Um die Wirkung von Störvariablen zu kontrollieren, müssen die Personen zufällig auf die Ausprägungen der UV aufgeteilt werden.

37 Hauptschule Realschule Hauptschule Gymnasium Numerisches RelativEmpirisches Relativ Messen: schematische Darstellung

38 "Unter 'Messen' wird allgemein die Zuordnung von Zahlen ('Messwerten') zu Objekten gemäß festgelegten Regeln verstanden. Die Mängel dieser Definition werden bereits dadurch deutlich, dass die Zuweisung von Schulnoten durch Würfeln eine definitionsgemäße Messung wäre. Eine brauchbare Definition muss für eine Messung fordern, dass die Messwerte zueinander Beziehungen aufweisen, die den Beziehungen der gemessenen Objekte entsprechen. So wird z.B. für eine sinnvolle Längenmessung gefordert, dass der 'größte' Messwert dem 'längsten' Objekt entspricht, der 'kleinste' Messwert dem 'kürzesten' Objekt. Eine Messung in diesem Sinne ist eine 'strukturtreue Abbildung': Die Beziehungen der Objekte ('kürzer' - 'länger') werden durch die Beziehungen der zugeordneten Zahlen ('kleiner' - 'größer') korrekt wiedergegeben." Messen und Messniveau (1) (Schnell et al. 1993: 143, Herv. im Original)

39 "Die Verwendung eines bestimmten Kriteriums, z.B. Länge, definiert eine bestimmte Beziehung ('Relation') der Objekte zueinander. Eine Menge von Objekten, über die eine Relation definiert wurde, bezeichnet man als 'empirisches Relativ', eine Menge von Zahlen, über die eine Relation definiert wurde, als 'numerisches Relativ'. [...] Das Problem der Messung besteht nun darin, eine Zuordnung der Zahlen zu den Objekten zu finden, so dass die Ordnung im numerischen Relativ der Ordnung im empirischen Relativ entspricht: Das Problem besteht in der Angabe einer Regel, die eine strukturtreue Abbildung ermöglicht." (Schnell et al. 1993: 143f., Herv. im Original) Messen und Messniveau (2)

40 Codieren Bei einigen Variablen ergibt sich die Zuordnung von Zahlen zu Variablenausprägungen unproblematisch, z.B. Alter in Jahren – 20 Bei anderen Variablen muss man Entscheidungen treffen, z.B. beim Geschlecht Mann=1, Frau=2 Die codierten Werte werden dann in eine Datenmatrix eingegeben

41 Datenmatrix AlterGeschlecht Vp 1201 Vp 2 Vp 3 Vp 4 Vp 5 Vp 6 Vp 7 Vp 8 …

42 Skalenniveaus Niveau:Eigenschaft:Beispiel:erlaubte Rechenoperationen Nominal- skala NameGeschlecht =  Ordinal- skala Rangfolge Schulnoten Intervall- skala mit gleichen Intervallabständen Temperatur (Celsius) + - Verhältnis- skala mit absolutem Nullpunkt Länge (Meter), Alter * /

43 Arten von Variablen Diskrete Variablen haben begrenzte Ausprägungen, z.B. Zahl der Kinder Kontinuierliche Variablen: zwischen zwei Werten ist jeder Zwischenwert möglich, z.B. Alter, Größe für die Statistik reicht folgende Unterscheidung: Kategoriale Variablen: wenige Ausprägungen Kontinuierliche Variablen: viele Ausprägungen

44 Arten von Variablen Unterscheidung nach...Bezeichnungen Messniveau nominalordinalintervall-, verhältnisskaliert nicht-metrischmetrisch Anzahl der Ausprägungen diskretkontinuierlich Art der Datenanalysekategorialkontinuierlich

45 Mittelwerte und Streuungsmaße nach Messniveau (1) Zentrale Tendenz (Mittelwerte) NominalOrdinalIntervallVerhältnis Modusja MedianneinJaja Arithm. Mittelnein ja Geom. Mittelnein ja

46 Mittelwerte und Streuungsmaße nach Messniveau (2) Streuung (Streuungsmaße) NominalOrdinalIntervallVerhältnis Spannweitenein(ja)ja Quartilsabstandnein(ja)ja Mittl. absolute Abweichung nein ja Varianz Standardabweichung nein ja Variationskoeffizientnein ja

47 Skalierung Häufig werden mehrere Variablen gemessen, die gemeinsam eine neue Variable ergeben: Index: eine Variable (soziale Schicht) ergibt sich aus mehreren anderen Variablen (Einkommen, Bildung, Berufsprestige). Die Berechnung der neuen aus den alten Variablen erfolgt nach definierten Rechenoperationen; im Beispiel ergibt sich das Problem unterschiedlicher Einheiten

48 Skalierung Skala: die Summe oder der Mittelwert aus mehreren Items (Fragen), die dasselbe Konstrukt messen sollen. Die Einheiten sind bei allen Items gleich. Es werden mehrere Items vorgelegt, um die Messgenauigkeit zu erhöhen. Wenn einige Items gegensinnig formuliert sind, müssen sie umgepolt werden, z.B. Ich habe Angst.nein ja Ich bin ganz ruhig.nein ja recode It2 (1=5) (2=4) (3=3) (4=2) (5=1).

49 Skalierung Der Skalenwert ergibt sich aus dem Mittelwert der einzelnen Items. Die Mittelung hat gegenüber einer Summierung zwei Vorteile: Das Minimum und das Maximum der Werte, die auftreten können, sind wie bei den Items, die Werte sind leichter interpretierbar. Fehlende Werte werden ausgeglichen, da nur durch die Anzahl vorhandener Werte geteilt wird.


Herunterladen ppt "Statistik I demnächst in Hörsaal 16 !!. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006."

Ähnliche Präsentationen


Google-Anzeigen