Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistiktutorat Sitzung 1: Grundbegriffe der Statistik

Ähnliche Präsentationen


Präsentation zum Thema: "Statistiktutorat Sitzung 1: Grundbegriffe der Statistik"—  Präsentation transkript:

1 Statistiktutorat Sitzung 1: Grundbegriffe der Statistik

2 Euer Rating Schätzt auf einer Skala von 1 (voll und ganz) bis 5 (im Gegenteil) folgende Frage ein: Ich erwarte, das Statistik mir mehr Schwierigkeiten machen wird, als andere Fächer im Psychologiestudium. Der Wert 3 würde also die Erwartung ausdrücken, dass Statistik für euch durchschnittlich schwierig wird; ein kleinerer Wert hieße schwieriger, ein größerer Wert weniger schwierig.

3 Was ist deskriptive Statistik? Der Bereich der Statistik, der eine Menge von erhobenen Daten summarisch (und damit überschaubar) darstellt bzw. beschreibt. Die Veranschaulichung kann grafisch oder rein numerisch erfolgen. Wortwörtlich: Beschreibende Statistik.

4 Daten als Balkendiagramm Eine rein numerische Darstellung dieser Daten wäre z.B: Der mittlere (durchschnittliche) Nitratgehalt in Säuglingsnahrung liegt in unserer Stichprobe bei 52 mg/kg.

5 Was ist Inferenzstatistik Inferenzstatistik bedeutet, aus Stichproben einer Population Rückschlüsse auf die Gesamtpopulation zu ziehen. Wortwörtlich: Schließende Statistik.

6 Die Verbindung Die Verfahren der Inferenzstatistik verwenden als Datengrundlage ihrer Berechnungen die mittels deskriptiver Statistik erhobenen Kennwerte. Die mathematische Grundlage der Inferenzstatistik bildet die Wahrscheinlichkeitsrechnung oder –theorie.

7 Der große Rahmen

8 Datenerhebung oBevor wir Daten deskriptiv beschreiben (und später eventuell inferentiell auswerten) können, müssen selbige Daten zunächst erhoben werden. oIn Schritt 1 werden die Merkmale der untersuchten Personen/Objekte zunächst klassifiziert.

9 Klassifikationskriterium I Qualitativ vs. Quantitativ oQualitative Merkmale beschreiben die Zugehörigkeit einer Person oder eines Objektes zu einer Kategorie. Beispiele: Haarfarbe, Nationalität oQuantitative Merkmale beschreiben die Ausprägung eines Merkmals auf einem Kontinuum. Beispiele: Extraversion, Körpergröße

10 Manifest vs. Latent oManifeste Merkmale können direkt beobachtet oder gemessen werden. oLatente Merkmale (synonym: Konstrukte) sind nur indirekt zu erfassen. Dies geschieht durch Rückschluss aus manifesten Merkmalen. oWie sind unserer Merkmale Haarfarbe, Herkunftsland, Körpergröße und Extraversion einzuordnen? Manifest: Haarfarbe, Nationalität, Körpergröße Latent: Extraversion Klassifikationskriterium II

11 Überblick: Klassifikation von Merkmalen

12 Vom Merkmal zur Variable oIn Schritt 2 der Datenerhebung müssen wir die nun klassifizierten Merkmale in Zahlen überführen. Dies geschieht durch eine Operationalisierung (synonym: Messvorschrift). oDie Operationalisierung definiert, wie unterschiedliche Ausprägungen eines Merkmals in Zahlen übertragen (=kodiert) werden. oMan spricht nun von einer Variable.

13 Definition Messung Wir haben nun zwei Schritte zur Datenerhebung unternommen. Datenerhebung ist synonym für Messung – wir können also nun auch den Begriff Messung definieren. oMessung: Zuordnung von Zahlen zu Objekten gemäß den Regeln einer Operationalisierung. oMit anderen Worten: kodieren von Merkmalen bzw. Überführung von Merkmalen in Variablen.

14 Beispiele für Operationalisierungen oDie Variable Haar soll die Haarfarbe erfassen. Es wird der Wert 1 für blond, der Wert 2 für schwarz und der Wert 3 für rot verwendet. oDie Variable Größe soll die Körpergröße der untersuchten Personen in cm erfassen. oDie Variable extr soll die mittels Fragebogen selbst eingeschätzte Extraversion auf einer Skala von 0 (maximal introvertiert) bis +10 (maximal extravertiert) erfassen.

15 Klassifikation von Variablen Analog zu Merkmalen werden auch Variablen klassifiziert. oManifest vs. latent: entspricht dem zugrunde liegenden Merkmal. oDiskret vs. kontinuierlich ( qualitativ vs. quantitativ)

16 Diskrete vs. kontinuierliche Variablen Diskret oDie Anzahl der möglichen Werte (auch wenn sehr hoch) ist endlich und damit genau abzählbar. Kontinuierlich oDie Variable kann auf einem beliebig genauem Kontinuum beschrieben werden, d.h. ihre Anzahl geht potentiell gegen unendlich.

17 Diskret (d) oder kontinuierlich (k)? oBeruf (Bezeichnung) (d) oReaktionszeit (in ms) (k) oParteizugehörigkeit (d) oTierart (d) oGewicht (in kg) (k) Diskrete vs. kontinuierliche Variablen

18 qualitativquantitativ diskretkontinuierlich latent/manifest Operationalisierung Schaubild Merkmal & Variable MerkmalVariable

19 oIn der Statistik ordnet man Variablen ein so genanntes Skalenniveau zu. oDiese Skalenniveau hat folgende Konsequenzen: 1.Es bestimmt, welche mathematischen Operationen (Tests) mit einer Variable durchgeführt werden können. 2.Welche Transformationen von Variablen möglich sind, ohne Information zu verlieren (d.h. das Skalenniveau zu senken). 3.Welche Aussagen meine Daten zulassen. Variable und Skalenniveau

20 Die 4 Skalenniveaus Man unterscheidet 4 Skalenniveaus: 1.Die Nominalskala 2.Die Ordinalskala 3.Die Intervallskala (metrisch) 4.Die Verhältnisskala (metrisch) oDabei steigt die Messgenauigkeit bzw. Aussagekraft der Daten von 1 nach 4 an. oEs sollte daher immer versucht werden, Daten auf einem möglichst hohem Skalenniveau zu erfassen. oViele für die Psychologie relevante Testverfahren setzten mindestens Intervallskalenniveau voraus. oZu beachten ist aber: Je höher das Skalenniveau, desto vorsichtiger muss ich mit meinen Daten umgehen.

21 Wovon hängt das Skaleniveau ab? I.Vom untersuchten Merkmal selbst: Geschlecht kann z.B. (heute) nur auf Nominalskalenniveau erhoben werden. II.Von der Operationalisierung des Merkmals: Die Schulleistung lässt sich mindestens ordinalskaliert erheben, doch die Operationalisierung sitzen geblieben vs. nicht sitzen geblieben wäre ebenfalls nur nominalskaliert.

22 Welches Skalenniveau? 3 Arten der Erfassung von psychischen Störungen oTypologie: 0 = keine Störung 1 = Störung nominal oAbgestufte Typologie: 0 = nicht beeinträchtigt 1 = wenig beeinträchtigt 2 = eher beeinträchtigt 3 = klinisch relevante Beeinträchtigung ordinal oKontinuierliche (dimensionale) Erfassung: Testergebnis in einem klinischen Interview (z.B ) metrisch

23 Die Nominalskala Es werden Namen (Zahlenwerte) für jede Merkmalsausprägung vergeben. Beispiel: Geschlecht (m / w); in SPSS wird dann eingegeben m=1, w=2 Zwei Annahmen müssen berücksichtigt werden: Exklusivität: Unterschiedliche Merkmalsausprägungen werden unterschiedlichen Zahlen zugeordnet. Exhaustivität: Jeder beobachteten Merkmalsausprägung eine Zahl zugeordnet.

24 Die Nominalskala Aussagekraft von Variablenwerten: Information über Gleichheit / Verschiedenheit der Merkmalsausprägung (Keine Aussagen zu größer/kleiner Relationen). Mögliche Transformationen: Es sind alle eineindeutigen Transformationen erlaubt: weiblich = 1; männlich = 2 oder weiblich = 2; männlich = 1 oder weiblich = 100; männlich = 200

25 Eineindeutig? Peer Jeanette Maria Eindeutig: Jedem Element der Menge A kann ein Element der Menge B zugeordnet werden. Eineindeutig: Zusätzlich kann jedem Element der Menge B auch genau ein Element der Menge A zugeordnet werden. Merkmal (Menge A) Variable (Menge B) Maria 2 ? ?

26 Die Ordinalskala Bei der Ordinalskala (Sonderfall: Rangskala) geben die Variablenwerte Aufschluss über die Rangfolge der Merkmalsträger bezüglich des gemessenen Merkmals. Beispiel: Schulabschluss –0 = kein SA –1 = Hauptschule –2 = Realschule –3 = Gymnasium Zusätzliche Annahme der Operationalisierung: Die zugeordneten Zahlen repräsentieren eine Rangreihe der Merkmalsausprägung.

27 Die Ordinalskala Aussagekraft von Variablenwerten: -Information über Gleichheit / Verschiedenheit der Merkmalsausprägung, -Größer / Kleiner Relationen Mögliche Transformationen: Erlaubt sind nur noch alle monotonen Transformationen. Beispiele: y = x + 3 y = 2x y = log(x)

28 Monotone Funktion A

29 Monotone Funktion B

30 Nicht-monotone Funktion A

31 Nicht-monotone Funktion B

32 Transformationen y =x², monoton oder nicht monoton? Antwort: Kommt darauf an. Nur wenn für unseren Definitionsbereich gilt x 0. Wer nicht sattelfest in Algebra ist, braucht sich keine Sorgen machen. Es werden keine fiesen Transformationen abgefragt und eure eigenen dürft ihr so einfach (und so auswendig) wie nötig gestalten.

33 Die Intervallskala Bei der Intervallskala geben die Variablenwerte Aufschluss über die Abstände zwischen Merkmalsausprägungen. Beispiel: Ergebnisse eines Intelligenztests: Peter = 115; Anne = 130 Differenz 15 Punkte Zusätzliche Annahme der Operationalisierung: Gleich große Intervalle zwischen Zahlenwerten der Variable repräsentieren gleich große Abstände in der Merkmalsausprägung.

34 Die Intervallskala Aussagekraft von Variablenwerten: -Information über Gleichheit / Verschiedenheit der Merkmalsausprägung, -Größer / Kleiner Relationen -Größe von Unterschieden Mögliche Transformationen: Erlaubt sind nur noch lineare Transformationen (y = ax+b). Beispiele: y = x -100 y = 0.1 x

35 Die Verhältnisskala Die Verhältnisskala kann vor allem bei der Messung physikalischer Größen (Länge, Gewicht, Zeit) angenommen werden. Beispiel: Reaktionszeit (ms). Zusätzliche Annahme für die Operationalisierung: Die Skala hat einen definierten Null-Punkt.

36 Die Verhältnisskala Aussagekraft von Variablenwerten: -Information über Gleichheit / Verschiedenheit der Merkmalsausprägung -Größer / Kleiner Relationen -Größe von Unterschieden -Verhältnis von Merkmalsausprägungen (z.B. doppelte Reaktionszeit) Mögliche Transformationen: Erlaubt sind nur noch alle multiplikativen Transformationen (y = ax). Beispiele: y = x (Umrechnung von Millisekunden in Sekunden) y = 24 x (Umrechnung von Jahren in Monate) Transformationen können z.B. dazu dienen, Daten aus verschiedenen Studien zusammenzuführen.

37 Überblick Skalenniveaus

38 Skalenniveaus und Informationsgewinn

39 Die große Grauzone oOft ist nicht eindeutig, ob eine Variable als ordinal- oder als intervallskalliert zu betrachten ist. oDie Grauzone beginnt dort, wo die Variable mehr Information als Größer/Kleiner Relation beinhaltet und endet dort, wo gesichert ist, dass Gleichheit der Intervalle gegeben ist. oLetzteres muss in jedem Einzelfall theoretisch begründet werden.

40 Lernziele oWie Objekte zu statistisch auswertbaren Daten werden. oWas Skalenniveaus sind und wovon sie abhängen. oWelche große Grauzone in puncto Skalenniveaus existiert.

41 Arbeitsblatt Aufgabe 1.1

42 Arbeitsblatt Aufgabe 1.2

43 Arbeitsblatt Aufgabe 1.3

44 Arbeitsblatt Aufgabe 1.4

45 Arbeitsblatt Aufgabe 1.5

46 Arbeitsblatt Aufgabe 1.6

47 Vielen Dank für eure Aufmerksamkeit!


Herunterladen ppt "Statistiktutorat Sitzung 1: Grundbegriffe der Statistik"

Ähnliche Präsentationen


Google-Anzeigen