Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistiktutorat Sitzung 1: Grundbegriffe der Statistik

Ähnliche Präsentationen


Präsentation zum Thema: "Statistiktutorat Sitzung 1: Grundbegriffe der Statistik"—  Präsentation transkript:

1 Statistiktutorat Sitzung 1: Grundbegriffe der Statistik

2 Euer Rating Schätzt auf einer Skala von 1 (voll und ganz) bis 5 (im Gegenteil) folgende Frage ein: „Ich erwarte, das Statistik mir mehr Schwierigkeiten machen wird, als andere Fächer im Psychologiestudium“. Der Wert 3 würde also die Erwartung ausdrücken, dass Statistik für euch durchschnittlich schwierig wird; ein kleinerer Wert hieße schwieriger, ein größerer Wert weniger schwierig.

3 Was ist deskriptive Statistik?
Der Bereich der Statistik, der eine Menge von erhobenen Daten summarisch (und damit überschaubar) darstellt bzw. beschreibt. Die Veranschaulichung kann grafisch oder rein numerisch erfolgen. Wortwörtlich: Beschreibende Statistik. deskriptiv wie „to describe“

4 Daten als Balkendiagramm
Eine rein numerische Darstellung dieser Daten wäre z.B: Der mittlere (durchschnittliche) Nitratgehalt in Säuglingsnahrung liegt in unserer Stichprobe bei 52 mg/kg. 

5 Was ist Inferenzstatistik
Inferenzstatistik bedeutet, aus Stichproben einer Population Rückschlüsse auf die Gesamtpopulation zu ziehen. Wortwörtlich: Schließende Statistik. Inferenz wie „the inference“ (Die Folgerung)

6 Die Verbindung Die Verfahren der Inferenzstatistik verwenden als Datengrundlage ihrer Berechnungen die mittels deskriptiver Statistik erhobenen Kennwerte. Die mathematische Grundlage der Inferenzstatistik bildet die Wahrscheinlichkeitsrechnung oder –theorie.

7 Der große Rahmen Stochastik = griechisch für „Kunst des Mutmaßens“
Mathematische Stochastik beschäftigt sich mit der Beschreibung und Untersuchung von Zufallsexperimenten Als mathematische Statistik (auch: schließende Statistik, induktive Statistik, Inferenzstatistik oder inferentielle Statistik) bezeichnet man das Teilgebiet der Statistik, das sich mit Analyse von Daten unter mathematischen Modellen beschäftigt

8 Datenerhebung Bevor wir Daten deskriptiv beschreiben (und später eventuell inferentiell auswerten) können, müssen selbige Daten zunächst erhoben werden. In Schritt 1 werden die Merkmale der untersuchten Personen/Objekte zunächst klassifiziert.

9 Klassifikationskriterium I
Qualitativ vs. Quantitativ Qualitative Merkmale beschreiben die Zugehörigkeit einer Person oder eines Objektes zu einer Kategorie. Beispiele: Haarfarbe, Nationalität Quantitative Merkmale beschreiben die Ausprägung eines Merkmals auf einem Kontinuum. Beispiele: Extraversion, Körpergröße

10 Klassifikationskriterium II
Manifest vs. Latent Manifeste Merkmale können direkt beobachtet oder gemessen werden. Latente Merkmale (synonym: Konstrukte) sind nur indirekt zu erfassen. Dies geschieht durch Rückschluss aus manifesten Merkmalen. Wie sind unserer Merkmale Haarfarbe, Herkunftsland, Körpergröße und Extraversion einzuordnen? Manifest: Haarfarbe, Nationalität, Körpergröße Latent: Extraversion

11 Überblick: Klassifikation von Merkmalen

12 Vom Merkmal zur Variable
In Schritt 2 der Datenerhebung müssen wir die nun klassifizierten Merkmale in Zahlen überführen. Dies geschieht durch eine Operationalisierung (synonym: Messvorschrift). Die Operationalisierung definiert, wie unterschiedliche Ausprägungen eines Merkmals in Zahlen übertragen (=kodiert) werden. Man spricht nun von einer Variable.

13 Definition „Messung“ Wir haben nun zwei Schritte zur Datenerhebung unternommen. Datenerhebung ist synonym für Messung – wir können also nun auch den Begriff Messung definieren. Messung: Zuordnung von Zahlen zu Objekten gemäß den Regeln einer Operationalisierung. Mit anderen Worten: kodieren von Merkmalen bzw. Überführung von Merkmalen in Variablen.

14 Beispiele für Operationalisierungen
Die Variable „Haar“ soll die Haarfarbe erfassen. Es wird der Wert 1 für blond, der Wert 2 für schwarz und der Wert 3 für rot verwendet. Die Variable „Größe“ soll die Körpergröße der untersuchten Personen in cm erfassen. Die Variable „extr“ soll die mittels Fragebogen selbst eingeschätzte Extraversion auf einer Skala von 0 (maximal introvertiert) bis +10 (maximal extravertiert) erfassen.

15 Klassifikation von Variablen
Analog zu Merkmalen werden auch Variablen klassifiziert. Manifest vs. latent: entspricht dem zugrunde liegenden Merkmal. Diskret vs. kontinuierlich (→ qualitativ vs. quantitativ)

16 Diskrete vs. kontinuierliche Variablen
Die Anzahl der möglichen Werte (auch wenn sehr hoch) ist endlich und damit genau abzählbar. Kontinuierlich Die Variable kann auf einem beliebig genauem Kontinuum beschrieben werden, d.h. ihre Anzahl geht potentiell gegen unendlich.

17 Diskrete vs. kontinuierliche Variablen
Diskret (d) oder kontinuierlich (k)? Beruf (Bezeichnung) (d) Reaktionszeit (in ms) (k) Parteizugehörigkeit Tierart Gewicht (in kg)

18 Schaubild Merkmal & Variable
Operationalisierung Merkmal Variable latent/manifest diskret kontinuierlich qualitativ quantitativ

19 Variable und Skalenniveau
In der Statistik ordnet man Variablen ein so genanntes Skalenniveau zu. Diese Skalenniveau hat folgende Konsequenzen: Es bestimmt, welche mathematischen Operationen (Tests) mit einer Variable durchgeführt werden können. Welche Transformationen von Variablen möglich sind, ohne Information zu verlieren (d.h. das Skalenniveau zu senken). Welche Aussagen meine Daten zulassen.

20 Die 4 Skalenniveaus Man unterscheidet 4 Skalenniveaus:
Die Nominalskala Die Ordinalskala Die Intervallskala (metrisch) Die Verhältnisskala (metrisch) Dabei steigt die Messgenauigkeit bzw. Aussagekraft der Daten von 1 nach 4 an . Es sollte daher immer versucht werden, Daten auf einem möglichst hohem Skalenniveau zu erfassen. Viele für die Psychologie relevante Testverfahren setzten mindestens Intervallskalenniveau voraus. Zu beachten ist aber: Je höher das Skalenniveau, desto „vorsichtiger“ muss ich mit meinen Daten umgehen.

21 Wovon hängt das Skaleniveau ab?
Vom untersuchten Merkmal selbst: Geschlecht kann z.B. (heute) nur auf Nominalskalenniveau erhoben werden. Von der Operationalisierung des Merkmals: Die Schulleistung lässt sich mindestens ordinalskaliert erheben, doch die Operationalisierung „sitzen geblieben“ vs. „nicht sitzen geblieben“ wäre ebenfalls nur nominalskaliert .

22 Welches Skalenniveau? 3 Arten der Erfassung von psychischen Störungen
Typologie: 0 = keine Störung 1 = Störung nominal Abgestufte Typologie: 0 = nicht beeinträchtigt 1 = wenig beeinträchtigt 2 = eher beeinträchtigt 3 = klinisch relevante Beeinträchtigung ordinal Kontinuierliche (dimensionale) Erfassung: Testergebnis in einem klinischen Interview (z.B ) metrisch

23 Die Nominalskala Es werden „Namen“ (Zahlenwerte) für jede Merkmalsausprägung vergeben. Beispiel: Geschlecht („m“ / „w“); in SPSS wird dann eingegeben m=1, w=2 Zwei Annahmen müssen berücksichtigt werden: Exklusivität: Unterschiedliche Merkmalsausprägungen werden unterschiedlichen Zahlen zugeordnet. Exhaustivität: Jeder beobachteten Merkmalsausprägung eine Zahl zugeordnet.

24 Die Nominalskala Aussagekraft von Variablenwerten:
Information über Gleichheit / Verschiedenheit der Merkmalsausprägung (Keine Aussagen zu größer/kleiner Relationen). Mögliche Transformationen: Es sind alle eineindeutigen Transformationen erlaubt: weiblich = 1; männlich = 2 oder weiblich = 2; männlich = 1 oder weiblich = 100; männlich = 200

25 Eineindeutig? Eindeutig: Jedem Element der Menge A kann ein Element der Menge B zugeordnet werden. Eineindeutig: Zusätzlich kann jedem Element der Menge B auch genau ein Element der Menge A zugeordnet werden. Merkmal (Menge A) Variable (Menge B) Peer „1“ Maria „2“ ? Jeanette „3“ „2“ Maria ?

26 Die Ordinalskala Beispiel: Schulabschluss
Bei der Ordinalskala (Sonderfall: Rangskala) geben die Variablenwerte Aufschluss über die Rangfolge der Merkmalsträger bezüglich des gemessenen Merkmals. Beispiel: Schulabschluss 0 = kein SA 1 = Hauptschule 2 = Realschule 3 = Gymnasium Zusätzliche Annahme der Operationalisierung: Die zugeordneten Zahlen repräsentieren eine Rangreihe der Merkmalsausprägung.

27 Die Ordinalskala Aussagekraft von Variablenwerten:
Information über Gleichheit / Verschiedenheit der Merkmalsausprägung, Größer / Kleiner Relationen Mögliche Transformationen: Erlaubt sind nur noch alle monotonen Transformationen. Beispiele: y = x + 3 y = 2x y = log(x)

28 Monotone Funktion A

29 Monotone Funktion B

30 Nicht-monotone Funktion A

31 Nicht-monotone Funktion B

32 Transformationen y =x², monoton oder nicht monoton?
Antwort: Kommt darauf an. Nur wenn für unseren Definitionsbereich gilt x ≥ 0. Wer nicht sattelfest in Algebra ist, braucht sich keine Sorgen machen. Es werden keine fiesen Transformationen abgefragt und eure eigenen dürft ihr so einfach (und so auswendig) wie nötig gestalten.

33 Die Intervallskala Bei der Intervallskala geben die Variablenwerte Aufschluss über die Abstände zwischen Merkmalsausprägungen. Beispiel: Ergebnisse eines Intelligenztests: Peter = 115; Anne = 130 → Differenz 15 Punkte Zusätzliche Annahme der Operationalisierung: Gleich große Intervalle zwischen Zahlenwerten der Variable repräsentieren gleich große Abstände in der Merkmalsausprägung.

34 Die Intervallskala Aussagekraft von Variablenwerten:
Information über Gleichheit / Verschiedenheit der Merkmalsausprägung, Größer / Kleiner Relationen Größe von Unterschieden Mögliche Transformationen: Erlaubt sind nur noch lineare Transformationen (y = ax+b). Beispiele: y = x -100 y = 0.1 x

35 Die Verhältnisskala Die Verhältnisskala kann vor allem bei der Messung physikalischer Größen (Länge, Gewicht, Zeit) angenommen werden. Beispiel: Reaktionszeit (ms). Zusätzliche Annahme für die Operationalisierung: Die Skala hat einen definierten Null-Punkt.

36 Die Verhältnisskala Aussagekraft von Variablenwerten:
Information über Gleichheit / Verschiedenheit der Merkmalsausprägung Größer / Kleiner Relationen Größe von Unterschieden Verhältnis von Merkmalsausprägungen (z.B. doppelte Reaktionszeit) Mögliche Transformationen: Erlaubt sind nur noch alle multiplikativen Transformationen (y = ax). Beispiele: y = ∙ x (Umrechnung von Millisekunden in Sekunden) y = 24 ∙ x (Umrechnung von Jahren in Monate) → Transformationen können z.B. dazu dienen, Daten aus verschiedenen Studien zusammenzuführen.

37 Überblick Skalenniveaus

38 Skalenniveaus und Informationsgewinn

39 Die große Grauzone Oft ist nicht eindeutig, ob eine Variable als ordinal- oder als intervallskalliert zu betrachten ist. Die Grauzone beginnt dort, wo die Variable mehr Information als „Größer/Kleiner“ Relation beinhaltet und endet dort, wo gesichert ist, dass Gleichheit der Intervalle gegeben ist. Letzteres muss in jedem Einzelfall theoretisch begründet werden.

40 Lernziele Wie Objekte zu statistisch auswertbaren Daten werden.
Was Skalenniveaus sind und wovon sie abhängen. Welche große Grauzone in puncto Skalenniveaus existiert.

41 Arbeitsblatt Aufgabe 1.1

42 Arbeitsblatt Aufgabe 1.2

43 Arbeitsblatt Aufgabe 1.3

44 Arbeitsblatt Aufgabe 1.4

45 Arbeitsblatt Aufgabe 1.5

46 Arbeitsblatt Aufgabe 1.6

47 Vielen Dank für eure Aufmerksamkeit!


Herunterladen ppt "Statistiktutorat Sitzung 1: Grundbegriffe der Statistik"

Ähnliche Präsentationen


Google-Anzeigen