Deskriptive Statistik und Wahrscheinlichkeitstheorie

Deskriptive Statistik und Wahrscheinlichkeitstheorie
Tutorat Deskriptive Statistik und Wahrscheinlichkeitstheorie

In Kleingruppen Kurze Vorstellung
Was erwarten wir von dem Fach Statistik? Was erwarten wir vom Tutorat? Warum brauchen Psychologen Statistik? Schätzt euch individuell auf einer Skala von 1 (gar nicht) bis 5 (völlig zutreffend) ein und berichtet den Mittelwert (arithmetisches Mittel). Ich freue mich auf die Methodenausbildung. Der Gedanke an die Prüfungen macht mir Angst. Statistik wird mir schwerer fallen als andere Fächer.

Statistik?

Warum Statistik? Voraussetzung, um Forschung kritisch zu betrachten und um ihre Denklogik zu verstehen Zur Beurteilung, wann welche Methoden für eigene Untersuchungen geeignet sind Zur Anwendung und Auswertung psychologischer Tests Um den Bachelor zu erlangen uvm.

Lernziele Wissen,… wie Objekte zu statistisch auswertbaren Daten werden. was Skalenniveaus sind und wovon sie abhängen. welche Transformationen verlustfrei gerechnet werden können. welche große Grauzone in puncto Skalenniveaus existiert.

Was ist deskriptive Statistik?
Der Bereich der Statistik, der eine Menge von erhobenen Daten summarisch (und damit überschaubar) darstellt bzw. beschreibt. Die Veranschaulichung kann grafisch oder rein numerisch erfolgen. Wortwörtlich: Beschreibende Statistik.

Daten als Balkendiagramm
Eine rein numerische Darstellung dieser Daten wäre z.B: Der mittlere (durchschnittliche) Nitratgehalt in Säuglingsnahrung liegt in unserer Stichprobe bei 52 mg/kg.

Was ist Inferenzstatistik?
Inferenzstatistik bedeutet, aus Stichproben einer Population Rückschlüsse auf die Gesamtpopulation zu ziehen. Wortwörtlich: Schließende Statistik.

Die Verbindung Die Verfahren der Inferenzstatistik verwenden als Datengrundlage ihrer Berechnungen die mittels deskriptiver Statistik erhobenen Kennwerte. Die mathematische Grundlage der Inferenzstatistik bildet die Wahrscheinlichkeitsrechnung oder – theorie.

Der große Rahmen

Datenerhebung Bevor wir Daten deskriptiv beschreiben (und später eventuell inferentiell auswerten) können, müssen selbige Daten zunächst erhoben werden. In einem ersten Schritt werden die Merkmale der untersuchten Personen/Objekte zunächst klassifiziert. In einem zweiten Schritt werden die nun klassifizierten Merkmale in Zahlen überführt.

Klassifikationskriterium I
Qualitativ vs. Quantitativ Qualitative Merkmale beschreiben die Zugehörigkeit einer Person oder eines Objektes zu einer Kategorie. Beispiele: Studienfach, Geschlecht Quantitative Merkmale beschreiben die Ausprägung eines Merkmals auf einem Kontinuum. Beispiele: Extraversion, Zeit, Anzahl

Klassifikationskriterium II
Manifest vs. Latent Manifeste Merkmale können direkt beobachtet oder gemessen werden. Latente Merkmale (synonym: Konstrukte) sind nur indirekt zu erfassen. Dies geschieht durch Rückschluss aus manifesten Merkmalen. Wie sind unsere Merkmale Haarfarbe, Herkunftsland, Körpergröße und Extraversion einzuordnen? Manifest: Haarfarbe, Nationalität, Körpergröße Latent: Extraversion, Mut, Intelligenz

Überblick: Klassifikation von Merkmalen

Vom Merkmal zur Variable
In Schritt 2 der Datenerhebung müssen wir die nun klassifizierten Merkmale in Zahlen überführen. Dies geschieht durch eine Operationalisierung. Die Operationalisierung definiert, wie unterschiedliche Ausprägungen eines Merkmals in Zahlen übertragen (=kodiert) werden. Man spricht nun von einer Variable.

Beispiele für Operationalisierungen
Die Variable „Haar“ soll die Haarfarbe erfassen. Es wird der Wert 1 für blond, der Wert 2 für schwarz und der Wert 3 für rot verwendet. Die Variable „Größe“ soll die Körpergröße der untersuchten Personen in cm erfassen. Die Variable „extr“ soll die mittels Fragebogen selbst eingeschätzte Extraversion auf einer Skala von 0 (maximal introvertiert) bis 10 (maximal extravertiert) erfassen.

Definition „Messung“ Messen ist eine Zuordnung von Zahlen zu Objekten oder Ereignissen, sofern diese Zuordnung eine homomorphe Abbildung eines empirischen Relativs in ein numerisches Relativ ist (Ort, 1983).

Tutorat Deskriptive Statistik
Numerisches Relativ Empirisches Relativ

Tutorat Deskriptive Statistik

Klassifikation von Variablen
Analog zu Merkmalen werden auch Variablen klassifiziert. Manifest vs. latent: entspricht dem zugrunde liegenden Merkmal Diskret vs. kontinuierlich (→ qualitativ vs. quantitativ)

Diskrete vs. kontinuierliche Variablen
Die Anzahl der möglichen Werte ist endlich und damit genau abzählbar. Beispiel: Anzahl Personen in einem Tutorat Kontinuierlich / Stetig Die Variable kann auf einem beliebig genauem Kontinuum beschrieben werden, d.h. ihre Anzahl geht potentiell gegen unendlich. Beispiel: Temperatur, Körpergröße

Diskrete vs. kontinuierliche Variablen
Diskret oder kontinuierlich? Beruf (Bezeichnung) diskret Reaktionszeit (in ms) kontinuierlich Parteizugehörigkeit Tierart Gewicht (in kg)

Schaubild Merkmal & Variable
Operationalisierung Merkmal Variable latent/manifest diskret kontinuierlich qualitativ quantitativ

Variable und Skalenniveau
In der Statistik ordnet man Variablen ein so genanntes Skalenniveau zu. Diese Skalenniveau hat folgende Konsequenzen: Es bestimmt, welche mathematischen Operationen (Tests) mit einer Variable durchgeführt werden können. Welche Transformationen von Variablen möglich sind, ohne Information zu verlieren (d.h. das Skalenniveau zu senken). Welche Aussagen meine Daten zulassen.

Transformationen Man rechnet alle Daten mit einer bestimmten Formel um. Beispiel: Sekunden in Millisekunden umrechnen. Jedes Skalenniveau erlaubt bestimmte verlustfreie Transformationen !

Die 4 Skalenniveaus Die Nominalskala Die Ordinalskala
Man unterscheidet 4 Skalenniveaus: Die Nominalskala Die Ordinalskala Die Intervallskala (metrisch) Die Verhältnisskala (metrisch)

Die 4 Skalenniveaus Dabei steigt die Messgenauigkeit bzw. Aussagekraft der Daten von 1 nach 4 an. Viele für die Psychologie relevante Testverfahren setzten mindestens Intervallskalenniveau voraus.  Daten auf einem möglichst hohem Skalenniveau erfassen!

Wovon hängt das Skalenniveau ab?
Vom untersuchten Merkmal selbst: Geschlecht kann z.B. nur auf Nominalskalenniveau erhoben werden. Von der Operationalisierung des Merkmals: Schulleistung in Note oder in „sitzen geblieben“ vs. „nicht sitzen geblieben“

Welches Skalenniveau? Drei Arten der Erfassung des Merkmals „Depressivität“ Typologie: 0 = keine Störung 1 = Störung nominal Abgestufte Typologie: 0 = nicht beeinträchtigt 1 = wenig beeinträchtigt 2 = eher beeinträchtigt 3 = klinisch relevante Beeinträchtigung ordinal Kontinuierliche (dimensionale) Erfassung: Testergebnis in einem klinischen Interview (z.B. BDI 0-63) metrisch

Die Nominalskala Es werden „Namen“ (Zahlenwerte) für jede Merkmalsausprägung vergeben. Beispiel: Geschlecht („m“ / „w“); in SPSS wird dann eingegeben m=1, w=2 Zwei Annahmen müssen berücksichtigt werden: Exklusivität: Unterschiedliche Merkmalsausprägungen werden unterschiedlichen Zahlen zugeordnet. Exhaustivität: Jeder beobachteten Merkmalsausprägung wird eine Zahl zugeordnet.

Die Nominalskala Aussagekraft von Variablenwerten: Information über Gleichheit / Verschiedenheit der Merkmalsausprägung (Keine Aussagen zu größer/kleiner Relationen). Mögliche Transformationen: Es sind alle eineindeutigen Transformationen erlaubt: weiblich = 1; männlich = 2 oder weiblich = 2; männlich = 1 oder weiblich = 100; männlich = 200

Eineindeutig? Eindeutig: Jedem Element der Menge A kann ein Element der Menge B zugeordnet werden. Eineindeutig: Zusätzlich kann jedem Element der Menge B auch genau ein Element der Menge A zugeordnet werden. Merkmal „Herkunft“ (Menge A) Variable „stadt“ (Menge B) Bochum „1“ Ulm „2“ Heidelberg „3“ „4“ Kassel

Die Ordinalskala Beispiel: Schulabschluss
Bei der Ordinalskala (Sonderfall: Rangskala) geben die Variablenwerte Aufschluss über die Rangfolge der Merkmalsträger bezüglich des gemessenen Merkmals. Beispiel: Schulabschluss 0 = kein SA 1 = Hauptschule 2 = Realschule 3 = Gymnasium Zusätzliche Annahme der Operationalisierung: Die zugeordneten Zahlen repräsentieren eine Rangreihe der Merkmalsausprägung.

Die Ordinalskala Aussagekraft von Variablenwerten:
Information über Gleichheit / Verschiedenheit der Merkmalsausprägung, Größer / Kleiner Relationen Mögliche Transformationen: Erlaubt sind nur noch alle monotonen Transformationen. Beispiele: y = x + 3 y = 2x y = log(x)

Monotone Funktion A

Monotone Funktion B

Nicht-monotone Funktion A

Transformationen y =x², monoton oder nicht monoton? Antwort: Kommt darauf an. Nur wenn für unseren Definitionsbereich gilt x ≥ 0. Wer nicht sattelfest in Algebra ist, braucht sich keine Sorgen machen. Es werden keine fiesen Transformationen abgefragt und eure eigenen dürft ihr so einfach (und so auswendig) wie nötig gestalten.

Die Intervallskala Bei der Intervallskala geben die Variablenwerte Aufschluss über die Abstände zwischen Merkmalsausprägungen. Beispiel: Ergebnisse eines Intelligenztests: Peter = 115; Anne = 130 → Differenz 15 Punkte Zusätzliche Annahme der Operationalisierung: Gleich große Intervalle zwischen Zahlenwerten der Variable repräsentieren gleich große Abstände in der Merkmalsausprägung.

Die Intervallskala Aussagekraft von Variablenwerten:
Information über Gleichheit / Verschiedenheit der Merkmalsausprägung, Größer / Kleiner Relationen Größe von Unterschieden Mögliche Transformationen: Erlaubt sind nur noch lineare Transformationen (y = ax+b). Beispiele: y = x -100 y = 0.1 x

Die Verhältnisskala Die Verhältnisskala kann vor allem bei der Messung physikalischer Größen (Länge, Gewicht, Zeit) angenommen werden. Beispiel: Reaktionszeit (ms). Zusätzliche Annahme für die Operationalisierung: Die Skala hat einen definierten Null-Punkt.

Die Verhältnisskala Aussagekraft von Variablenwerten:
Information über Gleichheit / Verschiedenheit der Merkmalsausprägung Größer / Kleiner Relationen Größe von Unterschieden Verhältnis von Merkmalsausprägungen (z.B. doppelte Reaktionszeit) Mögliche Transformationen: Erlaubt sind nur noch alle multiplikativen Transformationen (y = ax). Beispiele: y = ∙ x (Umrechnung von Millisekunden in Sekunden) y = 24 ∙ x (Umrechnung von Jahren in Monate) → Transformationen können z.B. dazu dienen, Daten aus verschiedenen Studien zusammenzuführen.

Überblick Skalenniveaus

Skalenniveaus und Informationsgewinn

Die große Grauzone Oft ist nicht eindeutig, ob eine Variable als ordinal- oder als intervallskaliert zu betrachten ist. Die Grauzone beginnt dort, wo die Variable mehr Information als „Größer/Kleiner“ Relation beinhaltet und endet dort, wo gesichert ist, dass Gleichheit der Intervalle gegeben ist. Letzteres muss in jedem Einzelfall theoretisch begründet werden.

Lernziele Wissen,… wie Objekte zu statistisch auswertbaren Daten werden. was Skalenniveaus sind und wovon sie abhängen. welche Transformationen verlustfrei gerechnet werden können. welche große Grauzone in puncto Skalenniveaus existiert.

Arbeitsblatt Aufgabe 1.1

Vielen Dank für eure Aufmerksamkeit!
Bis nächste Woche Fragen an

Deskriptive Statistik und Wahrscheinlichkeitstheorie

Ähnliche Präsentationen

Präsentation zum Thema: "Deskriptive Statistik und Wahrscheinlichkeitstheorie"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback

Anmelden

Anmeldung über soziales Netzwerk:

Deskriptive Statistik und Wahrscheinlichkeitstheorie

Ähnliche Präsentationen

Präsentation zum Thema: "Deskriptive Statistik und Wahrscheinlichkeitstheorie"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback