Statistiktutorat Sitzung 1: Grundbegriffe der Statistik

Slides:



Advertisements
Ähnliche Präsentationen
GrafStat Ausgabe 2009 Ein kurzer Überblick.
Advertisements

Quanti Tutorium
Deskriptive Statistik und Explorative Datenanalyse
Definition [1]: Sei S eine endliche Menge und sei p eine Abbildung von S in die positiven reellen Zahlen Für einen Teilmenge ES von S sei p definiert.
Vom graphischen Differenzieren
Prof. Dr. W. Conen 15. November 2004
Was ist Testtheorie?.
Merkmale Beispiele Anwendung Träger Autos Menschen Völker Jahre
Die Beschreibung von Bewegungen
Bewegungswissenschaft
Ein Modellansatz zur Beschreibung von Vagheiten
Numerik partieller Differentialgleichungen
EmPra Der Einfluss und die Verarbeitung von emotionalen Reizen
Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.
Law of comparative judgement
Forschungsstatistik I
Kapitel 5 Stetigkeit.
Kapitel 6 Differenzierbarkeit. Kapitel 6: Differenzierbarkeit © Beutelspacher Juni 2005 Seite 2 Inhalt 6.1 Die Definition 6.2 Die Eigenschaften 6.3 Extremwerte.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Quantitative Methoden I
Forschungsmethoden und Diagnostik
Diskurs Fragebögen Auswertung.
Statistiktutorat Thema 1: Grundbegriffe der Statistik
Deskriptive Statistik und Wahrscheinlichkeitstheorie
Univariate Statistik M. Kresken.
Grundbegriffe M. Kresken.
§9 Der affine Raum – Teil 2: Geraden
§9 Der affine Raum – Teil 2: Geraden
Tutorium
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Diskrete Wahrscheinlichkeitsmodelle
Stetige Zufallsgrößen
Wahrscheinlichkeitsrechnung
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Histogramm/empirische Verteilung Verteilungen
§24 Affine Koordinatensysteme
Chi Quadrat Test Tamara Katschnig.
Statistisches Basiswissen
STATISIK LV Nr.: 1375 SS März 2005.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
§3 Allgemeine lineare Gleichungssysteme
Einführung in SPSS/PASW. Eckdaten Ort: ZIP-Pool Zielgruppe: Primär 3. Semester Bachelor, sekundär Diplomstudierende Zeiten: Dienstags: 10:15-11:45 Uhr.
Seminar: Datenerhebung
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Fuzzymengen – Was ist das?
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/06 29.November 2005.
Formale Sprachen Grammatiken und die Chomsky-Hierarchie
Wahrscheinlichkeitsrechnung
Lineare Funktionen und ihre Schaubilder, die Geraden
Die ersten Schritte bei der Entdeckung der Statistik
Data Mining Georg Pölzlbauer.
Theorie psychometrischer Tests, II
Automaten, formale Sprachen und Berechenbarkeit II SoSe 2004 Prof. W. Brauer Teil 3: Potenzreihen und kontextfreie Sprachen (Vgl. Buch von A. Salomaa)
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Item-Response-Theorie – oder probabilistische Testtheorie
Veranstaltung 4.
Vom graphischen Differenzieren
Messen Zuordnung von Zahlen zu Objekten/Ereignissen gemäß Regeln
Messen und Testen.
Skalenniveaus Tamara Katschnig.
Statistik I Statistik I Statistische Grundbegriffe
Grundbegriffe M. Kresken.
Ökonometrie und Statistik Wiederholung
Ökonometrie und Statistik Wiederholung
Ökonometrie und Statistik Wiederholung
Korrelation & Skalentransformation
 Präsentation transkript:

Statistiktutorat Sitzung 1: Grundbegriffe der Statistik christian_langrock@web.de

Euer Rating Schätzt auf einer Skala von 1 (voll und ganz) bis 5 (im Gegenteil) folgende Frage ein: „Ich erwarte, das Statistik mir mehr Schwierigkeiten machen wird, als andere Fächer im Psychologiestudium“. Der Wert 3 würde also die Erwartung ausdrücken, dass Statistik für euch durchschnittlich schwierig wird; ein kleinerer Wert hieße schwieriger, ein größerer Wert weniger schwierig.

Was ist deskriptive Statistik? Der Bereich der Statistik, der eine Menge von erhobenen Daten summarisch (und damit überschaubar) darstellt bzw. beschreibt. Die Veranschaulichung kann grafisch oder rein numerisch erfolgen. Wortwörtlich: Beschreibende Statistik. deskriptiv wie „to describe“

Daten als Balkendiagramm Eine rein numerische Darstellung dieser Daten wäre z.B: Der mittlere (durchschnittliche) Nitratgehalt in Säuglingsnahrung liegt in unserer Stichprobe bei 52 mg/kg. 

Was ist Inferenzstatistik Inferenzstatistik bedeutet, aus Stichproben einer Population Rückschlüsse auf die Gesamtpopulation zu ziehen. Wortwörtlich: Schließende Statistik. Inferenz wie „the inference“ (Die Folgerung)

Die Verbindung Die Verfahren der Inferenzstatistik verwenden als Datengrundlage ihrer Berechnungen die mittels deskriptiver Statistik erhobenen Kennwerte. Die mathematische Grundlage der Inferenzstatistik bildet die Wahrscheinlichkeitsrechnung oder –theorie.

Der große Rahmen Stochastik = griechisch für „Kunst des Mutmaßens“ Mathematische Stochastik beschäftigt sich mit der Beschreibung und Untersuchung von Zufallsexperimenten Als mathematische Statistik (auch: schließende Statistik, induktive Statistik, Inferenzstatistik oder inferentielle Statistik) bezeichnet man das Teilgebiet der Statistik, das sich mit Analyse von Daten unter mathematischen Modellen beschäftigt

Datenerhebung Bevor wir Daten deskriptiv beschreiben (und später eventuell inferentiell auswerten) können, müssen selbige Daten zunächst erhoben werden. In Schritt 1 werden die Merkmale der untersuchten Personen/Objekte zunächst klassifiziert.

Klassifikationskriterium I Qualitativ vs. Quantitativ Qualitative Merkmale beschreiben die Zugehörigkeit einer Person oder eines Objektes zu einer Kategorie. Beispiele: Haarfarbe, Nationalität Quantitative Merkmale beschreiben die Ausprägung eines Merkmals auf einem Kontinuum. Beispiele: Extraversion, Körpergröße

Klassifikationskriterium II Manifest vs. Latent Manifeste Merkmale können direkt beobachtet oder gemessen werden. Latente Merkmale (synonym: Konstrukte) sind nur indirekt zu erfassen. Dies geschieht durch Rückschluss aus manifesten Merkmalen. Wie sind unserer Merkmale Haarfarbe, Herkunftsland, Körpergröße und Extraversion einzuordnen? Manifest: Haarfarbe, Nationalität, Körpergröße Latent: Extraversion

Überblick: Klassifikation von Merkmalen

Vom Merkmal zur Variable In Schritt 2 der Datenerhebung müssen wir die nun klassifizierten Merkmale in Zahlen überführen. Dies geschieht durch eine Operationalisierung (synonym: Messvorschrift). Die Operationalisierung definiert, wie unterschiedliche Ausprägungen eines Merkmals in Zahlen übertragen (=kodiert) werden. Man spricht nun von einer Variable.

Definition „Messung“ Wir haben nun zwei Schritte zur Datenerhebung unternommen. Datenerhebung ist synonym für Messung – wir können also nun auch den Begriff Messung definieren. Messung: Zuordnung von Zahlen zu Objekten gemäß den Regeln einer Operationalisierung. Mit anderen Worten: kodieren von Merkmalen bzw. Überführung von Merkmalen in Variablen.

Beispiele für Operationalisierungen Die Variable „Haar“ soll die Haarfarbe erfassen. Es wird der Wert 1 für blond, der Wert 2 für schwarz und der Wert 3 für rot verwendet. Die Variable „Größe“ soll die Körpergröße der untersuchten Personen in cm erfassen. Die Variable „extr“ soll die mittels Fragebogen selbst eingeschätzte Extraversion auf einer Skala von 0 (maximal introvertiert) bis +10 (maximal extravertiert) erfassen.

Klassifikation von Variablen Analog zu Merkmalen werden auch Variablen klassifiziert. Manifest vs. latent: entspricht dem zugrunde liegenden Merkmal. Diskret vs. kontinuierlich (→ qualitativ vs. quantitativ)

Diskrete vs. kontinuierliche Variablen Die Anzahl der möglichen Werte (auch wenn sehr hoch) ist endlich und damit genau abzählbar. Kontinuierlich Die Variable kann auf einem beliebig genauem Kontinuum beschrieben werden, d.h. ihre Anzahl geht potentiell gegen unendlich.

Diskrete vs. kontinuierliche Variablen Diskret (d) oder kontinuierlich (k)? Beruf (Bezeichnung) (d) Reaktionszeit (in ms) (k) Parteizugehörigkeit Tierart Gewicht (in kg)

Schaubild Merkmal & Variable Operationalisierung Merkmal Variable latent/manifest diskret kontinuierlich qualitativ quantitativ

Variable und Skalenniveau In der Statistik ordnet man Variablen ein so genanntes Skalenniveau zu. Diese Skalenniveau hat folgende Konsequenzen: Es bestimmt, welche mathematischen Operationen (Tests) mit einer Variable durchgeführt werden können. Welche Transformationen von Variablen möglich sind, ohne Information zu verlieren (d.h. das Skalenniveau zu senken). Welche Aussagen meine Daten zulassen.

Die 4 Skalenniveaus Man unterscheidet 4 Skalenniveaus: Die Nominalskala Die Ordinalskala Die Intervallskala (metrisch) Die Verhältnisskala (metrisch) Dabei steigt die Messgenauigkeit bzw. Aussagekraft der Daten von 1 nach 4 an . Es sollte daher immer versucht werden, Daten auf einem möglichst hohem Skalenniveau zu erfassen. Viele für die Psychologie relevante Testverfahren setzten mindestens Intervallskalenniveau voraus. Zu beachten ist aber: Je höher das Skalenniveau, desto „vorsichtiger“ muss ich mit meinen Daten umgehen.

Wovon hängt das Skaleniveau ab? Vom untersuchten Merkmal selbst: Geschlecht kann z.B. (heute) nur auf Nominalskalenniveau erhoben werden. Von der Operationalisierung des Merkmals: Die Schulleistung lässt sich mindestens ordinalskaliert erheben, doch die Operationalisierung „sitzen geblieben“ vs. „nicht sitzen geblieben“ wäre ebenfalls nur nominalskaliert .

Welches Skalenniveau? 3 Arten der Erfassung von psychischen Störungen Typologie: 0 = keine Störung 1 = Störung nominal Abgestufte Typologie: 0 = nicht beeinträchtigt 1 = wenig beeinträchtigt 2 = eher beeinträchtigt 3 = klinisch relevante Beeinträchtigung ordinal Kontinuierliche (dimensionale) Erfassung: Testergebnis in einem klinischen Interview (z.B. 0-100) metrisch

Die Nominalskala Es werden „Namen“ (Zahlenwerte) für jede Merkmalsausprägung vergeben. Beispiel: Geschlecht („m“ / „w“); in SPSS wird dann eingegeben m=1, w=2 Zwei Annahmen müssen berücksichtigt werden: Exklusivität: Unterschiedliche Merkmalsausprägungen werden unterschiedlichen Zahlen zugeordnet. Exhaustivität: Jeder beobachteten Merkmalsausprägung eine Zahl zugeordnet.

Die Nominalskala Aussagekraft von Variablenwerten: Information über Gleichheit / Verschiedenheit der Merkmalsausprägung (Keine Aussagen zu größer/kleiner Relationen). Mögliche Transformationen: Es sind alle eineindeutigen Transformationen erlaubt: weiblich = 1; männlich = 2 oder weiblich = 2; männlich = 1 oder weiblich = 100; männlich = 200

Eineindeutig? Eindeutig: Jedem Element der Menge A kann ein Element der Menge B zugeordnet werden. Eineindeutig: Zusätzlich kann jedem Element der Menge B auch genau ein Element der Menge A zugeordnet werden. Merkmal (Menge A) Variable (Menge B) Peer „1“ Maria „2“ ? Jeanette „3“ „2“ Maria ?

Die Ordinalskala Beispiel: Schulabschluss Bei der Ordinalskala (Sonderfall: Rangskala) geben die Variablenwerte Aufschluss über die Rangfolge der Merkmalsträger bezüglich des gemessenen Merkmals. Beispiel: Schulabschluss 0 = kein SA 1 = Hauptschule 2 = Realschule 3 = Gymnasium Zusätzliche Annahme der Operationalisierung: Die zugeordneten Zahlen repräsentieren eine Rangreihe der Merkmalsausprägung.

Die Ordinalskala Aussagekraft von Variablenwerten: Information über Gleichheit / Verschiedenheit der Merkmalsausprägung, Größer / Kleiner Relationen Mögliche Transformationen: Erlaubt sind nur noch alle monotonen Transformationen. Beispiele: y = x + 3 y = 2x y = log(x)

Monotone Funktion A

Monotone Funktion B

Nicht-monotone Funktion A

Nicht-monotone Funktion B

Transformationen y =x², monoton oder nicht monoton? Antwort: Kommt darauf an. Nur wenn für unseren Definitionsbereich gilt x ≥ 0. Wer nicht sattelfest in Algebra ist, braucht sich keine Sorgen machen. Es werden keine fiesen Transformationen abgefragt und eure eigenen dürft ihr so einfach (und so auswendig) wie nötig gestalten.

Die Intervallskala Bei der Intervallskala geben die Variablenwerte Aufschluss über die Abstände zwischen Merkmalsausprägungen. Beispiel: Ergebnisse eines Intelligenztests: Peter = 115; Anne = 130 → Differenz 15 Punkte Zusätzliche Annahme der Operationalisierung: Gleich große Intervalle zwischen Zahlenwerten der Variable repräsentieren gleich große Abstände in der Merkmalsausprägung.

Die Intervallskala Aussagekraft von Variablenwerten: Information über Gleichheit / Verschiedenheit der Merkmalsausprägung, Größer / Kleiner Relationen Größe von Unterschieden Mögliche Transformationen: Erlaubt sind nur noch lineare Transformationen (y = ax+b). Beispiele: y = x -100 y = 0.1 x

Die Verhältnisskala Die Verhältnisskala kann vor allem bei der Messung physikalischer Größen (Länge, Gewicht, Zeit) angenommen werden. Beispiel: Reaktionszeit (ms). Zusätzliche Annahme für die Operationalisierung: Die Skala hat einen definierten Null-Punkt.

Die Verhältnisskala Aussagekraft von Variablenwerten: Information über Gleichheit / Verschiedenheit der Merkmalsausprägung Größer / Kleiner Relationen Größe von Unterschieden Verhältnis von Merkmalsausprägungen (z.B. doppelte Reaktionszeit) Mögliche Transformationen: Erlaubt sind nur noch alle multiplikativen Transformationen (y = ax). Beispiele: y = 0.001 ∙ x (Umrechnung von Millisekunden in Sekunden) y = 24 ∙ x (Umrechnung von Jahren in Monate) → Transformationen können z.B. dazu dienen, Daten aus verschiedenen Studien zusammenzuführen.

Überblick Skalenniveaus

Skalenniveaus und Informationsgewinn

Die große Grauzone Oft ist nicht eindeutig, ob eine Variable als ordinal- oder als intervallskalliert zu betrachten ist. Die Grauzone beginnt dort, wo die Variable mehr Information als „Größer/Kleiner“ Relation beinhaltet und endet dort, wo gesichert ist, dass Gleichheit der Intervalle gegeben ist. Letzteres muss in jedem Einzelfall theoretisch begründet werden.

Lernziele Wie Objekte zu statistisch auswertbaren Daten werden. Was Skalenniveaus sind und wovon sie abhängen. Welche große Grauzone in puncto Skalenniveaus existiert.

Arbeitsblatt Aufgabe 1.1

Arbeitsblatt Aufgabe 1.2

Arbeitsblatt Aufgabe 1.3

Arbeitsblatt Aufgabe 1.4

Arbeitsblatt Aufgabe 1.5

Arbeitsblatt Aufgabe 1.6

Vielen Dank für eure Aufmerksamkeit!