Statistiktutorat Thema 1: Grundbegriffe der Statistik

Slides:



Advertisements
Ähnliche Präsentationen
Quanti Tutorium
Advertisements

Deskriptive Statistik und Explorative Datenanalyse
Prof. Dr. W. Conen 15. November 2004
Was ist Testtheorie?.
Auswertung der Befragung
Lagemaße kritische Fragen
Messen „Messen ist die Bestimmung der Ausprägung einer
Bewegungswissenschaft
Untersuchungsarten im quantitativen Paradigma
Java: Objektorientierte Programmierung
Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.
Gliederung Vertrauensintervalle Arten von Hypothesen
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Forschungsstatistik I
Kapitel 5 Stetigkeit.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Quantitative Methoden I
Diskurs Fragebögen Auswertung.
Statistiktutorat Sitzung 1: Grundbegriffe der Statistik
Tutorat IV: Diagramme, Datenkontrolle, Wahrscheinlichkeitsrechnung
Statistiktutorat: Datenkontrolle
Deskriptive Statistik und Wahrscheinlichkeitstheorie
Konfidenzintervalle Intervallschätzung
Die Student- oder t-Verteilung
Statistische Methoden I SS 2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
II. Wahrscheinlichkeitstheorie
III. Induktive Statistik
Extra-SPSS-Kurse Durchführung: Birte Holtfreter Termine Di Mi Mi Ort PC-Pool Loefflerstarße.
Univariate Statistik M. Kresken.
§14 Basis und Dimension (14.1) Definition: V sei wieder ein K-Vektorraum. Eine Menge B von Vektoren aus V heißt Basis von V, wenn B ist Erzeugendensystem.
§14 Basis und Dimension  (14.1) Definition: V sei wieder ein K-Vektorraum. Eine Menge B von Vektoren aus V heißt Basis von V, wenn B ist Erzeugendensystem.
Sportmotorische Tests
Tutorium Willkommen zurück, in der wunderbaren Welt der Statistik Teil II.
Manipulationen mit Statistik
Diskrete Wahrscheinlichkeitsmodelle
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
§10 Vektorraum. Definition und Beispiele
Christian Schulz, Marc Thielbeer, Sebastian Boldt
Histogramm/empirische Verteilung Verteilungen
§24 Affine Koordinatensysteme
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Chi Quadrat Test Tamara Katschnig.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Statistisches Basiswissen
STATISIK LV Nr.: 1375 SS März 2005.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
§23 Basiswechsel und allgemeine lineare Gruppe
§3 Allgemeine lineare Gleichungssysteme
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Fuzzymengen – Was ist das?
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
Die Struktur von Untersuchungen
Das ABC der Statistik DIE SÄULENDIAGRAMME 1
Die ersten Schritte bei der Entdeckung der Statistik
Automaten, formale Sprachen und Berechenbarkeit II SoSe 2004 Prof. W. Brauer Teil 3: Potenzreihen und kontextfreie Sprachen (Vgl. Buch von A. Salomaa)
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Veranstaltung 4.
Empirische Sozialforschung am Beispiel der Limburger Nordstadt
Kapitel 5Strukturen Information aus der realen Welt werden in einem informationsverarbeitenden System als Daten abgelegt. Diese stellen also eine (vereinfachte)
Messen Zuordnung von Zahlen zu Objekten/Ereignissen gemäß Regeln
Methoden der Sozialwissenschaften
Messen und Testen.
Syntax, Semantik, Spezifikation - Grundlagen der Informatik R. Hartwig Kapitel 3 / 1 Algebraische Hülle und Homomorphie A = [A, F ] sei  -Algebra. Eine.
Statistik I Statistik I Statistische Grundbegriffe
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Ökonometrie und Statistik Wiederholung
Ökonometrie und Statistik Wiederholung
 Präsentation transkript:

Statistiktutorat Thema 1: Grundbegriffe der Statistik christian_langrock@web.de

Zitate Statistik ist für mich das Informationsmittel der Mündigen. Wer mit ihr umgehen kann, kann weniger leicht manipuliert werden. Der Satz: „Mit Statistik kann man alles beweisen“ gilt nur für die Bequemen, die keine Lust haben, genau hinzusehen (Elisabeth Noelle-Neumann, Gründerin von Allensbach ). Wenn man mündige Bürger haben will, muss man ihnen drei Dinge beibringen: Lesen, Schreiben und statistisches Denken (Gerd Gigerenzer, Direktor des MPI für Bildungsforschung). Statistiken sind wie Bikinis, sie enthüllen eine ganze Menge, verbergen aber das Wichtigste (anonym).

Struktur meines Tutorats Wiederholung (ca. 15 min) Theorieteil (30 – 45 min) Rechnen in Gruppen (30 – 45 min)

Gliederung Thema I Der rote Faden für dieses Semester Wirklichkeit mathematisch abbilden: Messung & Operationalisierung Skalenniveaus und ihre Eigenschaften

Der Rote Faden für dieses Semester

Der große Rahmen Stochastik = griechisch für „Kunst des Mutmaßens“ Mathematische Stochastik beschäftigt sich mit der Beschreibung und Untersuchung von Zufallsexperimenten Als mathematische Statistik (auch: schließende Statistik, induktive Statistik, Inferenzstatistik oder inferentielle Statistik) bezeichnet man das Teilgebiet der Statistik, das sich mit Analyse von Daten unter mathematischen Modellen beschäftigt

Was ist deskriptive Statistik? Der Bereich der Statistik, der eine Menge von erhobenen Daten summarisch (und damit überschaubar) darstellt bzw. beschreibt. Die Veranschaulichung kann grafisch oder rein numerisch erfolgen. Wortwörtlich: Beschreibende Statistik. deskriptiv wie „to describe“

Daten als Balkendiagramm Eine rein numerische Darstellung dieser Daten wäre z.B: Der mittlere (durchschnittliche) Nitratgehalt in Säuglingsnahrung liegt in unserer Stichprobe bei 52 mg/kg. 

Was ist Inferenzstatistik Inferenzstatistik bedeutet, aus Stichproben einer Population Rückschlüsse auf die Gesamtpopulation zu ziehen. Wortwörtlich: Schließende Statistik. Inferenz wie „the inference“ (Die Folgerung)

Die Verbindung Die Verfahren der Inferenzstatistik verwenden als Datengrundlage ihrer Berechnungen die mittels deskriptiver Statistik erhobenen Kennwerte. Die mathematische Grundlage der Inferenzstatistik bildet die Wahrscheinlichkeitsrechnung.

Wirklichkeit mathematisch abbilden: Messung & Operationalisierung

Datenerhebung Bevor wir Daten deskriptiv beschreiben (und später eventuell inferentiell auswerten) können, müssen die Daten erhoben werden. Dazu werden zunächst die Merkmale der untersuchten Personen/Objekte klassifiziert.

Klassifikationskriterium I Qualitativ vs. Quantitativ Qualitative Merkmale beschreiben die Zugehörigkeit einer Person/eines Objektes zu einer von mehreren Kategorien. Beispiele: Haarfarbe, Nationalität Quantitative Merkmale beschreiben die Ausprägung einer Person/eines Objekts bezüglich eines Merkmals. Beispiele: Extraversion, Körpergröße

Klassifikationskriterium II Manifest vs. Latent Manifeste Merkmale sind direkt beobacht- und damit messbar Latente Merkmale (synonym: Konstrukte) sind nur indirekt zu erfassen. Dies geschieht durch Rückschluss aus manifesten Merkmalen. Wie sind unserer Merkmale Haarfarbe, Herkunftsland, Körpergröße und Extraversion einzuordnen? Manifest: Haarfarbe, Nationalität, Körpergröße Latent: Extraversion

Überblick: Klassifikation von Merkmalen

Vom Merkmal zur Variable Nach der Klassifikation erfolgt die Überführung der Merkmale in Zahlen. Dies geschieht nach den Regeln einer Operationalisierung (synonym: Messvorschrift). Messung: Zuordnung von Zahlen zu Objekten gemäß den Regeln einer Operationalisierung.

Beispiele für Operationalisierungen Die Variable „Haar“ soll die Haarfarbe erfassen. Es wird der Wert 1 für blond, der Wert 2 für schwarz und der Wert 3 für rot verwendet. Die Variable „Größe“ soll die Körpergröße der untersuchten Personen in cm erfassen. Die Variable „extr“ soll die mittels Fragebogen selbst eingeschätzte Extraversion auf einer Skala von 0 (maximal introvertiert) bis +10 (maximal extravertiert) erfassen.

Abstrakte Definition „Messung“ Zuordnung von Zahlen zu Objekten oder Ereignissen, sofern dieser Zuordnung eine homomorphe Abbildung eines empirischen Relativs in ein numerisches Relativ ist. Empirisches Relativ: Menge von Objekten, die sich anhand eines Merkmals vergleichen lassen. Numerisches Relativ: Menge von Zahlen die sich anhand von Zahlen in Relation bringen lassen. Homomorphe Abbildung: eindeutige Abbildung.

isomorph vs. homomorph Homomorphe Zuordnung: Jedem Element der Menge A kann ein Element der Menge B zugeordnet werden. Isomorphe Zuordnung : Zusätzlich kann jedem Element der Menge B auch genau ein Element der Menge A zugeordnet werden. Merkmal (Menge A) Variable (Menge B) blond „1“ dunkel „2“ ? brünett „3“ dunkel „2“ ?

Klassifikation von Variablen Diskret: Die Anzahl der möglichen Werte (auch wenn sehr hoch) ist endlich und damit genau abzählbar. Kontinuierlich: Die Variable kann auf einem beliebig genauem Kontinuum beschrieben werden, d.h. die Anzahl der möglichen Werte geht gegen unendlich. → qualitativ vs. quantitativ.

Diskrete vs. kontinuierliche Variablen Diskret (d) oder kontinuierlich (k)? Beruf (Bezeichnung) (d) Reaktionszeit (in ms) (k) Parteizugehörigkeit Tierart Gewicht (in kg)

Schaubild Merkmal & Variable Operationalisierung Merkmal Variable latent/manifest diskret kontinuierlich qualitativ quantitativ

Skalenniveaus und ihre Eigenschaften

Variable und Skalenniveau In der Statistik ordnet man Variablen ein so genanntes Skalenniveau zu. Diese Skalenniveau hat folgende zentrale Konsequenzen: Es bestimmt, welche mathematischen Operationen (Tests) mit einer Variable durchgeführt werden können und damit die Präzision der möglichen Schlussfolgerungen. Es bestimmt, welche Transformationen von Variablen möglich sind, ohne Information zu verlieren (d.h. das Skalenniveau zu senken)

Transformationen Unter einer Transformation wird eine Umwandlung von Variablenwerten durch eine mathematische Funktion verstanden, welche die ursprünglichen Werte in jeweils neue Werte überführt. Beispiel: f (x) = 3 · x Zweck: Daten aus verschiedenen Studien zusammen führen oder bestimmte Verteilungsformen herstellen, die Voraussetzung für viele Tests sind.

Die 4 Skalenniveaus Man unterscheidet 4 Skalenniveaus: Die Nominalskala Die Ordinalskala Die Intervallskala (metrisch) Die Verhältnisskala (metrisch) Viele für die Psychologie relevante Testverfahren setzten mindestens Intervallskalenniveau voraus. Daher immer versucht werden, Daten auf einem möglichst hohem Skalenniveau zu erfassen.

Wovon hängt das Skaleniveau ab? Vom untersuchten Merkmal selbst: Geschlecht kann z.B. nur auf Nominalskalenniveau erhoben werden – entweder Mann oder Frau. Von der Operationalisierung des Merkmals: Körpergewicht lässt sich verhältnisskaliert erheben, doch die Operationalisierung >70 kg = schwer, <70 kg = leicht wäre lediglich ordinalskaliert

Die Nominalskala Bei der Nominalskala geben die Variablenwerte Auskunft über die Zugehörigkeit zu einer Kategorie: Es werden „Namen“ (Zahlenwerte) für jede Merkmalsausprägung vergeben. Beispiel: Geschlecht („m“ / „w“); in SPSS wird dann eingegeben m=1, w=2 Aussagekraft: Gleichheit/Verschiedenheit der Merkmalsausprägungen Mögliche Transformationen: Es sind alle eineindeutigen Transformationen erlaubt: weiblich = 1; männlich = 2 oder weiblich = 2; männlich = 1 oder weiblich = 100; männlich = 200

Die Ordinalskala Beispiel: Schulabschluss Bei der Ordinalskala (Sonderfall: Rangskala) geben die Variablenwerte Aufschluss über die Rangfolge der Merkmalsträger bezüglich des gemessenen Merkmals. Beispiel: Schulabschluss 0 = kein SA 1 = Hauptschule 2 = Realschule 3 = Gymnasium Zusätzliche Annahme der Operationalisierung: Die zugeordneten Zahlen repräsentieren eine Rangreihe der Merkmalsausprägung. Sonderfall Rangskala: Jeder Rang kann nur einmal vergeben werden.

Die Ordinalskala Aussagekraft von Variablenwerten: Information über Gleichheit / Verschiedenheit der Merkmalsausprägung, Größer / Kleiner Relationen Mögliche Transformationen: Erlaubt sind nur noch alle monotonen Transformationen. Beispiele: y = x + 3 y = 2x y = log(x)

Monotone Funktion A

Monotone Funktion B

Nicht-monotone Funktion A

Nicht-monotone Funktion B

Die Intervallskala Bei der Intervallskala geben die Variablenwerte Aufschluss über die Abstände zwischen Merkmalsausprägungen. Beispiel: Ergebnisse eines Intelligenztests: Peter = 115; Anne = 130 → Differenz 15 Punkte Zusätzliche Annahme der Operationalisierung: Gleich große Intervalle zwischen Zahlenwerten der Variable repräsentieren gleich große Abstände in der Merkmalsausprägung.

Die Intervallskala Aussagekraft von Variablenwerten: Information über Gleichheit / Verschiedenheit der Merkmalsausprägung, Größer / Kleiner Relationen Größe von Unterschieden Mögliche Transformationen: Erlaubt sind nur noch lineare Transformationen (y = ax+b). Beispiele: y = x -100 y = 0.1 x

Die Verhältnisskala Die Verhältnisskala erlaubt Aussagen über das Verhältnis von Merkmalsausprägungen. Sie kann vor allem bei der Messung physikalischer Größen (Länge, Gewicht, Zeit) angenommen werden. Beispiel: Reaktionszeit (ms). Zusätzliche Annahme für die Operationalisierung: Die Skala hat einen definierten Null-Punkt.

Die Verhältnisskala Aussagekraft von Variablenwerten: Information über Gleichheit / Verschiedenheit der Merkmalsausprägung Größer / Kleiner Relationen Größe von Unterschieden Verhältnis von Merkmalsausprägungen (z.B. doppelte Reaktionszeit) Mögliche Transformationen: Erlaubt sind nur noch alle multiplikativen Transformationen (y = ax). Beispiele: y = 0.001 ∙ x (Umrechnung von Millisekunden in Sekunden) y = 24 ∙ x (Umrechnung von Jahren in Monate)

Überblick Skalenniveaus

Skalenniveaus und Informationsgewinn

Welches Skalenniveau? 3 Arten der Erfassung von psychischen Störungen Typologie: 0 = keine Störung 1 = Störung nominal Abgestufte Typologie: 0 = nicht beeinträchtigt 1 = wenig beeinträchtigt 2 = eher beeinträchtigt 3 = klinisch relevante Beeinträchtigung ordinal Kontinuierliche (dimensionale) Erfassung: Testergebnis in einem klinischen Interview (z.B. 0-100) metrisch

Grauzone bei Skalenniveaus Oft ist nicht eindeutig, ob eine Variable als ordinal- oder als intervallskalliert gelten kann. Die Grauzone beginnt dort, wo die Variable mehr Information als „Größer/Kleiner“ Relation beinhaltet und endet dort, wo gesichert ist, dass Gleichheit der Intervalle gegeben ist. Ob Gleichheit der Intervalle gegeben ist, muss in jedem Einzelfall theoretisch und/oder statistisch geprüft werden.

Vielen Dank für eure Aufmerksamkeit!