Tutorat IV: Diagramme, Datenkontrolle, Wahrscheinlichkeitsrechnung

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Sicherheitslabordaten bei Gesunden
Deskriptive Statistik und Explorative Datenanalyse
Stichprobe im qualitativen Forschungsprozess
Vorlesung Programmieren II
k-Sigma-Intervalle Vortrag zu dem Thema
Klassen (Zweck) Wozu legt man Klassen an? Überblick
Lagemaße kritische Fragen
Aufgabe Analyse (Friedman-Test) von letzter Stunde wiederholen
Aufgabe Analyse (Friedman-Test) von letzter Stunde wiederholen
Zufallsgrößen und Beschreibung – Wiederholung Sek. I
Evaluation – Grundlagen im Rahmen des Moduls zur Qualifizierung der SLK in Niedersachsen.
Gliederung Vertrauensintervalle Arten von Hypothesen
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.
Konfidenzintervalle für Parameter
Mehrfachregressionen
2. Univariate Regressionsanalyse 2.1 Das statische Regressionsmodell
Statistiktutorat Sitzung 3: Grafische Darstellungen und Wahrscheinlichkeitsrechnung
Statistiktutorat: Datenkontrolle
Deskriptive Statistik und Wahrscheinlichkeitstheorie
II. Wahrscheinlichkeitstheorie
Univariate Statistik M. Kresken.
und relative Häufigkeit Bettina delert, andreas mertke
Statistik als Powerpoint-Graph
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Wiederholung und Beispiele
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Online-Befragung Themen: 1. Vor- und Nachteile 2. Voraussetzungen
Einführung in die Metaanalyse
Eigenschaften der OLS-Schätzer
Daten auswerten Boxplots
Histogramm/empirische Verteilung Verteilungen
Diagramme für Häufigkeiten und Prozentwerte
Wahrscheinlichkeitsrechnung Grundbegriffe
Aufgabenzettel V Statistik I
Definitionen für Wahrscheinlichkeiten
Seminar: Datenerhebung
Seminar: Datenerhebung
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Messwerte, Verteilung, Histogramm, Mittelwert und Standardabweichung
Die Gaußverteilung.
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
Konfidenzintervall und Testen für den Mittelwert und Anteile
Wahrscheinlichkeitsrechnung
Referat über das Thema STOCHASTIK.
Zusammengestellt von Mag. Raimund Hermann
Methoden der Psychologie: Statistik I und II
Statistik als Powerpoint-Graph
Der Zentralwert.
Coaching Konzept Methoden der Psychologie: Statistik I und II.
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
Bioinformatik Vorlesung
Veranstaltung 4.
Zum Einfluss subjektiver und objektiver Merkmale auf die Wiedererkennung von Werbeplakaten Antje Bauer & Stefanie Frehse Institut für Allgemeine Psychologie.
Erheben, berechnen und darstellen von Daten
Stochastik Grundlagen
Empirische Sozialforschung am Beispiel der Limburger Nordstadt
Methoden der Sozialwissenschaften
K. Desch - Statistik und Datenanalyse SS05
K. Desch - Statistik und Datenanalyse SS05 Statistik und Datenanalyse 1.Wahrscheinlichkeit 2.Wahrscheinlichkeitsverteilungen 3.Monte-Carlo-Methoden 4.Statistische.
Die Binomialverteilung
Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.
Testtheorie (Vorlesung 13: ) Wiederholung: Richtigstellung
Die Gaussverteilung.
 Präsentation transkript:

Tutorat IV: Diagramme, Datenkontrolle, Wahrscheinlichkeitsrechnung 19.11.2009 christina.dorn0@googlemail.com

Wiederholung grafische Darstellungen

Welche grafische Darstellung ist hier gewählt?

Welche grafische Darstellung ist hier gewählt?

Welche grafische Darstellung ist hier gewählt? Was unterscheidet ein Histogramm von Balkendiagrammen oder Polygonen?

Welche grafische Darstellung ist hier gewählt? Was stellt ein Scatterplot dar?

Was fehlt… Welche Möglichkeiten der grafischen Darstellung außer Balkendiagrammen, Histogrammen und Scatterplots kennt ihr und was wird jeweils dargestellt?

Vorbereitung von Daten zur statistischen Analyse- Datenkontrolle

Notwendigkeit der Datenkontrolle Primäre Aufgabe der Statistik: Datenanalyse Normalerweise liegt ein Datensatz in elektronischer Form als Datei vor Man sollte sich aber als gewissenhafter Wissenschaftler fragen: Wie ist diese Datei entstanden???

Was sind die häufigsten Erhebungsmethoden von Daten in psychologischen Untersuchungen?

Erhebungsmethoden Befragungsmethoden („Standardmethode“) a) schriftlich: Fragebogen sehr ökonomisch das am häufigsten verwendete Instrument b) Im direkten Gespräch: Interview Offene, standardisierte und teilstandardisierte Form Beobachtung (mit oder ohne Videoaufzeichnungen) Audio- oder Videoaufzeichungen können später ausgewertet und kodiert werden

Erhebungsmethoden 3) Neue Datenquellen (Kernspintomografie, Lig-Daten aus dem Internet,…)

Look at your Data! Datenkontrolle vor Datenanalyse in Bezug auf: Korrektheit/Verständnis der Probanden Fehleingaben Plausibilität

Play with your Data! Datenkontrolle Sind die Werte realistisch? Ist die Größe der Veränderungen nach der Postmessung realistisch? Bsp.: Kann man innerhalb von einer Woche 20kg abnehmen??? Sind die Daten überhaupt möglich? Zum Messzeitpunkt T2 jünger als zu T1?

Grafische Analysen, Ausreißer, Extremwerte Neben deskriptiven Werten, welche im Rahmen der explorativen Datenanalyse herangezogen werden, sollen auch grafische Analysen (ideal: Box-Plot) zur Suche von auffälligen Werten herangezogen werden Unterscheidung: fehlerhafte Eingabe vs. Außreißer (eine 7 auf einer 5-stufigen Skala ist sicher kein Ausreißer!)

Ermittlung von Ausreißern und Extremwerten- zwei Definitionen 1. Turkey- Kriterium (via Box-Plot) Ein Subjekt Y ist ein Ausreißer wenn gilt: Ein Subjekt Y ist ein Extremwert, wenn gilt

2. Definition (nach Hair, Black, Babin, Anderson and Tatham, 2006) Außreißer werden über das Konfidenzintervall um den Mittelwert definiert Bei kleinen Stichproben (N<80) gilt: ± 2,5 SD vom Mittelwert Bei größeren Stichproben: ± 4 SD => Alle Werte außerhalb des Intervalls werden als Außreißer betrachtet

Wichtig: Ausschluss von Probanden muss immer begründet sein Wenn möglich: Statistik mit und ohne Ausreißern berechnen => je nach Anteil der Ausreißer sollten sich hier keine bedeutsamen Unterschiede ergeben Wenn signifikante Ergebnisse nur mit Ausreißern erreicht werden, muss das kritisch diskutiert werden Empfehlung: Ausreißer durch den nächsten, plausibelsten Wert ersetzen Windsorisieren

Windsorisieren Um den Mittelwert einer Stichprobe wird ein Konfidenzintervall ermittelt, welches 90% aller Werte enthält Alle Werte außerhalb dieses Intervalls = Ausreißer Ausreißer werden folgendermaßen ersetzt: Aller Werte unterhalb der 5%-Grenze (unterhalb des Konfidenzintervalls) werden durch den Wert der unteren Grenze ersetzt Alle Werte oberhalb der 95%-Grenze (oberhalb des KI) werden durch den Wert der oberen Grenze des Intervalls ersetzt

Vorteil des Windsorisierens: ☺ Nachteil: -

Fehlende Werte Gruppenarbeit: Gruppe 1: Was sind fehlende Werte und welche Probleme ergeben sich aus ihnen? Gruppe 2: Missing Data Diagnose Gruppe 3: MCAR Gruppe 4: MAR Gruppe 5: NMAR

Wahrscheinlichkeitsrechnung

Wozu, weshalb, warum? Wir erinnern uns: Der große Rahmen… Stochastik = griechisch für „Kunst des Mutmaßens“ Mathematische Stochastik beschäftigt sich mit der Beschreibung und Untersuchung von Zufallsexperimenten Als mathematische Statistik (auch: schließende Statistik, induktive Statistik, Inferenzstatistik oder inferentielle Statistik) bezeichnet man das Teilgebiet der Statistik, das sich mit Analyse von Daten unter mathematischen Modellen beschäftigt

Aufgabe: Wie groß ist die p, bei einem Kartenspiel mit 32 Karten einen König zu ziehen?

Wahrscheinlichkeitstheorie Wie kann man Wahrscheinlichkeit bestimmen? 1.Relativer Anteil der „günstigen Fälle“ an allen möglichen Ereignissen („a priori“ Wahrscheinlichkeit, Laplace): 2. Grenzwert der relativen Häufigkeit des Eintretens der „günstigen Fälle“ bei sehr häufigem Durchführen eines Zufallsexperimentes („a posteriori“ Wahrscheinlichkeit, Bernoulli):

Bernoulli-Wahrscheinlichkeit Gesetz der großen Zahl: Schätzung ist umso genauer je mehr N gegen unendlich gehen Fiktives Bsp.: Es soll untersucht werden, wie viele Depressive eine bipolare Störung haben. Es werden auf einer Depressionsstation zunächst 10 Patienten untersucht:

Vielen Dank für eure Mitarbeit und Aufmerksamkeit!