Statistiktutorat: Datenkontrolle

Slides:



Advertisements
Ähnliche Präsentationen
Brandenburg im Wandel Untersuchungsanlage
Advertisements

Tutorat Statistik II im SS 09 Mediator- & Moderatoranalyse
Analyse kryptographischer Protokolle mittels Algebren
Auswertung der Befragung
Gliederung Vertrauensintervalle Arten von Hypothesen
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Patrick Rössler Einführung in die Methoden der empirischen Kommunikationsforschung Vorlesung BA Kommunikationswissenschaft.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Mehrfachregressionen
Anwendungsseminar: Kausale Modellbildung
Quantitative Methoden I
Quantitative Methoden I
Hypothesen testen: Grundidee
Herzlich willkommen beim 1. Workshop der AG Methodik
Institutionelle Infrastruktur und allgemeine Charakteristika von Sozialstatistiken II Die Zuverlässigkeit retrospektiv erhobener Lebensverlaufsdaten Analysen.
Statistiktutorat Thema 1: Grundbegriffe der Statistik
Tutorat IV: Diagramme, Datenkontrolle, Wahrscheinlichkeitsrechnung
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Klausurtermin (laut Prüfungsamt) Probeklausur Freitag, 13. Juni 2003 statt Vorlesung.
Univariate Statistik M. Kresken.
Meta-Analyse Forschungsmethoden und Evaluation
VL Diagnostische Kompetenz (Bewegungslehre 2) 3
VL Diagnostische Kompetenz (Bewegungslehre 2) 3. Korrelation und Gütekriterien.
Tutorium
Tutorium
Tutorium
Tutorium
Wenn man einen Erscheinungsbereich quantitativ beschreiben will, so ist es vorteilhaft, wenn man irgendwelche Bilanzen machen kann. Dann wird die Beschreibung.
Analyse kategorialer Variablen
Statistik als Powerpoint-Graph
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Diskrete Wahrscheinlichkeitsmodelle
Multikollinearität Wann spricht man von Multikollinearität?
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Diagramme für Häufigkeiten und Prozentwerte
Chi Quadrat Test Tamara Katschnig.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Aufgabenzettel V Statistik I
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Definitionen für Wahrscheinlichkeiten
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Gleichungen und Gleichungssysteme
STATISIK LV Nr.: 1375 SS März 2005.
Die Struktur von Untersuchungen
Empirische Softwaretechnik
Die ersten Schritte bei der Entdeckung der Statistik
Relationale Datenbanken
Data Mining Georg Pölzlbauer.
Multivariate Statistische Verfahren
Statistik – Regression - Korrelation
Internetbasierte Fragebogenuntersuchungen und Surveys Christine Surer
Veranstaltung 4.
Vom graphischen Differenzieren
Spiel und Spaß mit Zahlen
Empirische Sozialforschung am Beispiel der Limburger Nordstadt
Gegenstand der Psychologie
Die einfache/multiple lineare Regression
Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung
SS 2009Maschinelles Lernen und Neural Computation 133 Kapitel 7: Ensemble Methoden.
Sozialpsychologie - Vertiefung im SS 2011 Willkommen zur Theoretischen und Empirischen Vertiefung im Fach Sozialpsychologie! Meine Kontaktdaten: Dr. Nicole.
Kooperationstraining im Volleyball. Goethe-Universität Frankfurt am Main Gliederung 1.Einführung 2.Methode 3.Ergebnisse 4.Diskussion
Mathematik Q1 -Stochastik. Die Immunschwächekrankheit AIDS wird durch das HI-Virus, welches 1993 entdeckt wurde, verursacht. Die Krankheit gilt bis heute.
Institut für Informationssysteme Technische Universität Braunschweig Institut für Informationssysteme Technische Universität Braunschweig Verdrängung von.
Die 7 Management-Werkzeuge
Auflösung klassischer Geschlechterrollen
Die klassischen Methoden der historisch-vergleichenden Forschung Universität Zürich Soziologisches Institut Seminar: Methoden des internationalen Vergleichs.
Wohnungseinbruchsdiebstahl – aktuelle Entwicklungen und Folgen für die Betroffenen Vortrag anlässlich des 9. Niedersächsischen Präventionstags am
Lineare Optimierung Nakkiye Günay, Jennifer Kalywas & Corina Unger Jetzt erkläre ich euch die einzelnen Schritte und gebe Tipps!
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Statistiktutorat: Datenkontrolle christian_langrock@web.de

Gliederung Ausreisser-Analyse Analyse von fehlenden Werten MCAR MAR NRM

Ausreisseranalyse Ausreisser- und Extremwerte nach Tukey-Kriterium identifizieren Grafisches Ergebnis: Boxplot Ersetzungsmöglichkeit „Windsorisieren“ Problem: Werte können sowohl durch Fehler/bewusst falsche Angaben sein, als auch real bestehen.

Missing-Data Diagnose Fehlende Werte sind besonders in tendenziell „intrusiven“ Fächern wie der Psychologie ein verbreitetes Problem Erfassung von fehlenden Werten pro Variable und pro Person Insbesondere bei mehr als 5% fehlenden Werte sollte genau hingesehen werden

Missing Completely at Randon (MCAR) Kein Zusammenhang zwischen Fehlen ja/nein und Ausprägung in der analysierten Variablen Kein Zusammenhang zwischen Fehlen ja/nein und weiteren erhobenen Variablen Fehlende Werte stellen kein Problem dar, da die vorhandenen Werte eine repräsentative Stichprobe aller Werte darstellen

Beispiel MCAR Ich untersuche die Wirkung einer Diät (abhängige Variable Gewicht) anhand der Gewichtsdifferenz zwischen Beginn und Abschluss. Neben dem Gewicht erhebe ich die Variablen Geschlecht, Körpergröße und Alter. MCAR liegt vor, wenn unter den Probanden, die die Diät nicht abschließen weder eine bestimmten Gewichtsklasse, noch eine bestimmte Altersgruppe, noch eine bestimmte Größe noch eine bestimmtes Geschlecht überrepräsentiert ist.

Missing at Random (MAR) Kein Zusammenhang zwischen Fehlen ja/nein und Ausprägung in der analysierten Variablen Zusammenhang zwischen Fehlen ja/nein und weiteren erhobenen Variablen Fehlende Werte können prinzipiell durch statistische Methoden (überzufällig gut) geschätzt werden

Beispiel MAR MAR liegt vor, wenn unter den Probanden, die die Diät nicht abschließen, zwar keine bestimmte Gewichtsklasse aber mindestens eine der Variablen Alter, Größe und Geschlecht überrepräsentiert ist.

Nonrandom Missing (NRM) Zusammenhang zwischen Fehlen ja/nein und Ausprägung in der analysierten Variablen. Kein Zusammenhang zwischen Fehlen ja/nein und weiteren erhobenen Variablen. Eine optimale statistische Lösung dieses Problems ist derzeit nicht verfügbar.

Beispiel NRM NRM liegt vor, wenn eine bestimmte Gewichtsklasse bei denjenigen, die die Diät nicht abschließen, überrepräsentiert ist.