Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistiktutorat: Datenkontrolle

Ähnliche Präsentationen


Präsentation zum Thema: "Statistiktutorat: Datenkontrolle"—  Präsentation transkript:

1 Statistiktutorat: Datenkontrolle

2 Gliederung Ausreisser-Analyse Analyse von fehlenden Werten MCAR MAR
NRM

3 Ausreisseranalyse Ausreisser- und Extremwerte nach Tukey-Kriterium identifizieren Grafisches Ergebnis: Boxplot Ersetzungsmöglichkeit „Windsorisieren“ Problem: Werte können sowohl durch Fehler/bewusst falsche Angaben sein, als auch real bestehen.

4 Missing-Data Diagnose
Fehlende Werte sind besonders in tendenziell „intrusiven“ Fächern wie der Psychologie ein verbreitetes Problem Erfassung von fehlenden Werten pro Variable und pro Person Insbesondere bei mehr als 5% fehlenden Werte sollte genau hingesehen werden

5 Missing Completely at Randon (MCAR)
Kein Zusammenhang zwischen Fehlen ja/nein und Ausprägung in der analysierten Variablen Kein Zusammenhang zwischen Fehlen ja/nein und weiteren erhobenen Variablen Fehlende Werte stellen kein Problem dar, da die vorhandenen Werte eine repräsentative Stichprobe aller Werte darstellen

6 Beispiel MCAR Ich untersuche die Wirkung einer Diät (abhängige Variable Gewicht) anhand der Gewichtsdifferenz zwischen Beginn und Abschluss. Neben dem Gewicht erhebe ich die Variablen Geschlecht, Körpergröße und Alter. MCAR liegt vor, wenn unter den Probanden, die die Diät nicht abschließen weder eine bestimmten Gewichtsklasse, noch eine bestimmte Altersgruppe, noch eine bestimmte Größe noch eine bestimmtes Geschlecht überrepräsentiert ist.

7 Missing at Random (MAR)
Kein Zusammenhang zwischen Fehlen ja/nein und Ausprägung in der analysierten Variablen Zusammenhang zwischen Fehlen ja/nein und weiteren erhobenen Variablen Fehlende Werte können prinzipiell durch statistische Methoden (überzufällig gut) geschätzt werden

8 Beispiel MAR MAR liegt vor, wenn unter den Probanden, die die Diät nicht abschließen, zwar keine bestimmte Gewichtsklasse aber mindestens eine der Variablen Alter, Größe und Geschlecht überrepräsentiert ist.

9 Nonrandom Missing (NRM)
Zusammenhang zwischen Fehlen ja/nein und Ausprägung in der analysierten Variablen. Kein Zusammenhang zwischen Fehlen ja/nein und weiteren erhobenen Variablen. Eine optimale statistische Lösung dieses Problems ist derzeit nicht verfügbar.

10 Beispiel NRM NRM liegt vor, wenn eine bestimmte Gewichtsklasse bei denjenigen, die die Diät nicht abschließen, überrepräsentiert ist.


Herunterladen ppt "Statistiktutorat: Datenkontrolle"

Ähnliche Präsentationen


Google-Anzeigen