Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistiktutorat: Datenkontrolle

Ähnliche Präsentationen


Präsentation zum Thema: "Statistiktutorat: Datenkontrolle"—  Präsentation transkript:

1 Statistiktutorat: Datenkontrolle

2 Gliederung I.Ausreisser-Analyse II.Analyse von fehlenden Werten -MCAR -MAR -NRM

3 Ausreisseranalyse oAusreisser- und Extremwerte nach Tukey- Kriterium identifizieren Grafisches Ergebnis: Boxplot oErsetzungsmöglichkeit Windsorisieren oProblem: Werte können sowohl durch Fehler/bewusst falsche Angaben sein, als auch real bestehen.

4 Missing-Data Diagnose oFehlende Werte sind besonders in tendenziell intrusiven Fächern wie der Psychologie ein verbreitetes Problem oErfassung von fehlenden Werten pro Variable und pro Person oInsbesondere bei mehr als 5% fehlenden Werte sollte genau hingesehen werden

5 Missing Completely at Randon (MCAR) oKein Zusammenhang zwischen Fehlen ja/nein und Ausprägung in der analysierten Variablen oKein Zusammenhang zwischen Fehlen ja/nein und weiteren erhobenen Variablen Fehlende Werte stellen kein Problem dar, da die vorhandenen Werte eine repräsentative Stichprobe aller Werte darstellen

6 Beispiel MCAR Ich untersuche die Wirkung einer Diät (abhängige Variable Gewicht) anhand der Gewichtsdifferenz zwischen Beginn und Abschluss. Neben dem Gewicht erhebe ich die Variablen Geschlecht, Körpergröße und Alter. MCAR liegt vor, wenn unter den Probanden, die die Diät nicht abschließen weder eine bestimmten Gewichtsklasse, noch eine bestimmte Altersgruppe, noch eine bestimmte Größe noch eine bestimmtes Geschlecht überrepräsentiert ist.

7 Missing at Random (MAR) oKein Zusammenhang zwischen Fehlen ja/nein und Ausprägung in der analysierten Variablen oZusammenhang zwischen Fehlen ja/nein und weiteren erhobenen Variablen Fehlende Werte können prinzipiell durch statistische Methoden (überzufällig gut) geschätzt werden

8 Beispiel MAR MAR liegt vor, wenn unter den Probanden, die die Diät nicht abschließen, zwar keine bestimmte Gewichtsklasse aber mindestens eine der Variablen Alter, Größe und Geschlecht überrepräsentiert ist.

9 Nonrandom Missing (NRM) oZusammenhang zwischen Fehlen ja/nein und Ausprägung in der analysierten Variablen. oKein Zusammenhang zwischen Fehlen ja/nein und weiteren erhobenen Variablen. Eine optimale statistische Lösung dieses Problems ist derzeit nicht verfügbar.

10 Beispiel NRM NRM liegt vor, wenn eine bestimmte Gewichtsklasse bei denjenigen, die die Diät nicht abschließen, überrepräsentiert ist.


Herunterladen ppt "Statistiktutorat: Datenkontrolle"

Ähnliche Präsentationen


Google-Anzeigen