Modul Statistische Datenanalyse

Name: Modul Statistische Datenanalyse
Uploaded: 2017-08-25T05:10:45+00:00
Duration: PTM7S25
Channel: Wernher Katzman
Description: Modul Statistische Datenanalyse

Modul Statistische Datenanalyse
Praktikum Experimentelle Ökologie — SS 20005 Modul Statistische Datenanalyse • Statistik und experimentelles Design gehören zu den wichtigsten Arbeitsinstrumenten von Biologen (bes. Ökologen). • Die statistische Analyse sollte vor der Durchführung eines Experiments geplant werden, nicht erst danach. • Fehler bei der stat. Auswertung und dem experimentellen Design gehören zu den wichtigsten Gründen, weshalb Forschungsresultate in Ökologie nicht publiziert werden können. • Statistik ist nicht Mathematik und nicht allzu schwierig zu lernen. • Statistik lernt man am einfachsten, wenn man eigene Daten analysieren kann und die Hilfe von erfahrenen Leuten in Anspruch nehmen kann.

Typen von Daten: • kontinuierlich • binär • kategoriell
Häufigkeitsverteilungen von Daten: Normalverteilung Binomialverteilung Poissonverteilung n Mittelwert (mean) Standardabweichung (standard deviation) s = n - 1 Die Normalverteilung (Glockenkurve) Varianz (variance) s2 = n - 1

Die Normalverteilung ist eine Wahrscheinlichkeitsverteilung
68% 95% Standard deviation Frequency Beispiel: Körpergrösse der Kursteilnehmer Die Normalverteilung ist eine Wahrscheinlichkeitsverteilung Wahrscheinlichkeit, dass • eine Person grösser als 185 cm gross ist • kleiner als 160 cm gross ist • zwischen 160 und 170 cm gross ist

(confidence interval)
Wichtige Begriffe und Konzepte Grundgesamtheit (population) Stichprobe (sample) Stichprobenerhebung (sampling): muss repräsentative sein, d.h. alle Individuen einer Population müssen die gleiche Wahrscheinlichkeit haben, in der Stichprobe vertreten zu sein (Zufallsstichprobe, random sampling) Merke: Mittelwerte von Zufallsstichproben variieren um den wahren Mittelwert der Grundgesamtheit ! Beispiel Körpergrösse Standardfehler des Mittelwerts (standard error of the mean) s.e. = s 95% Konfidenzinterval (confidence interval)

Testen von Hypothesen Gibt es Unterschiede zwischen Gruppen der Grundgesamtheit? (Beispiel Körpergrösse von Frauen und Männern) Nullhypothese H0: es gibt keine Unterschiede Alternativhypothese H1: es gibt Unterschiede t -Test: Vergleich von zwei Gruppen Varianzanalyse (ANOVA): Vergleich von zwei oder mehr Gruppen

Varianzanalyse (Analysis of Variance)
Beispiel Düngungsexperiment Biomasse (g) von 10 Pflanzen wenig Dünger: 12.3, 13.4, 11.8, 16.5, 14.1 viel Dünger: , 19.5, 18,1 16.7, 21.3

H0: keine Unterschiede zwischen zwei Gruppen
Abweichung vom Mittelwert Biomasse (g) Gesamtmittelwert (grand mean) wenig viel Dünger Biomasse (g) Dünger wenig viel Mittelwert einer Behandlungsgruppe (treatment mean) H1: Gruppen haben unterschiedliche Mittelwerte Abweichung vom Mittelwert (“residual” oder “error”)

One-way analysis of variance
0.0022 90.205 9 Total Prob > F 3.275 26.196 8 Error 19.6 64.009 1 Treatment F Ratio Mean Square Sum of Squares DF Source DF = degrees of freedom SStotal = Total sum of squares SSerror = Error sum of squares SStreat = Treatment sum of squares SStotal = SStreat + SSerror MSerror = SSerror / 8 MStreat = SStreat / 1 Wenn H0 zutrifft, dann sind MSerror und MStreat etwa gleich gross. D.h. MStreat MSerror F = sollte etwa 1 sein

SStotal SStotal SStreat SSerror SStreat SSerror Biomasse (g) wenig
viel Dünger SStreat SSerror Biomasse (g) Biomasse (g) wenig viel wenig viel MStreat MSerror F = R2 = SStreat SStotal % der vom Modell erklärten Varianz

Fiktives Datenset A Grosse Mittelwertsunterschiede
Geringe Streuung innerhalb Gruppen Grafen & Hails

Fiktives Datenset B Geringe Mittelwertsunterschiede
Grosse Streuung innerhalb Gruppen Grafen & Hails

Hilfe meine Daten sind nicht normalverteilt!
Annahmen der ANOVA • Residuen sind normalverteilt • gleiche Streuung in jeder Gruppe • Datenpunkte sind unabhängig bes. bei kontinuierlichen Daten bes. bei Zähldaten bes. bei Prozentwerten Datentransformation Hilfe meine Daten sind nicht normalverteilt!

Schlussfolgerungen beim prüfen von Nullhypothesen
Test ist signifikant: die Gruppen gehören mit Irrtumswahrscheinlichkeit p zu unterschiedlichen Grundgesamtheiten (solchen mit unterschiedlichen Mittelwerten) Test nicht signifikant: kein Beweis dass Gruppen gleich sind! The absence of a proof is not proof for an absence! Situation Wahre Statistische Schlussfolgerung H0 abgelehnt H0 nicht abgelehnt Effekt vorhanden Kein Effekt type II error type I error 

Statistische Macht (statistical power)
Wahrscheinlichkeit mit der eine Nullhypothese, die effektiv falsch ist, abgelehnt werden kann. Abhängig von: • Grösse der Unterschiede zwischen Gruppen (effect size) • Stichprobenumfang (sample size) • Ausmass der Streuung innerhalb der Gruppen (error variance)

Modul Statistische Datenanalyse

Ähnliche Präsentationen

Präsentation zum Thema: "Modul Statistische Datenanalyse"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback

Anmelden

Anmeldung über soziales Netzwerk:

Modul Statistische Datenanalyse

Ähnliche Präsentationen

Präsentation zum Thema: "Modul Statistische Datenanalyse"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback