Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Modul Statistische Datenanalyse

Ähnliche Präsentationen


Präsentation zum Thema: "Modul Statistische Datenanalyse"—  Präsentation transkript:

1 Modul Statistische Datenanalyse
Praktikum Experimentelle Ökologie — SS 20005 Modul Statistische Datenanalyse • Statistik und experimentelles Design gehören zu den wichtigsten Arbeitsinstrumenten von Biologen (bes. Ökologen). • Die statistische Analyse sollte vor der Durchführung eines Experiments geplant werden, nicht erst danach. • Fehler bei der stat. Auswertung und dem experimentellen Design gehören zu den wichtigsten Gründen, weshalb Forschungsresultate in Ökologie nicht publiziert werden können. • Statistik ist nicht Mathematik und nicht allzu schwierig zu lernen. • Statistik lernt man am einfachsten, wenn man eigene Daten analysieren kann und die Hilfe von erfahrenen Leuten in Anspruch nehmen kann.

2 Typen von Daten: • kontinuierlich • binär • kategoriell
Häufigkeitsverteilungen von Daten: Normalverteilung Binomialverteilung Poissonverteilung n Mittelwert (mean) Standardabweichung (standard deviation) s = n - 1 Die Normalverteilung (Glockenkurve) Varianz (variance) s2 = n - 1

3 Die Normalverteilung ist eine Wahrscheinlichkeitsverteilung
68% 95% Standard deviation Frequency Beispiel: Körpergrösse der Kursteilnehmer Die Normalverteilung ist eine Wahrscheinlichkeitsverteilung Wahrscheinlichkeit, dass • eine Person grösser als 185 cm gross ist • kleiner als 160 cm gross ist • zwischen 160 und 170 cm gross ist

4 (confidence interval)
Wichtige Begriffe und Konzepte Grundgesamtheit (population) Stichprobe (sample) Stichprobenerhebung (sampling): muss repräsentative sein, d.h. alle Individuen einer Population müssen die gleiche Wahrscheinlichkeit haben, in der Stichprobe vertreten zu sein (Zufallsstichprobe, random sampling) Merke: Mittelwerte von Zufallsstichproben variieren um den wahren Mittelwert der Grundgesamtheit ! Beispiel Körpergrösse Standardfehler des Mittelwerts (standard error of the mean) s.e. = s 95% Konfidenzinterval (confidence interval)

5

6 Testen von Hypothesen Gibt es Unterschiede zwischen Gruppen der Grundgesamtheit? (Beispiel Körpergrösse von Frauen und Männern) Nullhypothese H0: es gibt keine Unterschiede Alternativhypothese H1: es gibt Unterschiede t -Test: Vergleich von zwei Gruppen Varianzanalyse (ANOVA): Vergleich von zwei oder mehr Gruppen

7 Varianzanalyse (Analysis of Variance)
Beispiel Düngungsexperiment Biomasse (g) von 10 Pflanzen wenig Dünger: 12.3, 13.4, 11.8, 16.5, 14.1 viel Dünger: , 19.5, 18,1 16.7, 21.3

8 H0: keine Unterschiede zwischen zwei Gruppen
Abweichung vom Mittelwert Biomasse (g) Gesamtmittelwert (grand mean) wenig viel Dünger Biomasse (g) Dünger wenig viel Mittelwert einer Behandlungsgruppe (treatment mean) H1: Gruppen haben unterschiedliche Mittelwerte Abweichung vom Mittelwert (“residual” oder “error”)

9 One-way analysis of variance
0.0022 90.205 9 Total Prob > F 3.275 26.196 8 Error 19.6 64.009 1 Treatment F Ratio Mean Square Sum of Squares DF Source DF = degrees of freedom SStotal = Total sum of squares SSerror = Error sum of squares SStreat = Treatment sum of squares SStotal = SStreat + SSerror MSerror = SSerror / 8 MStreat = SStreat / 1 Wenn H0 zutrifft, dann sind MSerror und MStreat etwa gleich gross. D.h. MStreat MSerror F = sollte etwa 1 sein

10 SStotal SStotal SStreat SSerror SStreat SSerror Biomasse (g) wenig
viel Dünger SStreat SSerror Biomasse (g) Biomasse (g) wenig viel wenig viel MStreat MSerror F = R2 = SStreat SStotal % der vom Modell erklärten Varianz

11 Fiktives Datenset A Grosse Mittelwertsunterschiede
Geringe Streuung innerhalb Gruppen Grafen & Hails

12 Fiktives Datenset B Geringe Mittelwertsunterschiede
Grosse Streuung innerhalb Gruppen Grafen & Hails

13 Hilfe meine Daten sind nicht normalverteilt!
Annahmen der ANOVA • Residuen sind normalverteilt • gleiche Streuung in jeder Gruppe • Datenpunkte sind unabhängig bes. bei kontinuierlichen Daten bes. bei Zähldaten bes. bei Prozentwerten Datentransformation Hilfe meine Daten sind nicht normalverteilt!

14 Schlussfolgerungen beim prüfen von Nullhypothesen
Test ist signifikant: die Gruppen gehören mit Irrtumswahrscheinlichkeit p zu unterschiedlichen Grundgesamtheiten (solchen mit unterschiedlichen Mittelwerten) Test nicht signifikant: kein Beweis dass Gruppen gleich sind! The absence of a proof is not proof for an absence! Situation Wahre Statistische Schlussfolgerung H0 abgelehnt H0 nicht abgelehnt Effekt vorhanden Kein Effekt type II error type I error

15 Statistische Macht (statistical power)
Wahrscheinlichkeit mit der eine Nullhypothese, die effektiv falsch ist, abgelehnt werden kann. Abhängig von: • Grösse der Unterschiede zwischen Gruppen (effect size) • Stichprobenumfang (sample size) • Ausmass der Streuung innerhalb der Gruppen (error variance)


Herunterladen ppt "Modul Statistische Datenanalyse"

Ähnliche Präsentationen


Google-Anzeigen