Modul Statistische Datenanalyse

Slides:



Advertisements
Ähnliche Präsentationen
T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.
Advertisements

Aufgabe Analyse (Friedman-Test) von letzter Stunde wiederholen
Bewegungswissenschaft
Thema der Stunde I. Einführung in die Varianzanalyse:
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
EmPra Der Einfluss und die Verarbeitung von emotionalen Reizen
Einfaktorielle Varianzanalyse
Gliederung Vertrauensintervalle Arten von Hypothesen
Gliederung Der Begriff der Stichprobe, Stichprobenfehler
Die t-Verteilung Jonathan Harrington.
Die t-Verteilung (fortgesetzt)
Forschungsstatistik II
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-28.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.
Das Allgemeine lineare Modell (ALM) - Varianz als Schlüsselkonzept
Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.
Konfidenzintervalle für Parameter
Modellvergleich.
Ein frohes und erfolgreiches Jahr
Hypothesen testen: Grundidee
Prüfung statistischer Hypothesen
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Was steht in einer ANOVA - Tabelle?
Fragen Was wird mit der Alphafehler-Kumulierung bzw. –inflation bezeichnet? Wie hoch ist die Wahrscheinlichkeit bei einer Untersuchung mit 4 Gruppen einen.
Statistische Methoden II
Nachholung der Vorlesung vom Freitag
Konfidenzintervalle Intervallschätzung
Ab nächster Woche wird die Übungsgruppe Gruppe 2: Henrike Berg Di SR 222 wegen Personalmangel eingestellt.
Die Vorlesung Statistische Methoden II findet am (nächste Woche) wegen der Projektwoche nicht wegen der Projektwoche nicht statt.
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,
Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.
Klausurtermin (laut Prüfungsamt) Probeklausur Freitag, 13. Juni 2003 statt Vorlesung.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Test auf Normalverteilung
Deskriptive Statistik
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: ANOVA I
Einführung in die Metaanalyse
(Un-)sicherheiten in der Ökosystemmodellierung
Eigenschaften der OLS-Schätzer
Wiederholung: Einfache Regressionsgleichung
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Vergleich der 3 Arten des t-Tests Testergebnisse berichten
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Chi Quadrat Test Tamara Katschnig.
Ausgleichungsrechnung I
Seminar: Datenerhebung
Die t-Verteilung und die Prüfstatistik
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Varianzanalyse mit Messwiederholungen
Die t-Verteilung Jonathan Harrington. Standard error of the mean (SE) ist die Standardabweichung von Mittelwerten Ich werfe 5 Würfel und berechne den.
Die t-Verteilung und die Prüfstatistik
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
STATISIK LV Nr.: 1375 SS März 2005.
SStotal SStotal SStreat SSerror SStreat SSerror Biomasse (g) wenig
Konfidenzintervall und Testen für den Mittelwert und Anteile
Varianzanalyse Teststatistik: F – Test -> vergleich zweier Varianzen -> Grundlage der Varianzanalyse Welche „Varianzen“ werden miteinander verglichen?
Soziale Urteilsbildung Lozo, Soziale Urteilsbildung, AE Sozialpsychologie, SS 2004 Laienhafte Inferenzstrategien oder „the intuitive psychologist“ 2: Urteilsheuristiken.
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
K. Desch - Statistik und Datenanalyse SS05
Forschungsstrategien Johannes Gutenberg Universität Mainz
ANOVA für unabhängige Daten.
 Präsentation transkript:

Modul Statistische Datenanalyse Praktikum Experimentelle Ökologie — SS 20005 Modul Statistische Datenanalyse • Statistik und experimentelles Design gehören zu den wichtigsten Arbeitsinstrumenten von Biologen (bes. Ökologen). • Die statistische Analyse sollte vor der Durchführung eines Experiments geplant werden, nicht erst danach. • Fehler bei der stat. Auswertung und dem experimentellen Design gehören zu den wichtigsten Gründen, weshalb Forschungsresultate in Ökologie nicht publiziert werden können. • Statistik ist nicht Mathematik und nicht allzu schwierig zu lernen. • Statistik lernt man am einfachsten, wenn man eigene Daten analysieren kann und die Hilfe von erfahrenen Leuten in Anspruch nehmen kann.

Typen von Daten: • kontinuierlich • binär • kategoriell Häufigkeitsverteilungen von Daten: Normalverteilung Binomialverteilung Poissonverteilung n Mittelwert (mean) Standardabweichung (standard deviation) s = n - 1 Die Normalverteilung (Glockenkurve) Varianz (variance) s2 = n - 1

Die Normalverteilung ist eine Wahrscheinlichkeitsverteilung 68% 95% Standard deviation Frequency Beispiel: Körpergrösse der Kursteilnehmer Die Normalverteilung ist eine Wahrscheinlichkeitsverteilung Wahrscheinlichkeit, dass • eine Person grösser als 185 cm gross ist • kleiner als 160 cm gross ist • zwischen 160 und 170 cm gross ist

(confidence interval) Wichtige Begriffe und Konzepte Grundgesamtheit (population) Stichprobe (sample) Stichprobenerhebung (sampling): muss repräsentative sein, d.h. alle Individuen einer Population müssen die gleiche Wahrscheinlichkeit haben, in der Stichprobe vertreten zu sein (Zufallsstichprobe, random sampling) Merke: Mittelwerte von Zufallsstichproben variieren um den wahren Mittelwert der Grundgesamtheit ! Beispiel Körpergrösse Standardfehler des Mittelwerts (standard error of the mean) s.e. = s 95% Konfidenzinterval (confidence interval)

Testen von Hypothesen Gibt es Unterschiede zwischen Gruppen der Grundgesamtheit? (Beispiel Körpergrösse von Frauen und Männern) Nullhypothese H0: es gibt keine Unterschiede Alternativhypothese H1: es gibt Unterschiede t -Test: Vergleich von zwei Gruppen Varianzanalyse (ANOVA): Vergleich von zwei oder mehr Gruppen

Varianzanalyse (Analysis of Variance) Beispiel Düngungsexperiment Biomasse (g) von 10 Pflanzen wenig Dünger: 12.3, 13.4, 11.8, 16.5, 14.1 viel Dünger: 17.8, 19.5, 18,1 16.7, 21.3

H0: keine Unterschiede zwischen zwei Gruppen Abweichung vom Mittelwert Biomasse (g) Gesamtmittelwert (grand mean) wenig viel Dünger Biomasse (g) Dünger wenig viel Mittelwert einer Behandlungsgruppe (treatment mean) H1: Gruppen haben unterschiedliche Mittelwerte Abweichung vom Mittelwert (“residual” oder “error”)

One-way analysis of variance 0.0022 90.205 9 Total Prob > F 3.275 26.196 8 Error 19.6 64.009 1 Treatment F Ratio Mean Square Sum of Squares DF Source DF = degrees of freedom SStotal = Total sum of squares SSerror = Error sum of squares SStreat = Treatment sum of squares SStotal = SStreat + SSerror MSerror = SSerror / 8 MStreat = SStreat / 1 Wenn H0 zutrifft, dann sind MSerror und MStreat etwa gleich gross. D.h. MStreat MSerror F = sollte etwa 1 sein

SStotal SStotal SStreat SSerror SStreat SSerror Biomasse (g) wenig viel Dünger SStreat SSerror Biomasse (g) Biomasse (g) wenig viel wenig viel MStreat MSerror F = R2 = SStreat SStotal % der vom Modell erklärten Varianz

Fiktives Datenset A Grosse Mittelwertsunterschiede Geringe Streuung innerhalb Gruppen Grafen & Hails

Fiktives Datenset B Geringe Mittelwertsunterschiede Grosse Streuung innerhalb Gruppen Grafen & Hails

Hilfe meine Daten sind nicht normalverteilt! Annahmen der ANOVA • Residuen sind normalverteilt • gleiche Streuung in jeder Gruppe • Datenpunkte sind unabhängig bes. bei kontinuierlichen Daten bes. bei Zähldaten bes. bei Prozentwerten Datentransformation Hilfe meine Daten sind nicht normalverteilt!

Schlussfolgerungen beim prüfen von Nullhypothesen Test ist signifikant: die Gruppen gehören mit Irrtumswahrscheinlichkeit p zu unterschiedlichen Grundgesamtheiten (solchen mit unterschiedlichen Mittelwerten) Test nicht signifikant: kein Beweis dass Gruppen gleich sind! The absence of a proof is not proof for an absence! Situation Wahre Statistische Schlussfolgerung H0 abgelehnt H0 nicht abgelehnt Effekt vorhanden Kein Effekt type II error type I error 

Statistische Macht (statistical power) Wahrscheinlichkeit mit der eine Nullhypothese, die effektiv falsch ist, abgelehnt werden kann. Abhängig von: • Grösse der Unterschiede zwischen Gruppen (effect size) • Stichprobenumfang (sample size) • Ausmass der Streuung innerhalb der Gruppen (error variance)