Wann ist eine Regression zulässig? siehe siehe auch: UCLA Statistics Dept. Denise.

Slides:



Advertisements
Ähnliche Präsentationen
Modellprämissen der linearen Regression
Advertisements

Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
1 Wiederholungsstunde Altweiber Es wurden bei 200 zufällig ausgewählten normalwüchsigen männlichen erwachesnen Personen die Körpergröße bestimmt.
Varianzanalyse 2 Faktorielle Varianzanalysen mit Meßwiederholung
Aufgabe Analyse (Friedman-Test) von letzter Stunde wiederholen
Aufgabe Analyse (Friedman-Test) von letzter Stunde wiederholen
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Regression und Korrelation
Logistic Regression Jonathan Harrington Befehle: logistic.txt.
Logistic Regression Jonathan Harrington Bitte lost.txt und lost2.txt laden – siehe Befehle in logistic.txt.
Die Varianzanalyse ohne Messwiederholung
Die Varianzanalyse Jonathan Harrington.
Mehrfache und polynomiale Regression Jonathan Harrington Kriteria für die Durchführung einer Regression pfad = "Das Verzeichnis, wo die Daten gespeichert.
Mixed Models Jonathan Harrington library(ez) library(lme4)
Die t-Verteilung Jonathan Harrington.
Mehrfache und polynomiale Regression
Logistische Regression und die Analyse von Proportionen Jonathan Harrington library(lme4) library(lattice) library(multcomp) source(file.path(pfadu, "phoc.txt"))
Kovarianz, Korrelation, (lineare) Regression
Kovarianz, Korrelation, (lineare) Regression
Logistic Regression Jonathan Harrington Befehle: logistic.txt.
Logistische Regression und die Analyse von Proportionen Jonathan Harrington library(lme4) library(lattice) library(multcomp) source(file.path(pfadu, "phoc.txt"))
Logistische Regression und die Analyse von Proportionen
Die Varianzanalyse Analysis of Variance (ANOVA) Jonathan Harrington
Logistische Regression und psychometrische Kurven
Die t-Verteilung (fortgesetzt)
Mehrfache und polynomiale Regression
Mehrfache und polynomiale Regression Jonathan Harrington Kriteria für die Durchführung einer Regression library(MASS) # ydata.txt und epg.txt in einem.
Die Varianzanalyse Jonathan Harrington Analysis of Variance (ANOVA) pfad = "Verzeichnis wo Sie anova1 gespeichert haben" attach(paste(pfad, "anova1", sep="/"))
4. Anwendung der logistic Regression auf die Berechung einer perzeptiven Grenzen zwischen Kategorien Experiment. Anhand der Sprachsynthese wurde ein F2-
Kovarianz, Korrelation, (lineare) Regression
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Kovarianz, Korrelation, (lineare) Regression Jonathan Harrington BITTE NOCH EINMAL dframes.zip (Webseite 4.1) herunterladen und in pfad auspacken.
Die Varianzanalyse ohne Messwiederholung Jonathan Harrington.
Logistische Regression und die Analyse von Proportionen Jonathan Harrington.
A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.
Nicht-Lineare Regression
Nachholung der Vorlesung vom Freitag
Konfidenzintervalle Intervallschätzung
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird auf Montag, den 17. Mai verlegt! Zeit: 16 Uhr Ort: Kiste Nächste Woche!!!!
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
Vorlesung: ANOVA I
Multikollinearität Wann spricht man von Multikollinearität?
Kapitel 9 Analyse der Modellstruktur
Die t-Verteilung und die Prüfstatistik
Varianzanalyse mit Messwiederholungen
Die t-Verteilung Jonathan Harrington. Standard error of the mean (SE) ist die Standardabweichung von Mittelwerten Ich werfe 5 Würfel und berechne den.
Die t-Verteilung und die Prüfstatistik
Einige Kriterien für die Durchführung einer Varianzanalyse Jonathan Harrington.
Messwerte, Verteilung, Histogramm, Mittelwert und Standardabweichung
Die Gaußverteilung.
Peter Grzybek Projekt # (FWF) Projekt # 43s9 (OEAD/SAIA) Graphem-Häufigkeiten.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Modul Statistische Datenanalyse
Lineare Restriktionen
Kapitel 18 Dynamische Modelle: Schätzen der Parameter
Bewertung von Regressionsbeziehungen
Kovarianz, Korrelation, (lineare) Regression
Varianzanalyse Teststatistik: F – Test -> vergleich zweier Varianzen -> Grundlage der Varianzanalyse Welche „Varianzen“ werden miteinander verglichen?
Regression (zweiter Teil)
Test 1 Test 2 Test 3. Test 4 Test 5 Test 6 Test 7 Test 8 Test 9.
Grafische Darstellung von Gruppenunterschieden.
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Kovarianz, Korrelation, (lineare) Regression
Test.
Kovarianz, Korrelation, (lineare) Regression
Konfidenzintervalle und Tests auf Normalverteilung
Kovarianz, Korrelation, (lineare) Regression
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Wann ist eine Regression zulässig? siehe siehe auch: UCLA Statistics Dept. Denise Ferrari & Tiffany Head, Regression in R Part I:

Die wichtigsten Kriterien (a) von einer Normalverteilung nicht signifikant abweichen. (c) keine Autokorrelation aufweisen. (b) 'eine konstante Varianz aufweisen. (d) ggf. Ausreißer entfernen (wenn a-c nicht zutreffen) Die Residuals sollen:

( a) Sind die Residuals normalverteilt? regp = lm(F2 ~ COG, data = epg) shapiro.test(resid(regp)) Shapiro-Wilk normality test data: resid(regp) W = , p-value = epg = read.table(file.path(pfadu, "epg.txt"))

(b) Haben die Residuals eine konstante Varianz? Insbesondere sollten die residuals nicht wesentlich größer am Anfang/Ende sein, sondern auf eine randomisierte Weise um die 0 Linie verteilt sein. plot(resid(regp)) abline(h=0, lty=2)

(c) Keine Autokorrelation Ein gutes Beispiel von autokorrelierten Daten: ein stimmfahtes Sprachsignal Autokorrelation ist wenn die Werte eines Signals mit sich selbst korreliert sind

acf(resid(regp)) 95% Konfidenzintervall um 0 Wenn die meisten ACF-Werte innerhalb der blauen Linien liegen, gibt es keine Autokorrelation. Insbesondere die Werte bei lag 1 und 2 beobachten: diese sollten innerhalb des Vertauensintervalls liegen. (c) Keine Autokorrelation

(d) Ausreißer Ein einziger Ausreißer vor allem vom Mittelpunkt weit entfernt kann die Regressionslinie deutlich beeinflussen. Ausreißer die eventuell (aber nicht unbedingt) die Regression stark beeinflussen, können mit dem sog. Cookes Distance aufgedeckt werden plot(regp, 4)

with(epg, plot(COG, F2, cex = 10*sqrt(cooks.distance(regp)))) with(epg, text(COG, F2, as.character(1:length(F2)))) Die Cookes-Entfernungen und daher Ausreißer könnten auch mit einem sogenannten 'bubble plot' abgebildet werden (d) Ausreißer