Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Slides:



Advertisements
Ähnliche Präsentationen
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Advertisements

Modellprämissen der linearen Regression
Der F - Test Man prüft, ob sich 2 Varianzen unterscheiden, mit dem F-Quotienten: Geprüft werden stets die Schätzungen der Populationsvarianzen aufgrund.
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Theorie psychometrischer Tests, III
Forschungsstrategien Johannes Gutenberg Universität Mainz
Methoden der Psychologie Multivariate Analysemethoden und Multivariates Testen Günter Meinhardt Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Methoden der Psychologie Evaluation & Forschungsmethoden Günter Meinhardt Johannes Gutenberg Universität Mainz q-q-Plot Methode zur Prüfung der Multivariaten.
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Wann ist eine Regression zulässig? siehe siehe auch: UCLA Statistics Dept. Denise.
Forschungsstatistik II
Forschungsstatistik II
Heute Prüfung der Produkt-Moment Korrelation
Law of comparative judgement
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.
Der Binomialtest Man habe einen wahren Anteil P.
Numerische Klassifikation TWINSPAN
Hypothesen testen: Grundidee
2. Univariate Regressionsanalyse 2.1 Das statische Regressionsmodell
Strukturgleichungsmodelle
Statistische Methoden II SS 2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Tutorium
Eigenschaften der OLS-Schätzer
Chi Quadrat Test Tamara Katschnig.
Kapitel 10 Multikollinearität
SStotal SStotal SStreat SSerror SStreat SSerror Biomasse (g) wenig
Strategie der Modellbildung
setzt Linearität des Zusammenhangs voraus
Der Binomialtest Man habe einen wahren Anteil P. Kann man aufgrund von p sagen, daß in der Population tatsächlich der Anteil P zugrunde liegt? [Beispiele]
Prüft ebenfalls die Annahme der Varianzhomogenität (exakter)
Forschungsstrategien Johannes Gutenberg Universität Mainz
/ SES.125 Parameterschätzung
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Einführung in die Diskriminanzanalyse
Analysen univariater Stichproben
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Nachtrag Residuenanalyse
Kovarianz, Korrelation, (lineare) Regression
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Ökonometrie und Statistik Mehrfachregression
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Forschungsstrategien Johannes Gutenberg Universität Mainz
Ökonometrie und Statistik Unabhängigkeitstest, c² - Test (Chi Quadrat Test) Dr. Bertram Wassermann.
Kovarianz, Korrelation, (lineare) Regression
Konfidenzintervalle und Tests auf Normalverteilung
Kovarianz, Korrelation, (lineare) Regression
Fortgeschrittene Statistische Methoden Cordula Hunt
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Korrelation & Skalentransformation
Fortgeschrittene statistische Methoden SS2020
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz Vorlesung q-q-Plot Methode zur Prüfung der Multivariaten Normalverteilung Günter Meinhardt Johannes Gutenberg Universität Mainz

Verteilungsanpassung/Prüfung Prüfung der NV-Annahme Klassifikation Verteilungsanpassung/Prüfung Prüfung der Verteilungs-annahme Ausreißeranalyse: Vor der Schätzung der Parameter (m,S) für die multivariate NV- wird eine Analyse der Rohdaten auf Ausreißer vorgenommen. Effiziente Tests: Die NV- Annahme ist mit effektiven Methoden und trennscharfen Test zu prüfen, um ihre Gültigkeit sicherzustellen Korrekturen und Datentransformationen: Ist die NV- Annahme auf den originalen Skalen verletzt, können Skalentransformationen für die einzelnen Variablen des Variablen- verbundes gefunden werden, mit denen die multivariate Normalver- auf den transformierten Skalen gilt.

Mahalanobisdistanz D Prüfung der Verteilungs-annahme & Prüfung der NV-Annahme Klassifikation Mahalanobisdistanz D Prüfung der Verteilungs-annahme & Outlier- Identifikation Kernkonzept der Ausreißer-Identifikation Der Abstand einer Beobachtung vom Schwerpunkt der Verteilung wird über die multivariate Distanz D bestimmt. Dabei werden stets die quadrierten Distanzen D2 verwendet, da diese Chi-Quadrat verteilt sind, wenn die Variablen einer multivariaten Normalverteilung entstammen. Dann definiert mit die Inverse der Varianz- Kovarianz Matrix S, die verallgemeinerte quadrierte Distanz im multivariaten Raum. Sie heißt quadrierte Mahalanobis-Distanz.

Identifikation von Ausreißern Test der NV-Annahme (multivariat) Klassifikation Identifikation von Ausreißern Data Clearing m-dimensions Auch im multivariaten Fall mit m-Variablen sind Ausreißer in kleinen Stichproben nicht zuverlässig bestimmbar, Bei N > 30 legt man die Quantile der multivariaten Normalverteilung zugrunde (c2) und eliminiert die Beobachtungen, dessen quadrierte Mahalanobis-Distanzen jenseits der äußeren Quantile liegen. Dies sollten nicht mehr als 7%-8% sein. Ausreißer: [Excel-Beispiel q-q-Plot]

Test über Quantilskorrelation Test der NV-Annahme (multivariat) Klassifikation Test über Quantilskorrelation Q-Q Plot Methode multivariat Nach Ausreißerbereinigung werden den Meßvektoren empirische Quantile qo zugeordnet über die Reihe der Meßwerte sortiert nach Mahalanobisdistanz. Mit aus den Daten geschätzten Parametern (m,S) werden für die linearen Prozentränge erwartete Quantile qe aus der c2 - Verteilung bestimmt. Man trägt qo (y-Achse) und qe (x-Achse) gegeneinander ab. Perfekte Passung liegt vor, wenn die Daten auf der Winkelhalbierenden liegen. Man bestimmt Anteil der aufgeklärten Varianz und Korrelation. Für den Test des Korrelationskoeffizienten verfährt man exakt wie im univariaten Fall.

Datenbeispiel (m = 4 Variablen) Test der NV-Annahme (multivariat) Klassifikation Datenbeispiel (m = 4 Variablen) Q-Q Plot Methode mit 3 Ausreißern N = 30 m = 4 Korrelations-Test NV Test knapp im Annahmebereich, aber 2 Ausreißer verschlechtern die Passung beträchtlich, auch in den unteren Quantilen Die beiden größten Ausreißer erfüllen das Kriterium, aber der 3. höchste Wert ist ebenfalls suspekt (hoher Intervallabstand)

Datenbeispiel (m = 4 Variablen) Test der NV-Annahme (multivariat) Klassifikation Datenbeispiel (m = 4 Variablen) Q-Q Plot Methode ohne 3 Ausreißer N = 27 m = 4 Korrelations-Test NV Test zeigt nach Entfernung der höchsten 3 Werte (nicht nur 2) nun eine gute Passung der multivariaten NV

Allgemeines zur Verteilungskorrektur Skalentransformationen Test der NV-Annahme (multivariat) Klassifikation Allgemeines zur Verteilungskorrektur Ausreisser-Kontrolle Ausreißerbereinigung sollte immer multivariat erfolgen, da ein Ausreisser in einer einzelnen Variable noch nicht einen Ausreißer im Variablenverbund definiert. Das Entfernen extremer Beobachtungen ändert die Korrelationsmatrix, daher können iterative Bereinigungen nötig werden. Skalentransformationen Transformationen Skalentransformationen können nur univariat erfolgen. (Keine Methode definiert eine Transformation für den Variablenverbund) Es ist ratsam eine univariate Untersuchung systematischer Verteilungsabweichungen nach der multivariaten Ausreißerkontrolle durchzuführen, und die einzelnen Variablen mit geeigneten Potenz- transformationen zu korrigieren. Sind die Randverteilungen (univariate) alle normal, so wird auch die multivariate Verteilung normalverteilt sein.

Ausreißer als Distanz vom Zentroid x2 x1 Ausreisser in 2D Klassifikation Ausreißer als Distanz vom Zentroid x1 x2 univariat & multiv. multivariat aber nicht univariat Zentroid Ausreisser in 2D: einer univariat & multivariat und einer multivariat

Ausreißer als Distanz vom Zentroid Ausreisser in 2D Klassifikation Ausreisser in 4D: einer uni+multi und zwei multivariat Ausreißer als Distanz vom Zentroid uni+multivariat multivariat multivariat

Kritische Q-Q- Korrelationen Test der NV-Annahme Klassifikation Kritische Q-Q- Korrelationen Q-Q Plot Methode Korrelations-Test Ist rqq < rcrit(a), wird die Annahme der NV auf dem gewählten a Level verworfen. a sollte progressiv gewählt sein (10%), da man eine Sicherheit für die Beibehaltung wünscht.

Q-Q Korrelations-Test Test der NV-Annahme Klassifikation Q-Q Korrelations-Test citation Filliben, J.J. (1975). The probability plot correlation coefficient test for normality. Technometrics, 17, 111–117. doi:10.1080/00401706.1975.10489279 Das Korrelationsmaß rqq wird für große Stichproben gleich der W-Statistik des Anpassungstests von Shapiro & Wilk, der in gängigen Softwarepaketen enthalten ist. citation Shapiro, S. S., & Wilk, M. B. (1965). An analysis of variance test for normality. Biometrica, 52, 591–611.