Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Slides:



Advertisements
Ähnliche Präsentationen
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Advertisements

T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.
Der F - Test Man prüft, ob sich 2 Varianzen unterscheiden, mit dem F-Quotienten: Geprüft werden stets die Schätzungen der Populationsvarianzen aufgrund.
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Theorie psychometrischer Tests, III
Forschungsstrategien Johannes Gutenberg Universität Mainz
Methoden der Psychologie Multivariate Analysemethoden und Multivariates Testen Günter Meinhardt Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Methoden der Psychologie Evaluation & Forschungsmethoden Günter Meinhardt Johannes Gutenberg Universität Mainz q-q-Plot Methode zur Prüfung der Multivariaten.
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Heute Prüfung der Produkt-Moment Korrelation
Law of comparative judgement
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.
Der Binomialtest Man habe einen wahren Anteil P.
Hypothesen testen: Grundidee
2. Univariate Regressionsanalyse 2.1 Das statische Regressionsmodell
Strukturgleichungsmodelle
Statistische Methoden II SS 2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Tutorium
Eigenschaften der OLS-Schätzer
Kapitel 9 Analyse der Modellstruktur
Chi Quadrat Test Tamara Katschnig.
Kapitel 10 Multikollinearität
Strategie der Modellbildung
setzt Linearität des Zusammenhangs voraus
Der Binomialtest Man habe einen wahren Anteil P. Kann man aufgrund von p sagen, daß in der Population tatsächlich der Anteil P zugrunde liegt? [Beispiele]
Prüft ebenfalls die Annahme der Varianzhomogenität (exakter)
Forschungsstrategien Johannes Gutenberg Universität Mainz
Univ.-Prof. Dr.-Ing. H. Nacken Vorlesung Wasserwirtschaft & Hydrologie I Themen: Vorlesung 8 Statistik Dichtefunktionen Jährliche und partielle Serien.
Ausgleich nach der Methode der kleinsten Quadrate
Varianzfortpflanzung
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Einführung in die Diskriminanzanalyse
Analysen univariater Stichproben
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Nachtrag Residuenanalyse
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Ökonometrie und Statistik Mehrfachregression
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Forschungsstrategien Johannes Gutenberg Universität Mainz
Ökonometrie und Statistik Unabhängigkeitstest, c² - Test (Chi Quadrat Test) Dr. Bertram Wassermann.
Konfidenzintervalle und Tests auf Normalverteilung
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Korrelation & Skalentransformation
Fortgeschrittene statistische Methoden SS2020
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz Vorlesung q-q-Plot Methode zur Prüfung der Multivariaten Normalverteilung Günter Meinhardt Johannes Gutenberg Universität Mainz

Verteilungsanpassung/Prüfung Prüfung der NV-Annahme Klassifikation Verteilungsanpassung/Prüfung Prüfung der Verteilungs-annahme Ausreißeranalyse: Vor der Schätzung der Parameter (m,S) für die multivariate NV- wird eine Analyse der Rohdaten auf Ausreißer vorgenommen. Effiziente Tests: Die NV- Annahme ist mit effektiven Methoden und trennscharfen Test zu prüfen, um ihre Gültigkeit sicherzustellen Korrekturen und Datentransformationen: Ist die NV- Annahme auf den originalen Skalen verletzt, können Skalentransformationen für die einzelnen Variablen des Variablen- verbundes gefunden werden, mit denen die multivariate Normalver- auf den transformierten Skalen gilt.

Mahalanobisdistanz D Prüfung der Verteilungs-annahme & Prüfung der NV-Annahme Klassifikation Mahalanobisdistanz D Prüfung der Verteilungs-annahme & Outlier- Identifikation Kernkonzept der Ausreißer-Identifikation Der Abstand einer Beobachtung vom Schwerpunkt der Verteilung wird über die multivariate Distanz D bestimmt. Dabei werden stets die quadrierten Distanzen D2 verwendet, da diese Chi-Quadrat verteilt sind, wenn die Variablen einer multivariaten Normalverteilung entstammen. Dann definiert mit die Inverse der Varianz- Kovarianz Matrix S, die verallgemeinerte quadrierte Distanz im multivariaten Raum. Sie heißt quadrierte Mahalanobis-Distanz.

Identifikation von Ausreißern Test der NV-Annahme (multivariat) Klassifikation Identifikation von Ausreißern Data Clearing p-dimensions Auch im multivariaten Fall sind Ausreißer in kleinen Stichproben nicht zuverlässig bestimmbar, Bei N > 30 legt man die Quantile der multivariaten Normalverteilung zugrunde (c2) und eliminiert die Beobachtungen, dessen quadrierte Mahalanobis-Distanzen jenseits der äußeren Quantile liegen. Dies sollten nicht mehr als 7%-8% sein. Ausreißer: [Excel-Beispiel q-q-Plot]

Test über Quantilskorrelation Test der NV-Annahme (multivariat) Klassifikation Test über Quantilskorrelation Q-Q Plot Methode multivariat Nach Ausreißerbereinigung werden den Meßvektoren empirische Quantile qo zugeordnet über die Reihe der Meßwerte sortiert nach Mahalanobisdistanz. Mit aus den Daten geschätzten Parametern (m,S) werden für die linearen Prozentränge erwartete Quantile qe aus der c2 - Verteilung bestimmt. Man trägt qo (y-Achse) und qe (x-Achse) gegeneinander ab. Perfekte Passung liegt vor, wenn die Daten auf der Winkelhalbierenden liegen. Man bestimmt Anteil der aufgeklärten Varianz und Korrelation. Für den Test des Korrelationskoeffizienten verfährt man exakt wie im univariaten Fall.

Datenbeispiel (p = 4 Variablen) Test der NV-Annahme (multivariat) Klassifikation Datenbeispiel (p = 4 Variablen) Q-Q Plot Methode mit 3 Ausreißern N = 30 p = 4 Korrelations-Test NV Test knapp im Annahmebereich, aber 2 Ausreißer verschlechtern die Passung beträchtlich, auch in den unteren Quantilen Die beiden größten Ausreißer erfüllen das Kriterium, aber der 3. höchste Wert ist ebenfalls suspekt (hoher Intervallabstand)

Datenbeispiel (p = 4 Variablen) Test der NV-Annahme (multivariat) Klassifikation Datenbeispiel (p = 4 Variablen) Q-Q Plot Methode ohne 3 Ausreißer N = 27 p = 4 Korrelations-Test NV Test zeigt nach Entfernung der höchsten 3 Werte (nicht nur 2) nun eine gute Passung der multivariaten NV

Allgemeines zur Verteilungskorrektur Skalentransformationen Test der NV-Annahme (multivariat) Klassifikation Allgemeines zur Verteilungskorrektur Ausreisser-Kontrolle Ausreißerbereinigung sollte immer multivariat erfolgen, da ein Ausreisser in einer einzelnen Variable noch nicht einen Ausreißer im Variablenverbund definiert. Das Entfernen extremer Beobachtungen ändert die Korrelationsmatrix, daher können iterative Bereinigungen nötig werden. Skalentransformationen Transformationen Skalentransformationen können nur univariat erfolgen. (Keine Methode definiert eine Transformation für den Variablenverbund) Es ist ratsam eine univariate Untersuchung systematischer Verteilungsabweichungen nach der multivariaten Ausreißerkontrolle durchzuführen, und die einzelnen Variablen mit geeigneten Potenz- transformationen zu korrigieren. Sind die Randverteilungen (univariate) alle normal, so wird auch die multivariate Verteilung normalverteilt sein.

Ausreißer als Distanz vom Zentroid x2 x1 Ausreisser in 2D Klassifikation Ausreißer als Distanz vom Zentroid x1 x2 univariat & multiv. multivariat aber nicht univariat Zentroid Ausreisser in 2D: einer univariat & multivariat und einer multivariat

Ausreißer als Distanz vom Zentroid Ausreisser in 2D Klassifikation Ausreisser in 4D: einer uni+multi und zwei multivariat Ausreißer als Distanz vom Zentroid uni+multivariat multivariat multivariat

Kritische Q-Q- Korrelationen Test der NV-Annahme (univariat) Klassifikation Kritische Q-Q- Korrelationen Q-Q Plot Methode Korrelations-Test Ist rqq < rcrit(a), wird die Annahme der NV auf dem gewählten a Level verworfen. a sollte progressiv gewählt sein (10%), da man eine Sicherheit für die Beibehaltung wünscht.