Multivariate Statistische Verfahren

Slides:



Advertisements
Ähnliche Präsentationen
Vorlesung Programmieren II
Advertisements

Schnelle Matrizenoperationen von Christian Büttner
Berg-Schlosser : VL : Vergleichende Politikwissenschaft Vergleichende Methoden Ausgangsbasis : Fälle: begrenzte Auswahl auf der Makro-Ebene, abhängig.
Theorie psychometrischer Tests, III
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Seminar Lehrevaluation
Mehrfachregressionen
SoSe 06, Statistik mit SPSS
Produktform der Inversen 1
Quantitative Methoden I
Hypothesen testen: Grundidee
Nachholung der Vorlesung vom Freitag
Nachholung der Vorlesung vom Freitag
Vorlesung Die Vorlesung Statistische Methoden II nächste Woche vom 6. Juni ( nächste Woche ) wird auf den 4. Juni (Mittwoch) vorverlegt ! 14 – 16 Zeit:
Vorlesung Die Vorlesung Statistische Methoden II in 2 Wochen vom 6. Juni ( in 2 Wochen ) wird auf den 4. Juni (Mittwoch) vorverlegt ! 14 – 16 Zeit: 14.
Chi-Quadrat-Test auf Unabhängigkeit I
Chi-Quadrat-Test auf Anpassung
Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.
Chi-Quadrat-Test auf Unabhängigkeit I Hypothese Ablehnungsbereich.
Chi-Quadrat-Tests. Satz von Karl Pearson I X: Stichprobenvariable, die r > 2 verschieden Werte annehmen kann: Die Verteilung von X ist durch einen Wahrscheinlichkeitsvektor.
Klausur am :00 bis 13:00 Hörsaal Loefflerstraße und Hörsaal Makarenkostraße.
§9 Der affine Raum – Teil 2: Geraden
Tutorium
Tutorium
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Multivariate Statistische Verfahren
Chi Quadrat Test Tamara Katschnig.
Globale Interpolations- und Prädiktionsverfahren
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Folie 1 Kapitel IV. Matrizen Inhalt: Matrizen als eigenständige mathematische Objekte Zusammenhang zwischen Matrizen und linearen Abbildungen Produkt von.
§23 Basiswechsel und allgemeine lineare Gruppe
§3 Allgemeine lineare Gleichungssysteme
Polynome und schnelle Fourier-Transformation
Seminar: Datenerhebung
Statistik: Mehr zur Regression.
Kapitel 10 Multikollinearität
Kapitel 19 Kointegration
Theorie psychometrischer Tests, IV
Multivariate Statistische Verfahren
Theorie psychometischer Tests, V Nichtklassische Modelle
Theorie psychometrischer Tests, II
Multivariate Statistische Verfahren
Multivariate Statistische Verfahren
Multivariate Statistische Verfahren
ENDLICHE KÖRPER RSA – VERFAHREN.
Stundenbild Unterrichtsstd. für eine 7. Klasse
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation III Vorlesung 1 WS 2001/02 Punkt-in-Landkarte I (Streifenkarte)
Veranstaltung 4.
Wann ist eine Funktion (über den natürlichen Zahlen) berechenbar?
Statistiken je nach Messniveau
Geoinformationssysteme
Einführung in die Informationsverarbeitung Teil Thaller Stunde V: Wege und warum man sie geht Graphen. Köln 14. Januar 2016.
- Seite 1 TIME INTELLIGENCE ® by Zeichenrand – Löschen! Titel.
Die klassischen Methoden der historisch-vergleichenden Forschung Universität Zürich Soziologisches Institut Seminar: Methoden des internationalen Vergleichs.
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
- Seite 1 TIME INTELLIGENCE ® by Titel.
Einführung in die Diskriminanzanalyse
Multivariate Statistische Verfahren
Wiederholung und klausurtypische Fragen
 Präsentation transkript:

Multivariate Statistische Verfahren Korrespondenzanalyse Universität Mainz Institut für Psychologie WS 2010/2011 Uwe Mortensen

Einführung I Es werden Kontingenztabellen betrachtet: die Abhängigkeiten zwischen Zeilen- und Spaltenkategorien werden zunächst durch einen Chi-Quadrat-Wert repräsentiert. Ist er signifikant,geht man davon aus, dass Abhängigkeiten existieren, andernfalls behält man die Nullhypothese (es existieren keine Abhängigkeiten) bei. Westphal (1931) in „Der Nervenarzt“:

Einführung II Ernst Kretschmer (1888 – 1964): „Körperbau und Charakter“ (1921) Leptosom (dünn, hager) – schizothym – schizoid – schiziphren Pyknisch (rund und mollig) – zyklothym – zykloid – manisch-depressiv Athletisch (kräfig, muskulär) – barykinetisch – epileptoid - epileptisch Widerspricht Westphals Tabelle der Kretschmerschen Theorie? Ein signifikanter Chi-Quadrat-Wert gibt auf diese Frage keine Antwort; Die Häufigkeiten scheinen nicht auf Kretschmers Theorie zu weisen, und ein signifikanter Chi-Quadrat-Wert sagt nur, dass wahrscheinlich Abhängigkeiten zwischen Körperbau und „Charakter“ bestehen.

Einführung III Intuitive Betrachtung: sollte Kretschmers Theorie mit den Daten kompatibel sein, so müssen Skalen für den Körperbau existieren, auf denen sich die Körperbautypen nach Maßgabe ihrer „Ähnlichkeit“ anordnen lassen, und analog dazu Skalen, nach denen sich die Erkrankungen nach Maßgabe ihrer Ähnlichkeiten anordnen lassen. Weiter muß zwischen den beiden Skalenklassen eine Beziehung bestehen derart, dass die die Beziehungen zwischen Körperbau und Erkrankung abgebildet werden. Die Beziehung zwischen den Kategorien Körperbau und Art der Erkrankung wird nicht perfekt sein: Die Existenz von Mischtypen wirkt wie „Rauschen“

Einführung IV Aber kann eine Beziehung der Form f(Erkrankung) = g(Körperbau) + zuf. Fehler überhaupt angenommen werden, wenn man Häufigkeiten erklären will? (f und g numerische Werte = Skalenwerte)

Also: Beziehungen zwischen Häufigkeiten in einer Kontingenztabelle durch latente Variablen derart, dass Das Chi-Quadrat der Tabelle durch latente Variablen erklärt wird!

Distanzen zwischen Zeilen- bzw. Spaltenkategorien Häufigkeitsverteilungen für die Körperbautypen Profile für die Körperbautypen: Häufigkeiten, geteilt durch Randsummen Die absolute Häufigkeit, mit der ein Körperbautyp vorkommt, wirkt verzerrend auf die Wahrnehmung der Unterschiedlichkeit der Verteilungen Elemente der Profile entsprechen bedingten Wahrscheinlichkeiten. Relativierung in Bezug auf Randsummen wirkt entzerrend auf Darstellung der Unterschiede.

Definition von Profilen Zeilen‘‘masse‘‘ Spalten“masse“

Distanzen zwischen Zeilenkategorien Vorteil dieser Definition der Kategoriendistanz: unmittelbar einsichtig. Nachteil der Definition: läßt sich nicht gut mit dem Chi-Quadrat in Verbindung bringen, keine Verteilungsäquivalenz (wird gleich erklärt)

Chi-Quadrat-Distanzen (zwischen Zeilenkategorien) Die Chi-Quadrat-Distanzen definieren eine „Chi-Quadrat-Metrik“

Verteilungsäquivalenz Fasst man Zeilenkategorien mit identischen Häufigkeitsverteilungen zusammen, so ändern sich die Chi-Quadrat-Distanzen zwischen den Spaltenkategorien nicht. Fasst man Spaltenkategorien mit identischen Häufigkeitsverteilungen zusammen, so ändern sich die Chi-Quadrat-Verteilungen zwischen den Zeilenkategorien nicht. Der Ausdruck „Chi-Quadrat-Distanz“ ist ein wenig irreführend, weil keine direkte Beziehung zum Chi-Quadrat besteht; die folgenden Betrachtungen zeigen aber eine indirekte Beziehung auf.

Ansatz I

Ansatz II

Ansatz III Ja!

Ansatz III

Zusammenfassung: Das Chi-Quadrat kann in voneinander unabhängige, additive Komponenten zerlegt werden Die Komponenten werden so bestimmt, dass sie voneinander unabhängigen Urteilsdimensionen etc entsprechen. Dazu werden die Residuen einer Singularwertzerlegung unterzogen: (i) Komponenten für die Zeilenkategorien, (ii) Komponenten für die Spaltenkategorien. Die beiden Klassen von Komponenten beziehen sich auf die gleichen latenten Variablen! Die SVD-Koordinaten für die Kategorien werden so skaliert, dass die euklidischen Distanzen zwischen den Punkten (Zeilenpunkte einerseits, Spaltenpunkte andererseits) den Chi-Quadrat-Distanzen zwischen den Kategorien entsprechen. Die Distanzen zwischen Zeilen- und Spaltenpunkten sind nicht erklärt; die Ähnlichkeit wird über das Skalarprodukt ausgedrückt.

Multiple Korrespondenzanalyse: Anwendung der KA auf Fragebögen, Tests, etc Testtheorie und (0, 1)-Items (Aufgaben: gelöst- nicht gelöst, Meinungsitem: zugestimmt – nicht zugestimmt, etc Problem: Anwendung der Faktorenanalyse bzw PCA auf (0, 1)-Daten führt oft zu Pseudorepäsentationen der unterliegenden latenten Variablen: Der Produkt-Moment-Korrelationskoeffizient wird zum Phi-Koeffizienten mit der Implikation, dass unterschiedliche Schwierigkeiten semantische Faktoren vortäuschen. Die Faktorenanalyse von (0, 1)-Daten ist äußerst problematisch. Die multiple Korrespondenztheorie liefert einen Ausweg:

Multiple Korrespondenzanalyse: Anwendung der KA auf Fragebögen, Tests, etc Items Personen Antwortkategorien

Multiple Korrespondenzanalyse: Anwendung der KA auf Fragebögen, Tests, etc Aus der Indikatormatrix oder –tabelle entsteht eine Kontingenztabelle, die aus Teilkontingenztabellen aufgebaut ist: jedes Item mit jedem, jede Angtwortkategorie mit jeder. Das Resultat ist eine Burt-Matrix (nach Sir Cyril Burt, 1950)

Items Beispiel (Burt, 1950) Items Antwortkategorien Haar Augen Kopf Statur

Korrespondenz der Klassifikationen auf OCT-Basis (RMG) und auf histologischer Basis. (OCT = Optical Coherence Tomography) schwerere Form leichtere Entzündung (kein Krebs) 0 = keine Erkrankung, CIN 21 Krebs, leichte Form, CIN 22 Krebs, etwas schwerere Form, CIN 23 Krebs, schwerere Form, CIN 10 kein Krebs, Entzündung

Identifikation von Emotionen im Gesichtsausdruck Anger Disgust No happiness Happiness Fear Surprise

Beispiel I

Beispiel II Marascuilo & McMcSweeny (1977): 500 Männer verschiedenen Glaubens wurden nach ihrer Meinung zur Abtreibung befragt:

Beispiel III Genetische Untersuchungen: Haar- und Augenfarbe schottischer Kinder (Tocher 1908, Maung 1941)

Beispiel V Ansichten zur Behandlung von Strafgefangenen in den USA

Beispiel VI Trends in Studienfächern (USA)

Beispiel VI Trends in Studienfächern – Doktorgrade (USA)

Beispiel VI Trends in Studienfächern – Doktorgrade (USA)

Beispiel VII Selbstmorde in Deutschland 1974 - 1977

Beispiel VII Selbstmorde in Deutschland 1974 - 1977

Beispiel VII Selbstmorde in Deutschland 1974 - 1977 Altergruppe und Methode – nach Geschlechtern getrennt

Beispiel VII Selbstmorde in Deutschland 1974 - 1977

Danke für Ihre Aufmerksamkeit!