Forschungsstatistik I

Slides:



Advertisements
Ähnliche Präsentationen
Statistik-Tutorat SS 2009 Christina
Advertisements

Berechnung des Korrelationskoeffizienten Vorbemerkung. Der Korrelationskoeffizient ist im Grunde ein Bruch aus 3 unvollständig berechneten statistischen.
Theorie psychometrischer Tests, III
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Regression und Korrelation
Gliederung Voraussetzungen für die Berechnung der Produkt-Moment- Korrelation Spearman‘sche Rangkorrelation Beispielrechnung ohne Verbundkorrektur Beispielrechnung.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-17.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-23.
Heute Prüfung der Produkt-Moment Korrelation
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Der Produkt-Moment- Korrelationskoeffizient Der Produkt-Moment Korrelationskoeffizient gibt Stärke und Richtung des linearen Zusammenhanges zweier Variablen.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Algorithmentheorie 02 – Polynomprodukt und Fast Fourier Transformation
Mehrfachregressionen
Quantitative Methoden I
Quantitative Methoden I
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Streuungsparameter Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Die Vorlesung Mathematik I (Prof. Kugelmann) findet heute um 14:30 Uhr im Hörsaal Loefflerstraße 70 statt.
Rechenregeln für Mittelwert, Varianz und Streuung.
Datenmatrix.
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Datentabelle für 2 Merkmale
Streuungsparameter Median Mittlere Abweichung vom Median
erstellt von Petra Bader
Kodiersysteme und erste Umrechnungen
§9 Der affine Raum – Teil 2: Geraden
§9 Der affine Raum – Teil 2: Geraden
(Gini-Koeffizient, Lorenz-Kurve)
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Semipartialkorrelation Multiple Korrelation Inkrementelle Validität
Relationen zwischen metrischen Merkmalen
Logistische Regression
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
Statistik: Mehr zur Regression.
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Bivariate Statistik M. Kresken.
Data Mining Georg Pölzlbauer.
Forschungsmethodik II, SS 2010 Vesna Pavlovski & Julia Pichlhöfer
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Statistik Typen statistischer Zusammenhänge: Statistik I
setzt Linearität des Zusammenhangs voraus
Varianzanalyse und Eta²
Phi-Koeffizient: Alternative Berechnungsart
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Korrelation & Skalentransformation
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz Stunde 14.12.04

Themen der Woche Wiederholung: Varianzzerlegung und Gütemasse der linearen Regression Abweichungswerte und z- Werte Korrelation und vektorielle Deutung des Korrelationskoeffizienten Nichtlineare Regression Korrelation bei Binärdaten: Phi-Korrelation Korrelation von Binärdaten und intervallskalierten Daten: biseriale und punktbiseriale Korrelation Rangkorrelation

Varianzzerlegung Für die lineare Regression gilt die additive Varianzzerlegung Die Kriteriumsvarianz ist die Summe aus Vorhersagevarianz und Fehlervarianz

Determinationskoeffizient Wegen der Varianzzerlegung gilt Man definiert als Determinationskoeffizient Der Determinationskoeffizient gibt den Anteil der erklärten Varianz an der gesamten Kriteriumsvarianz an.

Determinationskoeffizient Ferner gilt (s. Steigungsdreieck) Und daher Woraus man für den Determinationskoeffizienten erhält Der Anteil der erklärten Varianz ist der Anteil der quadrierten Kovarianz an dem Produkt der beiden Varianzen.

Standardschätzfehler Wegen gilt und daher Der Standardschätzfehler beschreibt die Streuung um die Regressionsgerade. Er ist definiert als Anteil an der Streuung des Kriteriums, der zulasten der „Unzuverlässigkeit“ geht.

Regression X aus Y Ansatz Koeffizienten Die Regressionsgerade „X aus Y“ (grau) minimiert den Vorhersagefehler in X- Richtung. Man erhält die Koeffizienten der Geraden durch Vertauschen von X und Y und Lösen den Normalgleichungen. Beide Geraden schneiden sich im Punkt [Tafel]

Abweichungswerte Ansatz Geraden Bei Abweichungswerten fällt die additive Konstante weg. Beide Geraden schneiden sich im Nullpunkt [Tafel]

z - Werte Die Covarianz von z- Werten ist: Geraden: Die Covarianz von z- standardisierten Variablen ist der sog. Pearson – Produkt – Moment Korrelationskoeffizient [Tafel]

z - Werte Die Geradensteigung bei z- Werten ist: -3 -2 -1 1 2 3 z X Y Die Geradensteigung bei z- standardisierten Variablen ist der Pearson – Produkt – Moment Korrelationskoeffizient. Beide Regressionsgeraden fallen zusammen, es gibt nur noch eine.

Der Produkt-Moment-Korrelationskoeffizient Der Produkt-Moment Korrelationskoeffizient gibt Stärke und Richtung des linearen Zusammenhanges zweier Variablen an. Es gilt: für seinen Wertebereich. Er ist invariant gegenüber linearen Transformationen

Vektorielle Deutung 1. Für die Variablen X und Y berechne man Abweichungswerte: 2. Man betrachte die beiden Ensembles der Abweichungswerte als Zufallsvektoren: Die Abweichungswerte sind die Koordinaten. Diese Darstellung heißt Darstellung der Messvariablen im Personraum, weil 2 Variablen als 2 Punkte in einem Raum aufgefasst werden, der durch die N Personen aufgespannt wird.

Vektorielle Deutung 1. 2. Dann lässt sich zeigen: Covarianz ist proportional dem inneren Produkt der Vektoren 2. Varianzen sind proportional dem Quadrat der Länge der Vektoren

Vektorielle Deutung 1. 2. Dann ist die Korrelation: Die Korrelation ist das Produkt der gleichgerichteten Länge der beiden Vektoren, normiert durch ihr Längenprodukt. 2. Die Korrelation entspricht dem Cosinus des Winkels der Vektoren

Vektorielle Deutung Es gilt Das Produkt der gleichgerichteten Längen zweier Vektoren kann niemals grösser werden als das Längenprodukt der Vektoren selbst (Schwarz‘sche Ungleichung).

Nichtlineare Regression 2 Fälle: Funktionen, deren Koeffizienten durch Rückführung auf die lineare Regression gefunden werden Funktionen, für die das nicht möglich ist Unter a. fallen: (Potenz, Geometrisch) (Exponential) (Hyperbel) Die Lösung für die Koeffizienten findet man nach Logarithmierung und anschliessender Lösung der Normalgleichungen [Beispiel:Tafel+Math]

Nichtlineare Regression: Beispiel Modell Dosis Erreg X Y 0.50 1.00 0.90 2.00 1.50 3.00 4.00 2.30 5.00 2.80 Log-Modell: Logarithmiert: log(X) log(Y) -0.693 0.000 -0.105 0.693 0.405 1.099 1.386 0.833 1.609 1.030 Regression über Log-Daten liefert:

Binärdaten: Dichotome Variablen Binäre Kodierungen können natürlich sein oder künstlich erzeugt durch Definition einer Schranke auf den beiden metrischen Ausgangsvariablen.

Der Phi-Koeffizient Der Phi- Koeffizient gibt eine Korrelation von dichotomen Variablen an, die der Produkt-Moment Korrelation über die zugrundeliegenden Binärdaten entspricht.

Der Phi-Koeffizient Der Phi- Koeffizient muss an der maximal möglichen Korrelation korrigiert werden, wenn schiefe Randverteilungen vorliegen. pt ist die größte auftretende Randfeldproportion, ps die dazu korrespondierende im Feld der anderen Variable mit gleichem Vorzeichen. [Tafelbetrachtung+Rechenbeispiele+Zusammenhang mit CHI-Quadrat]

Die punkt-biseriale-Korrelation Die Korrelation einer metrischen Variable und einer dichotomen wird bestimmt durch den Mittelwertsunterschied, den die Gruppen mit den den Merkmalen X=0 und X=1 in der Variable Y haben. [Tafelbetrachtung]

Die (punkt)-biseriale-Korrelation oder (Gesamtmittelformeln) Hierin ist p der Anteil der Personen für die X=1 gilt. w ist der Ordinatenabschnitt der Standardnormalverteilung für die Stelle der Dichotomisierung. Die biseriale Korrelation gilt bei begründeter Vermutung, dass die dichotome Variable latent normalverteilt ist. [Rechenbeispiel]

Die Rangkorrelation Zwei Rangreihen werden über die Spearman‘sche Rangkorrelation korreliert. Hierbei werden die Werte auf jeder der beiden Variablen in eine eigene Rangreihe gebracht. Bei Rangbindungen ist der Mittelwert der Rangplätze einzusetzen. [Tafelbeispiel Rangbindung, Aufgaben]