Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.

Ähnliche Präsentationen


Präsentation zum Thema: "Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz."—  Präsentation transkript:

1 Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz Stunde

2 I. Aktualisierung: Häufigkeitsverteilungen Themen der Stunde II. Abweichungsmaße III. Standardisierung IV. Die Normalverteilung

3 Häufigkeitsverteilungen Absolute Häufigkeit eines Wertes x : Relative Häufigkeit eines Wertes x : (N = Anzahl aller Werte) Kumulierte absolute Häufigkeit bis zu einer Schranke x : Relative kumulierte Häufigkeit bis zu einer Schranke x : (Empirische Verteilungsfunktion) [Datenbeispiele, Mathematica]

4 Beispiel Hufigk.Summen-% glt.Kumul % Diskrete Variable: 50 mal einen Würfel werfen

5 Beispiel kontinuierliche Variable: 50 Zeiten für eine Wertejustage Hufigk.Summen-% glt.Kumul %

6 Beispiel: Kumulierte Häufigkeiten Kumuliert WürfelnKumuliert Zeiten Augenzahl Häufigkeit Justagezeit (Intervall-Mitte) Häufigkeit

7 Klassenbildung Klassen sind halb-offene Intervalle: der obere Wert gehört hinzu, der untere nicht Das gesamte Werteensemble X wird in k disjunkte und erschöpfende Klassen eingeteilt. Zur Beschriftung der Werteachse wird häufig die Klassenmitte d i verwendet.

8 Klassenbildung Die Meßwertklassen dürfen sich nicht überschneiden Die obere Klassengrenze gehört zur Klasse, die untere nicht Alle Klassen sollen dieselbe Breite haben (Normalfall) Nicht mehr als 20 Klassen bilden Anzahl k der Kategorien sollte etwa betragen

9 Klassenbildung Klassen k Umfang N Anzahl k der Kategorien bei Umfang N Oder die einfachere Regel bit + 1 :

10 Beispiel Optischer Eindruck wird durch Anzahl der Klassen bestimmt zu vieleoptimal

11 Empirische Verteilungsfunktion F(x) Es gilt: Ferner gilt für die relative Häufigkeit im Intervall (x a,x b ] : xaxa xbxb F(x) x

12 x (Justagezeit) Relative kumulierte Häufigkeit Median Der Median ist derjenige Wert, der die Reihe der Messwerte Halbiert (50% liegen drunter, 50% drüber) N ungerade: Der te Wert N gerade: Mittel zwischen bem Wert und ten [Tafelbeispiel, Mathematica]

13 x (Justagezeit) Relative kumulierte Häufigkeit Median = 2. Quartil Quantile: Centil, Dezentil, Quartil Die Meßwerte (x), die bestimmten relativen Häufigkeiten entsprechen, werden Quantile genannt. Centil: 100er Einteilung Dezentil: 10er Einteilung, Quartil: 4er Einteilung 1. Quartil

14 Quantile: empirische Bestimmung Quantile können auch über eine graphische Methode aus der empirischen Verteilungsfunktion gewonnen werden. Es sei p ein Anteilswert, 0 < p < 1. Ein Wert x p, für den gilt, dass mindestens ein Anteil der Daten p kleiner oder gleich x p und mindestens ein Anteil 1-p der Daten größer oder gleich x p ist, heisst p-Quantil. Es gilt: [Berechnungsbeispiele, Mathematica-Beispiele]

15 Quantile: empirische Bestimmung Fall 1: Np ist nicht ganzzahlig: Die Horizontale vom p-Wert der Y-Achse trifft auf ein senkrechtes Treppenstück. Der X-Wert ist das zugehörige Quantil. Fall 2: Np ist ganzzahlig: Die Horizontale vom p-Wert der Y-Achse trifft genau eine Treppenstufe. Mittelung der Treppengrenzen ergibt das Quantil.

16 Ausgleichskurve Die Quantile kann man auch mit einer glatten Ausgleichskurve, die die empirische Verteilungsfunktion gut beschreibt, ermitteln [Tafel+Mathematica] x (Justagezeit) Relative kumulierte Häufigkeit Median = 2. Quartil 1. Quartil F(x)

17 Abweichungsmaße Die Abweichungsmaße bewerten die Abweichung aller Werte des Kollektivs von einem Maß der zentralen Tendenz. Sie Geben das Ausmaß der Homogenität der Werte an Die wichtigsten Abweichungsmaße sind 1. Varianz und Standardabweichung 2. Mittlere Abweichung 3. Halber Quartilsabstand

18 Mittlere Abweichung Ist die Summe aller Abweichungsbeträge vom Mittelwert Diese Abweichung ist vom Median minimal (von jedem anderen Wert ist sie größer)

19 Halber Quartilabstand Justagezeit Relative kumulierte Häufigkeit Q1Q1 Q3Q3

20 Varianz und Standardabweichung Die Varianz ist die Summe aller Abweichungsquadrate vom Mittelwert, gewichtet um den Stichprobenumfang. Die Standardabweichung ist die Wurzel der Varianz [Tafelbeispiel: alternative Berechnung]

21 Verteilungsmomente heisst k - tes Zentralmoment. [Tafelbetrachtung: Varianz und Covarianz in Momentenschreibweise] heisst k - tes Potenzmoment.

22 Momentenschreibweise (Varianz in Momentenschreibweise) (Covarianz zweier Variablen in Momentenschreibweise)

23 Linear transformierte Daten Für linear transformierte Daten von beiden Beziehungen wird umfassend Gebrauch gemacht gilt: [Tafelbetrachtungen]

24 Standardisierung Die Standardisierung drückt einen Meßwert aus als eine Abweichung vom Mittelwert, gemessen in Einheiten der Standardabweichung. Sie ist eine spezielle Lineartransformation. [Tafelbetrachtung] Die Standardvariable z hat folgende Eigenschaften: [Mittelwert Null] [Standardabweichung Eins]

25 IQs IQ- Werte sind Standardwerte, die aus z- transformierten Rohdaten berechnet werden. Sie sind eine spezielle Lineartransformation und drücken wie z- Werte, die individuelle Leistung, zumeist gemessen über die Anzahl gelöster Aufgaben, als Abweichung vom Mittelwert der Vergleichsgruppe aus Variabilitäts-IQ. [Tafelbeispiel, Berechnungsbeispiel] [Mittelwert Hundert] [Standardabweichung fünfzehn]

26 Standard-Werte Die Standardwerte wie T oder IQ sind einfache lineare Transformationen der z Werte. Ihre Kennwerte berechnen sich nach den Eigenschaften für lineare Transformationen. zIQT Die Standardwerte haben daher folgende Eigenschaften:

27 Die Normalverteilung Die Normalverteilung (Gausssche Glockenkurve) ist eine symmetrische Verteilung. Ihre Form ist durch die Standardabweichung und den Mittelwert eindeutig festgelegt. Sie resultiert aus dem Modell unabhängiger sich überlagernder Zufallsfehler (Galton-Brett) [Tafelbeispiel Galton, Mathematica] x f (x)

28 Die Normalverteilung Die Verteilungsfunktion der Normalverteilung (Fläche unter der Normalkurve) kann man nicht auf eine geschlossene Form bringen. Sie ist aber für standardisierte Variablen (z-Standardisierung) austabelliert und elektronisch implementiert (z.B. in Excel) x F(x)F(x)

29 Die Normalverteilung Die Fläche unter der Kurve ist bei der Normalverteilung eine Funktion der Standardabweichung (in Einheiten von s angebbar) [Tabellenbenutzung, Mathematica, Aufgabenbeispiel zu IQs]

30 Standardisierung & Verteilung Die Standardisierung ändert die Verteilungsform nicht. Ist eine Variable normalverteilt, so ist auch die z- standardisierte Variable normalverteilt. Aus der z- standardisierten Variable über Lineartransformation gewonnene Standardvariable sind ebenfalls normalverteilt.

31 Schiefe Linkssteil: ModMed AM rechtssteil: x f(x) AMMed Mod f(x) x

32 Momentenkoeffizienten [Tafelbetrachtung, Beispielberechnung] heisst Momentenkoeffizient der Schiefe (Kurtosis). Für symmetrische Verteilungen gilt: Linkssteil: a 3 > 0 Rechtsssteil: a 3 < 0

33 Momentenkoeffizienten [Beispielberechnung] heisst Momentenkoeffizient der Breite (Exzess). Für normale (Normalverteilung) Breiten gilt: schmal: a 4 > 3 breit: a 4 < 3

34 Standardisierung & Verteilung Die Standardisierung ändert die Verteilungseigenschaften nicht. Ist eine Variable z.B linkssteil, so ist auch die z- standardisierte Variable linkssteil. Lineare Transformationen ändern prinzipiell nicht Verteilungs- Eigenschaften wie Schiefe und Exzess.


Herunterladen ppt "Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz."

Ähnliche Präsentationen


Google-Anzeigen