Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz Stunde 24.11.04
Themen der Stunde I. Häufigkeitsverteilungen II. Quartile und Median III. Abweichungsmaße
Häufigkeitsverteilungen Absolute Häufigkeit eines Wertes x : Relative Häufigkeit eines Wertes x : (N = Anzahl aller Werte) Kumulierte absolute Häufigkeit bis zu einer Schranke x : Relative kumulierte Häufigkeit bis zu einer Schranke x : (Empirische Verteilungsfunktion) [Datenbeispiele, Mathematica]
Beispiel Diskrete Variable: 50 mal einen Würfel werfen Hufigk. Summen- % glt. Kumul % 1 7 14.00000 14.0000 2 11 18 22.00000 36.0000 3 9 27 18.00000 54.0000 4 6 33 12.00000 66.0000 5 8 41 16.00000 82.0000 50 100.0000 Diskrete Variable: 50 mal einen Würfel werfen
Beispiel kontinuierliche Variable: 50 Zeiten für eine Wertejustage Hufigk. Summen- % glt. Kumul % 20.00000<x<=30.00000 0.00000 0.0000 30.00000<x<=40.00000 2 4.00000 4.0000 40.00000<x<=50.00000 3 5 6.00000 10.0000 50.00000<x<=60.00000 10 10.00000 20.0000 60.00000<x<=70.00000 20 20.00000 40.0000 70.00000<x<=80.00000 12 32 24.00000 64.0000 80.00000<x<=90.00000 14 46 28.00000 92.0000 90.00000<x<=100.0000 4 50 8.00000 100.0000 kontinuierliche Variable: 50 Zeiten für eine Wertejustage
Beispiel: Kumulierte Häufigkeiten Kumuliert Würfeln Kumuliert Zeiten Häufigkeit Häufigkeit Augenzahl Justagezeit (Intervall-Mitte)
Klassenbildung Die Meßwertklassen dürfen sich nicht überschneiden Die obere Klassengrenze gehört zur Klasse, die untere nicht Alle Klassen sollen dieselbe Breite haben (Normalfall) Nicht mehr als 20 Klassen bilden Anzahl k der Kategorien sollte etwa betragen
Beispiel zu viele optimal Optischer Eindruck wird durch Anzahl der Klassen bestimmt
Median N ungerade: N gerade: Justagezeit Relative kumulierte Häufigkeit Median N ungerade: Der te Wert N gerade: Mittel zwischen bem Wert und ten Der Median ist derjenige Wert, der die Reihe der Messwerte Halbiert (50% liegen drunter, 50% drüber) [Tafelbeispiel, Mathematica]
Quantile: Centil, Dezentil, Quartil Relative kumulierte Häufigkeit Median = 2. Quartil 1. Quartil Justagezeit Die Meßwerte (x), die bestimmten relativen Häufigkeiten entsprechen, werden Quantile genannt. Centil: 100er Einteilung Dezentil: 10er Einteilung, Quartil: 4er Einteilung
Quantile: empirische Bestimmung Es sei p ein Anteilswert, 0 < p < 1. Ein Wert xp, für den gilt, dass mindestens ein Anteil der Daten p kleiner oder gleich xp und mindestens ein Anteil 1-p der Daten größer oder gleich xp ist, heisst p-Quantil. Es gilt: Quantile können auch über eine graphische Methode aus der empirischen Verteilungsfunktion gewonnen werden. [Berechnungsbeispiele, Mathematica-Beispiele]
Quantile: empirische Bestimmung Fall 1: Np ist nicht ganzzahlig: Die Horizontale vom p-Wert der Y Achse trifft auf ein senkrechtes Treppenstück. Der X-Wert ist das zugehörige Quantil. Fall 2: Np ist ganzzahlig: Die Horizontale vom p-Wert der Y Achse trifft genau eine Treppenstufe. Mittelung der Treppengrenzen ergibt das Quantil.
Ausgleichskurve Relative kumulierte Häufigkeit Median = 2. Quartil 1. Quartil Justagezeit Die Quantile kann man auch mit einer glatten Ausgleichskurve, die die empirische Verteilungsfunktion gut beschreibt, ermitteln [Tafel+Mathematica]
Abweichungsmaße Die Abweichungsmaße bewerten die Abweichung aller Werte des Kollektivs von einem Maß der zentralen Tendenz. Sie Geben das Ausmaß der Homogenität der Werte an Die wichtigsten Abweichungsmaße sind 1. Varianz und Standardabweichung 2. Mittlere Abweichung 3. Halber Quartilsabstand
Mittlere Abweichung Ist die Summe aller Abweichungsbeträge vom Mittelwert Diese Abweichung ist vom Median minimal (von jedem anderen Wert ist sie größer)
Halber Quartilabstand Justagezeit Relative kumulierte Häufigkeit Q1 Q3
Varianz und Standardabweichung Die Varianz ist die Summe aller Abweichungsquadrate vom Mittelwert, gewichtet um den Stichprobenumfang Die Standardabweichung ist die Wurzel der Varianz [Tafelbeispiel: alternative Berechnung]
Bedeutung bei Normalverteilung Liegt die Normalverteilung vor, so ist der relative Anteil der Beobachtungen Einheiten der Standardabweichung um den Mittelwert eindeutig zugeordnet.
Standardisierung Die Standardisierung drückt einen Meßwert aus als eine Abweichung vom Mittelwert, gemessen in Einheiten der Standardabweichung Die Standardvariable z hat folgende Eigenschaften: [Mittelwert Null] [Standardabweichung Eins] [Tafelbeispiele, Mathematica: Standard-Normalverteilung]