Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Forschungsmethoden Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften, Universität Fribourg.

Ähnliche Präsentationen


Präsentation zum Thema: "Forschungsmethoden Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften, Universität Fribourg."—  Präsentation transkript:

1 Forschungsmethoden Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften, Universität Fribourg

2 Deskriptive vs. Inferenz-Statistik
Deskriptive Statistik Beschreibung von Daten mit Hilfe statistischer Kennwerte: anhand der Masse der zentralen Tendenz (Masse der „Mitte“) und der Dispersion (Variabilität) beschreibende Statistik Schliessende Statistik (Inferenzstatistik) Beurteilung von Daten, ob sie den Hypothesen entsprechen: Schätzen von Parametern und Berechnung statistischer Signifikanz schlussfolgernde Statistik

3 Häufigkeiten Kategorie f (x) cumf(x) % cum% weiblich 18 85,7 82,1
Geschlecht der Teilnehmenden an der Veranstaltung „Einführung in die Methoden der empirischen Sozialforschung im SS 2005 Kategorie f (x) cumf(x) % cum% weiblich 18 85,7 82,1 männlich 3 21 14,3 100,0 Total 100.0 absolute Häufigkeiten kumulierte relative Häufigkeiten in Prozent kum. relative

4 Kategorien Problem: sehr viele Merkmalsausprägungen
Lösung: Zusammenfassung der beobachteten Daten aus bestimmten Wertbereichen zu Gruppen bzw. Kategorien Beispiel: „12 Minutenlauf“ im Rahmen eines Fitnesstests 2000 m ≤ x ≤ 2250 m 2250 m ≤ x ≤ 2500 m ... 3750 m ≤ x ≤ 4000 m Vorteil  übersichtliche Anzahl an Kategorien, innerhalb derer die Anzahl der zugehörigen Fälle zusammengefasst wird Nachteil  Reduktion der Informationen

5 Kategorien: Breite und Anzahl
Regeln zur Kategorienbreite und –anzahl: Ausschliesslichkeit der Kategorien (disjunkt)  jedes beobachtete Ereignis (bzw. jeder Wert kann nur einer Kategorie zugeordnet werden Benachbarte Konzipierung der Kategorien  es darf keine „Lücke“ zwischen zwei Kategorien entstehen, in der ein Wert liegen könnte (geschlossene) Kategorien müssen gleich breit sein Sinnvolle Anzahl zu bildender Kategorien  Faustregel: m = x lg (N)  m = Kategorien N = Versuchspersonen  maximale Anzahl an Kategorien = 20 Offene Kategorien bei Ausreissern und Extremwerten  eine offene Kategorie hat keine obere oder untere Grenze (z.B. x ≤ 300)

6 Masse der zentralen Tendenz
Drei Kennwerte (Masse), die bestimmte Eigenschaften von Daten zusammenfassen und beschreiben. Damit können auch verschiedene Stichproben miteinander verglichen werden. Modus / Modalwert Wert, der am häufigsten vorkommt Median / Zentralwert Wert, der in der Mitte der Verteilung liegt und diese halbiert Arithmetisches Mittel / Mittelwert Durchschnittlicher Wert einer Verteilung Achtung: jedes Mass setzt bestimmte Mindestanforderungen an das Skalenniveau voraus!

7 Modus / Modalwert Definition
Der Modalwert (Mo) ist derjenige Wert einer Verteilung, welcher am häufigsten besetzt ist. Vorteil  sehr stabil gegenüber Extremwerten Voraussetzungen auf allen Skalenniveaus berechenbar Achtung: es können mehrere Modalwerte vorherrschen bimodal = zwei Modalwerte multimodal = mehr als zwei Modalwerte in solchen Fällen geben gewisse Statistikprogramme (z. B. SPSS) nur den kleinsten dieser Werte und eine zusätzliche Warnung aus

8 Modus / Modalwert: Beispiel
Beispiel: Test mit maximal 10 Punkten (n=14) 2, 3, 4, 4, 5, 5, 6, 7, 7, 7, 8, 8, 9, 10 Modalwert: Mo = 7

9 Median / Zentralwert Definition Vorteil Voraussetzung Berechnung
Der Median (Md) ist derjenige Wert der die geordnete Reihe der Messwerte in die oberen und unteren 50 Prozent aufteilt. Somit ist die Anzahl der Messwerte über und unter dem Median gleich. Vorteil  ebenfalls sehr stabil gegenüber Extremwerten Voraussetzung mindestens Ordinalskalenniveau Berechnung Für ungerades N: Md = x  Wert (x) von Person Für gerades N: Md = x + x Für grupp. Daten: Md = untere Grenze fk + . Kat.breite N + 1 2 N + 1 2 N 2 N 2 +1 2 N 2 - cum fk-1 fk

10 Median / Zentralwert: Beispiel
Medianbestimmung bei ungerader Anzahl Werte: Md = 9 Medianbestimmung bei gerader Anzahl Werte: Md = (9+13) / 2 = 11 Drei Beobachtungen haben einen kleineren, drei einen grösseren Wert als der Median angibt (Wert existiert nicht in den Daten).

11 Arithmetisches Mittel
Definition Der arithmetische Mittel (μ bzw. x, AM) ist die Summe aller Messwerte geteilt durch deren Anzahl N.  Durchschnitt aller Messwerte Nachteil  empfindlich gegenüber Extremwerten Voraussetzung mindestens Intervallskalenniveau Berechnung Summe aller Werte AM = x = Gesamtanzahl (n)

12 Drei Masse der zentralen Tendenz

13 AM, Mo und Md bei verschiedenen Verteilungsformen
Modalwert, Median und arithmetisches Mittel hängen von der Verteilungsform ab.

14 Wie verteilen sich die Daten?

15 Masse der Dispersion Die Masse der Dispersion beschreiben die Variabilität bzw. Streuung der beobachteten Werte. Variationsbreite (Range, Spannweite) Quartile, Interquartilsabstand (Perzentile) AD-Streuung („average deviation“) Varianz Standardabweichung (standard deviation)

16 Variationsbreite (Range, Spannweite)
Definition Die Spannweite bzw. der Range beschreibt bei kontinuierlichen Daten die Grösse des Intervalls, in welchem die unterschiedlichen Werte einer Variable lieben. Bei nominalskalierten Variablen gibt der Range die Anzahl der Kategorien an. Nachteile bei kontinuierlichen Daten werden nur die minimalsten und maximalsten Messwerte berücksichtigt sehr empfindlich gegenüber Extremwerten / Ausreissern daher werden oft Extremwerte weggelassen (z.B. statt Spannweite nur mittlere 90 Prozent darstellen) Berechnung kontinuierliche Daten:  Range = maximaler Wert – minimaler Wert diskrete Daten (d.h. aus getrennten Einheiten bestehende Daten wie z.B. Kategorien):  Range = maximaler Wert – minimaler Wert +1

17 Perzentile, Quartile, Interquartilabstand
Definition Die Perzentile teilen die Datenverteilung in mehrere Teile (bei Perzentilen 100, entsprechend den Prozenträngen) ein. Als Quartile werden jene Punkte bezeichnet, welche eine Verteilung in vier gleich grosse Abschnitte aufteilen. Das mittlere Quartil (Q2) entspricht dabei dem Median (Prozentrang von 50), während das untere Quartil (Q1) den 25. Prozentrang und das obere Quartil (Q3) den 75. Prozentrang erfasst. Die Differenz der beiden Quartile Q1 und Q2 wird als Interquartilsabstand (IQA) bezeichnet. Vorteil Ausreisser wirken sich nicht so sehr auf Kennwerte aus, da mit den Quartilen Q1 und Q3 nur die mittleren 50 Prozent der Verteilung berücksichtigt werden Nachteil Der Interquartilsabstand beinhaltet nur Informationen der mittleren 50 Prozent der Verteilung.

18 Perzentile, Quartile, Interquartilabstand: Beispiel
Spezialfall Median: Teilt Verteilung in zwei gleich grosse Teile (je 50%) beim 50. Perzentil. 2, 4, 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 9, 9, 10, 10 (Md = 6,5) Für die Einteilung in vier gleich grosse Teile werden drei Quartile (das 25., 50. & 75. Perzentil) bestimmt. 2, 4, 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 9, 9, 10, 10 P25 = 5 P50 = 6.5 P75 = 8

19 AD-Streuung („average deviation“)
Definition Die AD-Streuung gibt den Durchschnitt der absoluten Abweichungen aller Messwerte vom Mittelwert an. Merkmale die aufsummierten Werte ergeben immer null  daher müssen negative Werte stets in positive Werte transformiert werden, so dass die aufsummierten Werte immer positiv sind je grösser die AD-Streuung ist, desto grösser ist die Variabilität der Variablenwerte alle Abweichungen haben den exakt gleichen Einfluss auf die AD- Streuung Berechnung å = N i = i x AD 1

20 Abweichung vom Mittelwert
Varianz Definition Die Varianz (σ2 bzw. s2) ist die durchschnittliche quadrierte Abweichung vom Mittelwert. Berechnung Abweichung vom Mittelwert im Quadrat (x – x1)2 + (x – x2)2 + (x – x3) (x – xn)2 dividiert durch n x=3.5 s2 = ( ) / 8 = 32 / 8 = 4

21 Varianz Warum Quadrierung? Freiheitsgrade
Summe aller Werte ist nie Null (d.h. immer positiv) grössere Abweichungen vom arithmetischen Mittelwert werden stärker berücksichtigt (kleinere Abweichungen können eher zufällig entstehen, wodurch grössere Abweichungen statistisch bedeutsamer zu betrachten sind  siehe Beispiel „Gewichtsschwankungen“ Freiheitsgrade die Freiheitsgrade ergeben sich aus der Stichprobengrösse, welche um die Anzahl der als bekannt vorausgesetzten Kennwerte reduziert wird Warum wird Quadratsumme durch Freiheitsgrade (N-1) und nicht durch N geteilt? Gefahr der Unterschätzung der Populationsvarianz  konservative Schätzung durch N-1

22 Standardabweichung („standard deviation“)
Definition Die Standardabweichung (σ bzw. s, SD) entspricht der Wurzel aus der Varianz. Berechnung Beispiel (vgl. Beispiel von der Varianzberechnung)

23 Literatur Aron, A. & Aron E. N. (1999). Statistics for Psychology. New Jersey: Prentice Hall. Leonhard, R. (2004). Lehrbuch Statistik: Einstieg und Vertiefung. Bern: Hans Huber. Shavelson, R. J. (1995). Statistical Reasoning for the Behavioral Sciences. Boston: Allyn and Bacon. Wosnitza, M., & Jäger, R. S. (2000; Hrsg.). Daten erfassen, auswerten und präsentieren - aber wie? Landau: Verlag Empirische Pädagogik.


Herunterladen ppt "Forschungsmethoden Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften, Universität Fribourg."

Ähnliche Präsentationen


Google-Anzeigen