Forschungsmethoden Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften, Universität Fribourg.

Slides:



Advertisements
Ähnliche Präsentationen
Sicherheitslabordaten bei Gesunden
Advertisements

Quanti Tutorium
Univariate Statistik M. Kresken.
Der F - Test Man prüft, ob sich 2 Varianzen unterscheiden, mit dem F-Quotienten: Geprüft werden stets die Schätzungen der Populationsvarianzen aufgrund.
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Streuung Bezeichnung Streuung=Dispersion=Variabilität Fragestellung:
Zentralwert bei Listen: Beispiele und Formeln
Lagemaße kritische Fragen
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Bewegungswissenschaft
Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.
Gliederung Definition des Wahrscheinlichkeitsbegriffes
Gliederung Der Begriff der Stichprobe, Stichprobenfehler
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Forschungsstatistik II
Heute Prüfung der Produkt-Moment Korrelation
Der Binomialtest Man habe einen wahren Anteil P.
Kapitel 1 Das Schubfachprinzip
Hypothesen testen: Grundidee
Deskriptive Statistik und Wahrscheinlichkeitstheorie
Konfidenzintervalle Intervallschätzung
Die Student- oder t-Verteilung
Median Merkmal Geordneter Datensatz
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Die Vorlesung Mathematik I (Prof. Kugelmann) findet heute um 14:30 Uhr im Hörsaal Loefflerstraße 70 statt.
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Univariate Statistik M. Kresken.
Fachschule für Technik Biomedizinische Arbeitsmethoden
Deskriptive Statistik
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Das wars!.
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Wiederholung und Beispiele
Eigenschaften der OLS-Schätzer
Daten auswerten Boxplots
Diagramme für Häufigkeiten und Prozentwerte
Ausgleichungsrechnung I
Ausgleichungsrechnung II
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Chi Quadrat Test Tamara Katschnig.
Aufgabenzettel V Statistik I
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Die Poisson-Verteilung: Mittelwert und Standardabweichung
Kennwerte und Boxplots
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.
Konfidenzintervall und Testen für den Mittelwert und Anteile
Referat über das Thema STOCHASTIK.
Der Zentralwert.
Deskriptive Statistik
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Bioinformatik Vorlesung
Statistik – Regression - Korrelation
Veranstaltung 4.
Erheben, berechnen und darstellen von Daten
Mathematik für BiologInnen WS 05
setzt Linearität des Zusammenhangs voraus
Varianzanalyse und Eta²
Verteilungen, Varianz Tamara Katschnig.
Prüft ebenfalls die Annahme der Varianzhomogenität (exakter)
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
Statistik III Statistik III 2. Streuungsmaße (Dispersionsmaße)
Statistik I Statistik I Statistische Grundbegriffe
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Ein Dozent hat mittels eines Fragebogens die Körpergröße seiner Studenten festgestellt. Anhand der erfassten Daten weiß er, dass der kleinste Student 158.
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
 Präsentation transkript:

Forschungsmethoden Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften, Universität Fribourg

Deskriptive vs. Inferenz-Statistik Deskriptive Statistik Beschreibung von Daten mit Hilfe statistischer Kennwerte: anhand der Masse der zentralen Tendenz (Masse der „Mitte“) und der Dispersion (Variabilität) beschreibende Statistik Schliessende Statistik (Inferenzstatistik) Beurteilung von Daten, ob sie den Hypothesen entsprechen: Schätzen von Parametern und Berechnung statistischer Signifikanz schlussfolgernde Statistik

Häufigkeiten Kategorie f (x) cumf(x) % cum% weiblich 18 85,7 82,1 Geschlecht der Teilnehmenden an der Veranstaltung „Einführung in die Methoden der empirischen Sozialforschung im SS 2005 Kategorie f (x) cumf(x) % cum% weiblich 18 85,7 82,1 männlich 3 21 14,3 100,0 Total 100.0 absolute Häufigkeiten kumulierte relative Häufigkeiten in Prozent kum. relative

Kategorien Problem: sehr viele Merkmalsausprägungen Lösung: Zusammenfassung der beobachteten Daten aus bestimmten Wertbereichen zu Gruppen bzw. Kategorien Beispiel: „12 Minutenlauf“ im Rahmen eines Fitnesstests 2000 m ≤ x ≤ 2250 m 2250 m ≤ x ≤ 2500 m ... 3750 m ≤ x ≤ 4000 m Vorteil  übersichtliche Anzahl an Kategorien, innerhalb derer die Anzahl der zugehörigen Fälle zusammengefasst wird Nachteil  Reduktion der Informationen

Kategorien: Breite und Anzahl Regeln zur Kategorienbreite und –anzahl: Ausschliesslichkeit der Kategorien (disjunkt)  jedes beobachtete Ereignis (bzw. jeder Wert kann nur einer Kategorie zugeordnet werden Benachbarte Konzipierung der Kategorien  es darf keine „Lücke“ zwischen zwei Kategorien entstehen, in der ein Wert liegen könnte (geschlossene) Kategorien müssen gleich breit sein Sinnvolle Anzahl zu bildender Kategorien  Faustregel: m = 1 + 3.32 x lg (N)  m = Kategorien N = Versuchspersonen  maximale Anzahl an Kategorien = 20 Offene Kategorien bei Ausreissern und Extremwerten  eine offene Kategorie hat keine obere oder untere Grenze (z.B. x ≤ 300)

Masse der zentralen Tendenz Drei Kennwerte (Masse), die bestimmte Eigenschaften von Daten zusammenfassen und beschreiben. Damit können auch verschiedene Stichproben miteinander verglichen werden. Modus / Modalwert Wert, der am häufigsten vorkommt Median / Zentralwert Wert, der in der Mitte der Verteilung liegt und diese halbiert Arithmetisches Mittel / Mittelwert Durchschnittlicher Wert einer Verteilung Achtung: jedes Mass setzt bestimmte Mindestanforderungen an das Skalenniveau voraus!

Modus / Modalwert Definition Der Modalwert (Mo) ist derjenige Wert einer Verteilung, welcher am häufigsten besetzt ist. Vorteil  sehr stabil gegenüber Extremwerten Voraussetzungen auf allen Skalenniveaus berechenbar Achtung: es können mehrere Modalwerte vorherrschen bimodal = zwei Modalwerte multimodal = mehr als zwei Modalwerte in solchen Fällen geben gewisse Statistikprogramme (z. B. SPSS) nur den kleinsten dieser Werte und eine zusätzliche Warnung aus

Modus / Modalwert: Beispiel Beispiel: Test mit maximal 10 Punkten (n=14) 2, 3, 4, 4, 5, 5, 6, 7, 7, 7, 8, 8, 9, 10 Modalwert: Mo = 7

Median / Zentralwert Definition Vorteil Voraussetzung Berechnung Der Median (Md) ist derjenige Wert der die geordnete Reihe der Messwerte in die oberen und unteren 50 Prozent aufteilt. Somit ist die Anzahl der Messwerte über und unter dem Median gleich. Vorteil  ebenfalls sehr stabil gegenüber Extremwerten Voraussetzung mindestens Ordinalskalenniveau Berechnung Für ungerades N: Md = x  Wert (x) von Person Für gerades N: Md = x + x Für grupp. Daten: Md = untere Grenze fk + . Kat.breite N + 1 2 N + 1 2 N 2 N 2 +1 2 N 2 - cum fk-1 fk

Median / Zentralwert: Beispiel Medianbestimmung bei ungerader Anzahl Werte: 4 7 9 13 17 Md = 9 Medianbestimmung bei gerader Anzahl Werte: 4 7 9 13 17 30 Md = (9+13) / 2 = 11 Drei Beobachtungen haben einen kleineren, drei einen grösseren Wert als der Median angibt (Wert existiert nicht in den Daten).

Arithmetisches Mittel Definition Der arithmetische Mittel (μ bzw. x, AM) ist die Summe aller Messwerte geteilt durch deren Anzahl N.  Durchschnitt aller Messwerte Nachteil  empfindlich gegenüber Extremwerten Voraussetzung mindestens Intervallskalenniveau Berechnung Summe aller Werte AM = x = Gesamtanzahl (n)

Drei Masse der zentralen Tendenz  

AM, Mo und Md bei verschiedenen Verteilungsformen Modalwert, Median und arithmetisches Mittel hängen von der Verteilungsform ab.

Wie verteilen sich die Daten?

Masse der Dispersion Die Masse der Dispersion beschreiben die Variabilität bzw. Streuung der beobachteten Werte.   Variationsbreite (Range, Spannweite) Quartile, Interquartilsabstand (Perzentile) AD-Streuung („average deviation“) Varianz Standardabweichung (standard deviation)

Variationsbreite (Range, Spannweite) Definition Die Spannweite bzw. der Range beschreibt bei kontinuierlichen Daten die Grösse des Intervalls, in welchem die unterschiedlichen Werte einer Variable lieben. Bei nominalskalierten Variablen gibt der Range die Anzahl der Kategorien an. Nachteile bei kontinuierlichen Daten werden nur die minimalsten und maximalsten Messwerte berücksichtigt sehr empfindlich gegenüber Extremwerten / Ausreissern daher werden oft Extremwerte weggelassen (z.B. statt Spannweite nur mittlere 90 Prozent darstellen) Berechnung kontinuierliche Daten:  Range = maximaler Wert – minimaler Wert diskrete Daten (d.h. aus getrennten Einheiten bestehende Daten wie z.B. Kategorien):  Range = maximaler Wert – minimaler Wert +1

Perzentile, Quartile, Interquartilabstand Definition Die Perzentile teilen die Datenverteilung in mehrere Teile (bei Perzentilen 100, entsprechend den Prozenträngen) ein. Als Quartile werden jene Punkte bezeichnet, welche eine Verteilung in vier gleich grosse Abschnitte aufteilen. Das mittlere Quartil (Q2) entspricht dabei dem Median (Prozentrang von 50), während das untere Quartil (Q1) den 25. Prozentrang und das obere Quartil (Q3) den 75. Prozentrang erfasst. Die Differenz der beiden Quartile Q1 und Q2 wird als Interquartilsabstand (IQA) bezeichnet. Vorteil Ausreisser wirken sich nicht so sehr auf Kennwerte aus, da mit den Quartilen Q1 und Q3 nur die mittleren 50 Prozent der Verteilung berücksichtigt werden Nachteil Der Interquartilsabstand beinhaltet nur Informationen der mittleren 50 Prozent der Verteilung.

Perzentile, Quartile, Interquartilabstand: Beispiel Spezialfall Median: Teilt Verteilung in zwei gleich grosse Teile (je 50%) beim 50. Perzentil. 2, 4, 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 9, 9, 10, 10 (Md = 6,5) Für die Einteilung in vier gleich grosse Teile werden drei Quartile (das 25., 50. & 75. Perzentil) bestimmt. 2, 4, 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 9, 9, 10, 10 P25 = 5 P50 = 6.5 P75 = 8

AD-Streuung („average deviation“) Definition Die AD-Streuung gibt den Durchschnitt der absoluten Abweichungen aller Messwerte vom Mittelwert an. Merkmale die aufsummierten Werte ergeben immer null  daher müssen negative Werte stets in positive Werte transformiert werden, so dass die aufsummierten Werte immer positiv sind je grösser die AD-Streuung ist, desto grösser ist die Variabilität der Variablenwerte alle Abweichungen haben den exakt gleichen Einfluss auf die AD- Streuung Berechnung å = N i = i x AD 1

Abweichung vom Mittelwert Varianz Definition Die Varianz (σ2 bzw. s2) ist die durchschnittliche quadrierte Abweichung vom Mittelwert. Berechnung Abweichung vom Mittelwert im Quadrat (x – x1)2 + (x – x2)2 + (x – x3)2 + ........ + (x – xn)2 dividiert durch n x=3.5 s2 = (6.25 + 6.25 + 0.25 + 2.25 + 12.25 + 2.25 + 0.25 + 2.25) / 8 = 32 / 8 = 4

Varianz Warum Quadrierung? Freiheitsgrade Summe aller Werte ist nie Null (d.h. immer positiv) grössere Abweichungen vom arithmetischen Mittelwert werden stärker berücksichtigt (kleinere Abweichungen können eher zufällig entstehen, wodurch grössere Abweichungen statistisch bedeutsamer zu betrachten sind  siehe Beispiel „Gewichtsschwankungen“ Freiheitsgrade die Freiheitsgrade ergeben sich aus der Stichprobengrösse, welche um die Anzahl der als bekannt vorausgesetzten Kennwerte reduziert wird Warum wird Quadratsumme durch Freiheitsgrade (N-1) und nicht durch N geteilt? Gefahr der Unterschätzung der Populationsvarianz  konservative Schätzung durch N-1

Standardabweichung („standard deviation“) Definition Die Standardabweichung (σ bzw. s, SD) entspricht der Wurzel aus der Varianz. Berechnung Beispiel (vgl. Beispiel von der Varianzberechnung)

Literatur Aron, A. & Aron E. N. (1999). Statistics for Psychology. New Jersey: Prentice Hall. Leonhard, R. (2004). Lehrbuch Statistik: Einstieg und Vertiefung. Bern: Hans Huber. Shavelson, R. J. (1995). Statistical Reasoning for the Behavioral Sciences. Boston: Allyn and Bacon. Wosnitza, M., & Jäger, R. S. (2000; Hrsg.). Daten erfassen, auswerten und präsentieren - aber wie? Landau: Verlag Empirische Pädagogik.