Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus.

Ähnliche Präsentationen


Präsentation zum Thema: "Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus."—  Präsentation transkript:

1 Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus – Fragebogenformate Datensätze in SPSS Kennwerte – Häufigkeiten – Maße der zentralen Tendenz – Maße der Dispersion

2 Deskriptive Statistik 02_grundbegriffe_kennwerte2 Definition: Unter deskriptiver Statistik versteht man ein Gruppe statistischer Methoden zur Beschreibung statistischer Daten anhand statistischer Kennwerte, Graphiken, Diagrammen oder Tabellen. (Leonhart, 2004) Deskriptive Statistik bezieht sich immer auf eine Stichprobe, d.h. auf die Personen, die tatsächlich untersucht bzw. beobachtet wurden. Die Inferenzstatistik zieht dagegen aus den in einer Stichprobe erhobenen Daten Schlüsse auf die zugrunde liegende Population.

3 Grundbegriffe der Datenerhebung 02_grundbegriffe_kennwerte3 Bei einer Datenerhebung geht es darum, bestimmte Merkmalsausprägungen der untersuchten Einheiten zu messen. Was sind Merkmale? Was sind Einheiten? Was ist eine Messung?

4 Deskriptive Statistik 02_grundbegriffe_kennwerte4 Beispiel 1: Merkmale von Psychologiestudierenden: Geschlecht Alter Größe Wohnort Ängstlichkeit Extravertiertheit Statistikkenntnisse

5 Merkmale 02_grundbegriffe_kennwerte5 Beispiel 2: Merkmale von Therapiemaßnahmen: Anzahl der therapeutischen Sitzungen (25 vs. 100) Therapeutisches Setting (z.B. Einzel- vs. Gruppentherapie) Eingesetzte therapeutische Methoden (z.B. Gesprächsterapie vs. Verhaltenstherapie) Motivation des Klienten Motivation des Therapeuten … Eine statistische Erhebung von Merkmalen muss nicht auf Basis von Personen erfolgen.

6 Merkmale 02_grundbegriffe_kennwerte6 Qualitative vs. Quantitative Merkmale Qualitative Merkmale beschreiben die Zugehörigkeit einer Person oder eines Objektes zu einer Kategorie. Quantitative Merkmale beschreiben die Ausprägung eines Merkmals auf einem Kontinuum. Beispiele … – Qualitativ: Geschlecht, Wohnort – Quantitativ: Alter, Ängstlichkeit

7 Merkmale 02_grundbegriffe_kennwerte7 Manifeste vs. Latente Merkmale Manifeste Merkmale können (im Prinzip) direkt beobachtet oder gemessen werden. Latente Merkmale können nur indirekt zu erfasst werden. Diese Merkmale sind meist nur unzureichend operational definiert, so dass ihre Messung indirekt durch korrespondierender manifeste Merkmale geschieht. Beispiele … – Manifest: Geschlecht, Körpergröße – Latent: Persönlichkeitseigenschaften

8 Deskriptive Statistik 02_grundbegriffe_kennwerte8 Klassifikation von Merkmalen: ManifestLatent Qualitativ Geschlecht Wohnort … Persönlichkeitstypus (z.B. Choleriker) … Quantitativ Alter Gewicht … Persönlichkeitseigenschaft (z.B. Extraversion) …

9 Messung 02_grundbegriffe_kennwerte9 Vom Merkmal zur Variable Um ein Merkmal exakt zu erfassen, muss eine präzise Operationalisierung (Messvorschrift) vorliegen. Die Operationalisierung definiert, wie unterschiedliche Ausprägungen eines Merkmals erfasst (kodiert) werden Die Kodierung der Merkmalsausprägungen erfolgt in der Regel in Zahlen. Man spricht nun von einer Variable, die die Information enthält. Ein Messung ist also eine Zuordnung von Zahlen zu Objekten gemäß den Regeln einer Operationalisierung.

10 Operationalisierung 02_grundbegriffe_kennwerte10 Beispiele für Operationalisierungen Die Variable sex soll das Geschlecht erfassen. Es wird für Frauen der Wert 1 und für Männer der Wert 2 verwendet. Die Variable alter soll das Alter der untersuchten Personen in Jahren erfassen. Die Variable alter soll das Alter von Säuglingen in Monaten erfassen. Die Variable opt soll den selbst eingeschätzten Optimismus auf einer Skala von -2 (überhaupt nicht optimistisch) bis +2 (extrem optimistisch) erfassen. Die Variable angst soll die Ängstlichkeit erfassen. Diese wird gemessen als die Zeitdauer in Sekunden, bis eine Spinne angefasst wird.

11 Variablen 02_grundbegriffe_kennwerte11 Klassifikation von Variablen: Diskret vs. Kontinuierlich Diskrete Variablen: Die Anzahl der möglichen Werte ist abzählbar. Kontinuierliche Variablen: Die möglichen Werte liegen auf einem Kontinuum. Beispiele …

12 Merkmale und Variablen 02_grundbegriffe_kennwerte12 Merkmalqualitativ oder quantitativ ? manifest oder latent ? diskret oder kontinuierlich Geschlechtqualitativmanifestdiskret Alterquantitativmanifest? Wohnortqualitativmanifestdiskret Optimismus (Rating 1 bis 5) quantitativlatentdiskret Ängstlichkeit (Zeit bis zur Handlung) quantitativlatentkontinuierlich

13 Skalenniveaus Möglichkeiten, das Konstrukt Ängstlichkeit zu operationalisieren: Mutprobe (z.B. bungee jump) – Erfolg: angst=0 – Misserfolg: angst=1 Experten-Rating (Einschätzung) – nicht ängstlich (0) – wenig ängstlich (1) – eher ängstlich (2) – klinisch relevante Angststörung (3) Ergebnis eines Ängstlichkeitsfragebogens – Werte von 0-40 Mutprobe – Zeit bis zur erfolgreichen Handlung (0 bis ? Sekunden) 02_grundbegriffe_kennwerte13 Die Art der Operationalisierung beeinflusst das Skalenniveau und damit die Möglichkeiten der statistischen Auswertung!

14 Skalenniveaus Vier Skalenniveaus: (1)Nominalskala (2)Ordinalskala (3)Intervallskala (4)Verhältnisskala Die Messgenauigkeit und Aussagekraft der Daten steigt mit dem Skalenniveau. Es sollte daher versucht werden, Daten auf einem möglichst hohem Skalenniveau zu erfassen. 02_grundbegriffe_kennwerte14

15 Skalenniveaus Die Nominalskala Es werden Namen (Zahlenwerte) für jede Merkmalsausprägung vergeben. Beispiel: Geschlecht (m / w) Zwei Annahmen müssen berücksichtigt werden: 1.Exklusivität: Unterschiedliche Merkmalsausprägungen werden unterschiedlichen Zahlen zugeordnet. 2.Exhaustivität: Jeder beobachteten Merkmalsausprägung eine Zahl zugeordnet. Man spricht von einer homomorphen Abbildung, d.h. aus der Variablen kann immer auf das Merkmal zurückgeschlossen werden. 02_grundbegriffe_kennwerte15

16 Skalenniveaus Die Nominalskala Aussagekraft von Variablenwerten: – Information über Gleichheit / Verschiedenheit der Merkmalsausprägung (Keine Aussagen zu größer/kleiner Relationen möglich!) Mögliche Transformationen: – Die Variablenwerte können willkürlich vorgegeben und auch nachträglich geändert werden. – Es sind alle eineindeutigen Transformationen erlaubt – Beispiel: weiblich = 1;männlich = 2 oder weiblich = 2; männlich = 1 oderweiblich = 100; männlich = 200; 02_grundbegriffe_kennwerte16

17 Skalenniveaus Die Ordinalskala Bei der Ordinalskala (Rangskala) geben die Variablenwerte Aufschluss über die Rangfolge der Merkmalsträger bezüglich des gemessenen Merkmals Beispiel: Schulabschluss 0=kein SA, 1=Haupts., 2=Reals., 3=Gymnasium) Zusätzliche Annahme für die Operationalisierung: 3.Die zugeordneten Zahlen repräsentieren eine Rangreihe der Merkmalsausprägung. 02_grundbegriffe_kennwerte17

18 Skalenniveaus Die Ordinalskala Aussagekraft von Variablenwerten: – Information über Gleichheit / Verschiedenheit der Merkmalsausprägung – Größer / Kleiner Relationen Mögliche Transformationen: – Erlaubt sind nur noch alle monotonen Transformationen. – Beispiele y = x + 3 y = 2x y = log(x) 02_grundbegriffe_kennwerte18

19 Skalenniveaus Die Intervallskala Bei der Intervallskala geben die Variablenwerte Aufschluss über die Abstände zwischen Merkmalsausprägungen. Beispiel: Ergebnisse eines Intelligenztests (IQ (Peter) = 115; IQ(Anne) = 130 Differenz 15 Punkte ) Zusätzliche Annahme für die Operationalisierung: 4.Gleich große Intervalle zwischen Zahlenwerten der Variable repräsentieren gleich große Abstände in der Merkmalsausprägung. 02_grundbegriffe_kennwerte19

20 Skalenniveaus Die Intervallskala Aussagekraft von Variablenwerten: – Information über Gleichheit / Verschiedenheit der Merkmalsausprägung – Größer / Kleiner Relationen – Größe von Unterschieden Mögliche Transformationen: – Erlaubt sind nur noch alle linearen Transformationen (y = ax+b). – Beispiele y = x y = 0.1 x 02_grundbegriffe_kennwerte20

21 Skalenniveaus Die Verhältnisskala Die Verhältnisskala kann vor allem bei der Messung physikalischer Größen (Länge, Gewicht, Zeit) angenommen werden. Beispiel: Reaktionszeit (ms) Zusätzliche Annahme für die Operationalisierung: 5.Die Skala hat einen definierten Null-Punkt. 02_grundbegriffe_kennwerte21

22 Skalenniveaus Die Verhältnisskala Aussagekraft von Variablenwerten: – Information über Gleichheit / Verschiedenheit der Merkmalsausprägung – Größer / Kleiner Relationen – Größe von Unterschieden – Verhältnis von Merkmalsausprägungen (z.B. doppelte Reaktionszeit) Mögliche Transformationen: – Erlaubt sind nur noch alle multiplikativen Transformationen (y = ax). – Beispiele y = x (Umrechnung von Millisekunden in Sekunden) y = 24 x (Umrechnung von Jahren in Monate) 02_grundbegriffe_kennwerte22

23 Skalenniveaus SkalenniveauBeispieleMögliche Aussagen Erlaubte Trans- formationen NominalskalaGeschlecht, Diagnosen Gleichheit / Verschiedenheit Eineindeutige Transformationen OrdinalskalaSchulbildung, Ratings Größer / Kleiner Relationen Monotone Trans- formationen IntervallskalaIQ, Persönlichkeits- merkmale Gleichheit von Differenzen Lineare Trans- formationen VerhältnisskalaAlter, Reaktionszeit Gleichheit von Verhältnissen Multiplikative Transformationen 02_grundbegriffe_kennwerte23

24 Skalenniveaus Das Skalenniveau hängt ab: 1. Von dem erhobenen Merkmal 2. Von der Operationalisierung der Messung Beispiele: Geschlecht ist immer Nominalskaliert, da das Merkmal an sich keine Rangreihe oder Intervalle definiert. Ängstlichkeit kann jedoch nominal-, ordinal-, oder intervallskaliert erhoben werden (s.o.) Durch die Art der Messung kann das Skalenniveau sinken. 02_grundbegriffe_kennwerte24

25 Skalenniveaus Niveau eines Merkmals vs. Niveau der Variablen Beispiel 1: Zeit bis zum Anfassen der Spinne – Peter: 10 Sekunden; Martin: 20 Sekunden – Also: Martin hat doppelt so lange gezögert wie Peter. (Zeit ist verhältnis- skaliert) – Also: Martin ist doppelt so ängstlich wie Peter – Das ergibt keinen Sinn – Ängstlichkeit kann vermutlich nicht auf Verhältnisskalenniveau gemessen werden. Für (latente) psychologische Konstrukte wird in aller Regel nur Intervallskalenniveau angenommen. 02_grundbegriffe_kennwerte25

26 Skalenniveaus Niveau eines Merkmals vs. Niveau der Variablen Beispiel 2: Reaktionszeit – Viele psychologische Studien beruhen auf Reaktionszeiten – Die Zeit ist verhältnisskaliert – Aber: Unterschiede zwischen 500 ms und 600 ms sind psychologisch bedeutsamer als Unterschiede zwischen 1500 ms und 1600 ms – Daher werden Reaktionszeiten vor der Auswertung manchmal logarithmiert – Nun gilt: ln(600) - ln(500) = 6.40 – 6.22 = 0.18 ln(1600) - ln(1500) = 7.38 – 7.31 = 0.07 – Eine Logarithmierung ist eigentlich nur für ordinalskalierte Variablen zulässig. – Dennoch wird angenommen, dass die logarithmierten Zeiten besser das intervallskalierte Konstrukt (z.B. Aufmerksamkeit) abbilden. 02_grundbegriffe_kennwerte26

27 Skalenniveaus Das Skalenniveau von Fragebogen Oft ist das Skalenniveau umstritten: – z.B. Schulnoten (ordinal oder intervall?) – z.B. Ratings (ordinal oder intervall?) Für einzelne Fragebogenitems kann man nur von einem Ordinalskalennieveau ausgehen Bei einer Aggregation von vielen Items (Summenbildung) wird meist von einem Intervallskalenniveau ausgegangen. Für psychologische Untersuchungen ist das Intervallskalenniveau von besonderer Bedeutung, da viele statistische Verfahren nur bei intervallskalierten Daten eingesetzt werden können. 02_grundbegriffe_kennwerte27

28 Unterschiedliche Fragebogenformate 02_grundbegriffe_kennwerte28 Trifft zuTrifft nicht zu Bei allem sehe ich stets die positive Seite. 10 Ich blicke immer mit Zuversicht in die Zukunft 10 Auch in unsicheren Zeiten rechne ich im allgemeinen damit, dass sich alles zum Besten wendet. 10 Alles in allem erwarte ich, dass mir mehr gute als schlechte Dinge widerfahren. 10 Zweistufige Antworten

29 Unterschiedliche Fragebogenformate 02_grundbegriffe_kennwerte29 Trifft gar nicht zu Trifft eher nicht zu Unbestimmt Trifft eher zu Trifft voll und ganz zu Bei allem sehe ich stets die positive Seite Ich blicke immer mit Zuversicht in die Zukunft Auch in unsicheren Zeiten rechne ich im allgemeinen damit, dass sich alles zum Besten wendet Alles in allem erwarte ich, dass mir mehr gute als schlechte Dinge widerfahren Mehrstufige Ratingskalen

30 Unterschiedliche Fragebogenformate 02_grundbegriffe_kennwerte30 Zufrieden Ärgerlich Gut Schlecht Ausgeruht Schlapp Gelassen Angespannt Ruhig Unruhig Bipolare Ratingskalen

31 Zusammenfassung Grundbegriffe 02_grundbegriffe_kennwerte31 Die deskriptive Statistik dient der Beschreibung einer Stichprobe. Grundlage jeder Statistik ist ein Datensatz. Dieser entsteht durch die Messung von Merkmalen der Mitglieder dieser Stichprobe. Dabei spielt die Operationalisierung der Merkmale eine entscheidende Rolle. Die Daten können auf unterschiedlichen Skalenniveaus vorliegen: – Noninalskala, Ordinalskala, Intervallskala, Verhältnisskala Grundsätzlich sollte versucht werden, bei einer Messung ein möglichst hohes Skalenniveau zu erreichen. Bei der Erfassung vieler psychologischer Merkmale kann ein Intervallskalenniveau erreicht werden.

32 Datensätze in SPSS 02_grundbegriffe_kennwerte32

33 Datensätze in SPSS 02_grundbegriffe_kennwerte33

34 Datensätze in SPSS Erstellen eines neuen Datensatzes Definieren der Variablen (Variablenansicht) – Name (kurzer Bezeichner) – Typ (meist: Numerisch = Zahl oder String = Text) – evtl.: Variablenlable und Wertelable – wichtig: Wert für missings (fehlende Werte) definieren! – Messniveau (Skalenniveau): Nominal, ordinal, oder Metrisch Eingabe der Daten (Datenansicht) – Jede Zeile ist ein Fall (eine Versuchsperson) – Bei fehlenden Angaben immer den Wert für missings eintragen! 02_grundbegriffe_kennwerte34

35 Statistische Kennwerte 02_grundbegriffe_kennwerte35 Daten können auf viele unterschiedliche Arten dargestellt werden. Es gehört zu den Kompetenzen eines Statistikers zu entscheiden, welche Art der Darstellung geeignet ist. Sinnvoll ist immer eine Zusammenfassung des ursprünglichen Datensatzes. Gleichzeitig soll aber auch möglichst viel Information über das erhobene Merkmal erhalten bleiben. Dies erfolgt z.B. durch die Darstellung von – Häufigkeiten – Maßen der Zentrale Tendenz – Maßen der Dispersion

36 Häufigkeiten Eine Urliste enthält alle Werte einer Stichprobe Beispiel Geschlecht: (w, w, w, m, m, w, w, w, w, m, w, m, …) Zur Darstellung der Geschlechterverteilung fasst man diese Urliste zusammen: Berechnung der Prozente: 02_grundbegriffe_kennwerte36

37 Häufigkeiten in SPSS Befehle in SPSS Grundsätzlich gibt es zwei Möglichkeiten, Befehle aufzurufen (1)Das Menu Vorteil: Einfache Bedienung, wenn man sich nicht gut auskennt Nachteil: Wenn man das Ergebnis nochmal braucht, muss man alles von neuem anklicken. (2)Das Syntaxfenster Öffnen mit Datei > Neu > Syntax Dann können Befehle direkt eingetippt werden. Vorteil: Man kann die Syntax speichern, und alle Berechnungen später erneut ausführen Nachteil: Man muss die Befehle kennen Sie müssen den Syntax nicht für die Klausur lernen. ABER: Ich empfehle jedem regelmäßigem SPSS Nutzer, sich mit der SPSS Syntax vertraut zu machen. 02_grundbegriffe_kennwerte37

38 Häufigkeiten in SPSS Häufigkeiten über das Menu berechnen Analysieren > Deskriptive Statistik > Häufigkeiten 02_grundbegriffe_kennwerte38

39 Häufigkeiten in SPSS Häufigkeiten über das Menu berechnen Die interessierenden Variablen aus der Liste (links) in das Auswahlfeld (rechts) schieben … und OK anklicken 02_grundbegriffe_kennwerte39

40 Häufigkeiten in SPSS Häufigkeiten über den Syntax berechnen Ein Syntaxfester öffnen Den Befehl eingeben: – frequency sex. – fre sex. Den Befehl ausführen: – Strg. R (run) – oder den blauen Pfeil anklicken 02_grundbegriffe_kennwerte40

41 Häufigkeiten in SPSS Häufigkeiten – SPSS Ausgabe 02_grundbegriffe_kennwerte41

42 Häufigkeiten in SPSS Häufigkeiten – SPSS Ausgabe 02_grundbegriffe_kennwerte42

43 Häufigkeiten in SPSS Häufigkeiten – SPSS Ausgabe 02_grundbegriffe_kennwerte43 Bundesland HäufigkeitProzent Gültige Prozente Kumulierte Prozente GültigBaden-Württemberg 5354,156,4 Bayern 77,17,463,8 Hessen 88,28,572,3 Saarland 22,02,174,5 Nordrhein-Westfalen 77,17,481,9 Rheinland-Pfalz 33,13,285,1 Niedersachsen 33,13,288,3 Berlin 22,02,190,4 Thüringen 22,02,192,6 Mecklenburg-Vorpommern 22,02,194,7 Bremen 11,01,195,7 außerhalb Deutschlands 44,14,3100,0 Gesamt 9495,9100,0 Fehlend 44,1 Gesamt 98100,0

44 Kategorisierung Oft hat ein Merkmal zu viele Ausprägungen, um für jede einzelne die Häufigkeit anzugeben. In diesem Fall kann es sinnvoll sein, Kategorien zu bilden. Regeln für die Bildung von Kategorien: – Kategorien sind disjunkt (keine Überlappung) – Kategorien sind direkt benachbart (keine Lücken) – An den Rändern sind offene Kategorien erlaubt – Alle geschlossenen Kategorien sind gleich breit – Je größer eine Stichprobe, desto mehr und desto schmalere Kategorien werden gebildet, in der Regel nicht mehr als 20. – Faustregel für die Anzahl der Kategorien (Leonhard, 2004): Bei N Probanden: m = · log (N) Bei 20 Probanden: m = · log (20) = · Bei 100 Probanden: m = · log (100) = · Bei 1000 Probanden: m = · log (100) = · _grundbegriffe_kennwerte44

45 Kategorisierung 02_grundbegriffe_kennwerte45 Kenntnisse in der Statistik HäufigkeitProzent Gültige Prozente Kumulierte Prozente Gültig0 88, ,0 9,2 2 22,0 11,2 5 77,1 18, ,3 35, ,1 41, ,2 54, ,0 55, ,0 57, ,2 69, ,0 70, ,0 71, ,2 81, ,2 91, ,0 92, ,0 93, ,0 94, ,0 95, ,0 98, ,0 100,0 Gesamt 98100,0

46 Kategorisierung KategorieProzentKumuliert 0 x < % 10 x < % 41.80% 20 x < % 57.10% 30 x < % 71.40% 40 x < % 81.60% 50 x < % 92.90% 60 x 7.10% % 02_grundbegriffe_kennwerte46 Selbsteinschätzung der Statistikkenntnisse (Kategorisiert)

47 Maße der Zentralen Tendenz 02_grundbegriffe_kennwerte47 Maße der zentralen Tendenz geben an, wie ein Merkmal bei den meisten Mitgliedern einer Stichprobe bzw. in dieser Stichprobe im Durchschnitt ausgeprägt ist. Es gibt dafür unterschiedliche Maße der zentralen Tendenz – Modalwert (für alle Skalentypen) – Median (für mindestens ordinalskalierte Daten) – Mittelwert (für mindestens intervallskalierte Daten).

48 Der Modalwert 02_grundbegriffe_kennwerte48 Der Modalwert (Modus, Mo) ist derjenige Wert aus einer Verteilung, welcher am häufigsten besetzt ist. Es kann auch mehrere Modalwerte geben. – SPSS gibt dann nur den kleinsten Wert aus. Bei kategorisierten Daten wird die Mitte der am häufigsten besetzten Kategorie angegeben. Die Angabe des Modalwertes ist besonders bei nominalskalierten Daten sinnvoll.

49 Der Modalwert 02_grundbegriffe_kennwerte49 KategorieProzent 0 x < % 10 x < % 20 x < % 30 x < % 40 x < % 50 x < % 60 x 7.10% Beispiele: Wert Häufigkeit

50 Der Modalwert in SPSS 02_grundbegriffe_kennwerte50 Den Modalwert über das Menu berechnen Analysieren > Deskriptive Statistiken > Häufigkeiten… Auswahl Statistiken … Auswahl Modalwert

51 Der Modalwert in SPSS 02_grundbegriffe_kennwerte51 Den Modalwert über den Syntax berechnen Ergänzende Unterbefehle in der Syntax werden immer mit einem / eingeleitet. Ganz am Ende des Kommandos steht ein Punkt. /format notable unterdrückt die normale Häufigkeitstabelle /statistics modus gibt den Modalwert aus. frequencies age /format notable /statistics modus.

52 Der Modalwert in SPSS 02_grundbegriffe_kennwerte52 Modalwert – SPSS Ausgabe

53 Der Median 02_grundbegriffe_kennwerte53 Der Median Der Median (Md) ist derjenige Wert, der die geordnete Reihe der Messwerte in die oberen und die unteren 50 Prozent aufteilt. Somit ist die Anzahl der Messwerte über und unter dem Median gleich. Man benötigt ordinalskalierte Daten, um eine geordnete Reihe bilden zu können.

54 Der Median 02_grundbegriffe_kennwerte54 Der Median – Berechnung Für ungerade N nimmt man den Wert in der Mitte der geordneten Liste: – Liste: 20, 21, 23, 27, 35 – Md = 23 – Allgemein: Für gerade N nimmt man den Mittelwert der beiden in der Mitte stehenden Werte: – Liste: 20, 21, 23, 27, 35, 36 – Md = (23+27) / 2 = 25 – Allgemein:

55 Der Median 02_grundbegriffe_kennwerte55 Beispiel:

56 Der Median in SPSS 02_grundbegriffe_kennwerte56 Den Median über das Menu berechnen Analysieren > Deskriptive Statistiken > Häufigkeiten Auswahl Statistiken … Auswahl Median

57 Der Median in SPSS 02_grundbegriffe_kennwerte57 Den Median über den Syntax berechnen Ergänzende Unterbefehle in der Syntax werden immer mit einem / eingeleitet. Ganz am Ende des Kommandos steht ein Punkt. /format notable unterdrückt die normale Häufigkeitstabelle /statistics median gibt den Median aus. Man kann auch Kennwerte kombinieren: – /statistics median, modus. frequencies age /format notable /statistics median.

58 Der Median in SPSS 02_grundbegriffe_kennwerte58 Median – SPSS Ausgabe

59 Der Median Der Median bei kategorisierten Daten Bei kategorisierten Daten wird berücksichtigt, wie viel Prozent der Stichprobe oberhalb und unterhalb der Kategorie mit dem Median liegen. Berechnung: – uG: Untere Grenze der Kategorie, in der der Median liegt. – KBBreite der Kategorie – f k Häufigkeit in der Kategorie k, in der der Median liegt – cum f k-1 :kumulierte Häufigkeit der Kategorie k-1, d.h. die Summe der Häufigkeiten aller Kategorien unter dem Median. 02_grundbegriffe_kennwerte59

60 Der Median Berechnung 02_grundbegriffe_kennwerte60 Kategoriefcum f 0 x < x < x < x < x < x < x 7 100

61 Das arithmetische Mittel 02_grundbegriffe_kennwerte61 Das arithmetische Mittel Der arithmetische Mittel (Mittelwert, Durchschnitt, ) ist das häufigste Maß der zentralen Tendenz. Das arithmetische Mittel darf nur für intervallskalierte Daten berechnet werden.

62 Das arithmetische Mittel 02_grundbegriffe_kennwerte62 Das arithmetische Mittel – Berechnung Das arithmetische Mittel ist die Summe aller Messwerte geteilt durch deren Anzahl N. Zum Rechnen mit dem Summenzeichen siehe auch Leonhart (2004, S. 421f)

63 Das arithmetische Mittel 02_grundbegriffe_kennwerte63 Beispiel: Vplot

64 Das arithmetische Mittel in SPSS 02_grundbegriffe_kennwerte64 Das arithmetische Mittel über das Menu berechnen Analysieren > Deskriptive Statistiken > Deskriptive Statistik… Variable auswählen OK

65 Das arithmetische Mittel in SPSS 02_grundbegriffe_kennwerte65 Das arithmetische Mittel über den Syntax berechnen oder descriptives lot. descriptives lot /statistic mean. descriptives age, lot, stat_k /statistic mean. frequency age, lot, stat_k /format notable /statistic mean.

66 Das arithmetische Mittel in SPSS 02_grundbegriffe_kennwerte66 Das arithmetische Mittel– SPSS Ausgabe descriptives age, stat_k, lot /statistic mean. frequency age, stat_k, lot /format notable /statistic mean.

67 Vergleich der Maße der Zentralen Tendenz 02_grundbegriffe_kennwerte67 frequencies age, freiburg /format notable /statistics modus median mean. Alter: Mittelwert > Median > Modus Einstellung zu Freiburg: Modus > Median > Mittelwert Warum?

68 Vergleich der Maße der Zentralen Tendenz 02_grundbegriffe_kennwerte68

69 Vergleich der Maße der Zentralen Tendenz 02_grundbegriffe_kennwerte69

70 Das gewichtete arithmetische Mittel (GAM) 02_grundbegriffe_kennwerte70 Das gewichtete arithmetische Mittel (GAM) Problem: Wie berechnet man das arithmetische Mittel, wenn man nur Mittelwerte aus verschiedenen Gruppen kennt? Beispiel: Die Studienmotivation von Psychologiestudierenden des 1.Semesters soll bestimmt werden. Ein Fragebogen wird in den drei Tutorien vorgegeben. Die Tutorinnen melden folgende Ergebnisse zurück: – Gruppe 1: M = 12 – Gruppe 2: M = 10 – Gruppe 3: M = 8 Wichtig: Die Gruppengrößen müssen beachtet werden!

71 Das gewichtete arithmetische Mittel (GAM) 02_grundbegriffe_kennwerte71 Berechnung: Gruppe 1: M=12; N=50 Gruppe 2: M=10; N=20; Gruppe 3: M=8; N=10;

72 Zusammenfassung: Maße der zentralen Tendenz 02_grundbegriffe_kennwerte72 Eine einfache Form der Zusammenfassung ist die Darstellung der Häufigkeiten oder Prozente. Der Modalwert ist der Wert einer Verteilung, der am häufigsten vorkommt. Der Median ist der Wert, der eine Stichprobe in die oberen 50% und unteren 50% aufteilt. Der Mittelwert ist die Summe aller Werte geteilt durch die Anzahl der Werte. Die Maße der zentralen Tendenz lassen auch Rückschlüsse auf die Verteilungsform zu. Sollen Mittelwerte aus Mittelwerten berechnet werden, müssen die Gruppengrößen berücksichtigt werden (GAM).

73 Maße der Dispersion Die Maße der zentralen Tendenz geben Auskunft über die Mitte einer Verteilung. Maße der Dispersion beziehen sie dagegen auf die Variabilität einer Verteilung, d.h. darauf, wie sehr sich die Werte unterscheiden. Beispiel: Schulnoten in zwei Klassen – Gruppe 1: 3, 3, 3, 3, 3, 3, 3 – Gruppe 2: 1, 2, 3, 3, 3, 4, 5 – Modalwert (=3), Median (=3) und Mittelwert (=3) unterscheiden nicht zwischen beiden Gruppen! – Dennoch gibt es natürlich Unterschiede zwischen den Verteilungen. 02_grundbegriffe_kennwerte73

74 Maße der Dispersion Maße der Dispersion: Spannweite Interquartilabstand Varianz Standardabweichung Schiefe, Exzess 02_grundbegriffe_kennwerte74

75 Spannweite (Range) Die Spannweite wird auch als Variationsbreite oder Range bezeichnet. Unterschiedliche Definitionen für kontinuierliche und diskrete Variablen: – Für kontinuierliche Variablen: Range = maximaler Wert – minimaler Wert. – Für diskrete Variablen: Range = maximaler Wert – minimaler Wert +1 (bzw.: Range = Anzahl der Kategorien) Bewertung – Eher geringe Aussagekraft über die Verteilung, da nur 2 Werte berücksichtigt werden (der Kleinste und der Größte) – Hohe Empfindlichkeit gegenüber Ausreißerwerten. 02_grundbegriffe_kennwerte75

76 Spannweite (Range) Beispiel: Wie groß ist der Range? 02_grundbegriffe_kennwerte76 MinimumMaximumRange Geschlecht122 Alter Bundesland111 Kenntnisse Freiburg59085

77 Spannweite (Range) In SPSS kann der Range über den Befehl Häufigkeiten ausgegeben werden. – Anwählen: Statistiken > Spannweite Syntax: Achtung: SPSS verwendet immer die Formel für kontinuierliche Variablen! 02_grundbegriffe_kennwerte77 frequency age, stat_k, lot /format notable /statistic range.

78 Interquartilabstand Als Quartilgrenzen werden die drei Punkte einer Verteilung bezeichnet, welche die geordnete Liste von Werten in vier Bereiche mit jeweils 25% der Stichprobe einteilen. – 25% (1. QG) 25% (2. QG) 25% (3. QG) 25% Die 2. Quartilgrenze entspricht damit dem Median Beispiel: In einem Assessment-Center erhalten die 12 Teilnehmer folgende Gesamtbeurteilungen (Max. 50 Punkte möglich): – 24, 28, 30, 31, 34, 35, 36, 37, 37, 41, 42, 43 02_grundbegriffe_kennwerte78 Q 1 =30.5 Q 2 =35.5 Q 3 =39

79 Interquartilabstand Der Abstand zwischen dem 1. und dem 3. Quartil wird als Interquartilabstand bezeichnet. Es ist ein Maß für den Kernbereich einer Verteilung. Im Interquartilbereich liegen 50% der Stichprobe. Berechnung: IQA = Q3 – Q1 – IQA = 39 – 30.5 = 8.5 Vorteil: Der IQA ist weniger anfällig gegenüber Ausreißern als die Spannweite. Voraussetzung für die Bildung von Quartilen ist ein Ordinal- skalenniveau. 02_grundbegriffe_kennwerte79

80 Interquartilabstand In SPSS kann man sich die Quartilgrenzen mit dem Befehl Häufigkeiten ausgeben lassen: Im Menu Analysieren > Deskriptive Statistiken > Häufigkeiten aufrufen. Dann unter Statistiken Quartile auswählen. 02_grundbegriffe_kennwerte80

81 In der Syntax: Perzentile sind hundertstel der Verteilung 25 Hundertstel entsprechen 1 Viertel – 1. Qurtil = Perzentil 25 – 2. Quartil = Perzentil 50 – 3. Quartil = Perzentil 75 Interquartilabstand 02_grundbegriffe_kennwerte81 frequency age, stat_k, lot /format notable /percentiles 25, 50, 75.

82 SPSS Ausgabe: IQA = 26.5 – 20.0 = 6.5 Interquartilabstand 02_grundbegriffe_kennwerte82

83 Zentrale Momente Als zentrales Moment wird der Abstand der Messwerte vom Mittelwert bezeichnet. Dabei unterscheidet man verschiedene Ordnungen: – Zentrales Moment 1. Ordnung: – Zentrales Moment 2. Ordnung: Varianz – Zentrales Moment 3. Ordnung: Schiefe – Zentrales Moment 4. Ordnung: Exzess 02_grundbegriffe_kennwerte83

84 Varianz Das wichtigste Maß für die Dispersion ist die Varianz. Bei der Berechnung der Varianz wird jeder einzelne Wert berücksichtigt. Die Varianz gibt an, wie weit jede individuelle Merkmals- ausprägung vom Mittelwert der Verteilung entfernt ist. Dabei wird die Summe des zentralen Moments 2. Ordnung über alle Probanden einer Stichprobe durch die Anzahl der Probanden dividiert: Voraussetzung für die Berechnung der Varianz ist Intervallskalenniveau. 02_grundbegriffe_kennwerte84

85 Varianz Beispiel: Berechnung der Varianz für folgende Variable: 02_grundbegriffe_kennwerte85 Vpx x-M(x-M)² Berechnen Sie den Mittelwert 2.Bilden Sie für jede Merkmalsausprägung die Differenz zum Mittelwert 3.Quadrieren Sie die Differenzen 4.Bilden Sie die Summe 5.Teilen Sie die Summe durch N

86 Varianz Varianz in der Stichprobe und in der Population Die Formel für die Varianz, die wir bisher kennengelernt haben, gilt für die Berechnung der Varianz in einer Stichprobe. In aller Regel will man etwas über die Varianz eines Merkmals in der gesamten Population erfahren. Die Varianz ist aber kein erwartungstreuer Schätzer, d.h. wenn man viele Stichproben untersucht, dann entspricht der Mittelwert der Varianzen dieser Stichproben nicht der Varianz der gesamten Population. Die Stichprobenvarianz unterschätzt die Populationsvarianz. Diese Abweichung ist umso stärker, je kleiner die Stichprobe ist. 02_grundbegriffe_kennwerte86

87 Varianz Varianz in der Population Die Formel für die Populationsvarianz korrigiert die Unterschätzung der Varianz in der Stichprobe: Unterschiede zu der Formel für s²: – Wir verwenden nun ein griechisches Sigma (statt s), um zu verdeutlichen, dass wir uns auf die Population beziehen. – Das ^ wird verwendet, um zu zeigen, dass die Populationsvarianz nur geschätzt werden kann. – Im Nenner steht N-1 (statt N). Dadurch wird das Ergebnis der Formel etwas größer. 02_grundbegriffe_kennwerte87

88 Varianz Zurück zum Beispiel: Stichprobenvarianz: Populationsschätzer: 02_grundbegriffe_kennwerte88

89 Standardabweichung Die Varianz ist durch die Bildung der Quadrate schwer zu interpretieren. Daher wird aus ihr oft die Standardabweichung berechnet, indem wieder die Quadratwurzel aus der Varianz gezogen wird. Voraussetzung für die Berechnung der Standardabweichung ist wiederum Intervallskalenniveau. 02_grundbegriffe_kennwerte89

90 Standardabweichung In der Stichprobe: Populationsschätzer: 02_grundbegriffe_kennwerte90

91 Schiefe Zusätzliche Information über die Form einer Verteilung liefert die Schiefe. Man unterscheidet 02_grundbegriffe_kennwerte91

92 Schiefe Die Schiefe wird aus dem zentralen Moment 3. Ordnung berechnet: Es gilt dabei: – a 3 <0 rechtssteile Verteilung – a 3 =0 symmetrische Verteilung – a 3 >0 linkssteile Verteilung 02_grundbegriffe_kennwerte92

93 Exzess (Kurtosis) Weitere Information über die Form einer Verteilung liefert der Exzess (Kurtosis). Man unterscheidet 02_grundbegriffe_kennwerte93

94 Exzess (Kurtosis) Der Exzess wird aus dem zentralen Moment 4. Ordnung berechnet: Es gilt dabei: – a 4 <0 breitgipflige Verteilung – a 4 =0 Normalverteilung – a 4 >0 schmalgipflige Verteilung 02_grundbegriffe_kennwerte94

95 Kennwerte in SPSS Varianz, Standardabweichung, Schiefe und Exzess können in SPSS über die Befehle Häufigkeiten oder Deskriptive Statistiken berechnet werden. Syntax für den Befehl Häufigkeiten: 02_grundbegriffe_kennwerte95 frequencies freiburg psycho stat /format notable /statistic mean variance stddev skewness kurtosis. frequencies freiburg_k psycho_k stat_k /format notable /statistic mean variance stddev skewness kurtosis.

96 Kennwerte in SPSS SPSS Ausgabe: 02_grundbegriffe_kennwerte96

97 Kennwerte und Skalenniveaus 02_grundbegriffe_kennwerte97 MaßSkalenniveau mindestens: Häufigkeit / ProzenteNominal ModalwertNominal MedianOrdinal QuartileOrdinal Arithmetisches MittelIntervall VarianzIntervall StandardabweichungIntervall SchiefeIntervall ExzessIntervall

98 Zusammenfassung Dispersionsmaße 02_grundbegriffe_kennwerte98 Wichtige Maße der Dispersion sind der Range, der Interquartilabstand, die Varianz und die Standardabweichung. Bei Varianz und Standardabweichung muss beachtet werden, ob ein Maß für die Stichprobe oder für eine Population berechnet wird. Weiteren Aufschluss über die exakte Verteilungsform liefern die Schiefe und der Exzess. Bei der Berechnung statistischer Kennwerte muss beachtet werden, ob das entsprechende Skalenniveau gegeben ist.


Herunterladen ppt "Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte1 Gliederung Deskriptive Statistik Grundbegriffe – Merkmale – Variable – Operationalisierung – Skalenniveaus."

Ähnliche Präsentationen


Google-Anzeigen