Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistik Statistik I Seminar + Blockveranstaltung Statistik I

Ähnliche Präsentationen


Präsentation zum Thema: "Statistik Statistik I Seminar + Blockveranstaltung Statistik I"—  Präsentation transkript:

1 Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Wintersemester 2004/2005 Statistik Statistik I Seminar + Blockveranstaltung

2 Statistik Thema Inhalt Sitzung Einführung Skalen, Häufigkeiten,
Statistik I Wintersemester 2004/2005 Statistik Sitzung Thema Inhalt (1) Einführung  Formalia / Bekanntgabe des Seminarplans  Begriffe: deskriptive bzw. inferente Statistik; Grundgesamtheit, Stichprobe  Gütekriterien quantitativer empirischer Untersuchungen: Validität, Reliabilität, Repräsentativität Ablaufschema empirischer Erhebungen Variablen, Variablenwerte (Ausprägungen) diskrete (= endliche) und stetige (= reelle Zahlen) Variablen (2) Skalen, Häufigkeiten, Lageparameter Skalen / Messniveaus; zulässige mathematische Operationen: Umwandlung von Skalenniveaus: Dichotomien; Dichotomisierung von Variablen  Verteilungen: Uni- bzw. bimodale Verteilungen, Symetrie / Schiefe  Lageparameter: Modus, Median / Quantile, arithmetisches Mittel (3) Methodische Grundlagen  Grundlagen standardisierter Befragungen  Range (Spannweite); Quartilsabstand  mittlere Abweichung; Varianz / Standardabweichung (-) (4) SPSS  Einführung in die Programmstruktur von SPSS  Codierung von Variablen und Items in SPSS  Darstellung in Diagrammen (6) Zusammen-hangsmaße I  Zusammenhangsmaße metrischer Daten: Pearson’s r  Zusammenhangsmaße dichotomer Daten; Cramer’s v (7) Zusammen-hangsmaße II  Zusammenhangsmaße ordinalskalierter Daten  Zusammenhangsmaße nominalskalierter Daten  Erwartungswerte: ² Test / auf ² basierende Zusammenhangsmaße (8) Arbeiten mit SPSS  Klassifizierung mit SPSS  Diagrammdarstellung mit SPSS  Lage- und Streuungsmaße mit SPSS  Zusammenhangsmaße mit SPSS (9)  Kennwert raum-zeitlicher Veränderung / Lokalisationskoeffizient  Datenimport in SPSS  Datenexport aus SPSS / Darstellungen mit Excel und ArcView

3 Statistik Thema Inhalt Sitzung Standardisierung Korrelation
Statistik I Wintersemester 2004/2005 Statistik Sitzung Thema Inhalt (5) Standardisierung Korrelation  Standardisierung von Variablen (Z-Transformation) / Skaleneffekte  Berechnung von statistischen Zusammenhangen metrischer Variablen: Produkt- Moment-Korrelationskoeffizient (Pearson’s r) (6) Arbeiten mit SPSS  Lage- und Streuungsmaße mit SPSS  Diagrammdarstellung mit SPSS  Zusammenhangsmaße mit SPSS (7)  Arbeiten mit klassifizierten Daten; Gewichtung  Variablenberechnung  Interpretation von Zusammenhängen (8) Zusammen-hangsmaße II  Wiederholung  Typen von Zusammenhängen  Erwartungswerte: ² Test / auf ² basierende Zusammenhangsmaße  Zusammenhangsmaße für nicht metrisch skalierte Variablen (Kontingenzkoeffizient)

4 Korrelationen Korrelationsanalyse / Wiederholung + –
Statistik I Wintersemester 2004/2005 Korrelationen Korrelationsanalyse / Wiederholung Messen der Stärke eines statistischen Zusammenhangs zwischen zwei Variablen Korrelationskoeffizienten geben in einem Wertebereich zwischen 0 und 1 diese Stärke an: < 0,2 sehr geringe Korrelation 0,2 – 0,5 geringe Korrelation 0,5 – 0.7 mittlere Korrelation 0,7 – 0,9 hohe Korrelation > 0,9 sehr hohe Korrelation Korrelationskoeffizienten für rangskalierte und metrische Variablen geben zusätzlich Auskunft über die Richtung des statistischen Zusammenhangs (Vorzeichen): +

5 Typen Zusammenhänge Typen statistischer Zusammenhänge
Statistik I Wintersemester 2004/2005 Typen Zusammenhänge Typen statistischer Zusammenhänge Y X einfacher einseitiger Zusammenhang: einfache lineare Regression  Verdunstung (Y) hängt von der Lufttemperatur (X) ab Y X einfacher wechselseitiger Zusammenhang: Korrelation  Verdunstung (Y) hängt von der Lufttemperatur (X) ab, umgekehrt hängt die Lufttemperatur auch von der Verdunstung ab (vgl. Verdunstungskälte) Y X2 mehrfacher einseitiger Zusammenhang: multiple lineare Regression  Verdunstung (Y) hängt von der Lufttemperatur (X1), Albedo (X2) und Luftfeuchte (X3) ab X1 X3 Y X2 mehrfacher mehrschichtiger Zusammenhang: Pfadanalyse  Verdunstung (Y) hängt von der Lufttemperatur (X1), Albedo (X2) und Luftfeuchte (X3) ab, Lufttemperatur (X1) und Albedo (X2) hängen zudem von der Sonneneinstrahlung (X4) ab X1 X3 X4 ? Z Y X vermeintlicher Zusammenhang (Scheinkorrelation): Partielle Korrelation  Beispiel: In einer polnischen Studie konnte nachgewiesen werden, dass die Geburtenraten (Y) statistisch abhängig von der Anzahl der vor Ort brütenden Störche (X) ist. Tatsächlich hängen beide Variablen aber von der Bevölkerungsdichte (Z) ab

6 Statistik I Wintersemester 2004/2005 Übersicht -> r Übersicht über die gängigen Korrelationskoeffizienten Skalenniveau Zusammenhangsmaß (Wertebereich) Richtung des Zusammenhangs Nominal [ = ; ≠ ] Kontingenzkoeffizient (0 <= C <= 1) nein Ordinal [ = ; ≠ ; > ; < ] Korrelationskoeffizient Spearman/ Korrelationskoeffizient Kendall (-1 <= rs <= +1) ja Metrisch (nicht-linear, nicht normalverteilt) [ = ; ≠ ; > ; < ; + ; - ; *; / ] Metrisch (linear, normalverteilt) [ = ; ≠ ; > ; < ; + ; - ; * ; / ] Korrelationskoeffizient Pearson (-1 <= r <= +1)

7 Pearson Pearson-Korrelationskoeffizient r – Streudiagramm
Statistik I Wintersemester 2004/2005 Pearson Pearson-Korrelationskoeffizient r – Streudiagramm Formel zur Berechnung von r auf der Basis standardisierter (z-transformierter) Werte: Voraussetzungen für die Anwendung: der Zusammenhang zwischen den eingehenden Variablen muss i.w.S. linear sein und die Variablen müssen jeweils hinreichend normalverteilt sein Darstellung: mit zunehmendem Anteil an Einpersonenhaushalten je Stadtteil nehmen tendenziell auch die Stimmenanteile für die Grünen zu (“+”-Richtung)

8 Statistik I Wintersemester 2004/2005 Übersicht -> c Übersicht über die gängigen Korrelationskoeffizienten Skalenniveau Zusammenhangsmaß (Wertebereich) Richtung des Zusammenhangs Nominal [ = ; ≠ ] Kontingenzkoeffizient (0 <= C <= 1) nein Ordinal [ = ; ≠ ; > ; < ] Korrelationskoeffizient Spearman/ Korrelationskoeffizient Kendall (-1 <= rs <= +1) ja Metrisch (nicht-linear, nicht normalverteilt) [ = ; ≠ ; > ; < ; + ; - ; *; / ] Metrisch (linear, normalverteilt) [ = ; ≠ ; > ; < ; + ; - ; * ; / ] Korrelationskoeffizient Pearson (-1 <= r <= +1)

9 Beispiel c Kontingenzkoeffizient C – Kreuztabelle
Statistik I Wintersemester 2004/2005 Beispiel c Kontingenzkoeffizient C – Kreuztabelle Stadteile mit geringem Anteil an Einpersonenhaushalten weisen überwiegend geringe Stimmenanteile für die Grünen auf Stadtteile mit mittlerem Anteil an Einpersonenhaushalten weisen überwiegend mittlere Stimmenanteile für die Grünen auf Stadtteile mit hohem Anteil an Einpersonenhaushalten weisen überwiegend hohe Stimmenanteile für die Grünen auf  Offenkundig ist ein statistischer Zusammenhang zwischen den Variablen vorhanden

10 Erwartungswerte Kontingenzkoeffizient C – Erwartungswerte berechnen 24
Statistik I Wintersemester 2004/2005 Erwartungswerte Kontingenzkoeffizient C – Erwartungswerte berechnen 24 24 / 98 Erwartungswerte THik basieren auf der Hypothese, dass zwischen den Variablen kein statistischer Zusammenhang besteht  Erwartungswerte pro Tabellenfeld stellen für diesen Fall die theoretisch zu erwartende Besetzungshäufigkeit dar Exemplarisches Berechungsbeispiel: • ( ) = 5,877 Allgemeine Berechnung: Summe Zeile i • (Summe Spalte k / n) = THik

11 Chi-Quadrat Kontingenzkoeffizient C – Chi-Quadrat (χ2) berechnen
Statistik I Wintersemester 2004/2005 Chi-Quadrat Kontingenzkoeffizient C – Chi-Quadrat (χ2) berechnen Chi-Quadrat stellt eine Prüfgröße dar, die als Summe der quadratischen Abweichungen der Beobachtungswerte Hik von den Erwartungswerten THik je Tabellenfeld definiert wird: Exemplarisches Berechnungsbeispiel: χ2 = ((10 – 5,9)2 / 5,9) + ((6 – 6,1)2 / 6,1) ((5 – 6,1)2 / 6,1) + ((3 – 5,9)2 / 5,9) + … + ((19 – 5,9)2 / 5,9) = 64,52

12 Kontingenzkoeffizient
Statistik I Wintersemester 2004/2005 Kontingenzkoeffizient Kontingenzkoeffizient C Berechnung des Kontingenzkoeffizienten C mit Hilfe von χ2: Der Kontingenzkoeffizient erlaubt nur Aussagen über die Stärke eines statistischen Zusammenhangs, nicht aber über die Richtung dieses Zusammenhangs  Durch den Einsatz der Korrelationskoeffizienten nach Spearman oder Kendall für rang- skalierte Variablen sind im vorliegenden Fall auch Aussagen über die Richtung möglich

13 Redskins Football-Niederlage der Redskins als gutes Omen für Kerry
Statistik I Wintersemester 2004/2005 Redskins Montag 1. November 2004, 01:43 Uhr Football-Niederlage der Redskins als gutes Omen für Kerry Landover/USA (AP) Wenn es nach den amerikanischen Football-Ergebnissen geht, hat George W. Bush die Präsidentschaftswahl schon so gut wie verloren. In dem mit Spannung erwarteten Spiel der Washington Redskins gegen die Green Bay Packers musste der Klub am Sonntag eine 14:28-Niederlage hinnehmen. Wenn die Redskins ihr letztes Heimspiel vor der Wahl verloren haben, hat seit 68 Jahren jedes Mal der Herausforderer gewonnen. Umgekehrt konnte die Partei des amtierenden Präsidenten die Wahl nur dann für sich entscheiden, wenn die Redskins erfolgreich waren. So war es schon bei der Wiederwahl von Franklin Roosevelt im Jahr drei Jahre zuvor waren die Redskins aus den Boston Braves hervorgegangen. Im Jahr 2000 gewannen die Redskins ihr letztes Heimspiel vor der Wahl - danach löste der Republikaner Bush den Demokraten Bill Clinton ab. «Oh ja, er wird gewinnen», sagte Kerry-Anhänger Darren Sharper von den Green Bay Packers. «Das ist garantiert. Ich muss jetzt nicht mehr wählen gehen. Das hat mir am Dienstag einen Weg gespart.» Während der Football somit eine klare Wahlaussage getroffen hat, sieht das beim Baseball ganz anders aus. Hier stehen die gerade gekürten Meister, die Red Sox aus Kerrys Heimatstaat Massachusetts im Blickpunkt. Klub-Eigentümer John Henry und Tom Werner sowie Manager Theo Epstein haben sich im Wahlkampf auf die Seite des Demokraten gestellt und traten sogar bei einer Kundgebung mit Kerry auf. Doch der wichtigste Mann der Verteidigung bei den Red Sox, der «Pitcher» (Werfer) Curt Schilling, wirbt für Bush. Teamsprecher Charles Steinberg bemüht sich um Schadensbegrenzung: «Wir sind große Unterstützer der Meinungsfreiheit.» Gerüchte, wonach die Klub-Leitung auf Schilling einwirken wollte, seien in keiner Weise zutreffend.

14 Redskins / Werterwartung
Statistik I Wintersemester 2004/2005 Redskins / Werterwartung Statistische und sachliche Zusammenhänge Football-Niederlage der Redskins als gutes Omen für Kerry ( ) Landover/USA (AP) Wenn es nach den amerikanischen Football-Ergebnissen geht, hat George W. Bush die Präsidentschaftswahl schon so gut wie verloren. In dem mit Spannung erwarteten Spiel der Washington Redskins gegen die Green Bay Packers musste der Klub am Sonntag eine 14:28-Niederlage hinnehmen. Wenn die Redskins ihr letztes Heimspiel vor der Wahl verloren haben, hat seit 68 Jahren jedes Mal der Herausforderer gewonnen. Umgekehrt konnte die Partei des amtierenden Präsidenten die Wahl nur dann für sich entscheiden, wenn die Redskins erfolgreich waren. So war es schon bei der Wiederwahl von Franklin Roosevelt im Jahr drei Jahre zuvor waren die Redskins aus den Boston Braves hervorgegangen.  Trotz Heimniederlage der Redskins hat John Kerry die Wahl verloren  Es besteht ein hoher statistischer, allerdings zweifelhafter sachlicher Zusammenhang, die Wahrscheinlichkeit eines statistischen Zufalls ist sehr hoch

15 Statistik Korrelationskoeffizienten - Berechnung mit Hilfe von SPSS
Statistik I Wintersemester 2004/2005 Statistik Korrelationskoeffizienten - Berechnung mit Hilfe von SPSS Kontingenzkoeffizient c Erzeugung einer Kreuztabelle mit Beobachtungs- und Erwartungswerten Berechnung des Koeffizienten: “Analysieren – Deskriptive Statistiken – Kreuztabellen (Statistik …)” Pearson-Korrelationskoeffizient r Z-Transformation (Standardisierung) der eingehenden Variablen und Anwendung der Berechnungsformel Berechnung des Koeffizienten: “Analysieren – Korrelation – Bivariat …” Spearman-Korrelationskoeffizient r / Kendall-tau Berechnung der Koeffizienten: “Analysieren – Korrelation – Bivariat …”  Kendall-tau weist hohe Stabilität bei Ausreißerwerten auf!


Herunterladen ppt "Statistik Statistik I Seminar + Blockveranstaltung Statistik I"

Ähnliche Präsentationen


Google-Anzeigen