Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistik I Wintersemester 2004/2005 Statistik Statistik I Seminar + Blockveranstaltung.

Ähnliche Präsentationen


Präsentation zum Thema: "Statistik I Wintersemester 2004/2005 Statistik Statistik I Seminar + Blockveranstaltung."—  Präsentation transkript:

1 Statistik I Wintersemester 2004/2005 Statistik Statistik I Seminar + Blockveranstaltung

2 Statistik I Wintersemester 2004/2005 Statistik Sitzung Thema Inhalt (1) Einführung Formalia / Bekanntgabe des Seminarplans Begriffe: deskriptive bzw. inferente Statistik; Grundgesamtheit, Stichprobe Gütekriterien quantitativer empirischer Untersuchungen: Validität, Reliabilität, Repräsentativität Ablaufschema empirischer Erhebungen Variablen, Variablenwerte (Ausprägungen) diskrete (= endliche) und stetige (= reelle Zahlen) Variablen (2) Skalen, Häufigkeiten, Lageparameter Skalen / Messniveaus; zulässige mathematische Operationen: Umwandlung von Skalenniveaus: Dichotomien; Dichotomisierung von Variablen Verteilungen: Uni- bzw. bimodale Verteilungen, Symetrie / Schiefe Lageparameter: Modus, Median / Quantile, arithmetisches Mittel (3) Methodische Grundlagen Grundlagen standardisierter Befragungen Range (Spannweite); Quartilsabstand mittlere Abweichung; Varianz / Standardabweichung (-) (4) Einführung SPSS Einführung in die Programmstruktur von SPSS Codierung von Variablen und Items in SPSS Darstellung in Diagrammen (6) Zusammen-hangsmaße I Zusammenhangsmaße metrischer Daten: Pearsons r Zusammenhangsmaße dichotomer Daten; Cramers v (7) Zusammen-hangsmaße II Zusammenhangsmaße ordinalskalierter Daten Zusammenhangsmaße nominalskalierter Daten Erwartungswerte: ² Test / auf ² basierende Zusammenhangsmaße (8) Arbeiten mit SPSS Klassifizierung mit SPSS Diagrammdarstellung mit SPSS Lage- und Streuungsmaße mit SPSS Zusammenhangsmaße mit SPSS (9) Arbeiten mit SPSS Kennwert raum-zeitlicher Veränderung / Lokalisationskoeffizient Datenimport in SPSS Datenexport aus SPSS / Darstellungen mit Excel und ArcView

3 Statistik I Wintersemester 2004/2005 Statistik Sitzung Thema Inhalt (5) Standardisierung Korrelation Standardisierung von Variablen (Z-Transformation) / Skaleneffekte Berechnung von statistischen Zusammenhangen metrischer Variablen: Produkt- Moment-Korrelationskoeffizient (Pearsons r) (6) Arbeiten mit SPSS Lage- und Streuungsmaße mit SPSS Diagrammdarstellung mit SPSS Zusammenhangsmaße mit SPSS (7) Arbeiten mit SPSS Arbeiten mit klassifizierten Daten; Gewichtung Variablenberechnung Interpretation von Zusammenhängen (8) Zusammen- hangsmaße II Wiederholung Typen von Zusammenhängen Erwartungswerte: ² Test / auf ² basierende Zusammenhangsmaße Zusammenhangsmaße für nicht metrisch skalierte Variablen (Kontingenzkoeffizient)

4 Statistik I Wintersemester 2004/2005 Korrelationen Korrelationsanalyse / Wiederholung Messen der Stärke eines statistischen Zusammenhangs zwischen zwei Variablen Korrelationskoeffizienten geben in einem Wertebereich zwischen 0 und 1 diese Stärke an: < 0,2sehr geringe Korrelation 0,2 – 0,5geringe Korrelation 0,5 – 0.7mittlere Korrelation 0,7 – 0,9hohe Korrelation > 0,9sehr hohe Korrelation Korrelationskoeffizienten für rangskalierte und metrische Variablen geben zusätzlich Auskunft über die Richtung des statistischen Zusammenhangs (Vorzeichen): +–

5 Statistik I Wintersemester 2004/2005 Typen Zusammenhänge Typen statistischer Zusammenhänge Y X einfacher einseitiger Zusammenhang: einfache lineare Regression Verdunstung (Y) hängt von der Lufttemperatur (X) ab Y X einfacher wechselseitiger Zusammenhang: Korrelation Verdunstung (Y) hängt von der Lufttemperatur (X) ab, umgekehrt hängt die Lufttemperatur auch von der Verdunstung ab (vgl. Verdunstungskälte) Y X 2 mehrfacher einseitiger Zusammenhang: multiple lineare Regression Verdunstung (Y) hängt von der Lufttemperatur (X 1 ), Albedo (X 2 ) und Luftfeuchte (X 3 ) ab X1X1 X3X3 Y X 2 mehrfacher mehrschichtiger Zusammenhang: Pfadanalyse Verdunstung (Y) hängt von der Lufttemperatur (X 1 ), Albedo (X 2 ) und Luftfeuchte (X 3 ) ab, Lufttemperatur (X 1 ) und Albedo (X 2 ) hängen zudem von der Sonneneinstrahlung (X 4 ) ab X1X1 X3X3 X4X4 ?Z?Z Y X vermeintlicher Zusammenhang (Scheinkorrelation): Partielle Korrelation Beispiel: In einer polnischen Studie konnte nachgewiesen werden, dass die Geburtenraten (Y) statistisch abhängig von der Anzahl der vor Ort brütenden Störche (X) ist. Tatsächlich hängen beide Variablen aber von der Bevölkerungsdichte (Z) ab

6 Statistik I Wintersemester 2004/2005 Übersicht -> r Übersicht über die gängigen Korrelationskoeffizienten SkalenniveauZusammenhangsmaß (Wertebereich) Richtung des Zusammenhangs Nominal [ = ; ] Kontingenzkoeffizient (0 <= C <= 1) nein Ordinal [ = ; ; > ; < ] Korrelationskoeffizient Spearman/ Korrelationskoeffizient Kendall (-1 <= r s <= +1) ja Metrisch (nicht-linear, nicht normalverteilt) [ = ; ; > ; < ; + ; - ; *; / ] Korrelationskoeffizient Spearman/ Korrelationskoeffizient Kendall (-1 <= r s <= +1) ja Metrisch (linear, normalverteilt) [ = ; ; > ; < ; + ; - ; * ; / ] Korrelationskoeffizient Pearson (-1 <= r <= +1) ja

7 Statistik I Wintersemester 2004/2005 Pearson Pearson-Korrelationskoeffizient r – Streudiagramm Voraussetzungen für die Anwendung: der Zusammenhang zwischen den eingehenden Variablen muss i.w.S. linear sein und die Variablen müssen jeweils hinreichend normalverteilt sein Darstellung: mit zunehmendem Anteil an Einpersonenhaushalten je Stadtteil nehmen tendenziell auch die Stimmenanteile für die Grünen zu (+-Richtung) Formel zur Berechnung von r auf der Basis standardisierter (z-transformierter) Werte:

8 Statistik I Wintersemester 2004/2005 Übersicht -> c Übersicht über die gängigen Korrelationskoeffizienten SkalenniveauZusammenhangsmaß (Wertebereich) Richtung des Zusammenhangs Nominal [ = ; ] Kontingenzkoeffizient (0 <= C <= 1) nein Ordinal [ = ; ; > ; < ] Korrelationskoeffizient Spearman/ Korrelationskoeffizient Kendall (-1 <= r s <= +1) ja Metrisch (nicht-linear, nicht normalverteilt) [ = ; ; > ; < ; + ; - ; *; / ] Korrelationskoeffizient Spearman/ Korrelationskoeffizient Kendall (-1 <= r s <= +1) ja Metrisch (linear, normalverteilt) [ = ; ; > ; < ; + ; - ; * ; / ] Korrelationskoeffizient Pearson (-1 <= r <= +1) ja

9 Statistik I Wintersemester 2004/2005 Beispiel c Kontingenzkoeffizient C – Kreuztabelle Stadteile mit geringem Anteil an Einpersonenhaushalten weisen überwiegend geringe Stimmenanteile für die Grünen auf Stadtteile mit mittlerem Anteil an Einpersonenhaushalten weisen überwiegend mittlere Stimmenanteile für die Grünen auf Stadtteile mit hohem Anteil an Einpersonenhaushalten weisen überwiegend hohe Stimmenanteile für die Grünen auf Offenkundig ist ein statistischer Zusammenhang zwischen den Variablen vorhanden

10 Statistik I Wintersemester 2004/2005 Erwartungswerte Kontingenzkoeffizient C – Erwartungswerte berechnen Erwartungswerte TH ik basieren auf der Hypothese, dass zwischen den Variablen kein statistischer Zusammenhang besteht Erwartungswerte pro Tabellenfeld stellen für diesen Fall die theoretisch zu erwartende Besetzungshäufigkeit dar Exemplarisches Berechungsbeispiel: ( ) = 5, / 98 Allgemeine Berechnung: Summe Zeile i (Summe Spalte k / n) = TH ik

11 Statistik I Wintersemester 2004/2005 Chi-Quadrat Kontingenzkoeffizient C – Chi-Quadrat (χ 2 ) berechnen Exemplarisches Berechnungsbeispiel: χ 2 = ((10 – 5,9) 2 / 5,9) + ((6 – 6,1) 2 / 6,1) + ((5 – 6,1) 2 / 6,1) + ((3 – 5,9) 2 / 5,9) + … + ((19 – 5,9) 2 / 5,9) = 64,52 Chi-Quadrat stellt eine Prüfgröße dar, die als Summe der quadratischen Abweichungen der Beobachtungswerte H ik von den Erwartungswerten TH ik je Tabellenfeld definiert wird:

12 Statistik I Wintersemester 2004/2005 Kontingenzkoeffizient Kontingenzkoeffizient C Der Kontingenzkoeffizient erlaubt nur Aussagen über die Stärke eines statistischen Zusammenhangs, nicht aber über die Richtung dieses Zusammenhangs Durch den Einsatz der Korrelationskoeffizienten nach Spearman oder Kendall für rang- skalierte Variablen sind im vorliegenden Fall auch Aussagen über die Richtung möglich Berechnung des Kontingenzkoeffizienten C mit Hilfe von χ 2 :

13 Statistik I Wintersemester 2004/2005 Redskins Montag 1. November 2004, 01:43 Uhr Football-Niederlage der Redskins als gutes Omen für Kerry Landover/USA (AP) Wenn es nach den amerikanischen Football-Ergebnissen geht, hat George W. Bush die Präsidentschaftswahl schon so gut wie verloren. In dem mit Spannung erwarteten Spiel der Washington Redskins gegen die Green Bay Packers musste der Klub am Sonntag eine 14:28-Niederlage hinnehmen. Wenn die Redskins ihr letztes Heimspiel vor der Wahl verloren haben, hat seit 68 Jahren jedes Mal der Herausforderer gewonnen. Umgekehrt konnte die Partei des amtierenden Präsidenten die Wahl nur dann für sich entscheiden, wenn die Redskins erfolgreich waren. So war es schon bei der Wiederwahl von Franklin Roosevelt im Jahr drei Jahre zuvor waren die Redskins aus den Boston Braves hervorgegangen. Im Jahr 2000 gewannen die Redskins ihr letztes Heimspiel vor der Wahl - danach löste der Republikaner Bush den Demokraten Bill Clinton ab. «Oh ja, er wird gewinnen», sagte Kerry-Anhänger Darren Sharper von den Green Bay Packers. «Das ist garantiert. Ich muss jetzt nicht mehr wählen gehen. Das hat mir am Dienstag einen Weg gespart.» Während der Football somit eine klare Wahlaussage getroffen hat, sieht das beim Baseball ganz anders aus. Hier stehen die gerade gekürten Meister, die Red Sox aus Kerrys Heimatstaat Massachusetts im Blickpunkt. Klub- Eigentümer John Henry und Tom Werner sowie Manager Theo Epstein haben sich im Wahlkampf auf die Seite des Demokraten gestellt und traten sogar bei einer Kundgebung mit Kerry auf. Doch der wichtigste Mann der Verteidigung bei den Red Sox, der «Pitcher» (Werfer) Curt Schilling, wirbt für Bush. Teamsprecher Charles Steinberg bemüht sich um Schadensbegrenzung: «Wir sind große Unterstützer der Meinungsfreiheit.» Gerüchte, wonach die Klub-Leitung auf Schilling einwirken wollte, seien in keiner Weise zutreffend.

14 Statistik I Wintersemester 2004/2005 Redskins / Werterwartung Statistische und sachliche Zusammenhänge Football-Niederlage der Redskins als gutes Omen für Kerry ( ) Landover/USA (AP) Wenn es nach den amerikanischen Football-Ergebnissen geht, hat George W. Bush die Präsidentschaftswahl schon so gut wie verloren. In dem mit Spannung erwarteten Spiel der Washington Redskins gegen die Green Bay Packers musste der Klub am Sonntag eine 14:28-Niederlage hinnehmen. Wenn die Redskins ihr letztes Heimspiel vor der Wahl verloren haben, hat seit 68 Jahren jedes Mal der Herausforderer gewonnen. Umgekehrt konnte die Partei des amtierenden Präsidenten die Wahl nur dann für sich entscheiden, wenn die Redskins erfolgreich waren. So war es schon bei der Wiederwahl von Franklin Roosevelt im Jahr drei Jahre zuvor waren die Redskins aus den Boston Braves hervorgegangen. Trotz Heimniederlage der Redskins hat John Kerry die Wahl verloren Es besteht ein hoher statistischer, allerdings zweifelhafter sachlicher Zusammenhang, die Wahrscheinlichkeit eines statistischen Zufalls ist sehr hoch

15 Statistik I Wintersemester 2004/2005 Statistik Korrelationskoeffizienten - Berechnung mit Hilfe von SPSS Kontingenzkoeffizient c Erzeugung einer Kreuztabelle mit Beobachtungs- und Erwartungswerten Berechnung des Koeffizienten: Analysieren – Deskriptive Statistiken – Kreuztabellen (Statistik …) Pearson-Korrelationskoeffizient r Z-Transformation (Standardisierung) der eingehenden Variablen und Anwendung der Berechnungsformel Berechnung des Koeffizienten: Analysieren – Korrelation – Bivariat … Spearman-Korrelationskoeffizient r / Kendall-tau Berechnung der Koeffizienten: Analysieren – Korrelation – Bivariat … Kendall-tau weist hohe Stabilität bei Ausreißerwerten auf!


Herunterladen ppt "Statistik I Wintersemester 2004/2005 Statistik Statistik I Seminar + Blockveranstaltung."

Ähnliche Präsentationen


Google-Anzeigen