Statistik Statistik I Seminar + Blockveranstaltung Statistik I

Slides:



Advertisements
Ähnliche Präsentationen
Quanti Tutorium
Advertisements

Univariate Statistik M. Kresken.
Masterstudiengang IE (Industrial Engineering)
Was ist Testtheorie?.
Bewegungswissenschaft
Stochastik in der Sek. II Sabrina Schultze.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Regression und Korrelation
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Forschungsstatistik II
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Der Produkt-Moment- Korrelationskoeffizient Der Produkt-Moment Korrelationskoeffizient gibt Stärke und Richtung des linearen Zusammenhanges zweier Variablen.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Der Zusammenhang metrischer Merkmale
Mehrfachregressionen
SoSe 06, Statistik mit SPSS
Quantitative Methoden I
Quantitative Methoden I
Hypothesen testen: Grundidee
Konfidenzintervalle Intervallschätzung
Die Student- oder t-Verteilung
Statistische Methoden I WS 2004/2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird auf Montag, den 17. Mai verlegt! Zeit: 16 Uhr Ort: Kiste Nächste Woche!!!!
Statistische Methoden II SS 2003
Statistische Maßzahlen
Datenmatrix.
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Lehrstuhl für Algebra und funktionalanalytische Anwendungen
Beschreibende Statistik
Univariate Statistik M. Kresken.
Deskriptive Statistik
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Diagnostische Statistik
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Stetige Zufallsgrößen
Ausgleichungsrechnung II
Forschungsmethoden Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften, Universität Fribourg.
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 1375 SS März 2005.
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) 3. Ausgaben ( ) Wiederholung Tabellen,
Einführung in SPSS/PASW. Eckdaten Ort: ZIP-Pool Zielgruppe: Primär 3. Semester Bachelor, sekundär Diplomstudierende Zeiten: Dienstags: 10:15-11:45 Uhr.
Seminar: Datenerhebung
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Referat über das Thema STOCHASTIK.
Deskriptive Statistik
Forschungsmethodik II, SS 2010 Vesna Pavlovski & Julia Pichlhöfer
Mailingliste des Instituts für Geographie Zur Ankündigung fachspezifischer Veranstaltungen sowie für wichtige Mitteilungen des Instituts steht allen Interessierten.
Statistik Typen statistischer Zusammenhänge: Statistik I
Veranstaltung 4.
Erheben, berechnen und darstellen von Daten
Empirische Sozialforschung am Beispiel der Limburger Nordstadt
Überblick empirische Forschung
Überblick Teil 1 Überblick empirische Forschung
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
Statistik III Statistik III 2. Streuungsmaße (Dispersionsmaße)
Grafische Darstellung von Gruppenunterschieden.
Ökonometrie und Statistik Wiederholung
Ökonometrie und Statistik Wiederholung
Ökonometrie und Statistik Wiederholung
Korrelation & Skalentransformation
 Präsentation transkript:

Statistik Statistik I Seminar + Blockveranstaltung Statistik I Wintersemester 2004/2005 Statistik Statistik I Seminar + Blockveranstaltung

Statistik Thema Inhalt Sitzung Einführung Skalen, Häufigkeiten, Statistik I Wintersemester 2004/2005 Statistik Sitzung Thema Inhalt (1) 21.10.04 Einführung  Formalia / Bekanntgabe des Seminarplans  Begriffe: deskriptive bzw. inferente Statistik; Grundgesamtheit, Stichprobe  Gütekriterien quantitativer empirischer Untersuchungen: Validität, Reliabilität, Repräsentativität Ablaufschema empirischer Erhebungen Variablen, Variablenwerte (Ausprägungen) diskrete (= endliche) und stetige (= reelle Zahlen) Variablen (2) 28.10.04 Skalen, Häufigkeiten, Lageparameter Skalen / Messniveaus; zulässige mathematische Operationen: Umwandlung von Skalenniveaus: Dichotomien; Dichotomisierung von Variablen  Verteilungen: Uni- bzw. bimodale Verteilungen, Symetrie / Schiefe  Lageparameter: Modus, Median / Quantile, arithmetisches Mittel (3) 04.11.04 Methodische Grundlagen  Grundlagen standardisierter Befragungen  Range (Spannweite); Quartilsabstand  mittlere Abweichung; Varianz / Standardabweichung (-) 11.11.04 (4) 18.11.04 SPSS  Einführung in die Programmstruktur von SPSS  Codierung von Variablen und Items in SPSS  Darstellung in Diagrammen (6) 25.11.04 Zusammen-hangsmaße I  Zusammenhangsmaße metrischer Daten: Pearson’s r  Zusammenhangsmaße dichotomer Daten; Cramer’s v (7) 02.12.04 Zusammen-hangsmaße II  Zusammenhangsmaße ordinalskalierter Daten  Zusammenhangsmaße nominalskalierter Daten  Erwartungswerte: ² Test / auf ² basierende Zusammenhangsmaße (8) 09.12.04 Arbeiten mit SPSS  Klassifizierung mit SPSS  Diagrammdarstellung mit SPSS  Lage- und Streuungsmaße mit SPSS  Zusammenhangsmaße mit SPSS (9) 16.12.04  Kennwert raum-zeitlicher Veränderung / Lokalisationskoeffizient  Datenimport in SPSS  Datenexport aus SPSS / Darstellungen mit Excel und ArcView

Statistik Thema Inhalt Sitzung Standardisierung Korrelation Statistik I Wintersemester 2004/2005 Statistik Sitzung Thema Inhalt (5) 25.11.04 Standardisierung Korrelation  Standardisierung von Variablen (Z-Transformation) / Skaleneffekte  Berechnung von statistischen Zusammenhangen metrischer Variablen: Produkt- Moment-Korrelationskoeffizient (Pearson’s r) (6) 02.12.04 Arbeiten mit SPSS  Lage- und Streuungsmaße mit SPSS  Diagrammdarstellung mit SPSS  Zusammenhangsmaße mit SPSS (7) 09.12.04  Arbeiten mit klassifizierten Daten; Gewichtung  Variablenberechnung  Interpretation von Zusammenhängen (8) 16.12.04 Zusammen-hangsmaße II  Wiederholung  Typen von Zusammenhängen  Erwartungswerte: ² Test / auf ² basierende Zusammenhangsmaße  Zusammenhangsmaße für nicht metrisch skalierte Variablen (Kontingenzkoeffizient)

Korrelationen Korrelationsanalyse / Wiederholung + – Statistik I Wintersemester 2004/2005 Korrelationen Korrelationsanalyse / Wiederholung Messen der Stärke eines statistischen Zusammenhangs zwischen zwei Variablen Korrelationskoeffizienten geben in einem Wertebereich zwischen 0 und 1 diese Stärke an: < 0,2 sehr geringe Korrelation 0,2 – 0,5 geringe Korrelation 0,5 – 0.7 mittlere Korrelation 0,7 – 0,9 hohe Korrelation > 0,9 sehr hohe Korrelation Korrelationskoeffizienten für rangskalierte und metrische Variablen geben zusätzlich Auskunft über die Richtung des statistischen Zusammenhangs (Vorzeichen): + –

Typen Zusammenhänge Typen statistischer Zusammenhänge Statistik I Wintersemester 2004/2005 Typen Zusammenhänge Typen statistischer Zusammenhänge Y X einfacher einseitiger Zusammenhang: einfache lineare Regression  Verdunstung (Y) hängt von der Lufttemperatur (X) ab Y X einfacher wechselseitiger Zusammenhang: Korrelation  Verdunstung (Y) hängt von der Lufttemperatur (X) ab, umgekehrt hängt die Lufttemperatur auch von der Verdunstung ab (vgl. Verdunstungskälte) Y X2 mehrfacher einseitiger Zusammenhang: multiple lineare Regression  Verdunstung (Y) hängt von der Lufttemperatur (X1), Albedo (X2) und Luftfeuchte (X3) ab X1 X3 Y X2 mehrfacher mehrschichtiger Zusammenhang: Pfadanalyse  Verdunstung (Y) hängt von der Lufttemperatur (X1), Albedo (X2) und Luftfeuchte (X3) ab, Lufttemperatur (X1) und Albedo (X2) hängen zudem von der Sonneneinstrahlung (X4) ab X1 X3 X4 ? Z Y X vermeintlicher Zusammenhang (Scheinkorrelation): Partielle Korrelation  Beispiel: In einer polnischen Studie konnte nachgewiesen werden, dass die Geburtenraten (Y) statistisch abhängig von der Anzahl der vor Ort brütenden Störche (X) ist. Tatsächlich hängen beide Variablen aber von der Bevölkerungsdichte (Z) ab

Statistik I Wintersemester 2004/2005 Übersicht -> r Übersicht über die gängigen Korrelationskoeffizienten Skalenniveau Zusammenhangsmaß (Wertebereich) Richtung des Zusammenhangs Nominal [ = ; ≠ ] Kontingenzkoeffizient (0 <= C <= 1)   nein Ordinal [ = ; ≠ ; > ; < ] Korrelationskoeffizient Spearman/ Korrelationskoeffizient Kendall (-1 <= rs <= +1) ja Metrisch (nicht-linear, nicht normalverteilt) [ = ; ≠ ; > ; < ; + ; - ; *; / ] Metrisch (linear, normalverteilt) [ = ; ≠ ; > ; < ; + ; - ; * ; / ] Korrelationskoeffizient Pearson (-1 <= r <= +1)  

Pearson Pearson-Korrelationskoeffizient r – Streudiagramm Statistik I Wintersemester 2004/2005 Pearson Pearson-Korrelationskoeffizient r – Streudiagramm Formel zur Berechnung von r auf der Basis standardisierter (z-transformierter) Werte: Voraussetzungen für die Anwendung: der Zusammenhang zwischen den eingehenden Variablen muss i.w.S. linear sein und die Variablen müssen jeweils hinreichend normalverteilt sein Darstellung: mit zunehmendem Anteil an Einpersonenhaushalten je Stadtteil nehmen tendenziell auch die Stimmenanteile für die Grünen zu (“+”-Richtung)  

Statistik I Wintersemester 2004/2005 Übersicht -> c Übersicht über die gängigen Korrelationskoeffizienten Skalenniveau Zusammenhangsmaß (Wertebereich) Richtung des Zusammenhangs Nominal [ = ; ≠ ] Kontingenzkoeffizient (0 <= C <= 1)   nein Ordinal [ = ; ≠ ; > ; < ] Korrelationskoeffizient Spearman/ Korrelationskoeffizient Kendall (-1 <= rs <= +1) ja Metrisch (nicht-linear, nicht normalverteilt) [ = ; ≠ ; > ; < ; + ; - ; *; / ] Metrisch (linear, normalverteilt) [ = ; ≠ ; > ; < ; + ; - ; * ; / ] Korrelationskoeffizient Pearson (-1 <= r <= +1)  

Beispiel c Kontingenzkoeffizient C – Kreuztabelle Statistik I Wintersemester 2004/2005 Beispiel c Kontingenzkoeffizient C – Kreuztabelle Stadteile mit geringem Anteil an Einpersonenhaushalten weisen überwiegend geringe Stimmenanteile für die Grünen auf Stadtteile mit mittlerem Anteil an Einpersonenhaushalten weisen überwiegend mittlere Stimmenanteile für die Grünen auf Stadtteile mit hohem Anteil an Einpersonenhaushalten weisen überwiegend hohe Stimmenanteile für die Grünen auf  Offenkundig ist ein statistischer Zusammenhang zwischen den Variablen vorhanden  

Erwartungswerte Kontingenzkoeffizient C – Erwartungswerte berechnen 24 Statistik I Wintersemester 2004/2005 Erwartungswerte Kontingenzkoeffizient C – Erwartungswerte berechnen 24 24 / 98 Erwartungswerte THik basieren auf der Hypothese, dass zwischen den Variablen kein statistischer Zusammenhang besteht  Erwartungswerte pro Tabellenfeld stellen für diesen Fall die theoretisch zu erwartende Besetzungshäufigkeit dar Exemplarisches Berechungsbeispiel: • ( ) = 5,877 Allgemeine Berechnung: Summe Zeile i • (Summe Spalte k / n) = THik  

Chi-Quadrat Kontingenzkoeffizient C – Chi-Quadrat (χ2) berechnen Statistik I Wintersemester 2004/2005 Chi-Quadrat Kontingenzkoeffizient C – Chi-Quadrat (χ2) berechnen Chi-Quadrat stellt eine Prüfgröße dar, die als Summe der quadratischen Abweichungen der Beobachtungswerte Hik von den Erwartungswerten THik je Tabellenfeld definiert wird:   Exemplarisches Berechnungsbeispiel: χ2 = ((10 – 5,9)2 / 5,9) + ((6 – 6,1)2 / 6,1) + ((5 – 6,1)2 / 6,1) + ((3 – 5,9)2 / 5,9) + … + ((19 – 5,9)2 / 5,9) = 64,52

Kontingenzkoeffizient Statistik I Wintersemester 2004/2005 Kontingenzkoeffizient Kontingenzkoeffizient C Berechnung des Kontingenzkoeffizienten C mit Hilfe von χ2: Der Kontingenzkoeffizient erlaubt nur Aussagen über die Stärke eines statistischen Zusammenhangs, nicht aber über die Richtung dieses Zusammenhangs  Durch den Einsatz der Korrelationskoeffizienten nach Spearman oder Kendall für rang- skalierte Variablen sind im vorliegenden Fall auch Aussagen über die Richtung möglich  

Redskins Football-Niederlage der Redskins als gutes Omen für Kerry Statistik I Wintersemester 2004/2005 Redskins Montag 1. November 2004, 01:43 Uhr Football-Niederlage der Redskins als gutes Omen für Kerry Landover/USA (AP) Wenn es nach den amerikanischen Football-Ergebnissen geht, hat George W. Bush die Präsidentschaftswahl schon so gut wie verloren. In dem mit Spannung erwarteten Spiel der Washington Redskins gegen die Green Bay Packers musste der Klub am Sonntag eine 14:28-Niederlage hinnehmen. Wenn die Redskins ihr letztes Heimspiel vor der Wahl verloren haben, hat seit 68 Jahren jedes Mal der Herausforderer gewonnen. Umgekehrt konnte die Partei des amtierenden Präsidenten die Wahl nur dann für sich entscheiden, wenn die Redskins erfolgreich waren. So war es schon bei der Wiederwahl von Franklin Roosevelt im Jahr 1936 - drei Jahre zuvor waren die Redskins aus den Boston Braves hervorgegangen. Im Jahr 2000 gewannen die Redskins ihr letztes Heimspiel vor der Wahl - danach löste der Republikaner Bush den Demokraten Bill Clinton ab. «Oh ja, er wird gewinnen», sagte Kerry-Anhänger Darren Sharper von den Green Bay Packers. «Das ist garantiert. Ich muss jetzt nicht mehr wählen gehen. Das hat mir am Dienstag einen Weg gespart.» Während der Football somit eine klare Wahlaussage getroffen hat, sieht das beim Baseball ganz anders aus. Hier stehen die gerade gekürten Meister, die Red Sox aus Kerrys Heimatstaat Massachusetts im Blickpunkt. Klub-Eigentümer John Henry und Tom Werner sowie Manager Theo Epstein haben sich im Wahlkampf auf die Seite des Demokraten gestellt und traten sogar bei einer Kundgebung mit Kerry auf. Doch der wichtigste Mann der Verteidigung bei den Red Sox, der «Pitcher» (Werfer) Curt Schilling, wirbt für Bush. Teamsprecher Charles Steinberg bemüht sich um Schadensbegrenzung: «Wir sind große Unterstützer der Meinungsfreiheit.» Gerüchte, wonach die Klub-Leitung auf Schilling einwirken wollte, seien in keiner Weise zutreffend.

Redskins / Werterwartung Statistik I Wintersemester 2004/2005 Redskins / Werterwartung Statistische und sachliche Zusammenhänge Football-Niederlage der Redskins als gutes Omen für Kerry (01.11.2004) Landover/USA (AP) Wenn es nach den amerikanischen Football-Ergebnissen geht, hat George W. Bush die Präsidentschaftswahl schon so gut wie verloren. In dem mit Spannung erwarteten Spiel der Washington Redskins gegen die Green Bay Packers musste der Klub am Sonntag eine 14:28-Niederlage hinnehmen. Wenn die Redskins ihr letztes Heimspiel vor der Wahl verloren haben, hat seit 68 Jahren jedes Mal der Herausforderer gewonnen. Umgekehrt konnte die Partei des amtierenden Präsidenten die Wahl nur dann für sich entscheiden, wenn die Redskins erfolgreich waren. So war es schon bei der Wiederwahl von Franklin Roosevelt im Jahr 1936 - drei Jahre zuvor waren die Redskins aus den Boston Braves hervorgegangen.  Trotz Heimniederlage der Redskins hat John Kerry die Wahl verloren  Es besteht ein hoher statistischer, allerdings zweifelhafter sachlicher Zusammenhang, die Wahrscheinlichkeit eines statistischen Zufalls ist sehr hoch

Statistik Korrelationskoeffizienten - Berechnung mit Hilfe von SPSS Statistik I Wintersemester 2004/2005 Statistik Korrelationskoeffizienten - Berechnung mit Hilfe von SPSS Kontingenzkoeffizient c Erzeugung einer Kreuztabelle mit Beobachtungs- und Erwartungswerten Berechnung des Koeffizienten: “Analysieren – Deskriptive Statistiken – Kreuztabellen (Statistik …)” Pearson-Korrelationskoeffizient r Z-Transformation (Standardisierung) der eingehenden Variablen und Anwendung der Berechnungsformel Berechnung des Koeffizienten: “Analysieren – Korrelation – Bivariat …” Spearman-Korrelationskoeffizient r / Kendall-tau Berechnung der Koeffizienten: “Analysieren – Korrelation – Bivariat …”  Kendall-tau weist hohe Stabilität bei Ausreißerwerten auf!