Statistische Grundlagen

Slides:



Advertisements
Ähnliche Präsentationen
Quanti Tutorium
Advertisements

Anzahl der ausgefüllten und eingesandten Fragebögen: 211
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
Die Projektgruppe heißt Sie herzlichst willkommen
LS 2 / Informatik Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)
Was ist Testtheorie?.
Streuung Bezeichnung Streuung=Dispersion=Variabilität Fragestellung:
Lagemaße kritische Fragen
Telefonnummer.
1 JIM-Studie 2010 Jugend, Information, (Multi-)Media Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Statistiken und Tabellen
Quantitative RT-PCR an nativen Prostatakarzinom-Biopsien: Etablierung der Technik und erste vergleichende Ergebnisse Medizinische Fakultät Universitätsklinikum.
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
EF: Standards + H2O red = H2O.
Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.
Internet facts 2008-II Graphiken zu dem Berichtsband AGOF e.V. September 2008.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Differentielles Paar UIN rds gm UIN
Prof. Dr. Bernhard Wasmayr
Studienverlauf im Ausländerstudium
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)
Univariate Statistik M. Kresken.
Prof. Dr. Bernhard Wasmayr VWL 2. Semester
Fachschule für Technik Biomedizinische Arbeitsmethoden
AWA 2007 Natur und Umwelt Natürlich Leben
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Prof. Dr. Günter Gerhardinger Soziale Arbeit mit Einzelnen und Familien Übersicht über die Lehrveranstaltung Grundlegende Bestimmungsfaktoren der Praxis.
Daten auswerten Boxplots
20:00.
Zusatzfolien zu B-Bäumen
Eine Einführung in die CD-ROM
Dokumentation der Umfrage
Where Europe does business Lück, JDZB | Seite © GfW NRW 252 a.
Wir üben die Malsätzchen
Aufgabenzettel V Statistik I
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Syntaxanalyse Bottom-Up und LR(0)
Kennwerte und Boxplots
Peter Grzybek Projekt # (FWF) Projekt # 43s9 (OEAD/SAIA) Graphem-Häufigkeiten.
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
Addieren und Subtrahieren von Dezimalzahlen
Mehr zum Testen von Hypothesen
Der Ablauf eines Clear Rex Klärzyklus
PROCAM Score Alter (Jahre)
Referat über das Thema STOCHASTIK.
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
Geometrische Aufgaben
Eine lllustration der Herausforderungen des Stromsystems der Zukunft
Symmetrische Blockchiffren DES – der Data Encryption Standard
Zahlentheorie und Zahlenspiele Hartmut Menzer, Ingo Althöfer ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List.
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Data Mining Georg Pölzlbauer.
Parkplatz-Orga Diese Version ist vom finale Version!
Deskriptive Statistik
Zusammengestellt von OE3DSB
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Technische Frage Technische Frage Bitte löse die folgende Gleichung:
Unternehmensbewertung Thomas Hering ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List of Figures Tabellenübersicht.
Forschungsprojekt Statistik 2013 „Jugend zählt“ – Folie 1 Statistik 2013 „Jugend zählt“: Daten zur Arbeit mit Kindern und Jugendlichen.
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
Folie Einzelauswertung der Gemeindedaten
Statistik – Regression - Korrelation
Datum:17. Dezember 2014 Thema:IFRS Update zum Jahresende – die Neuerungen im Überblick Referent:Eberhard Grötzner, EMA ® Anlass:12. Arbeitskreis Internationale.
Erheben, berechnen und darstellen von Daten
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Statistik I Statistik I Statistische Grundbegriffe
 Präsentation transkript:

Statistische Grundlagen - Maße für die zentrale Tendenz (Mittelwerte) - Streuungsmaße - Zusammenhangsmaße

Beschreibende (deskriptive) Statistik Arbeitsablauf der statistischen Bearbeitung von Testergebnissen Ordnung und Darstellung verhältnisskalierter Daten Tabellarische Ordnung Urliste Primäre Tafel Häufigkeitstabelle (evtl. mit Klassenbildung) Graphische Darstellung Histogramm oder Polygonzug Berechnung des Modus Median arithmetischen Mittels x

Skalenniveaus Verhältnisskala Intervallskala Ordinalskala Nominalskala absoluter Nullpunkt Rangordnung gleiche Abstände Beispiele: m, kg, s, Temperaturskala in °K Intervallskala Rangordnung gleiche Abstände Beispiel: Temperaturskala in °C Ordinalskala Rangordnung Beispiele: Plazierungen, trifft zu - trifft weniger zu - trifft nicht zu Nominalskala keine Voraussetzungen Beispiel: Ja/Nein

Median bei 5 Messwerten: 13,3 s Median (Zentralwert) - Wert, bei dem 50% der Messwerte erreicht (kummuliert) sind. - Ermittlung aus einer geordneten Reihe von Messwerten. 6 14,5 5 14,0 4 13,3 3 13,0 2 12,9 1 100m-Zeit [s] i Median bei 5 Messwerten: 13,3 s Median bei 6 Messwerten:13,65 s (13,3 + 14,0):2 14,9 Voraussetzung: mindestens Ordinalskala!

Modus bei 1,45 m Modus (Gipfelwert) - Wert, der am häufigsten vorkommt. 1 1,65 7 2 1,60 6 3 1,55 5 1,50 4 8 1,45 1,40 1,35 Anzahl n Hochsprung-höhe [m] i Modus bei 1,45 m Voraussetzung: Nominalskala

Mittelwert (x) Voraussetzung: mindestens Intervallskala! x S 38,24 13,21 10 35,64 12,63 9 43,40 15,12 8 35,42 13,11 7 38,64 13,39 6 41,84 5 35,82 13,77 4 46,62 16,30 3 55,24 15,66 2 45,68 16,00 1 Speer (xS) Kugel (xK) i 142,30 416,54 Voraussetzung: mindestens Intervallskala! 14,23 41,65

Beschreibende (deskriptive) Statistik Arbeitsablauf der statistischen Bearbeitung von Testergebnissen Ordnung und Darstellung verhältnisskalierter Daten Tabellarische Ordnung Urliste Primäre Tafel Häufigkeitstabelle (evtl. mit Klassenbildung) Graphische Darstellung Histogramm oder Polygonzug Berechnung des Maße für die zentrale Tendenz Modus Median arithmetisches Mittels x Berechnung der Streuungsmaße Variationsbreite (Range), R = xmax - xmin Standardabweichung s Variabiltätskoeffizient v

Warum Berechnung der Streuungsmaße? - Streuung verschiedener Verteilungen mit gleichem Mittelwert

Standardabweichung (±s) 41,65 14,23 x   416,54 142,30 S 38,24 13,21 10 35,64 12,63 9 43,40 15,12 8 35,42 13,11 7 38,64 13,39 6 41,84 5 35,82 13,77 4 46,62 16,30 3 55,24 15,66 2 45,68 16,00 1 Speer (xS) Kugel (xK) i -1,02 -1,60 0,89 -1,12 -0,84 -0,46 2,07 1,43 1,77 (xi - x) 1,04 2,56 0,79 1,25 0,71 0,21 4,28 2,04 3,13 (xi - x)2 -3,41 -6,01 1,75 -6,23 -3,01 0,19 -5,83 4,97 13,59 4,03 (xi - x) 11,66 36,17 3,05 38,86 9,08 0,03 34,04 24,66 184,58 16,21 (xi - x)2 17,28 358,34 1,39 6,31

Standardabweichung (±s) Variabilitätskoeffizient (v) Z-Transformation XK5=13,11 XS5=41,84

Komparative Statistik - Produkt-Moment Korrelation rxy - Ermittlung der Zusammenhänge zwischen zwei Merkmalen (Korrelationsrechnung) - Produkt-Moment Korrelation rxy - X-Y-Punktdiagramm

Korrelation (rxy) 6,31 1,39 ±s 41,65 14,23 x 358,34   416,54 17,28 142,30 S 11,66 -3,41 38,24 1,04 -1,02 13,21 10 36,17 -6,01 35,64 2,56 -1,60 12,63 9 3,05 1,75 43,40 0,79 0,89 15,12 8 38,86 -6,23 35,42 1,25 -1,12 13,11 7 9,08 -3,01 38,64 0,71 -0,84 13,39 6 0,03 0,19 41,84 5 34,04 -5,83 35,82 0,21 -0,46 13,77 4 24,66 4,97 46,62 4,28 2,07 16,30 3 184,58 13,59 55,24 2,04 1,43 15,66 2 16,21 4,03 45,68 3,13 1,77 16,00 1 (yi - x)2 (yi - x) Speer (yS) (xi - x)2 (xi - x) Kugel (xK) i 3,48 9,62 1,55 6,98 2,53 -0,21 2,68 10,28 19,43 7,13 (xiK - xK)·(yiS - xS) 63,48

Korrelation (rxy) i Kugel (xK) Speer (yS) (yi - x)2 1 16,00 1,77 3,13 (xi - x) (xi - x)2 Speer (yS) (yi - x) (yi - x)2 (xiK - xK)·(yiS - xS) 1 16,00 1,77 3,13 45,68 4,03 16,21 7,13 2 15,66 1,43 2,04 55,24 13,59 184,58 19,43 3 16,30 2,07 4,28 46,62 4,97 24,66 10,28 4 13,77 -0,46 0,21 35,82 -5,83 34,04 2,68 5 13,11 -1,12 1,25 41,84 0,19 0,03 -0,21 6 13,39 -0,84 0,71 38,64 -3,01 9,08 2,53 7 13,11 -1,12 1,25 35,42 -6,23 38,86 6,98 8 15,12 0,89 0,79 43,40 1,75 3,05 1,55 9 12,63 -1,60 2,56 35,64 -6,01 36,17 9,62 10 13,21 -1,02 1,04 38,24 -3,41 11,66 3,48 S 142,30   17,28 416,54   358,34 63,48 x 14,23 41,65 ±s 1,39 6,31

Interpretation des Korrelationskoeffizienten Korrelationskoeffizienten bewegen sich im Bereich von -1 bis +1. Positive Korrelationen ergeben sich bei Zusammenhängen der Art „je größer die eine Variable, desto größer die andere Variable“ Negative Korrelationen ergeben sich bei Zusammenhängen der Art „je größer die eine Variable, desto kleiner die andere Variable“ Werte zwischen 0,7 und 1,0 werden als hohe, Werte zwischen 0,3 und 0,7 als mittlere und Werte zwischen 0 und 0,3 als niedrige Korrelationen bezeichnet. Ein Wert von -1 oder +1 beschreibt einen vollständigen Zusammenhang. Die Korrelationsberechnung kann z.B. zur Identifikation von wichtigen biomechanischen Parametern (Kennwerten) und zur Abgrenzung von eher unwichtigen dienen.

Einschränkungen zum Korrelationskoeffizienten Nur sinnvoll anwendbar bei linearen Zusammenhängen! Für nichtlineare Zusammenhänge existieren andere Verfahren Ein hoher Korrelationskoeffizient sagt noch nichts über einen tatsächlich inhaltlich vorhandenen Zusammenhang aus (Scheinkorrelationen)! Durch die falsche Auswahl von Populationen (Selektionsfehler) können Verzerrungen entstehen.

Nichtlineare Zusammenhänge Parabolischer Zusammenhang Kein Zusammenhang Aus: BORTZ, J. (1989). Statistik für Sozialwissenschaftler. Berlin, Heidelberg, New York. Springer

Scheinkorrelation

Scheinkorrelation? Sind gute Golfspieler gegenüber schlechteren die besseren oder die schlechteren Unternehmensführer? Wer erreicht die besseren Renditen? Was meinen Sie? Argumente? Begründungen? Was braucht man zum Golferfolg? Disziplin? Konzentration? Scheinbar korreliert ein kleines Handicap im Golf mit hohen Renditen durch den Vorstandsvorsitzenden (negative Korrelation)! Ob dies allerdings inhaltlich begründbar ist, bleibt fraglich. Wäre Tiger Woods also der ideale Unternehmensführer?

Selektionsfehler (Stichprobe mit zu kleiner Streubreite) Aus: BORTZ, J. (1989). Statistik für Sozialwissenschaftler. Berlin, Heidelberg, New York. Springer

Selektionsfehler (Stichprobe mit zu kleiner Streubreite) Aus: BORTZ, J. (1989). Statistik für Sozialwissenschaftler. Berlin, Heidelberg, New York. Springer

Regression 100m-Zeit zu Weitsprungleistung Y = mx + b m = -1,0453504 b = 18,87 Beispiel: 12,5 * -1,0453504 + 18,87 = 5,87 m r = -0,92

Testverfahren für Gruppenvergleiche (Mittelwertsvergleiche) Aus:WILLIMCZIK, K. (1997): Statistik im Sport. Hamburg: Czwalina

Stichproben und Grundgesamtheit

Unterschiede zwischen Gruppen? Mittelwertsvergleiche z.B. mit einem t-Test ermöglichen die Entscheidung, ob sich Gruppen signifikant unterscheiden. Sie überprüfen Hypothesen!

Unterschiede zwischen Gruppen? Mittelwertsvergleiche z.B. mit einem t-Test ermöglichen die Entscheidung, ob sich Gruppen signifikant unterscheiden. Sie überprüfen Hypothesen!