Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistik: 19.10.04 Quantitative Merkmale. 19.10.04PI Statistik, WS 20042 Metrische Merkmale 22718484621318579912482696 1631536979718799740371576 655660800750949478566718.

Ähnliche Präsentationen


Präsentation zum Thema: "Statistik: 19.10.04 Quantitative Merkmale. 19.10.04PI Statistik, WS 20042 Metrische Merkmale 22718484621318579912482696 1631536979718799740371576 655660800750949478566718."—  Präsentation transkript:

1 Statistik: 19.10.04 Quantitative Merkmale

2 19.10.04PI Statistik, WS 20042 Metrische Merkmale 22718484621318579912482696 1631536979718799740371576 655660800750949478566718 53865878887897910475371226 7816545938967191234561665 3681973267618756711836602 943348 Beispiel: 50 Rechnungsbeträge in der Elektroabteilung eines Einkaufszentrums (in Euro)

3 19.10.04PI Statistik, WS 20043 Metrisches Merkmal Das Merkmal wird als (reelles) Vielfaches einer Maßeinheit gemessen Stetig, z.B. Rechnungsbeträge Diskret, z.B. beim Test erzielte Punkte

4 19.10.04PI Statistik, WS 20044 Klasse Häufig keit 0-2000 200-4005 400-60011 600-80019 800-10008 1000-12001 1200-14003 1400-16000 1600-18001 1800-20002 größer0 Metrisches Merkmal: Tabelle Beispiel: Rechnungsbeträge in der Elektroabteilung eines Einkaufszentrums (in Euro)

5 19.10.04PI Statistik, WS 20045 Metr. Merkmal: Histogramm Beispiel: Rechnungsbeträge

6 19.10.04PI Statistik, WS 20046 Histogramm Klassenhäufigkeiten: Häufigkeiten, mit der die Klassen der Merkmalsausprägungen besetzt sind Darstellung der Klassenhäufigkeiten als Flächen Größe der Fläche ist proportional zur Häufigkeit Am einfachsten sind Klassen gleicher Breite (dann ist Höhe proportional zu Häufigkeit) Histogramm (für stetige Merkmale) Balkendiagramm (für diskrete Merkmale)

7 19.10.04PI Statistik, WS 20047 Histogramm in EXCEL Beispiel: Rechnungsbeträge

8 19.10.04PI Statistik, WS 20048 Histogramm in EXCEL Teil der Analyse-Funktionen Probleme und deren Lösung: Balken (vergl. Balkendiagramm) statt Flächen Anklicken eines Stabes -> Datenreihen formatieren -> Optionen -> Abstandsbreite auf 0 setzen Klassengrenzen werden als Klassenmitten angezeigt Bereich mit Klassenmitten erzeugen Diagramm anklicken -> Datenquelle -> als Beschriftung der Rubrikenachse (X): Bereich mit Klassenmitten angeben X-Achse anklicken -> Muster -> Hauptstriche auf innen setzen -> Hilfsstriche auf außen setzen ->

9 19.10.04PI Statistik, WS 20049 Verbessertes Histogramm Beispiel: 50 Rechnungsbeträge

10 19.10.04PI Statistik, WS 200410 Histogramm-Konstruktion 1. Ordne die n Beobachtungen nach steigender Größe, bestimme die Spannweite der Häufigkeitsverteilung. 2. Zur Festlegung der Klassen unterteile die Spannweite in Intervalle gleicher Länge; die Zahl k der Klassen soll zwischen fünf und 20 liegen. Die Klassenmitten sollen einfache Zahlen sein. 3. Bestimme die Zahl der Beobachtungen jeder Klasse, d.s. die (absoluten) Klassenhäufigkeiten. 4. Zeichne das Histogramm. Bei gleichen Klassenbreiten sind die Höhen der Flächen proportional den Häufigkeiten; bei ungleichen Klassenbreiten sind die Höhen proportional den Quotienten aus Häufigkeit und Klassenbreite (gesamte Fläche: n oder 100%)

11 19.10.04PI Statistik, WS 200411 Zahl k der Klassen nnn 2054 3055 4066 5067 7579 100710 150812 200814 kleinstes k mit k n k soll nicht kleiner als 5 nicht größer als 20 sein (siehe Demo)

12 19.10.04PI Statistik, WS 200412 Altersverteilung aus College

13 19.10.04PI Statistik, WS 200413 Nochmals College

14 19.10.04PI Statistik, WS 200414 College 3

15 19.10.04PI Statistik, WS 200415 College 4

16 19.10.04PI Statistik, WS 200416 Beispiele von Verteilungen Rechnungsbeträge CO-Emission von PKWs Lebensalter Schäden durch Wirbelstürme (in Mio USD)

17 19.10.04PI Statistik, WS 200417 Schäden durch Wirbelstürme

18 19.10.04PI Statistik, WS 200418 Schäden durch Wirbelstürme KlasseKl.-BreiteHäufigk'trel.Häufigk'tDichte 0 – 5050190,500,010000 50 – 1005040,110,002105 100 – 500400100,260,000658 500 - 2000150050,130,000088 381,00 Dichte: Relative Häufigkeit/Klassenbreite Dichtehistogramm: Fläche beträgt 1

19 19.10.04PI Statistik, WS 200419 Schuh- und Körpergröße Nach R. Hatzinger, 2003

20 19.10.04PI Statistik, WS 200420 Charakteristika von Verteilungen Beschreiben durch Kennzahlen wesentliche Eigenschaften der Verteilung Dazu gehören: Quantile, Minimum, Maximum Lagemaße Streuungsmaße Schiefe: charakterisiert Symmetrie Wölbung (Kurtosis): Vergleich von symmetrischer Verteilung mit Gaussscher Glockenform

21 19.10.04PI Statistik, WS 200421 Populationskenngrößen Analyse-Funktion in EXCEL Rechnungsbeträge Mittelwert772,46 Standardfehler50,10 Median714,62 Modus718,46 Standardabweichung354,29 Stichprobenvarianz125518,49 Kurtosis3,29 Schiefe1,60 Wertebereich1746,15 Minimum226,92 Maximum1973,08 Summe38623,15 Anzahl50

22 19.10.04PI Statistik, WS 200422 Lage- und Streuungsmaße Lagemaße Mittelwert Median, getrimmter Mittelwert Modus Streuungsmaße Standardabweichung s Varianz s 2 Interquartilsabstand I Spannweite R

23 19.10.04PI Statistik, WS 200423 Lagemaße Mittelwert: Median: nach der Größe geordnete Beobachtungen: den Index i nennen wir den Rang von Median: wenn n=2m+1 ungerade (m ist Rang der mittleren Beobachtung): wenn n=2m gerade:

24 19.10.04PI Statistik, WS 200424 Robuste Lagemaße Median: extreme Werte (Ausreißer) haben keinen Effekt Getrimmter Mittelwert: Mittelwert von 80% der Beobachtungen, je 10% größte und kleinste Beobachtungen bleiben unberücksichtigt

25 19.10.04PI Statistik, WS 200425 Quantil (Perzentil) Quantil der Ordnung p aus n Beobachtungen x 1, …, x n ist die Beobachtung x (r) mit Rang r = (n+1)p wenn (n+1)p keine ganze Zahl ist: Mittel der benachbarten Beobachtungen Runden des Ranges (n+1)p Beispiel: Rechnungsbeträge (50 Beobachtungen) Quantil der Ordnung 0.8 (oder 0.8-Quantil): Mittel aus Beobachtungen mit Rängen 40 und 41 1. Quartil oder 0.25-Quantil: Mittel aus Beobachtungen mit Rängen 12 und 13

26 19.10.04PI Statistik, WS 200426 Einige Quantile Quartile: 0.25-Quantil oder 1. Quartil (Q 1, Q u ) 0.75-Quantil oder 3. Quartil (Q 3, Q o ) 0.5-Quantil ist der Median Dezile Unteres Dezil oder 0.1-Quantil Oberes Dezil oder 0.9-Quantil

27 19.10.04PI Statistik, WS 200427 Standardabweichung Ist die Wurzel aus der Varianz s 2 : Varianz oder Stichprobenvarianz: Eigenschaften der Standardabweichung: s kann nicht negativ sein s = 0: alle Beobachtungen haben gleichen Wert s wird in den gleichen Einheiten gemessen wie X

28 19.10.04PI Statistik, WS 200428 Überdeckung Intervall Anteil der Beobachtungen 2/3 95% ~ 100% Gilt für die Normalverteilung exakt Gilt weitgehend für alle symmetrischen, unimodalen Verteilungen

29 19.10.04PI Statistik, WS 200429 Andere Streuungsmaße Interquartilsabstand I = Q o – Q u = Q 3 – Q 1 überdeckt die zentralen 50% der Beobachtungen Spannweite (range) R = x (n) – x (1) Variationskoeffizient (s in Prozent des Mittelwertes): für nicht-neg. Merkmale; unabhängig von Maßeinheit MAD (mean absolute deviation)

30 19.10.04PI Statistik, WS 200430 Schiefe und Wölbung Schiefe: Maß für Asymmetrie (unimodale Verteilung) rechtsschief: Modus < < Momentkoeffizient (Fisher): mit Wölbung: g 2 = 0: Gausssche Glockenkurve g 2 < 0: abgeplattet, platykurtisch, heavy tail g 2 > 0: spitz, leptokurtisch, light tail

31 19.10.04PI Statistik, WS 200431 Box Plot Darstellung einer Häufigkeitsverteilung; gibt die wesentlichen Charakteristika wieder. (siehe Hackl & Katzenbeisser, S. 29-30) Ausreißer Whisker Q o Median Q u Whisker 50% der Daten

32 19.10.04PI Statistik, WS 200432 Beispiel: Heilmittelkosten Heilmittelkosten je Patient (in Euro) bei 1682 Praktischen Ärzten (AM) 176 Internisten (IN) 242 Orthopäden (OP) WGKG, 2002

33 19.10.04PI Statistik, WS 200433 Box Plot: Elemente Box: mittlere 50% der Beobachtungen; Begrenzungen sind Quartile; Median als Mittellinie Innere Grenzen (inner fences): Q u - 1.5I, Q u + 1.5I Äußere Grenzen (outer fences): Q u - 3I, Q u + 3I Beobachtungen innerhalb der Inneren Grenzen werden verbunden (whiskers) Beobachtungen außerhalb der Inneren Grenzen und innerhalb der Äußeren Grenzen: einzeln mit einem + einzeichnen (outlier) Beobachtungen außerhalb der Äußeren Grenzen: einzeln mit einem * einzeichnen (far outlier)

34 19.10.04PI Statistik, WS 200434 Fragestellungen In welchem Bereich kann man einen Mittelwert in der Grundgesamtheit erwarten ? Ist ein Mittelwert anders (kleiner, größer, oder ungleich) als eine bestimmte Vorgabe ?


Herunterladen ppt "Statistik: 19.10.04 Quantitative Merkmale. 19.10.04PI Statistik, WS 20042 Metrische Merkmale 22718484621318579912482696 1631536979718799740371576 655660800750949478566718."

Ähnliche Präsentationen


Google-Anzeigen