Quantitative Merkmale

Slides:



Advertisements
Ähnliche Präsentationen
Deskriptive Statistik und Explorative Datenanalyse
Advertisements

Univariate Statistik M. Kresken.
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Klaus-G. Westphal von der Industrie- und Handelskammer Braunschweig öffentlich bestellter und vereidigter Sachverständiger für Straßenverkehrstechnik.
Grundlagen der Wahrscheinlichkeitsrechnung - Verteilungen -
Klassen (Zweck) Wozu legt man Klassen an? Überblick
Lagemaße kritische Fragen
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Aufgabe Analyse (Friedman-Test) von letzter Stunde wiederholen
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Median Merkmal Geordneter Datensatz
Die Vorlesung Mathematik I (Prof. Kugelmann) findet heute um 14:30 Uhr im Hörsaal Loefflerstraße 70 statt.
Datenmatrix.
Quantile.
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Streuungsparameter Median Mittlere Abweichung vom Median
Quantile.
Univariate Statistik M. Kresken.
Wahrscheinlich-keitsrechnung
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Stetige Zufallsgrößen
Wiederholung und Beispiele
QUASI 2008 Benchmarks der Umfrage bei Dialysepatienten ÖDTR Reinhard Kramar.
QUASI 2007 Benchmarks der Umfrage bei Dialysepatienten ÖDTR Reinhard Kramar.
Daten auswerten Boxplots
Histogramm/empirische Verteilung Verteilungen
Computergestützte Übersetzung und Terminologieverwaltung
(Version Office 2000) Die Folientexte bauen sich dynamisch auf – Folienwechsel müssen per Taste oder Mausklick vorgenommen werden.
Aufgabenzettel V Statistik I
Forschungsmethoden Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften, Universität Fribourg.
STATISIK LV Nr.: 1375 SS März 2005.
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) 3. Ausgaben ( ) Wiederholung Tabellen,
Messwerte, Verteilung, Histogramm, Mittelwert und Standardabweichung
Kennwerte und Boxplots
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.
Konfidenzintervall und Testen für den Mittelwert und Anteile
Erheben von Daten kategoriale Merkmale
Arbeiten mit der Normalverteilung
Arbeiten mit der Normalverteilung
Quantitative Merkmale
Referat über das Thema STOCHASTIK.
1 Stichprobenverfahren zur Qualitätssicherung Hilfestellung der Statistik in der Wirtschaftsprüfung.
Flexibilisierung der Arbeit
Statistik Peter Hackl Sprechstunde: Fr, 10:45-11:45 Tel.:
1 (C) 2002, Hermann Knoll, HTW Chur, Fachhochschule Ostschweiz Wahrscheinlichkeitsverteilung Lernziele: Wahrscheinlichkeitsverteilung und der Wahrscheinlichkeitsdichte.
ohne Animationseffekte (
Deskriptive Statistik
Bioinformatik Vorlesung
Statistik – Regression - Korrelation
Veranstaltung 4.
Erheben, berechnen und darstellen von Daten
K. Desch - Statistik und Datenanalyse SS05
STATISIK LV Nr.: 1375 SS März 2005.
Verteilungen, Varianz Tamara Katschnig.
Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
Statistik III Statistik III 2. Streuungsmaße (Dispersionsmaße)
Statistik I Statistik I Statistische Grundbegriffe
Ökonometrie und Statistik Wiederholung
Univariate Statistik M. Kresken.
Ökonometrie und Statistik Wiederholung
 Präsentation transkript:

Quantitative Merkmale Statistik: 1.3.04 Quantitative Merkmale

Metrische Merkmale Beispiel: 50 Rechnungsbeträge in der Elektroabteilung eines Einkaufszentrums (in Euro) 227 1848 462 1318 579 912 482 696 1631 536 979 718 799 740 371 576 655 660 800 750 949 478 566 538 658 788 878 1047 537 1226 781 654 593 896 719 1234 561 665 368 1973 267 618 756 711 836 602 943 348 1.3.04 PI Statistik, SS 2004

Metrisches Merkmal: Tabelle Beispiel: Rechnungsbeträge in der Elektroabteilung eines Einkaufszentrums (in Euro) Klasse Häufigkeit 0-200 200-400 5 400-600 11 600-800 19 800-1000 8 1000-1200 1 1200-1400 3 1400-1600 1600-1800 1800-2000 2 größer 1.3.04 PI Statistik, SS 2004

Metr. Merkmal: Histogramm Beispiel: Rechnungsbeträge 1.3.04 PI Statistik, SS 2004

Histogramm Klassenhäufigkeiten: Häufigkeiten, mit der die Klassen der Merkmalsausprägungen besetzt sind Darstellung der Klassenhäufigkeiten als Flächen Größe der Fläche ist proportional zur Häufigkeit Am einfachsten sind Klassen gleicher Breite (dann ist Höhe proportional zu Häufigkeit) Histogramm (für stetige Merkmale) <-> Balkendiagramm (für diskrete Merkmale) 1.3.04 PI Statistik, SS 2004

„Histogramm“ in EXCEL Beispiel: Rechnungsbeträge 1.3.04 PI Statistik, SS 2004

Histogramm in EXCEL Teil der Analyse-Funktionen Probleme und deren Lösung: Balken (vergl. Balkendiagramm) statt Flächen Anklicken eines Stabes -> Datenpunkt formatieren -> Optionen -> Abstandsbreite auf „0“ setzen Klassengrenzen werden als Klassenmitten angezeigt Bereich mit Klassenmitten erzeugen Diagramm anklicken -> als „Beschriftung der Rubrikenachse (X)“ den Bereich mit Klassenmitten angeben X-Achse anklicken -> Muster -> Hauptstriche auf „innen“ setzen -> Hilfsstriche auf „außen“ setzen -> 1.3.04 PI Statistik, SS 2004

Verbessertes Histogramm Beispiel: Rechnungsbeträge 1.3.04 PI Statistik, SS 2004

Histogramm-Konstruktion Ordne die n Beobachtungen nach steigender Größe, bestimme die Spannweite der Häufigkeitsverteilung. Zur Festlegung der Klassen unterteile die Spannweite in Intervalle gleicher Länge; die Zahl k der Klassen soll zwischen fünf und 20 liegen. Die Klassenmitten sollen „einfache“ Zahlen sein. Bestimme die Zahl der Beobachtungen jeder Klasse, d.s. die (absoluten) Klassenhäufigkeiten. Zeichne das Histogramm. Bei gleichen Klassenbreiten sind die Höhen der Flächen proportional den Häufigkeiten; bei ungleichen Klassenbreiten sind die Höhen proportional den Quotienten aus Häufigkeit und Klassenbreite. 1.3.04 PI Statistik, SS 2004

Zahl k der Klassen n √n 20 5 4 30 40 6 50 7 75 9 100 10 150 8 12 200 14 k so, dass k ≤ √n k soll nicht kleiner als 5 nicht größer als 20 sein 1.3.04 PI Statistik, SS 2004

Beispiele von Verteilungen Rechnungsbeträge CO-Emission von PKWs Lebensalter Schäden durch Wirbelstürme (in Mio USD) 1.3.04 PI Statistik, SS 2004

Schäden durch Wirbelstürme 1.3.04 PI Statistik, SS 2004

Schäden durch Wirbelstürme Klasse Kl.-Breite Häufigk't rel.Häufigk't Dichte 0 – 50 50 19 0,50 0,010000 50 – 100 4 0,11 0,002105 100 – 500 400 10 0,26 0,000658 500 - 2000 1500 5 0,13 0,000088   38 1,00 Dichte: Relative Häufigkeit/Klassenbreite Dichtehistogramm: Fläche beträgt 1 1.3.04 PI Statistik, SS 2004

Schuh- und Körpergröße Nach R. Hatzinger, 2003 1.3.04 PI Statistik, SS 2004

Charakteristika von Verteilungen Beschreiben durch Kennzahlen wesentliche Eigenschaften der Verteilung Dazu gehören: Quantile, Minimum, Maximum Lagemaße Streuungsmaße Schiefe: charakterisiert Symmetrie Wölbung (Kurtosis): Vergleich von symmetrischer Verteilung mit Gauss‘scher Glockenform 1.3.04 PI Statistik, SS 2004

Populationskenngrößen Analyse-Funktion in EXCEL Rechnungsbeträge Mittelwert 772,46 Standardfehler 50,10 Median 714,62 Modus 718,46 Standardabweichung 354,29 Stichprobenvarianz 125518,49 Kurtosis 3,29 Schiefe 1,60 Wertebereich 1746,15 Minimum 226,92 Maximum 1973,08 Summe 38623,15 Anzahl 50 1.3.04 PI Statistik, SS 2004

Lage- und Streuungsmaße Lagemaße Mittelwert Median , getrimmter Mittelwert Modus Streuungsmaße Standardabweichung s Varianz s 2 Interquartilsabstand I Spannweite R 1.3.04 PI Statistik, SS 2004

Lagemaße Mittelwert: Median: nach der Größe geordnete Beobachtungen: den Index i nennen wir den Rang von Median: wenn n=2m+1 ungerade (m ist Rang der mittleren Beobachtung): wenn n=2m gerade: 1.3.04 PI Statistik, SS 2004

Robuste Lagemaße Median: extreme Werte („Ausreißer“) haben keinen Effekt Getrimmter Mittelwert: Mittelwert von 80% der Beobachtungen, je 10% größte und kleinste Beobachtungen bleiben unberücksichtigt 1.3.04 PI Statistik, SS 2004

Quantil (Perzentil) Quantil der Ordnung p aus n Beobachtungen x1, …, xn ist die Beobachtung x(r) mit Rang r = (n+1)p wenn (n+1)p keine ganze Zahl ist: Mittel der benachbarten Beobachtungen Runden des Ranges (n+1)p Beispiel: Rechnungsbeträge (50 Beobachtungen) Quantil der Ordnung 0.8 (oder 0.8-Quantil): Mittel aus Beobachtungen mit Rängen 40 und 41 1. Quartil oder 0.25-Quantil: Mittel aus Beobachtungen mit Rängen 12 und 13 1.3.04 PI Statistik, SS 2004

Einige Quantile Quartile: Dezile 0.25-Quantil oder 1. Quartil (Q1, Qu) 0.75-Quantil oder 3. Quartil (Q3, Qo) 0.5-Quantil ist der Median Dezile Unteres Dezil oder 0.1-Quantil Oberes Dezil oder 0.9-Quantil 1.3.04 PI Statistik, SS 2004

Standardabweichung Ist die Wurzel aus der Varianz s 2: Varianz oder Stichprobenvarianz: Eigenschaften der Standardabweichung: s kann nicht negativ sein s = 0: alle Beobachtungen haben gleichen Wert s wird in den gleichen Einheiten gemessen wie X 1.3.04 PI Statistik, SS 2004

Überdeckung Anteil der Beobachtungen Intervall 2/3 95% ~ 100% Gilt für die Normalverteilung exakt Gilt weitgehend für alle symmetrischen, unimodalen Verteilungen 1.3.04 PI Statistik, SS 2004

Andere Streuungsmaße Interquartilsabstand I = Qo – Qu = Q3 – Q1 überdeckt die zentralen 50% der Beobachtungen Spannweite (range) R = x(n) – x(1) Variationskoeffizient (s in Prozent des Mittelwertes): für nicht-neg. Merkmale; unabhängig von Maßeinheit MAD (mean absolute deviation) 1.3.04 PI Statistik, SS 2004

Schiefe und Wölbung Schiefe: Maß für Asymmetrie (unimodale Verteilung) rechtsschief: Modus < < Momentkeoffizient (Fisher): mit Wölbung: g2 = 0: Gauss‘sche Glockenkurve g2 < 0: abgeplattet, platykurtisch, heavy tail g2 > 0: spitz, leptokurtisch, light tail 1.3.04 PI Statistik, SS 2004

Box Plot Darstellung einer Häufigkeitsverteilung; gibt die wesentlichen Charakteristika wieder. (siehe Hackl & Katzenbeisser, S. 29-30) Ausreißer Whisker Qo Median Qu 50% der Daten 1.3.04 PI Statistik, SS 2004

Beispiel: Heilmittelkosten Heilmittelkosten je Patient (in Euro) bei 1682 Praktischen Ärzten (AM) 176 Internisten (IN) 242 Orthopäden (OP) WGKG, 2002 1.3.04 PI Statistik, SS 2004

Box Plot: Elemente Box: mittlere 50% der Beobachtungen; Begrenzungen sind Quartile; Median als Mittellinie Innere Grenzen (inner fences): Qu - 1.5I, Qu + 1.5I Äußere Grenzen (outer fences): Qu - 3I, Qu + 3I Beobachtungen innerhalb der Inneren Grenzen werden verbunden (whiskers) Beobachtungen außerhalb der Inneren Grenzen und innerhalb der Äußeren Grenzen: einzeln mit einem + einzeichnen (outlier) Beobachtungen außerhalb der Äußeren Grenzen: einzeln mit einem * einzeichnen (far outlier) 1.3.04 PI Statistik, SS 2004

Fragestellungen In welchem Bereich kann man einen Mittelwert in der Grundgesamtheit erwarten ? Ist ein Mittelwert anders (kleiner, größer, oder ungleich) als eine bestimmte Vorgabe ? 1.3.04 PI Statistik, SS 2004