4 Spezifizierende Beschreibung

Slides:



Advertisements
Ähnliche Präsentationen
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Advertisements

Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Median Merkmal Geordneter Datensatz
Streuungsparameter Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Die Vorlesung Mathematik I (Prof. Kugelmann) findet heute um 14:30 Uhr im Hörsaal Loefflerstraße 70 statt.
Quantile.
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Streuungsparameter Median Mittlere Abweichung vom Median
Quantile.
(Gini-Koeffizient, Lorenz-Kurve)
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Wiederholung und Beispiele
Daten auswerten Boxplots
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.
Theorie psychometrischer Tests, II
Der Zentralwert.
Erheben, berechnen und darstellen von Daten
Mathematik für BiologInnen WS 05
setzt Linearität des Zusammenhangs voraus
STATISIK LV Nr.: 1375 SS März 2005.
Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.
Statistische Auswertung und Darstellungsmöglichkeiten von Messdaten Seminarvortrag von Christian Gorgels im Studiengang Scientific Programming.
Ein Dozent hat mittels eines Fragebogens die Körpergröße seiner Studenten festgestellt. Anhand der erfassten Daten weiß er, dass der kleinste Student 158.
1 H. Schupp, UdS Rund um den Fermat-Punkt Vortrag am im Rahmen der Ring-Vorlesung Welt der Mathematik – Mathematik der Welt an der Universität.
Page  1 Agenda  Beantwortung der Forschungsfragen  Datendarstellung für Präsentation und Bericht  Häufigkeitsverteilungen  Statistische Kennwerte.
Betrachtung der Realität aus der Sicht der Statistik VARIABILITÄT
Übersetzung: / Tradotto da:
Kapitel 8.1 Auswertung statistischer Daten
4 Spezifizierende Beschreibung
1 Einführung in die Statistik
Im Großstädtevergleich der Armutsgefährdungsquoten belegt die Stadt Bremen einen Platz im Mittelfeld. Die Stadt Bremen belegt bei einem Vergleich der Armutsgefährdungsquoten.
Österreichisches Wildeinflussmonitoring
Deskriptive Statistik -
Konjunkturelle Fluktuationen 2
5 Beschreibung und Analyse
7.2 Theoretische Kennwerte
Kapitel 2: Analoge, periodische Signale
Die Güternachfrage von Haushalten
1 Einführung in die Statistik
Wirtschaftswachstum D. Dollar / A. Kraay (2001):
Abiturprüfung Mathematik 2017 Baden-Württemberg Allgemeinbildende Gymnasien Wahlteil Analysis A 1 Lösungen der Aufgaben A 1.1 und A 1.2
Abiturprüfung Mathematik 2012 Baden-Württemberg Allgemeinbildende Gymnasien Pflichtteil Lösungen
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
Forschungsbudgets der Branche erreichen Rekordwert Externe und interne Aufwendungen in Milliarden Euro; 2017 und 2018: Schätzung/Prognose 2017 sind die.
Ökonometrie und Statistik Wiederholung
Lösung Aufgabe 1 Teilaufgabe a)
Univariate Statistik M. Kresken.
UE/BiTS Berlin, ALBA BERLIN College Sommersemester 2018
Wachstumsprozesse Natürliches Wachstum Größenbeschränktes Wachstum
10 Statistisches Schätzen
12 Das lineare Regressionsmodell
3 Gesamtbeschreibung empirischer Verteilungen.
Forschungsstrategien Johannes Gutenberg Universität Mainz
Ökonometrie und Statistik Wiederholung
5 Beschreibung und Analyse
Statistik und Biometrie
Wahlteil 2014 – Analysis A 1 Aufgabe A 1.1
Wahlteil 2009 – Geometrie II 1
Pflichtteil 2016 Aufgabe 6: Gegeben ist die Gerade
Wahlteil 2016 – Aufgabe B 1 Aufgabe B 1.1 In einem Koordinatensystem beschreiben die Punkte
Lage, Schnitte und Schnittwinkel
17 Ziele für eine bessere Welt
Ökonometrie und Statistik Wiederholung
Abiturprüfung Mathematik 2015 Baden-Württemberg Allgemeinbildende Gymnasien Wahlteil Analytische Geometrie / Stochastik Aufgabe B 2.1 und B Lösungen.
Konfidenzintervalle und Tests auf Normalverteilung
Abiturprüfung Mathematik 2015 Baden-Württemberg Allgemeinbildende Gymnasien Wahlteil Analysis A 2 Lösungen der Aufgaben A 2.1 und A 2.2
Ökonometrie und Statistik Wiederholung
 Präsentation transkript:

4 Spezifizierende Beschreibung empirischer Verteilungen

4 Spezifizierende Beschreibung empirischer Verteilungen 4.1 Spezifika empirischer Verteilungen 66 4.2 Lagekennwerte 70 4.2.1 Arithmetisches Mittel 70 4.2.2 Median 74 4.2.3 Modalwert 78 4.2.4 Fechner‘sche Lageregeln 79 4.3 Spezielle Lagekennwerte 81 4.3.1 Arithmetisches Mittel bei gruppierten Daten 81 4.3.2 Quantile 83 4.3.3 Geometrisches Mittel 88 4.4 Streuungskennwerte 93 4.4.1 Spannweite 93 4.4.2 Mittlere absolute Abweichungen 94 2

4 Spezifizierende Beschreibung empirischer Verteilungen 4.4.3 Median absoluter Abweichungen 98 4.4.4 Varianz, Standardabweichung und Schwankungsintervalle 101 4.5 Spezielle Streuungskennwerte 105 4.5.1 Varianz bei gruppierten Daten 105 4.5.2 Quantilsabstände 108 4.5.3 Variationskoeffizient 110 4.6 Standardisierung mittels Lage und Streuung 114 4.7 Messung von Schiefe 118 4.8 Darstellung und Messung von Konzentration 121 4.8.1 Lorenzkurve 121 4.8.2 Gini-Koeffizient 124 3

4 Spezifizierende Beschreibung empirischer Verteilungen 4.9 Spezifische Eigenschaften empirischer Kennwerte 129 4.9.1 Minimumeigenschaft des arithmetischen Mittels 129 4.9.2 Minimumeigenschaft des Medians 133 4.9.3 Transformationseigenschaften 137 4.9.4 Robustheit 145 4

4.1 Spezifika empirischer Verteilungen ● Unimodalität und Multimodalität ● ● Symmetrie und Schiefe ● ● Lage und Streuung ●

4.1 Spezifika empirischer Verteilungen Beispiel 4.1.1: Schiefe und Multimodalität

4.1 Spezifika empirischer Verteilungen

4.1 Spezifika empirischer Verteilungen

4.2 Lagekennwerte 4.2.1 Arithmetisches Mittel ● Definition und Berechnung ● > Gegeben metrisch skalierte Beobachtungswerte 𝑥 1 , 𝑥 2 ,... 𝑥 𝑛 : 𝑥 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 > Merkmalssumme 𝑖=1 𝑛 𝑥 𝑖 =𝑛× 𝑥 ● Interpretation ● 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 =0 Schwerpunkteigenschaft

4.2 Lagekennwerte ● Berechnung bei klassierten Daten ●

4.2 Lagekennwerte > Feststellung: Bei gleichmäßiger Verteilung aller Werte innerhalb der Klassen stimmen Klassenmittelwert und Klassenmitte ungefähr überein > Im Beispiel (Tab. 4.2.1) gilt deshalb mit k = 6 Klassen: 𝑥 ≈ 1 𝑛 𝑗=1 6 𝑚 𝑗 𝑛 𝑗 = 1 30 5×2+15×8+25×10+35×6+45×3+55×1 =26 𝑛 6 𝑚 6 𝑚 𝑗 ... Klassenmitte der j-ten Klasse ● Kein robuster Kennwert ●

4.2 Lagekennwerte

4.2 Lagekennwerte 4.2.2 Median ● Definition und Interpretation ● −1, 0, 0, 1, 3, 5, 6 −1, 0, 1, 3, 5, 6 𝑥 0.5 =1 𝑥 0.5 =2 ● Berechnung bei Urlisten ● 𝑥 1 =0, 𝑥 2 =1, 𝑥 3 =5, 𝑥 4 =6, 𝑥 5 =3, 𝑥 6 =0, 𝑥 7 =−1 Geordnete Werte: 𝑥 1 =−1, 𝑥 2 =0, 𝑥 3 =0, 𝑥 4 =1, 𝑥 5 =3, 𝑥 6 =5, 𝑥 7 =6 𝑛= 7 ungerade: 𝑥 0.5 = 𝑥 𝑛+1 2 = 𝑥 7+1 2 = 𝑥 4 =1 𝑥 0.5 =0.5 𝑥 𝑛/2 + 𝑥 𝑛/2+1 falls n gerade wäre

4.2 Lagekennwerte ● Berechnung bei klassierten Daten ● Einfallsklasse des Medians ist hier 𝑗=3 𝑐 𝑗−1 = 𝑐 2 =20, 𝐹 𝑛 𝑐 2 =0.333, 𝑓 3 / 𝑑 3 =0.0333

4.2 Lagekennwerte 𝑥 0.5 ≈20+ 0.5−0.333 0.0333 ≈25.02

4.2 Lagekennwerte

4.2 Lagekennwerte 4.2.3 Modalwert

4.2 Lagekennwerte 4.2.4 Fechner‘sche Lageregeln

4.2 Lagekennwerte Beispiel 4.2.1: Durchschnittseinkommen, Bundesmedian und Armutsgefährdung

4.3 Spezielle Lagekennwerte 4.3.1 Arithmetisches Mittel bei gruppierten Daten ● Hintergrund ● 𝑘 = 3 Gruppen 𝑛=282+585+250 =1117 𝑥 3 =1.6 𝑛 3 =250 ● Berechnung ● 𝑥 = 1 𝑛 𝑗=1 𝑘 𝑥 𝑗 𝑛 𝑗 = 1 1117 1.5×282+2.4×585+1.6×250 ≈1.99

4.3 Spezielle Lagekennwerte ● Klassierung als Spezialfall ● > Gruppen sind gegeben als Größenklassen > Problem: Klassenmittelwerte häufig unbekannt > Klassenmitten ersetzen approximativ die Klassenmittel 𝑚 𝑗 ≈ 𝑥 𝑗

4.3 Spezielle Lagekennwerte 4.3.2 Quantile ● Definition und Interpretation ● > Ein x%-Quantil wird (grob) gesagt von x% der Werte unterschritten und von (100x)% überschritten > Speziell: 50%-Quantil oder 0.5-Quantil = Median ● Berechnung bei Urlisten ● Werte geordnet! z. B. 0.25- und 0.9-Quantil: 0.25×30=7.5∉ℕ 0.9×30=27∈ℕ 𝑥 0.25 = 𝑥 7.5 +1 = 𝑥 8 =18 320 𝑥 0.9 =0.5 𝑥 27 + 𝑥 28 =0.5 41004+44981 =42992.5

4.3 Spezielle Lagekennwerte ● Berechnung bei klassierten Daten ● Einfallsklasse des 0.25-Quantils ist hier 𝑗=2 𝑐 𝑗−1 = 𝑐 1 =10, 𝐹 𝑛 𝑐 1 =0.067, 𝑓 2 / 𝑑 2 =0.0267

4.3 Spezielle Lagekennwerte 𝑥 0.25 ≈10+ 0.25−0.067 0.0267 ≈16.85 𝑥 0.9 ≈40+ 0.9−0.867 0.01 ≈43.3

4.3 Spezielle Lagekennwerte

4.3 Spezielle Lagekennwerte Beispiel 4.3.1: Dezile und Quintilsverhältnis der Einkommensverteilung

4.3 Spezielle Lagekennwerte 4.3.3 Geometrisches Mittel ● Hintergrund ● Umsätze eines Unternehmens +10% −10% +30% (Wachstumsraten) 1 3 0.1−0.1+0.3 =0.1 Problem: aber 1000×1.1×1.1×1.1=1331≠1287 Angabe des durchschnittlichen Wachstums mit 10% nicht sinnvoll

4.3 Spezielle Lagekennwerte ● Wachstumsfaktoren und Wachstumsraten ● > Wachstumsfaktoren im Beispiel: 1.1, 0.9, 1.3 z.B. 1.3= 1287 990 („späterer Zeitpunkt/früherer Zeitpunkt“) > Wachstumsraten im Beispiel: +10%, 10%, +30% Wachstumrate =(Wachstumsfaktor  1) ×100% ● Definition und Berechnung ● 𝑥 𝑔𝑒𝑜𝑚 = 1.1×0.9×1.3 1/3 ≈1.0877 Alternativ: 𝑥 𝑔𝑒𝑜𝑚 = 1287/1000 1/3 ≈1.0877 Damit gilt tatsächlich: 1000× 𝑥 𝑔𝑒𝑜𝑚 × 𝑥 𝑔𝑒𝑜𝑚 × 𝑥 𝑔𝑒𝑜𝑚 = 1000×1.0877 3 =1287

4.3 Spezielle Lagekennwerte

4.3 Spezielle Lagekennwerte Beispiel 4.3.2: Wirtschaftswachstum in Deutschland

4.3 Spezielle Lagekennwerte > Durchschnittliches Wachstum des realen BIP von 1994 bis 2007 𝑥 𝑔𝑒𝑜𝑚 = 1.017×1.008×1.017×…×1.033 1/13 ≈1.016 > Durchschnittliches Wachstum des realen BIP von 2008 bis 2012 𝑥 𝑔𝑒𝑜𝑚 = 1.011×0.949×1.040×1.033×1.007 1/5 ≈0.007 > Durchschnittliches Wachstum des nominalen BIP von 1994 bis 2012 𝑥 𝑔𝑒𝑜𝑚 = 2666.4/1782.2 1/18 ≈1.023

4.4 Streuungskennwerte 4.4.1 Spannweite −1, 0, 0, 1, 3, 5, 6 (geordnet!) R= 𝑥 7 − 𝑥 1 =6− −1 =7

4.4 Streuungskennwerte 4.4.2 Mittlere absolute Abweichungen ● Definition und Berechnung ● −1, 0, 0, 1, 3, 5, 6 ⟹ 𝑥 =2: 𝑑 ∗ = 1 7 −1−2 + 0−2 + 0−2 + 1−2 + 3−2 + 5−2 + 6−2 = 1 7 3+2+2+1+1+3+4 ≈2.29 ⟹ 𝑥 0.5 =1: 𝑑= 1 7 −1−1 + 0−1 + 0−1 + 1−1 + 3−1 + 5−1 + 6−1 = 1 7 2+1+1+0+2+4+5 ≈2.14

4.4 Streuungskennwerte ● Interpretation ● > 𝑑 ∗ ... Durchschnittsabstand aller Werte zum arithmetischen Mittel (Mittlere absolute Abweichung vom arithmetischen Mittel) > 𝑑 ... Durchschnittsabstand aller Werte zum Median (Mittlere absolute Abweichung vom Median)

4.4 Streuungskennwerte ● Berechnung bei klassierten Daten ● ⟹ 𝑥 =26 ⟹ 𝑥 =26 (Folie 72) ⟹ 𝑥 0.5 =25.02 (Folie 76) 𝑑 ∗ ≈ 1 30 2× 5−26 +8× 15−26 +…+1× 55−26 ≈9.33 𝑑≈ 1 30 2× 5−25.02 +8× 15−25.02 +…+1× 55−25.02 ≈9.00

4.4 Streuungskennwerte ● Median als präferierter Bezugswert ● > ... 𝑑 theoretisch fundiert über Minimumeigenschaft des Medians > ... 𝑑 ∗ eher unüblich Summen laufen jeweils bis k, j statt i

4.4 Streuungskennwerte 4.4.3 Median absoluter Abweichungen ● Hintergrund ● > Problem: Mittelwerte sind nicht robust, so auch nicht mittlere absolute Abweichungen (auch nicht wenn Bezugspunkt Median ist) > Situation ohne Ausreißer Beobachtungswerte: 1, 2, 3, 4, 5 ⟹ 𝑥 =3 𝑥 0.5 =3 Absolute Abweichungen: 2, 1, 0, 1, 2 ⟹ 𝑑 ∗ =1.2 𝑑=1.2 ... vom arithmetischen Mittel bzw. Median > Situation mit Ausreißer: 1, 2, 3, 4, 500 ⟹ 𝑥 =102 𝑥 0.5 =3 Absolute Abweichungen: 101, 100, 99,98,398 ⟹ 𝑑 ∗ =159.2 ... vom arithmetischen Mittel 2, 1, 0, 1, 497 ⟹ 𝑑=100.2 ... vom Median

4.4 Streuungskennwerte ● Definition und Berechnung ● ⟹ 𝑥 0.5 =3 Situation mit Ausreißer: 1, 2, 3, 4, 500 ⟹ 𝑥 0.5 =3 Absolute Abweichungen vom Median: 2, 1, 0, 1, 497 Geordnet: 0, 1, 1, 2, 497 Davon der Median: MAD = 1

4.4 Streuungskennwerte Beispiel 4.4.1: Streuung des weltweiten Pro-Kopf-BIP (vgl. Abb. 4.1.2) 𝑥 =14 936 𝑥 0.5 =5 476 𝑑=12 744 𝑀𝐴𝐷=4 722 (alle Einheiten in US-Dollar)

4.4 Streuungskennwerte 4.4.4 Varianz, Standardabweichung und Schwankungsintervalle ● Definition und Berechnung ● > Empirische Varianz in „originärer Formel“ 𝑠 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 > Empirische Standardabweichung 𝑠 = 𝑠 2 > Rechenbeispiel: −1, 0, 0, 1, 3, 5, 6 ⟹ 𝑥 =2 ⟹ 𝑠 2 = 1 7 −1−2 2 + 0−2 2 + 0−2 2 +… 6−2 2 ≈6.2857 ⟹ 𝑠 = 6.28571 ≈2.51

4.4 Streuungskennwerte ● Verschiebungsformel für die empirische Varianz ● > Allgemeine Verschiebungsformel 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 2 − 𝑥 −𝑐 2 > Für c = 0 folgt daraus die Verschiebungsformel für die emirische Varianz 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 2 − 𝑥 2 > Rechenbeispiel −1, 0, 0, 1, 3, 5, 6 ⟹ 𝑥 =2 ⟹ 𝑠 2 = 1 7 −1 2 + 0 2 + 0 2 + 1 2 + 3 2 + 5 2 + 6 2 − 2 2 ≈6.2857

4.4 Streuungskennwerte ● Standardabweichung und Interpretation ● Es liegen in den empirischen Schwankungsintervallen 𝑥 − 𝑠 , 𝑥 + 𝑠 , 𝑥 −2 𝑠 , 𝑥 +2 𝑠 und 𝑥 −3 𝑠 , 𝑥 +3 𝑠 ca. 68% 95% bzw. 99% aller Beobachtungswerte.

4.4 Streuungskennwerte ● Hintergründe ● Bedeutendstes Streuungsmaß in der Statistik aus verschiedenen Gründen...

4.5 Spezielle Streuungskennwerte 4.5.1 Varianz bei gruppierten Daten ● Berechnung ●

4.5 Spezielle Streuungskennwerte ● Beispiel 4.5.1 ● 𝑥 1 =1.0 𝑥 2 =2.0 𝑥 3 =1.46 𝑠 1 2 =0.06 𝑠 2 2 =0.05 𝑠 3 2 =0.0464 𝑛 1 =3 𝑛 2 =4 𝑛 3 =5 ⟹ 𝑥 = 𝑗=1 3 𝑓 𝑗 𝑥 𝑗 = 3 12 ×1.0+ 4 12 ×2.0+ 5 12 ×1.46=1.525

4.5 Spezielle Streuungskennwerte ⟹ 𝑗=1 3 𝑓 𝑗 𝑠 𝑗 2 = 3 12 ×0.06+ 4 12 ×0.05+ 5 12 ×0.0464=0.051 ⟹ 𝑗=1 3 𝑓 𝑗 𝑥 𝑗 − 𝑥 2 = 3 12 × 1−1.525 2 + 4 12 × 2−1.525 2 + 5 12 × 1.46−1.525 2 =0.145875 ⟹ 𝑠 2 =0.051+0.145875=0.196875 Intern Extern Gesamt Tatsächlich erhält man diesen Wert auch auf „konventionellem Wege“: 𝑠 2 = 1 12 𝑖=1 12 𝑥 𝑖 2 − 𝑥 2 = 1 12 1 2 + 1.3 2 +…+ 1.6 2 − 1.525 2 =0.196875 ● Interpretation ● ● Hintergründe ●

4.5 Spezielle Streuungskennwerte 4.5.2 Quantilsabstände 2α

4.5 Spezielle Streuungskennwerte Beispiel 4.5.2: Quantilsabstände der Einkommensverteilung 16168 𝑄 0.1 = 𝑥 0.9 − 𝑥 0.1 =35731−9913=25818 𝑄 0.2 = 𝑥 0.8 − 𝑥 0.2 =29039−12871=16168

4.5 Spezielle Streuungskennwerte 4.5.3 Variationskoeffizient ● Hintergrund ● > Verschiebungsinvarianz der Varianz ist manchmal störend: 1, 2, 3, 4, 5 ← identische Varianz → 15, 16, 17, 18, 19 > Beispiel: Angenommen, im Rahmen einer Marktstudie wird die Streuung von Preisen für bestimmte Produkte bei 3 verschiedenen Lebensmitteldiscountern vergli- chen. Dabei ergeben sich folgende Preise für 100g Speisezalz: 0.29, 0.39, 0.49 Euro 1kg Waschmittel: 19.79, 19.89, 19.99 Euro Somit erhalten wir: 𝑥 𝑆𝑎𝑙𝑧 =0.39 𝑠 𝑆𝑎𝑙𝑧 =0.0816 Identisch! 𝑥 𝑊𝑎𝑠𝑐ℎ𝑒𝑛 =19.89 𝑠 𝑊𝑎𝑠𝑐ℎ𝑒𝑛 =0.0816 Bezogen auf das Preisniveau variiert der Preis des Waschmittels relativ betrachtet weniger als der Preis des Salzes

4.5 Spezielle Streuungskennwerte ● Definition und Berechnung ● > Variationskoeffizient als Maß der relativen Streuung: 𝑣= 𝑠 𝑥 nichtnegative Werte mit 𝑥 >0 vorausgesetzt > Beispiel von zuvor: 𝑣 𝑆𝑎𝑙𝑧 = 𝑠 𝑆𝑎𝑙𝑧 𝑥 𝑆𝑎𝑙𝑧 = 0.0816 0.39 ≈0.209 𝑣 𝑊𝑎𝑠𝑐ℎ𝑒𝑛 = 𝑠 𝑊𝑎𝑠𝑐ℎ𝑒𝑛 𝑥 𝑊𝑎𝑠𝑐ℎ𝑒𝑛 = 0.0816 19.89 ≈0.004 ● Interpretation ● > Variationskoeffizient entspricht der Standardabweichung der prozentualen Abweichungen vom arithmetischen Mittel

4.5 Spezielle Streuungskennwerte > Im Beispiel des Salzes mit 𝑥 𝑆𝑎𝑙𝑧 =0.39 Preise: 0.29 0.39 0.49 Abweichung in %: −25.64% 0% 25.64% z. B. 0.49−0.39 0.39 ×100%=25.64% Standardabweichung : 𝑠 = 𝑠 2 = 1 3 −25.64−0 2 + 0−0 2 + 25.64−0 2 ≈0.209

4.5 Spezielle Streuungskennwerte Beispiel 4.5.3: Variationsvergleich von Wechselkursen 𝑥 𝑌𝑢𝑎𝑛 =9.49 𝑠 𝑌𝑢𝑎𝑛 =0.93 𝑣 𝑌𝑢𝑎𝑛 =0.10 𝑥 𝐷𝑜𝑙𝑙𝑎𝑟 =1.33 𝑠 𝐷𝑜𝑙𝑙𝑎𝑟 =0.09 𝑣 𝐷𝑜𝑙𝑙𝑎𝑟 =0.07

4.6 Standardisierung mittels Lage und Streuung ● Hintergrund ● > Beobachtungswerte aus unterschiedlichen Grundgesamtheiten lassen sich nicht immer sinnvoll vergleichen > Beispiel: Einkommensvergleich in zwei unterschiedlichen Ländern Deutscher: 2800 Euro bei einem Durchschnitt von 2500 Euro und einer Standardabweichung von 150 Euro Schweizer: 5500 Franken bei einem Durchschnitt von 5000 Franken und einer Standardabweichung von 400 Franken ● Berechnung und Interpretation ● > Allgemeine Form: > Spezialfall Z-Standardisierung: 𝑧 𝑖 = 𝑥 𝑖 − 𝑥 𝑠 𝑋

4.6 Standardisierung mittels Lage und Streuung > Im Beispiel von zuvor Deutscher: 2800−2500 150 =2 Schweizer: 5500−5000 400 =1.25 Fazit: Deutscher (Schweizer) liegt 2 (1.25) Standardabweichungen über dem Durchschnitt ● Eigenschaften z-standardisierter Werte ● > Mittelwert z-standardisierter Werte ist stets 0: 𝑧 = 1 𝑛 𝑖=1 𝑛 𝑧 𝑖 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 𝑠 𝑋 = 1 𝑛 𝑠 𝑋 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 =0 (vgl. Folie 70)

4.6 Standardisierung mittels Lage und Streuung > Varianz (Standardabweichung) z-standardisierter Werte ist stets 1: 𝑠 𝑍 2 = 1 𝑛 𝑖=1 𝑛 𝑧 𝑖 − 𝑧 2 = 1 𝑛 𝑖=1 𝑛 𝑧 𝑖 2 − 𝑧 2 = 1 𝑛 𝑖=1 𝑛 𝑧 𝑖 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 𝑠 𝑋 2 = 1 𝑠 𝑋 2 × 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 = 1 𝑠 𝑋 2 × 𝑠 𝑋 2 =1

4.6 Standardisierung mittels Lage und Streuung Beispiel 4.6.1: Standardisierte Zeitreihen

4.7 Messung von Schiefe ● Konzept und Definition ● > Feststellung: Bei schiefen Verteilungen liegen obere und untere Quantile gewöhnlich unterschiedlich weit vom Median entfernt > Erster Vorschritt: Zerlegung des Quantilsabstands im Sinne von 𝑥 1−𝛼 − 𝑥 𝛼 = 𝑥 0.5 − 𝑥 𝛼 + 𝑥 1−𝛼 − 𝑥 0.5 𝑄 𝛼

4.7 Messung von Schiefe > Quantilskoeffizient der Schiefe setzt die Differenz der beiden Abstände ins Verhältnis zum Quantilsabstand (siehe Kasten) ● Interpretation ● ... siehe Kasten QS

4.7 Messung von Schiefe Beispiel 4.7.1: Schiefe der Einkommensverteilung 𝑄𝑆 0.1 =0.25 𝑄𝑆 0.2 =0.17 𝑄𝑆 0.3 =0.10 𝑄𝑆 0.1 = 𝑥 0.9 − 𝑥 0.5 − 𝑥 0.5 − 𝑥 0.1 𝑥 0.9 − 𝑥 0.1 = 35731−19595 − 19595−9913 35731−9913 ≈0.25

4.8 Darstellung und Messung von Konzentration 4.8.1 Lorenz-Kurve ● Was versteht man unter Konzentration? ● Man vergleiche die folgenden beiden Datensätze Merkmalssumme jeweils = 20 Wie verteilt sich diese auf die einzelnen Merkmalsträger? Wie stark ist die Ungleichverteilung (Konzentration) ausgeprägt? ● Beispiel 4.8.1 ● Man stelle sich 3 Branchen mit jeweils 5 Firmen vor: Feststellung: Phänomen der Konzentration wird durch her- kömmliche Maße nicht adäquat gemessen

4.8 Darstellung und Messung von Konzentration ● Konstruktion einer Lorenzkurve ●

4.8 Darstellung und Messung von Konzentration ● Interpretation ● > Die Fläche zwischen Lorenzkurve und Winkelhalbierender wird immer dann groß, wenn wenige Merkmalsträger (relativ) viel von der Merkmalssumme auf sich vereinigen. > Keine Konzentration liegt vor, wenn die Lorenzkurve mit der Winkel- halbierenden zusammenfällt. Dann sind alle Werte gleich. Damit verteilt sich die Merkmalssumme gleichmäßig auf die Merkmalsträger. > Beispiel: Koordinatenpunkte der Lorenzkurve, falls Branche mit 5 Unter- nehmen keinerlei Konzentration aufweist: (0, 0), (0.2, 0.2), (0.4, 0.4), (0.6, 0.6), (0.8, 0.8), (1, 1)

4.8 Darstellung und Messung von Konzentration 4.8.2 Gini-Koeffizient ● Definition und Interpretation ● > (Nichtnormierter) Gini-Koeffizient: Zweifaches der Fläche zwischen Lorenzkurve und Winkelhalbierender > Gini-Koeffizient = 0, falls alle Werte gleich sind > Gini-Koeffizient ≈ 1 bei maximaler Konzentration, d. h. wenn ein ein- zelner Merkmalsträger die gesamte Merkmalssumme auf sich vereint

4.8 Darstellung und Messung von Konzentration ● Berechnung ● G= 2 𝑖 𝑥 𝑖 𝑛 𝑥 𝑖 − 𝑛+1 𝑛 Formel: Beispielrechnung für Branche 3: 20, 40, 60, 80, 100 (geordnet!) ⇒ 𝐺 3 = 2 1×20+2×40+3×60+4×80+5×100 5×300 − 6 5 ≈0.2667 Analog: 𝐺 1 =0.76, 𝐺 2 =0.1975

4.8 Darstellung und Messung von Konzentration ● Wertebereich und Normierung ● 𝐺 ist maximal 𝑛−1 𝑛 ; soll der Maximalwert = 1 sein: 𝐺 ∗ = 𝑛 𝑛−1 𝐺 Normierter Gini-Koeffizient

4.8 Darstellung und Messung von Konzentration ● Vorsicht bei der Interpretation ● 𝐺 𝐴 =0.4 𝐺 𝐵 =0.4 Fazit: Gini-Koeffizient allein verrät nicht alles! vgl. Fahrmeir et al. (2010)

4.8 Darstellung und Messung von Konzentration Beispiel 4.8.2: Konzentration von Einkommen in Deutschland

4.9 Spezifische Eigenschaften empirischer Kennwerte 4.9.1 Minimumeigenschaft des arithmetischen Mittels ● Hintergrund ● > Bekannt: 𝑠 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 verwendet 𝑥 als Referenzpunkt in der Frage „Wie stark streuen die Werte um ...?“ > Frage: Welcher Referenzpunkt c minimiert den Ausdruck 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 2 ? > Antwort: Die Lösung lautet tatsächlich 𝑐= 𝑥 ● Analytischer Nachweis ● > Minimierungsproblem: min 𝑐 𝑓 𝑐 mit 𝑓 𝑐 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 2 𝑑𝑓 𝑐 𝑑𝑐 =− 2 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 =− 2 𝑛 𝑖=1 𝑛 𝑥 𝑖 + 2 𝑛 𝑖=1 𝑛 𝑐

4.9 Spezifische Eigenschaften empirischer Kennwerte =−2 𝑥 +2𝑐=2 𝑐− 𝑥 ⇒ 𝑓 minimal für 𝑐= 𝑥 > Alternativ: Betrachte allgemeine Verschiebungsformel (Folie 102) 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 2 − 𝑥 −𝑐 2 𝑠 2 ⇔ 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 2 = 𝑠 2 + 𝑥 −𝑐 2 Ist minimal, falls 𝑐= 𝑥

4.9 Spezifische Eigenschaften empirischer Kennwerte ● Beispiel 4.9.1 ● Fall 1 : 1, 0, 0, 1, 3, 5, 6 Fall 2 : 1, 0, 0, 1, 3, 4, 5, 6 ⇒ 𝑥 =2, 𝑠 2 =6.28571 ⇒ 𝑥 =2.25, 𝑠 2 =5.9375 ⇒ 𝑓 1 𝑐 = 2−𝑐 2 +6.28571 ⇒ 𝑓 2 𝑐 = 2.25−𝑐 2 +5.9375

4.9 Spezifische Eigenschaften empirischer Kennwerte

4.9 Spezifische Eigenschaften empirischer Kennwerte 4.9.2 Minimumeigenschaft des Medians ● Hintergrund ● > Bekannt: 𝑑= 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 0.5 verwendet 𝑥 0.5 als Referenzpunkt in der Frage „Wie stark streuen die Werte um ...?“ > Frage: Welcher Referenzpunkt c minimiert den Ausdruck 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 ? > Antwort: Die Lösung lautet tatsächlich 𝑐= 𝑥 0.5 ● Analytischer Nachweis ● > Minimierungsproblem: min 𝑐 𝑓 𝑐 mit 𝑓 𝑐 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 > Jedoch: 𝑓 analytisch nicht gut handhabbar (teils nicht differenzierbar) auch keine Streuungzerlegungsformel > Minimumeigenschaft jedoch einsichtig („informaler Beweis“)

4.9 Spezifische Eigenschaften empirischer Kennwerte ● Beispiel 4.9.2 ●

4.9 Spezifische Eigenschaften empirischer Kennwerte Fall 1 : 1, 0, 0, 1, 3, 5, 6 Fall 2 : 1, 0, 0, 1, 3, 4, 5, 6 ⇒ 𝑥 0.5 =1 ⇒ 𝑥 0.5 =2 ⇒ 𝑓 1 𝑐 = −1−1 + 0−1 + …+ 6−1 ⇒ 𝑓 2 𝑐 = −1−2 + 0−2 + …+ 6−2

4.9 Spezifische Eigenschaften empirischer Kennwerte

4.9 Spezifische Eigenschaften empirischer Kennwerte 4.9.3 Transformationseigenschaften ● Arten von Transformationen ● > Ursprungswerte 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 sollen einheitlich transformiert werden > Verschiebung: 𝑢 𝑖 = 𝑥 𝑖 +𝑐 für 𝑖=1, …, 𝑛 > Umskalierung: 𝑢 𝑖 = 𝑐𝑥 𝑖 für 𝑖=1, …, 𝑛 und 𝑐>0 > Beispiel: Ursprungswerte: 1, 0, 0, 1, 3, 5, 6 Verschiebung um 𝑐=9: 8, 9, 9, 10, 12, 14, 15 Umskalierung mit 𝑐=2: 2, 0, 0, 2, 6, 10, 12

4.9 Spezifische Eigenschaften empirischer Kennwerte

4.9 Spezifische Eigenschaften empirischer Kennwerte ● Verschiebungsäquivarianz und Verschiebungsinvarianz ● > Äquivarianz ... „Gleichartige Veränderlichkeit“ bei Transformation > Invarianz ... „Unveränderlichkeit “ bei Transformation > Beispiel 1: Verschiebungsäquivarianz des arithmetischen Mittels: Transformation: 𝑢 𝑖 = 𝑥 𝑖 +𝑐 𝑢 = 1 𝑛 𝑖=1 𝑛 𝑢 𝑖 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 +𝑐 = = 𝑥 + 1 𝑛 ×𝑛𝑐= 𝑥 +𝑐 = 𝑥 +𝑐

4.9 Spezifische Eigenschaften empirischer Kennwerte > Beispiel 2: Verschiebungsinvarianz der (empirischen) Varianz 𝑠 𝑈 2 = 1 𝑛 𝑖=1 𝑛 𝑢 𝑖 − 𝑢 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 +𝑐− 𝑥 −𝑐 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 = 𝑠 𝑋 2 ● Skalenäquivarianz und Skaleninvarianz ● > Beispiel 3: Skalenäquivarianz des arithmetischen Mittels Transformation: 𝑢 𝑖 = 𝑐𝑥 𝑖 𝑢 = 1 𝑛 𝑖=1 𝑛 𝑢 𝑖 = 1 𝑛 𝑖=1 𝑛 𝑐 𝑥 𝑖 =𝑐× 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 =𝑐 𝑥

4.9 Spezifische Eigenschaften empirischer Kennwerte > Beispiel 4: Skalenäquivarianz der Standardabweichung Transformation: 𝑢 𝑖 = 𝑐𝑥 𝑖 mit 𝑐>0 𝑠 𝑈 2 = 1 𝑛 𝑖=1 𝑛 𝑢 𝑖 − 𝑢 2 = 1 𝑛 𝑖=1 𝑛 𝑐𝑥 𝑖 −𝑐 𝑥 2 = 𝑐 2 × 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 = 𝑐 2 𝑠 𝑋 2 => Fazit: Varianz ist weder äquivariant noch invariant, aber 𝑠 𝑈 = 𝑠 𝑈 2 = 𝑐 2 𝑠 𝑋 2 =𝑐 𝑠 𝑋 Beachte: 𝑐>0 => Fazit: Standardabweichung ist skalenäquivariant

4.9 Spezifische Eigenschaften empirischer Kennwerte ● Eigenschaften weiterer Kennwerte ●

4.9 Spezifische Eigenschaften empirischer Kennwerte ● Eigenschaften standardisierter Werte ● > Bei Verschiebung 𝑢 𝑖 = 𝑥 𝑖 +𝑐 gilt: 𝑢 = 𝑥 +𝑐 und 𝑠 𝑈 = 𝑠 𝑋 Daraus folgt bei einer Standardisierung verschobener Werte: 𝑧 𝑖 = 𝑢 𝑖 − 𝑢 𝑠 𝑈 = 𝑥 𝑖 +𝑐− 𝑥 −𝑐 𝑠 𝑋 = 𝑥 𝑖 − 𝑥 𝑠 𝑋 > Bei Umskalierung 𝑢 𝑖 = 𝑐𝑥 𝑖 gilt: 𝑢 =𝑐 𝑥 und 𝑠 𝑈 = 𝑐 𝑠 𝑋 Daraus folgt bei einer Standardisierung verschobener Werte: 𝑧 𝑖 = 𝑢 𝑖 − 𝑢 𝑠 𝑈 = 𝑐 𝑥 𝑖 −𝑐 𝑥 𝑐 𝑠 𝑋 = 𝑥 𝑖 − 𝑥 𝑠 𝑋 > Fazit: Verschiebungen und Umskalierungen wirken sich nicht auf standardisierte Werte aus

4.9 Spezifische Eigenschaften empirischer Kennwerte

4.9 Spezifische Eigenschaften empirischer Kennwerte 4.9.4 Robustheit ● Zum Begriff ● ● Robuste und nicht robuste Kennwerte ● ● Anmerkungen zur kritischen Verwendung ●