Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

4 Spezifizierende Beschreibung

Ähnliche Präsentationen


Präsentation zum Thema: "4 Spezifizierende Beschreibung"—  Präsentation transkript:

1 4 Spezifizierende Beschreibung
empirischer Verteilungen

2 4 Spezifizierende Beschreibung empirischer Verteilungen
4.1 Spezifika empirischer Verteilungen 66 4.2 Lagekennwerte 70 4.2.1 Arithmetisches Mittel 70 4.2.2 Median 74 4.2.3 Modalwert 78 4.2.4 Fechner‘sche Lageregeln 79 4.3 Spezielle Lagekennwerte 81 4.3.1 Arithmetisches Mittel bei gruppierten Daten 81 4.3.2 Quantile 83 4.3.3 Geometrisches Mittel 88 4.4 Streuungskennwerte 93 4.4.1 Spannweite 93 4.4.2 Mittlere absolute Abweichungen 94 2

3 4 Spezifizierende Beschreibung empirischer Verteilungen
4.4.3 Median absoluter Abweichungen 98 4.4.4 Varianz, Standardabweichung und Schwankungsintervalle 101 4.5 Spezielle Streuungskennwerte 105 4.5.1 Varianz bei gruppierten Daten 105 4.5.2 Quantilsabstände 108 4.5.3 Variationskoeffizient 110 4.6 Standardisierung mittels Lage und Streuung 114 4.7 Messung von Schiefe 118 4.8 Darstellung und Messung von Konzentration 121 4.8.1 Lorenzkurve 121 4.8.2 Gini-Koeffizient 124 3

4 4 Spezifizierende Beschreibung empirischer Verteilungen
4.9 Spezifische Eigenschaften empirischer Kennwerte 129 4.9.1 Minimumeigenschaft des arithmetischen Mittels 129 4.9.2 Minimumeigenschaft des Medians 133 4.9.3 Transformationseigenschaften 137 4.9.4 Robustheit 145 4

5 4.1 Spezifika empirischer Verteilungen
● Unimodalität und Multimodalität ● ● Symmetrie und Schiefe ● ● Lage und Streuung ●

6 4.1 Spezifika empirischer Verteilungen
Beispiel 4.1.1: Schiefe und Multimodalität

7 4.1 Spezifika empirischer Verteilungen

8 4.1 Spezifika empirischer Verteilungen

9 4.2 Lagekennwerte 4.2.1 Arithmetisches Mittel
● Definition und Berechnung ● > Gegeben metrisch skalierte Beobachtungswerte 𝑥 1 , 𝑥 2 ,... 𝑥 𝑛 : 𝑥 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 > Merkmalssumme 𝑖=1 𝑛 𝑥 𝑖 =𝑛× 𝑥 ● Interpretation ● 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 =0 Schwerpunkteigenschaft

10 4.2 Lagekennwerte ● Berechnung bei klassierten Daten ●

11 4.2 Lagekennwerte > Feststellung: Bei gleichmäßiger Verteilung aller Werte innerhalb der Klassen stimmen Klassenmittelwert und Klassenmitte ungefähr überein > Im Beispiel (Tab ) gilt deshalb mit k = 6 Klassen: 𝑥 ≈ 1 𝑛 𝑗=1 6 𝑚 𝑗 𝑛 𝑗 = ×2+15×8+25×10+35×6+45×3+55×1 =26 𝑛 6 𝑚 6 𝑚 𝑗 Klassenmitte der j-ten Klasse ● Kein robuster Kennwert ●

12 4.2 Lagekennwerte

13 4.2 Lagekennwerte 4.2.2 Median ● Definition und Interpretation ●
−1, 0, 0, 1, 3, 5, 6 −1, 0, 1, 3, 5, 6 𝑥 0.5 =1 𝑥 0.5 =2 ● Berechnung bei Urlisten ● 𝑥 1 =0, 𝑥 2 =1, 𝑥 3 =5, 𝑥 4 =6, 𝑥 5 =3, 𝑥 6 =0, 𝑥 7 =−1 Geordnete Werte: 𝑥 1 =−1, 𝑥 2 =0, 𝑥 3 =0, 𝑥 4 =1, 𝑥 5 =3, 𝑥 6 =5, 𝑥 7 =6 𝑛= 7 ungerade: 𝑥 0.5 = 𝑥 𝑛 = 𝑥 = 𝑥 4 =1 𝑥 0.5 =0.5 𝑥 𝑛/2 + 𝑥 𝑛/ falls n gerade wäre

14 4.2 Lagekennwerte ● Berechnung bei klassierten Daten ●
Einfallsklasse des Medians ist hier 𝑗=3 𝑐 𝑗−1 = 𝑐 2 =20, 𝐹 𝑛 𝑐 2 =0.333, 𝑓 3 / 𝑑 3 =0.0333

15 4.2 Lagekennwerte 𝑥 0.5 ≈ − ≈25.02

16 4.2 Lagekennwerte

17 4.2 Lagekennwerte 4.2.3 Modalwert

18 4.2 Lagekennwerte 4.2.4 Fechner‘sche Lageregeln

19 4.2 Lagekennwerte Beispiel 4.2.1: Durchschnittseinkommen, Bundesmedian und Armutsgefährdung

20 4.3 Spezielle Lagekennwerte
4.3.1 Arithmetisches Mittel bei gruppierten Daten ● Hintergrund ● 𝑘 = 3 Gruppen 𝑛= =1117 𝑥 3 =1.6 𝑛 3 =250 ● Berechnung ● 𝑥 = 1 𝑛 𝑗=1 𝑘 𝑥 𝑗 𝑛 𝑗 = × × ×250 ≈1.99

21 4.3 Spezielle Lagekennwerte
● Klassierung als Spezialfall ● > Gruppen sind gegeben als Größenklassen > Problem: Klassenmittelwerte häufig unbekannt > Klassenmitten ersetzen approximativ die Klassenmittel 𝑚 𝑗 ≈ 𝑥 𝑗

22 4.3 Spezielle Lagekennwerte
4.3.2 Quantile ● Definition und Interpretation ● > Ein x%-Quantil wird (grob) gesagt von x% der Werte unterschritten und von (100x)% überschritten > Speziell: 50%-Quantil oder 0.5-Quantil = Median ● Berechnung bei Urlisten ● Werte geordnet! z. B und 0.9-Quantil: 0.25×30=7.5∉ℕ 0.9×30=27∈ℕ 𝑥 = 𝑥 = 𝑥 8 =18 320 𝑥 0.9 =0.5 𝑥 𝑥 = =

23 4.3 Spezielle Lagekennwerte
● Berechnung bei klassierten Daten ● Einfallsklasse des 0.25-Quantils ist hier 𝑗=2 𝑐 𝑗−1 = 𝑐 1 =10, 𝐹 𝑛 𝑐 1 =0.067, 𝑓 2 / 𝑑 2 =0.0267

24 4.3 Spezielle Lagekennwerte
𝑥 ≈ − ≈16.85 𝑥 0.9 ≈ − ≈43.3

25 4.3 Spezielle Lagekennwerte

26 4.3 Spezielle Lagekennwerte
Beispiel 4.3.1: Dezile und Quintilsverhältnis der Einkommensverteilung

27 4.3 Spezielle Lagekennwerte
4.3.3 Geometrisches Mittel ● Hintergrund ● Umsätze eines Unternehmens +10% −10% +30% (Wachstumsraten) − =0.1 Problem: aber 1000×1.1×1.1×1.1=1331≠1287 Angabe des durchschnittlichen Wachstums mit 10% nicht sinnvoll

28 4.3 Spezielle Lagekennwerte
● Wachstumsfaktoren und Wachstumsraten ● > Wachstumsfaktoren im Beispiel: 1.1, 0.9, 1.3 z.B = („späterer Zeitpunkt/früherer Zeitpunkt“) > Wachstumsraten im Beispiel: +10%, 10%, +30% Wachstumrate =(Wachstumsfaktor  1) ×100% ● Definition und Berechnung ● 𝑥 𝑔𝑒𝑜𝑚 = 1.1×0.9×1.3 1/3 ≈1.0877 Alternativ: 𝑥 𝑔𝑒𝑜𝑚 = 1287/ /3 ≈1.0877 Damit gilt tatsächlich: 1000× 𝑥 𝑔𝑒𝑜𝑚 × 𝑥 𝑔𝑒𝑜𝑚 × 𝑥 𝑔𝑒𝑜𝑚 = 1000× =1287

29 4.3 Spezielle Lagekennwerte

30 4.3 Spezielle Lagekennwerte
Beispiel 4.3.2: Wirtschaftswachstum in Deutschland

31 4.3 Spezielle Lagekennwerte
> Durchschnittliches Wachstum des realen BIP von 1994 bis 2007 𝑥 𝑔𝑒𝑜𝑚 = ×1.008×1.017×…× /13 ≈1.016 > Durchschnittliches Wachstum des realen BIP von 2008 bis 2012 𝑥 𝑔𝑒𝑜𝑚 = ×0.949×1.040×1.033× /5 ≈0.007 > Durchschnittliches Wachstum des nominalen BIP von 1994 bis 2012 𝑥 𝑔𝑒𝑜𝑚 = / /18 ≈1.023

32 4.4 Streuungskennwerte 4.4.1 Spannweite
−1, 0, 0, 1, 3, 5, 6 (geordnet!) R= 𝑥 7 − 𝑥 1 =6− −1 =7

33 4.4 Streuungskennwerte 4.4.2 Mittlere absolute Abweichungen
● Definition und Berechnung ● −1, 0, 0, 1, 3, 5, 6 ⟹ 𝑥 =2: 𝑑 ∗ = −1−2 + 0−2 + 0−2 + 1−2 + 3−2 + 5−2 + 6−2 = ≈2.29 ⟹ 𝑥 0.5 =1: 𝑑= −1−1 + 0−1 + 0−1 + 1−1 + 3−1 + 5−1 + 6−1 = ≈2.14

34 4.4 Streuungskennwerte ● Interpretation ●
> 𝑑 ∗ ... Durchschnittsabstand aller Werte zum arithmetischen Mittel (Mittlere absolute Abweichung vom arithmetischen Mittel) > 𝑑 ... Durchschnittsabstand aller Werte zum Median (Mittlere absolute Abweichung vom Median)

35 4.4 Streuungskennwerte ● Berechnung bei klassierten Daten ● ⟹ 𝑥 =26
⟹ 𝑥 =26 (Folie 72) ⟹ 𝑥 0.5 =25.02 (Folie 76) 𝑑 ∗ ≈ × 5−26 +8× 15−26 +…+1× 55−26 ≈9.33 𝑑≈ × 5− × 15− …+1× 55− ≈9.00

36 4.4 Streuungskennwerte ● Median als präferierter Bezugswert ●
> ... 𝑑 theoretisch fundiert über Minimumeigenschaft des Medians > ... 𝑑 ∗ eher unüblich Summen laufen jeweils bis k, j statt i

37 4.4 Streuungskennwerte 4.4.3 Median absoluter Abweichungen
● Hintergrund ● > Problem: Mittelwerte sind nicht robust, so auch nicht mittlere absolute Abweichungen (auch nicht wenn Bezugspunkt Median ist) > Situation ohne Ausreißer Beobachtungswerte: , 2, 3, 4, 5 ⟹ 𝑥 =3 𝑥 0.5 =3 Absolute Abweichungen: , 1, 0, 1, 2 ⟹ 𝑑 ∗ =1.2 𝑑=1.2 ... vom arithmetischen Mittel bzw. Median > Situation mit Ausreißer: 1, 2, 3, 4, 500 ⟹ 𝑥 =102 𝑥 0.5 =3 Absolute Abweichungen: 101, 100, 99,98,398 ⟹ 𝑑 ∗ =159.2 ... vom arithmetischen Mittel 2, 1, 0, 1, 497 ⟹ 𝑑=100.2 ... vom Median

38 4.4 Streuungskennwerte ● Definition und Berechnung ● ⟹ 𝑥 0.5 =3
Situation mit Ausreißer: , 2, 3, 4, 500 ⟹ 𝑥 0.5 =3 Absolute Abweichungen vom Median: 2, 1, 0, 1, 497 Geordnet: 0, 1, 1, 2, 497 Davon der Median: MAD = 1

39 4.4 Streuungskennwerte Beispiel 4.4.1: Streuung des weltweiten Pro-Kopf-BIP (vgl. Abb ) 𝑥 =14 936 𝑥 0.5 =5 476 𝑑=12 744 𝑀𝐴𝐷=4 722 (alle Einheiten in US-Dollar)

40 4.4 Streuungskennwerte 4.4.4 Varianz, Standardabweichung und Schwankungsintervalle ● Definition und Berechnung ● > Empirische Varianz in „originärer Formel“ 𝑠 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 > Empirische Standardabweichung 𝑠 = 𝑠 2 > Rechenbeispiel: −1, 0, 0, 1, 3, 5, 6 ⟹ 𝑥 =2 ⟹ 𝑠 2 = −1− − −2 2 +… 6−2 2 ≈6.2857 ⟹ 𝑠 = ≈2.51

41 4.4 Streuungskennwerte ● Verschiebungsformel für die empirische Varianz ● > Allgemeine Verschiebungsformel 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 2 − 𝑥 −𝑐 2 > Für c = 0 folgt daraus die Verschiebungsformel für die emirische Varianz 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 2 − 𝑥 2 > Rechenbeispiel −1, 0, 0, 1, 3, 5, 6 ⟹ 𝑥 =2 ⟹ 𝑠 2 = − − 2 2 ≈6.2857

42 4.4 Streuungskennwerte ● Standardabweichung und Interpretation ●
Es liegen in den empirischen Schwankungsintervallen 𝑥 − 𝑠 , 𝑥 + 𝑠 , 𝑥 −2 𝑠 , 𝑥 +2 𝑠 und 𝑥 −3 𝑠 , 𝑥 +3 𝑠 ca % % bzw % aller Beobachtungswerte.

43 4.4 Streuungskennwerte ● Hintergründe ●
Bedeutendstes Streuungsmaß in der Statistik aus verschiedenen Gründen...

44 4.5 Spezielle Streuungskennwerte
4.5.1 Varianz bei gruppierten Daten ● Berechnung ●

45 4.5 Spezielle Streuungskennwerte
● Beispiel ● 𝑥 1 = 𝑥 2 = 𝑥 3 =1.46 𝑠 1 2 = 𝑠 2 2 = 𝑠 3 2 =0.0464 𝑛 1 = 𝑛 2 = 𝑛 3 =5 ⟹ 𝑥 = 𝑗=1 3 𝑓 𝑗 𝑥 𝑗 = 3 12 × × ×1.46=1.525

46 4.5 Spezielle Streuungskennwerte
⟹ 𝑗=1 3 𝑓 𝑗 𝑠 𝑗 2 = 3 12 × × ×0.0464=0.051 ⟹ 𝑗=1 3 𝑓 𝑗 𝑥 𝑗 − 𝑥 2 = 3 12 × 1− × 2− × 1.46− = ⟹ 𝑠 2 = = Intern Extern Gesamt Tatsächlich erhält man diesen Wert auch auf „konventionellem Wege“: 𝑠 2 = 𝑖=1 12 𝑥 𝑖 2 − 𝑥 2 = … − = ● Interpretation ● ● Hintergründe ●

47 4.5 Spezielle Streuungskennwerte
4.5.2 Quantilsabstände

48 4.5 Spezielle Streuungskennwerte
Beispiel 4.5.2: Quantilsabstände der Einkommensverteilung 16168 𝑄 0.1 = 𝑥 0.9 − 𝑥 0.1 =35731−9913=25818 𝑄 0.2 = 𝑥 0.8 − 𝑥 0.2 =29039−12871=16168

49 4.5 Spezielle Streuungskennwerte
4.5.3 Variationskoeffizient ● Hintergrund ● > Verschiebungsinvarianz der Varianz ist manchmal störend: 1, 2, 3, 4, 5 ← identische Varianz → 15, 16, 17, 18, 19 > Beispiel: Angenommen, im Rahmen einer Marktstudie wird die Streuung von Preisen für bestimmte Produkte bei 3 verschiedenen Lebensmitteldiscountern vergli- chen. Dabei ergeben sich folgende Preise für 100g Speisezalz: , , Euro 1kg Waschmittel: , 19.89, Euro Somit erhalten wir: 𝑥 𝑆𝑎𝑙𝑧 = 𝑠 𝑆𝑎𝑙𝑧 =0.0816 Identisch! 𝑥 𝑊𝑎𝑠𝑐ℎ𝑒𝑛 = 𝑠 𝑊𝑎𝑠𝑐ℎ𝑒𝑛 =0.0816 Bezogen auf das Preisniveau variiert der Preis des Waschmittels relativ betrachtet weniger als der Preis des Salzes

50 4.5 Spezielle Streuungskennwerte
● Definition und Berechnung ● > Variationskoeffizient als Maß der relativen Streuung: 𝑣= 𝑠 𝑥 nichtnegative Werte mit 𝑥 >0 vorausgesetzt > Beispiel von zuvor: 𝑣 𝑆𝑎𝑙𝑧 = 𝑠 𝑆𝑎𝑙𝑧 𝑥 𝑆𝑎𝑙𝑧 = ≈0.209 𝑣 𝑊𝑎𝑠𝑐ℎ𝑒𝑛 = 𝑠 𝑊𝑎𝑠𝑐ℎ𝑒𝑛 𝑥 𝑊𝑎𝑠𝑐ℎ𝑒𝑛 = ≈0.004 ● Interpretation ● > Variationskoeffizient entspricht der Standardabweichung der prozentualen Abweichungen vom arithmetischen Mittel

51 4.5 Spezielle Streuungskennwerte
> Im Beispiel des Salzes mit 𝑥 𝑆𝑎𝑙𝑧 =0.39 Preise: Abweichung in %: −25.64% % % z. B − ×100%=25.64% Standardabweichung : 𝑠 = 𝑠 2 = −25.64− − − ≈0.209

52 4.5 Spezielle Streuungskennwerte
Beispiel 4.5.3: Variationsvergleich von Wechselkursen 𝑥 𝑌𝑢𝑎𝑛 = 𝑠 𝑌𝑢𝑎𝑛 = 𝑣 𝑌𝑢𝑎𝑛 =0.10 𝑥 𝐷𝑜𝑙𝑙𝑎𝑟 = 𝑠 𝐷𝑜𝑙𝑙𝑎𝑟 = 𝑣 𝐷𝑜𝑙𝑙𝑎𝑟 =0.07

53 4.6 Standardisierung mittels Lage und Streuung
● Hintergrund ● > Beobachtungswerte aus unterschiedlichen Grundgesamtheiten lassen sich nicht immer sinnvoll vergleichen > Beispiel: Einkommensvergleich in zwei unterschiedlichen Ländern Deutscher: 2800 Euro bei einem Durchschnitt von 2500 Euro und einer Standardabweichung von 150 Euro Schweizer: 5500 Franken bei einem Durchschnitt von 5000 Franken und einer Standardabweichung von 400 Franken ● Berechnung und Interpretation ● > Allgemeine Form: > Spezialfall Z-Standardisierung: 𝑧 𝑖 = 𝑥 𝑖 − 𝑥 𝑠 𝑋

54 4.6 Standardisierung mittels Lage und Streuung
> Im Beispiel von zuvor Deutscher: 2800− =2 Schweizer: 5500− =1.25 Fazit: Deutscher (Schweizer) liegt 2 (1.25) Standardabweichungen über dem Durchschnitt ● Eigenschaften z-standardisierter Werte ● > Mittelwert z-standardisierter Werte ist stets 0: 𝑧 = 1 𝑛 𝑖=1 𝑛 𝑧 𝑖 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 𝑠 𝑋 = 1 𝑛 𝑠 𝑋 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 =0 (vgl. Folie 70)

55 4.6 Standardisierung mittels Lage und Streuung
> Varianz (Standardabweichung) z-standardisierter Werte ist stets 1: 𝑠 𝑍 2 = 1 𝑛 𝑖=1 𝑛 𝑧 𝑖 − 𝑧 2 = 1 𝑛 𝑖=1 𝑛 𝑧 𝑖 2 − 𝑧 2 = 1 𝑛 𝑖=1 𝑛 𝑧 𝑖 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 𝑠 𝑋 2 = 1 𝑠 𝑋 2 × 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 = 1 𝑠 𝑋 2 × 𝑠 𝑋 2 =1

56 4.6 Standardisierung mittels Lage und Streuung
Beispiel 4.6.1: Standardisierte Zeitreihen

57 4.7 Messung von Schiefe ● Konzept und Definition ●
> Feststellung: Bei schiefen Verteilungen liegen obere und untere Quantile gewöhnlich unterschiedlich weit vom Median entfernt > Erster Vorschritt: Zerlegung des Quantilsabstands im Sinne von 𝑥 1−𝛼 − 𝑥 𝛼 = 𝑥 0.5 − 𝑥 𝛼 + 𝑥 1−𝛼 − 𝑥 0.5 𝑄 𝛼

58 4.7 Messung von Schiefe > Quantilskoeffizient der Schiefe setzt die Differenz der beiden Abstände ins Verhältnis zum Quantilsabstand (siehe Kasten) ● Interpretation ● ... siehe Kasten QS

59 4.7 Messung von Schiefe Beispiel 4.7.1: Schiefe der Einkommensverteilung 𝑄𝑆 0.1 =0.25 𝑄𝑆 0.2 =0.17 𝑄𝑆 0.3 =0.10 𝑄𝑆 0.1 = 𝑥 0.9 − 𝑥 − 𝑥 0.5 − 𝑥 𝑥 0.9 − 𝑥 = −19595 − 19595− −9913 ≈0.25

60 4.8 Darstellung und Messung von Konzentration
4.8.1 Lorenz-Kurve ● Was versteht man unter Konzentration? ● Man vergleiche die folgenden beiden Datensätze Merkmalssumme jeweils = 20 Wie verteilt sich diese auf die einzelnen Merkmalsträger? Wie stark ist die Ungleichverteilung (Konzentration) ausgeprägt? ● Beispiel ● Man stelle sich 3 Branchen mit jeweils 5 Firmen vor: Feststellung: Phänomen der Konzentration wird durch her- kömmliche Maße nicht adäquat gemessen

61 4.8 Darstellung und Messung von Konzentration
● Konstruktion einer Lorenzkurve ●

62 4.8 Darstellung und Messung von Konzentration
● Interpretation ● > Die Fläche zwischen Lorenzkurve und Winkelhalbierender wird immer dann groß, wenn wenige Merkmalsträger (relativ) viel von der Merkmalssumme auf sich vereinigen. > Keine Konzentration liegt vor, wenn die Lorenzkurve mit der Winkel- halbierenden zusammenfällt. Dann sind alle Werte gleich. Damit verteilt sich die Merkmalssumme gleichmäßig auf die Merkmalsträger. > Beispiel: Koordinatenpunkte der Lorenzkurve, falls Branche mit 5 Unter- nehmen keinerlei Konzentration aufweist: (0, 0), (0.2, 0.2), (0.4, 0.4), (0.6, 0.6), (0.8, 0.8), (1, 1)

63 4.8 Darstellung und Messung von Konzentration
4.8.2 Gini-Koeffizient ● Definition und Interpretation ● > (Nichtnormierter) Gini-Koeffizient: Zweifaches der Fläche zwischen Lorenzkurve und Winkelhalbierender > Gini-Koeffizient = 0, falls alle Werte gleich sind > Gini-Koeffizient ≈ 1 bei maximaler Konzentration, d. h. wenn ein ein- zelner Merkmalsträger die gesamte Merkmalssumme auf sich vereint

64 4.8 Darstellung und Messung von Konzentration
● Berechnung ● G= 2 𝑖 𝑥 𝑖 𝑛 𝑥 𝑖 − 𝑛+1 𝑛 Formel: Beispielrechnung für Branche 3: 20, 40, 60, 80, (geordnet!) ⇒ 𝐺 3 = 2 1×20+2×40+3×60+4×80+5×100 5×300 − 6 5 ≈0.2667 Analog: 𝐺 1 =0.76, 𝐺 2 =0.1975

65 4.8 Darstellung und Messung von Konzentration
● Wertebereich und Normierung ● 𝐺 ist maximal 𝑛−1 𝑛 ; soll der Maximalwert = 1 sein: 𝐺 ∗ = 𝑛 𝑛−1 𝐺 Normierter Gini-Koeffizient

66 4.8 Darstellung und Messung von Konzentration
● Vorsicht bei der Interpretation ● 𝐺 𝐴 =0.4 𝐺 𝐵 =0.4 Fazit: Gini-Koeffizient allein verrät nicht alles! vgl. Fahrmeir et al. (2010)

67 4.8 Darstellung und Messung von Konzentration
Beispiel 4.8.2: Konzentration von Einkommen in Deutschland

68 4.9 Spezifische Eigenschaften empirischer Kennwerte
4.9.1 Minimumeigenschaft des arithmetischen Mittels ● Hintergrund ● > Bekannt: 𝑠 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 verwendet 𝑥 als Referenzpunkt in der Frage „Wie stark streuen die Werte um ...?“ > Frage: Welcher Referenzpunkt c minimiert den Ausdruck 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 2 ? > Antwort: Die Lösung lautet tatsächlich 𝑐= 𝑥 ● Analytischer Nachweis ● > Minimierungsproblem: min 𝑐 𝑓 𝑐 mit 𝑓 𝑐 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 2 𝑑𝑓 𝑐 𝑑𝑐 =− 2 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 =− 2 𝑛 𝑖=1 𝑛 𝑥 𝑖 + 2 𝑛 𝑖=1 𝑛 𝑐

69 4.9 Spezifische Eigenschaften empirischer Kennwerte
=−2 𝑥 +2𝑐=2 𝑐− 𝑥 ⇒ 𝑓 minimal für 𝑐= 𝑥 > Alternativ: Betrachte allgemeine Verschiebungsformel (Folie 102) 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 2 − 𝑥 −𝑐 2 𝑠 2 ⇔ 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 2 = 𝑠 𝑥 −𝑐 2 Ist minimal, falls 𝑐= 𝑥

70 4.9 Spezifische Eigenschaften empirischer Kennwerte
● Beispiel ● Fall 1 : 1, 0, 0, 1, 3, 5, 6 Fall 2 : 1, 0, 0, 1, 3, 4, 5, 6 ⇒ 𝑥 =2, 𝑠 2 = ⇒ 𝑥 =2.25, 𝑠 2 =5.9375 ⇒ 𝑓 1 𝑐 = 2−𝑐 ⇒ 𝑓 2 𝑐 = 2.25−𝑐

71 4.9 Spezifische Eigenschaften empirischer Kennwerte

72 4.9 Spezifische Eigenschaften empirischer Kennwerte
4.9.2 Minimumeigenschaft des Medians ● Hintergrund ● > Bekannt: 𝑑= 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 verwendet 𝑥 als Referenzpunkt in der Frage „Wie stark streuen die Werte um ...?“ > Frage: Welcher Referenzpunkt c minimiert den Ausdruck 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 ? > Antwort: Die Lösung lautet tatsächlich 𝑐= 𝑥 0.5 ● Analytischer Nachweis ● > Minimierungsproblem: min 𝑐 𝑓 𝑐 mit 𝑓 𝑐 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 −𝑐 > Jedoch: 𝑓 analytisch nicht gut handhabbar (teils nicht differenzierbar) auch keine Streuungzerlegungsformel > Minimumeigenschaft jedoch einsichtig („informaler Beweis“)

73 4.9 Spezifische Eigenschaften empirischer Kennwerte
● Beispiel ●

74 4.9 Spezifische Eigenschaften empirischer Kennwerte
Fall 1 : 1, 0, 0, 1, 3, 5, 6 Fall 2 : 1, 0, 0, 1, 3, 4, 5, 6 ⇒ 𝑥 0.5 =1 ⇒ 𝑥 0.5 =2 ⇒ 𝑓 1 𝑐 = −1−1 + 0−1 + …+ 6−1 ⇒ 𝑓 2 𝑐 = −1−2 + 0−2 + …+ 6−2

75 4.9 Spezifische Eigenschaften empirischer Kennwerte

76 4.9 Spezifische Eigenschaften empirischer Kennwerte
4.9.3 Transformationseigenschaften ● Arten von Transformationen ● > Ursprungswerte 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 sollen einheitlich transformiert werden > Verschiebung: 𝑢 𝑖 = 𝑥 𝑖 +𝑐 für 𝑖=1, …, 𝑛 > Umskalierung: 𝑢 𝑖 = 𝑐𝑥 𝑖 für 𝑖=1, …, 𝑛 und 𝑐>0 > Beispiel: Ursprungswerte: 1, 0, 0, 1, 3, 5, 6 Verschiebung um 𝑐=9: 8, 9, 9, 10, 12, 14, 15 Umskalierung mit 𝑐=2: 2, 0, 0, 2, 6, 10, 12

77 4.9 Spezifische Eigenschaften empirischer Kennwerte

78 4.9 Spezifische Eigenschaften empirischer Kennwerte
● Verschiebungsäquivarianz und Verschiebungsinvarianz ● > Äquivarianz ... „Gleichartige Veränderlichkeit“ bei Transformation > Invarianz ... „Unveränderlichkeit “ bei Transformation > Beispiel 1: Verschiebungsäquivarianz des arithmetischen Mittels: Transformation: 𝑢 𝑖 = 𝑥 𝑖 +𝑐 𝑢 = 1 𝑛 𝑖=1 𝑛 𝑢 𝑖 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 +𝑐 = = 𝑥 + 1 𝑛 ×𝑛𝑐= 𝑥 +𝑐 = 𝑥 +𝑐

79 4.9 Spezifische Eigenschaften empirischer Kennwerte
> Beispiel 2: Verschiebungsinvarianz der (empirischen) Varianz 𝑠 𝑈 2 = 1 𝑛 𝑖=1 𝑛 𝑢 𝑖 − 𝑢 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 +𝑐− 𝑥 −𝑐 2 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 = 𝑠 𝑋 2 ● Skalenäquivarianz und Skaleninvarianz ● > Beispiel 3: Skalenäquivarianz des arithmetischen Mittels Transformation: 𝑢 𝑖 = 𝑐𝑥 𝑖 𝑢 = 1 𝑛 𝑖=1 𝑛 𝑢 𝑖 = 1 𝑛 𝑖=1 𝑛 𝑐 𝑥 𝑖 =𝑐× 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 =𝑐 𝑥

80 4.9 Spezifische Eigenschaften empirischer Kennwerte
> Beispiel 4: Skalenäquivarianz der Standardabweichung Transformation: 𝑢 𝑖 = 𝑐𝑥 𝑖 mit 𝑐>0 𝑠 𝑈 2 = 1 𝑛 𝑖=1 𝑛 𝑢 𝑖 − 𝑢 2 = 1 𝑛 𝑖=1 𝑛 𝑐𝑥 𝑖 −𝑐 𝑥 2 = 𝑐 2 × 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 = 𝑐 2 𝑠 𝑋 2 => Fazit: Varianz ist weder äquivariant noch invariant, aber 𝑠 𝑈 = 𝑠 𝑈 2 = 𝑐 2 𝑠 𝑋 2 =𝑐 𝑠 𝑋 Beachte: 𝑐>0 => Fazit: Standardabweichung ist skalenäquivariant

81 4.9 Spezifische Eigenschaften empirischer Kennwerte
● Eigenschaften weiterer Kennwerte ●

82 4.9 Spezifische Eigenschaften empirischer Kennwerte
● Eigenschaften standardisierter Werte ● > Bei Verschiebung 𝑢 𝑖 = 𝑥 𝑖 +𝑐 gilt: 𝑢 = 𝑥 +𝑐 und 𝑠 𝑈 = 𝑠 𝑋 Daraus folgt bei einer Standardisierung verschobener Werte: 𝑧 𝑖 = 𝑢 𝑖 − 𝑢 𝑠 𝑈 = 𝑥 𝑖 +𝑐− 𝑥 −𝑐 𝑠 𝑋 = 𝑥 𝑖 − 𝑥 𝑠 𝑋 > Bei Umskalierung 𝑢 𝑖 = 𝑐𝑥 𝑖 gilt: 𝑢 =𝑐 𝑥 und 𝑠 𝑈 = 𝑐 𝑠 𝑋 Daraus folgt bei einer Standardisierung verschobener Werte: 𝑧 𝑖 = 𝑢 𝑖 − 𝑢 𝑠 𝑈 = 𝑐 𝑥 𝑖 −𝑐 𝑥 𝑐 𝑠 𝑋 = 𝑥 𝑖 − 𝑥 𝑠 𝑋 > Fazit: Verschiebungen und Umskalierungen wirken sich nicht auf standardisierte Werte aus

83 4.9 Spezifische Eigenschaften empirischer Kennwerte

84 4.9 Spezifische Eigenschaften empirischer Kennwerte
4.9.4 Robustheit ● Zum Begriff ● ● Robuste und nicht robuste Kennwerte ● ● Anmerkungen zur kritischen Verwendung ●


Herunterladen ppt "4 Spezifizierende Beschreibung"

Ähnliche Präsentationen


Google-Anzeigen