STATISIK LV Nr.: 1852 WS 2005/06 6. Dezember 2005.

Slides:



Advertisements
Ähnliche Präsentationen
Religionsmonitor 2008 Ergebnisse für Österreich
Advertisements

CATI-Übung 6. Begleitveranstaltung WS 09/10
Auswertung der Befragung
Konzentration 89.
Merkmale Beispiele Anwendung Träger Autos Menschen Völker Jahre
Streuungsmaß 3: absolute Abweichung vom Mittelwert
1 Prof. Dr. Beschorner / UPL / ABWL I / WS / Universität Ulm Allgemeines nDiese Woche keine Tutorien nÜbungsbetrieb ab nächster Woche.
Spriestersbach, Albert; Röhrig, Bernd; Prel, Jean-Baptist du; Gerhold-Ay, Aslihan; Blettner, Maria Deskriptive Statistik: Angabe statistischer Maßzahlen.
Forschungsstatistik I
Ein frohes und erfolgreiches Jahr
Quantitative Methoden I
Wie viele Einheitswürfel sind auf 0, 1, 2, 3 Seiten gefärbt?
Mittelwert, Median, Quantil
Eingabe und Kodierung von Daten in SPSS
Statistische Methoden I
Statistische Methoden I
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Statistische Methoden I WS 2006/2007 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial.
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Median Merkmal Geordneter Datensatz
Streuungsparameter Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Die Vorlesung Mathematik I (Prof. Kugelmann) findet heute um 14:30 Uhr im Hörsaal Loefflerstraße 70 statt.
Rechenregeln für Mittelwert, Varianz und Streuung.
Datenmatrix.
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung.
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Datentabelle für 2 Merkmale
Streuungsparameter Median Mittlere Abweichung vom Median
Beschreibende Statistik
(Gini-Koeffizient, Lorenz-Kurve)
Einführung Dezimalbrüche
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Die Interessengemeinschaft „Kohle-Dampf-Licht“
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 1375 SS März 2005.
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung) (Vorlesung) Prof. Dr. Günter Rudolph Fachbereich.
Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung) (Vorlesung) Prof. Dr. Günter Rudolph Fachbereich.
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.
STATISIK LV Nr.: 1852 WS 2005/06 29.November 2005.
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Diamant Zucker KG Diamant Zucker KG Gliederung: 1. Vorstellung des Betriebes 2. Entwicklung der landwirtschaftlichen Nutzfläche, der Pacht-
Ökologische Landwirtschaft
Zürcher Brutvogelaltas 2008 Seite 1 «Hotspots» (hier der Kulturlandvögel)
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
Relationen zwischen qualitativen Merkmalen
Santésuisse – Die Schweizer Krankenversicherer Zahlen & Fakten, Oktober 2001, Grafik Nr. 1.
InterregIIIA/Aufwind - Kofinanziert vom Bund, Land und der EU pby 1 Interreg IIIA – SPF Projekt Aufwind HERZLICH WILLKOMMEN!
Gesundheitszentrum in Winnenden, Am Jakobsweg 2
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
EÜ Literatur 12. Einheit.
+19 Konjunkturerwartung Dezember 2014 Indikator > +20 Indikator 0 bis +20 Indikator 0 bis -20 Indikator < -20 EU gesamt: +5 Indikator > +20 Indikator 0.
Messen Zuordnung von Zahlen zu Objekten/Ereignissen gemäß Regeln
Mathematik für BiologInnen WS 05
Umweltmanagementinformationssysteme (Übung)
STATISIK LV Nr.: 1375 SS März 2005.
Statistik I Statistik I Statistische Grundbegriffe
Ökonometrie und Statistik Wiederholung
Statistik III Statistik III Der Phi-Koeffizient
 Präsentation transkript:

STATISIK LV Nr.: 1852 WS 2005/06 6. Dezember 2005

Inhalt Maßzahlen: 2-dimensionale Merkmale Konzentrationsmaße Verhältniszahlen 2-dimensionale Merkmale Darstellung: Kontingenztafel, Grafiken Korrelationsrechnung Neben den Lagemaßen und Streuungsmaßen gibt es noch andere Maßzahlen, z.B. die Konzentrationsmaße. Wie ist die Konzentration der Daten, z.B. Einkommen und Bevölkerung: wie viel % des gesamten Einkommens entfallen auf wie viele % der Bevölkerung? Wie sehr ist das Einkommen konzentriert? Es liegt dann eine hohe Konzentration vor, wenn z.B. nur 10% des gesamten Einkommens auf 90% der gesamten Bevölkerung entfallen und die restlichen 90% des Einkommens auf nur 10% der Gesamtbevölkerung entfallen. Anderes Beispiel: Landwirtschaftliche Betriebe und landwirtschaftliche Nutzfläche.

Konzentrationsmaße Metrisch skaliertes Merkmal X mit positiven Ausprägungen Frage: Wie teilt sich die Summe der Merkmalswerte x1,…,xn in der Beobachtungsreihe auf die Untersuchungs-einheiten auf? Bsp: n landwirtschaftliche Betriebe, Größe der Nutzflächen: x1,...,xn. Wie teilt sich die gesamte Nutzfläche auf die einzelnen Betriebe auf? Neben den Lagemaßen und Streuungsmaßen gibt es noch andere Maßzahlen, z.B. die Konzentrationsmaße. Wie ist die Konzentration der Daten, z.B. Einkommen und Bevölkerung: wie viel % des gesamten Einkommens entfallen auf wie viele % der Bevölkerung? Wie sehr ist das Einkommen konzentriert? Es liegt dann eine hohe Konzentration vor, wenn z.B. nur 10% des gesamten Einkommens auf 90% der gesamten Bevölkerung entfallen und die restlichen 90% des Einkommens auf nur 10% der Gesamtbevölkerung entfallen. Anderes Beispiel: Landwirtschaftliche Betriebe und landwirtschaftliche Nutzfläche.

Konzentrationsmaße n Merkmalswerte werden durch q Merkmalsausprägungen a1<...<aq mit absoluten- und relativen Häufigkeiten hi bzw. fi bestimmt. Gesamtbetrag der Merkmalswerte in der Beobachtungsreihe: n Merkmalswert, n ist die Anzahl der Betriebe q Merkmalsausprägungen a1<...<aq, die Größe der landwirtschaftlichen Nutzfläche (z.B. Einteilung in Klassen: a1: bis 5 Hektar, a2: 5-10 Hektar, usw.) absolute Häufigkeiten: Anzahl der Betriebe mit einer Nutzfläche von „bis 5 ha“, Anzahl der Betriebe mit einer Nutzfläche von „5-10 ha“ usw. relative Häufigkeiten: Prozentsatz der Betriebe mit einer Nutzfläche von „bis 5 ha“, usw. Gesamtbetrag der Merkmalswerte in der Beobachtungsreihe: Gesamte landwirtschaftliche Nutzfläche (Summe der Nutzflächen jedes Betriebes)

Konzentrationsmaße Lorenzkurve: Grafische Darstellung der Konzentration der Merkmalswerte Koordinatenkreuz: Abszisse: es werden die nach der Größe der Merkmals-ausprägung geordneten relativen Häufigkeiten aufsummiert Ordinate: Ausprägungen werden der Größe nach aufsummiert und auf Summe aller Ausprägungen bezogen x-Achse: Merkmalsausprägungen: Betriebsgrößen, Größenklassen der landwirtschaftlichen Betriebe y-Achse: die Ausprägungen werden auf die Gesamtsumme (gesamte landwirtschaftlich Nutzfläche, also Nutzfläche aller Betriebe) bezogen. x-Achse: landwirtschaftliche Betrieb y-Achse: Nutzfläche

Konzentrationsmaße Verbinden der Punkte (ki,li) ergibt die Lorenzkurve, wobei immer k0=l0=0 und kq=lq=1 gilt. 1 li ki Wert auf der x-Achse: Kumulation der nach der Größe der Merkmalsausprägung geordneten relativen Häufigkeiten li Wert auf der y-Achse: Kumulation der nach der Größe geordneten Ausprägungen, bezogen auf die Summe aller Ausprägungen x-Achse: landwirtschaftliche Betrieb y-Achse: Nutzfläche 1 ki

Konzentrationsmaße Interpretation: ein Punkt (ki,li) der Lorenz-kurve gibt an, dass auf ki · 100% der Untersuchungseinheiten li · 100% des Gesamtbetrages aller Merkmalsaus-prägungen entfallen. Bsp. auf ki · 100% der landwirtschaftlichen Betriebe entfallen li · 100% der gesamten Nutzfläche

Konzentrationsmaße Bsp. landwirtschaftliche Betriebe Abszisse: Es wird der Prozentsatz der Betriebe mit der kleinsten Fläche bestimmt, dann wird der Prozentsatz der Betriebe mit der zweit-kleinsten Fläche bestimmt und zum Prozentsatz der Betriebe mit der kleinsten Fläche addiert, usw. Ordinate: Flächenanteile der Betriebe bzgl. der Gesamtfläche werden der Flächengröße nach aufsummiert.

Konzentrationsmaße Bsp. landwirtschaftliche Betriebe Einteilung der landwirtschaftlichen Nutzflächen in 5 Klassen Anzahl der Betriebe in der jeweiligen Klasse Nutzfläche aller Betriebe in einer Klasse = Flächengröße pro Gruppe Interpretation: auf ki · 100% der landwirtschaftlichen Betriebe entfallen li · 100% der gesamten Nutzfläche Kann aus der Tabelle abgelesen werden: auf 42% der Betriebe entfallen 6,3% der Nutzfläche, auf 60% der Betriebe entfallen 12,5% der Nutzfläche, auf 78% der Betriebe entfallen 27% der Nutzfläche, auf 94% der Betriebe entfallen 55% der Nutzfläche. 6% der Betriebe besitzen 45% der gesamten landwirtschaftlichen Nutzfläche

Konzentrationsmaße Bsp: landwirtschaftliche Betriebe Interpretation: auf ki · 100% der landwirtschaftlichen Betriebe entfallen li · 100% der gesamten Nutzfläche auf 42% der Betriebe entfallen 6,3% der Nutzfläche, auf 60% der Betriebe entfallen 12,5% der Nutzfläche, auf 78% der Betriebe entfallen 27% der Nutzfläche, auf 94% der Betriebe entfallen 55% der Nutzfläche.

Konzentrationsmaße Bsp. Landwirtschaftliche Betriebe: Interpretation: auf ki · 100% der landwirtschaftlichen Betriebe entfallen li · 100% der gesamten Nutzfläche auf 42% der Betriebe entfallen 6,3% der Nutzfläche, auf 60% der Betriebe entfallen 12,5% der Nutzfläche, auf 78% der Betriebe entfallen 27% der Nutzfläche, auf 94% der Betriebe entfallen 55% der Nutzfläche. Daraus folgt auch, dass die restlichen 6% der Betriebe 45% der Nutzfläche besitzen.

Konzentrationsmaße Extremfälle: Keine Konzentration, alle Untersuchungs-einheiten haben den gleichen Anteil am Gesamtbetrag. Lorenzkurve ist Diagonale. Gesamtbetrag konzentriert sich (fast) vollständig auf eine Untersuchungseinheit. Lorenzkurve ist (fast) senkrecht.

Konzentrationsmaße Extremfälle: Bild 1: Keine Konzentration, alle Untersuchungs-einheiten haben den gleichen Anteil am Gesamtbetrag. Lorenzkurve ist Diagonale. Bild 2: Gesamtbetrag konzentriert sich (fast) vollständig auf eine Untersuchungseinheit. Lorenzkurve liegt ist (fast) senkrecht.

Konzentrationsmaße Gini-Koeffizient od. Lorenzsche Konzentrationsmaß (LKM): Maßzahl für die Konzentration. Definiert als das 2-fache der Fläche (F) zw. Diagonale und Lorenzkurve. LKM = 2F. Es gilt immer: 0  LKM  (n-1)/n Standardisierter Gini-Koeffizient: LKMnor = n/(n-1) LKM Maß für die Größe der Konzentration. Je größer die Konzentration, desto größer die Fläche zw. Diagonale und Lorenzkurve und desto größer der Gini-Koeffizient. Standardisierter Gini-Koeffizient: wird verwendet damit bei absoluter Konzentration der Wert gleich 1 ist.

Konzentrationsmaße Berechnung von F: k … Werte auf Abszisse l … Werte auf Ordinate q … Anzahl der verschiedenen Merkmalsausprägungen Wie wird nun die Fläche zw. Diagonale und Lorenzkurve berechnet? k0=0, l0=0

Konzentrationsmaße Bsp. Landwirtschaftliche Nutzfläche LMK = 2F = i2Fi – 1 = 1,6048 – 1 = 0,6408 mit i = 1,…,5 LKMnor = 50/49 · 0,6408 = 0,6539

Verhältniszahlen Quotient zweier Maßzahlen: Verhältniszahl Gliederungszahlen Man bezieht eine Teilgröße auf eine ihr übergeordnete Gesamtgröße Beziehungszahlen Quotient zweier sachlich sinnvoll in Verbindung stehender Maßzahlen Index-Zahlen Quotient zweier Maßzahlen gleicher Art Jetzt kommen noch Verhältnis- und Indexzahlen, dann sind wir fertig mit den Maßzahlen. Eine Verhältniszahl ist der Quotient zweier Maßzahlen. Gliederungszahlen: Man bezieht eine Teilgröße auf eine ihr übergeordnete Gesamtgröße; Bsp: Ausschussware / Gesamtware Beziehungszahlen: Quotient zweier sachlich sinnvoll in Verbindung stehender Maßzahlen; Bsp: Schüler / Lehrer Index-Zahlen: Quotient zweier Maßzahlen gleicher Art; Bsp: Zeitreihen, Umsatzentwicklung über mehrere Jahre, (Umsatz im Jahr t) / (Umsatz in Jahr 0)

Gliederungszahlen Gliederungszahlen Bsp. Tagesproduktion 1500 Teile, davon 300 fehlerhaft. Dann sind 20% der Tagesproduktion Ausschuss (300/1500·100). Ausschussanteil ist eine Gliederungszahl Gliederungszahl: Man bezieht eine Teilgröße auf eine ihr übergeordnete Gesamtgröße

Beziehungszahlen Beziehungszahlen: Verursachungszahlen: Bezieht Bewegungsmassen auf die zugehörigen Bestandsmassen. Entsprechungszahlen: Alle Beziehungszahlen, bei denen man Ereignisse nicht auf ihren Bestand beziehen kann. Beziehungszahlen: Quotient zweier sachlich sinnvoll in Verbindung stehender Maßzahlen Man unterscheidet hier Verursachungszahlen und Entsprechungszahlen Verursacherzahl: Bezieht Bewegungsmassen auf die zugehörigen Bestandsmassen Bewegungs- oder Ereignismassen bzw. Punktmassen: Ereignisse, sie werden innerhalb einer Zeitspanne erfasst (Bsp: Geburten im Jahr 2004) Bestandsmassen bzw. Streckenmassen: Objekte mit Lebensdauer, sie werden zu einem Zeitpunkt erfasst (Bsp: Einwohner Österreichs am 1.1.05) Entsprechungszahl: Alle Beziehungszahlen, bei denen man Ereignisse nicht auf ihren Bestand beziehen kann

Beziehungszahlen Bsp. Verursachungszahlen: Geburtenziffer Bestandsmasse: Einwohner einer Stadt (E) Bewegungsmasse: Zahl der Lebend-geborenen (L) G = (L/E)*1000 Sagt, wie viele Geburten auf 1000 Einwohner einer Stadt entfallen. Beziehungszahlen: Quotient zweier sachlich sinnvoll in Verbindung stehender Maßzahlen Verursacherzahl: Bezieht Bewegungsmassen auf die zugehörigen Bestandsmassen Bewegungs- oder Ereignismassen bzw. Punktmassen: Ereignisse, sie werden innerhalb einer Zeitspanne erfasst (hier: Zahl der Lebendgeborenen im Zeitraum ...) Bestandsmassen bzw. Streckenmassen: Objekte mit Lebensdauer, sie werden zu einem Zeitpunkt erfasst (hier: Einwohner einer Stadt zum Zeitpunkt ...)

Beziehungszahlen Bsp. Entsprechungszahlen: Schüler-Lehrer-Verhältnis (Zahl der Schüler) / (Zahl der Lehrer) Sagt, wie viele Schüler (ungefähr) auf eine Lehrer entfallen. Dies entspricht aber i.A. nicht der durchschnittlichen Klassengröße. Entsprechungszahl: Alle Beziehungszahlen, bei denen man Ereignisse nicht auf ihren Bestand beziehen kann

Indexzahlen Indexzahlen: Es werden zwei Maßzahlen der gleichen Art in Beziehung gesetzt. Messzahlen oder Einfache Indizes Die zugehörigen Maßzahlen beschreiben eine realen Sachverhalt. (Zusammengesetzte) Indexzahlen Eine der Maßzahlen ist eine Zahl, die einen fiktiven Zustand beschreibt. Index-Zahlen: Quotient zweier Maßzahlen gleicher Art Bsp: Zeitreihen, Umsatzentwicklung über mehrere Jahre, (Umsatz im Jahr t) / (Umsatz in Jahr 0) Unterscheidung Einfache Indizes und Indexzahlen

Indexzahlen Einfache Indizes: Reihe von Maßzahlen, die man in Beziehung zueinander setzen will. x0,...,xt Maßzahlen zu Zeitpunkten t, x0 Maßzahl zum Basiszeitpunkt 0. Dann ist I0t = xt / x0 für t = 0, 1, 2, ... eine Zeitreihe einfacher Indizes Bsp: Man hat die Umsätze aus mehreren Jahren (xi) um möchte sie in Beziehung zueinander setzen. Wählen einer Basis (Basiszeitpunkt 0) Bestimmen der einfachen Indizes durch Division der Umsätze der einzelnen Jahre durch den Umsatz des Basisjahre.

Indexzahlen Messzahlen werden oftmals mit 100 multipliziert. Bsp. Umsatz im Jahr 5, bezogen auf Jahr 0: I05·100 = x5/x0 · 100 = 87 D.h. dass 87% des Umsatzes im Basisjahr im Jahr 5 umgesetzt werden. Oder: Es liegt eine Minderung des Umsatzes um 13% vor. Vergleich von I05·100=87 mit I06·100=90: Der Umsatz ist um 3 Prozentpunkte gestiegen. Bsp: Umsatz im Jahr 5 dividiert durch Umsatz im Basisjahr 0 mal 100: I05·100 = x5/x0 · 100 = 87 Interpretation: 87% des Umsatzes, der im Basisjahr gemacht wurde, wurde im Jahr 5 gemacht, d.h. der Umsatz im Jahr 5 ist um 13% geringer als der im Basisjahr. Vergleicht man Indexzahlen miteinander, z.B. Vergleich von I05·100=87 mit I06·100=90, kann man sagen dass der Umsatz von Jahr 5 auf Jahr 6 um 3 Prozentpunkte gestiegen ist.

Indexzahlen Umbasieren: Gegeben: Indizes I0t zur Basisperiode 0 Gesucht: Indizes Ikt zur Basisperiode k Berechung ohne Ursprungsdaten: Verkettung: Wenn für xt I0t berechnet werden soll, und x0 nicht bekannt ist. I0t = I0k · Ikt Umbasieren: Hat man nur Indexzahlen mit Basisperiode 0 und möchte man Indexzahlen zur Basisperiode k, so kann man – ohne die Originaldaten zu kennen – diese Werte berechnen: Ikt=I0t/I0k Verkettung: Möchte man für eine Wert x zum Zeitpunkt t die Indexzahl zur Basisperiode 0 berechnen – und ist der Wert x0 nicht bekannt – kann man das ebenfalls berechnen: I0t = I0k · Ikt

Indexzahlen Bsp. Umsatz für Jahre 1990 bis 1998 Bsp: Umsätze der Jahre 1990 bis 1998 Indexzahlen mit Basisperiode 1990: xt/x0 Indexzahlen mit Basisperiode 1994: xt/x4

Indexzahlen Umbasieren: Index von 1996 zur Basisperiode 1990 sollen in Index zur Basisperiode 1994 umgerechnet werden. I1990,1996 = 0,90 (Basisperiode 1990) I1990,1994 = 0,93 (Basisperiode 1990) I1994,1996 = 0,90 / 0,93 = 0,97 (Basisperiode 1994) Verkettung: Weiterer Wert für 1998 I1990,1998 = I1990,1994 · I1994,1998 = 0,93 · 1,04 = 0,97 Bsp: Umsätze der Jahre 1990 bis 1998

Indexzahlen Zusammengesetzte Indexzahlen (Indizes): Betrachte Warenkorb: n Waren zu einem Zeitpunkt t Mengen qt1,...,qtn Preise pt1,...,ptn Wert des Warenkorbes in Periode t: Zusammengesetzte Indexzahlen oder Indizes: Eine der Maßzahlen ist eine Zahl, die einen fiktiven Zustand beschreibt.

Indexzahlen Wertindex: Vergleich Wert eines Warenkorbes zur Berichtsperiode t mit dem zur Basisperiode 0 Zusammengesetzte Indexzahlen oder Indizes: Eine der Maßzahlen ist eine Zahl, die einen fiktiven Zustand beschreibt. Wertindex: der Wert eines Warenkorbes in der Berichtsperiode t wird mit dem Wert des Warenkorbes in der Basisperiode 0 verglichen bzw. in Beziehung gesetzt.

Indexzahlen Bsp. Durchschnittlicher Verbrauch an Fleisch aller privaten Haushalte in einer Gemeinde. Basismonat 1, Berichtsmonat 12. (Mengen in g, Preise in DM/kg) Wertindex: Vergleich Wert eines Warenkorbes zur Berichtsperiode t mit dem zur Basisperiode 0 Bsp: Verbrauch an Fleisch, n=7, F1,...,F7 sind 7 verschiedene Fleischarten – man hat also 7 Produkte im Warenkorb.

Indexzahlen Bsp. Wertindex (Wert des Warenkorbes in Berichtsperiode t) / (Wert des Warenkorbes in Basisperiode 0)

Indexzahlen Bsp. Wertindex 100 · W012 = 100 · 1,0119 = 101,19 D.h. der tatsächliche Aufwand für Fleisch für die privaten Haushalte ist vom Basismonat bis zum Berichtsmonat um 1,19% gestiegen. Es ist hier nicht berücksichtigt, dass der durchschnittliche Verbrauch im Berichtsmonat um 205g geringer ist.

Indexzahlen Preisindizes: Aussagen über die Preisentwicklung Für verschiedene Perioden das gleiche Mengenschema verwenden Preisindizes: Aussagen über die Preisentwicklung, es müssen für Basis- und Berichtsperiode die gleichen Mengen verwendet werden. Für Preisindizes gibt es 2 Möglichkeiten: Mengen im Basisjahr Mengen im Berichtsjahr

Indexzahlen Preisindex nach Paasche Man vergleicht den Wert eines Warenkorbes qt1,...,qtn zur jeweiligen Berichtsperiode t mit dem Wert, den dieser unter der Preissituation zur Basisperiode gehabt hätte. Preisindex nach Paasche: Für Basis- und Berichtsperiode werden die Mengen der Berichtsperiode verwendet. D.h. Wert des Warenkorbes (der Berichtsperiode) in der Berichtsperiode / Wert des Warenkorbes (der Berichtsperiode) in der Basisperiode. Die Mengen werden aus der Berichtsperiode genommen, die Preise aus Berichts- bzw. Basisperiode. Zähler: Preise und Mengen aus der Berichtsperiode Nenner: Preise aus der Basisperiode, Mengen aus der Berichtsperiode

Indexzahlen Bsp. Preisindex nach Paasche Zähler: Preise und Mengen aus der Berichtsperiode Nenner: Preise aus der Basisperiode, Mengen aus der Berichtsperiode

Indexzahlen Bsp. Preisindex nach Paasche D.h. nimmt man für beide Monate den durchschnittlichen Verbrauch an Fleisch im Berichtsmonat als Mengenschema (Warenkorb) an, so sind die Preise in diesem Zeitraum um 4,65% gestiegen.

Indexzahlen Preisindex nach Laspeyres Der Warenkorb q01,...,q0n der Basisperiode 0 wird für alle Berichtsperioden zugrundegelegt und ihr fiktiver Wert in der Berichtsperiode t wird mit seinem Wert in der Basisperiode verglichen. Preisindex nach Laspeyres: Für Basis- und Berichtsperiode werden die Mengen der Basisperiode verwendet. D.h. Wert des Warenkorbes (der Basisperiode) in der Berichtsperiode / Wert des Warenkorbes (der Basisperiode) in der Basisperiode. Die Mengen werden aus der Basisperiode genommen, die Preise aus Berichts- bzw. Basisperiode. Zähler: Preise aus der Berichtsperiode, Mengen aus der Basisperiode Nenner: Preise und Mengen aus der Basisperiode

Indexzahlen Bsp. Preisindex nach Laspeyres D.h. Für die im Basismonat verbrauchten Mengen an Fleisch muss man in der Berichtsperiode um 4,68% mehr Geld ausgeben. Zähler: Preise aus der Berichtsperiode, Mengen aus der Basisperiode Nenner: Preise und Mengen aus der Basisperiode

Indexzahlen Vergleich Preisindizes nach Paasche und Laspeyres: L: Warenkorb muss nur für Basisperiode bestimmt werden, Kosten (+) Aktualität (-) P: Warenkorb muss für Berichtsperioden bestimmt werden, Kosten (-) Aktualität (+) Vergleich. Sind Abweichungen groß, muss der Warenkorb neu festgelegt werden. Fishersche Idealindex: Der Vorteil beim Preisindex nach Laspeyres ist, dass der Warenkorb der Basisperiode verwendet wird, d.h. der Warenkorb muss nicht in jeder Periode neu erhoben werden => kostengünstig, der Nachteil ist allerdings, dass dieser Warenkorb nicht aktuell ist. Beim Preisindex nach Paasche ist es genau umgekehrt: der Vorteil ist dass der Warenkorb aktuell ist, der Nachteil ist, dass die Erhebung des Warenkorbes in jeder Periode teuer ist. Eine Kombination von Laspeyres- und Paasche Index ist der Fisher Idealindex, er ist die Wurzel aus (Paasche Index * Laspeyres Index).

Indexzahlen Mengenindizes: Aussagen über Mengenentwicklung (unabhängig von der Preisentwicklung) Genauso wie man Preisindizes bestimmen kann, kann man auch Mengenindizes bestimmen. Sie erlauben Aussagen über die Mengenentwicklung – unabhängig von der Preisentwicklung.

Indexzahlen Mengenindex nach Paasche Standardisierung nach den Preisen zur Berichtsperiode Zähler: Preise in der Berichtsperiode, Mengen in der Berichtsperiode Nenner: Preise in der Berichtsperiode, Mengen in der Basisperiode

Indexzahlen Bsp. Mengenindex nach Paasche D.h. der Verbrauch an Fleisch, gewichtet mit den Preisen im Berichtsmonat ist um 3,34% gesunken. Zähler: Preise in der Berichtsperiode, Mengen in der Berichtsperiode Nenner: Preise in der Berichtsperiode, Mengen in der Basisperiode

Indexzahlen Mengenindex nach Laspeyres Standardisierung nach den Preisen zur Basisperiode Zähler: Preise in der Basisperiode, Mengen in der Berichtsperiode Nenner: Preise in der Basisperiode, Mengen in der Basisperiode

Indexzahlen Bsp. Mengenindex nach Laspeyres D.h. der Verbrauch an Fleisch, gewichtet mit den Preisen zum Basismonat, ist um 3,31% gesunken. Zähler: Preise in der Basisperiode, Mengen in der Berichtsperiode Nenner: Preise in der Basisperiode, Mengen in der Basisperiode

Zweidimensionale Merkmale Frage: Wie lässt sich der Zusammenhang bzw. die Abhängigkeit zw. zwei Merkmalen messen? Wie stark ist der Zusammenhang bzw. die Abhängigkeit? Antwort durch Korrelationsrechnung. Lässt sich der Zusammenhang in einer bestimmten Form darstellen? Antwort durch Regressionsrechnung.

Zweidimensionale Merkmale n Untersuchungseinheiten, 2 Merkmale X und Y, Ausprägungen des Merkmals X a1,…,al und Ausprägungen des Merkmals Y b1,…,bm. 2-dimensionales Merkmal (X,Y) mit Ausprägungen (aj,bk), mit absoluten Häufigkeiten hjk und relativen Häufigkeiten fjk=1/n·hjk

Kontingenztafel Häufigkeitsverteilung von (X,Y) wird durch Kontingenztafel dargestellt. X Y b1 … bm a1 h11 h1m : al hl1 hlm

Kontingenztafel Bsp. Geschlecht (X) Rauchverhalten (Y): absolute und relative Häufigkeiten von (X,Y). X Y R N-R w 9 32 m 5 27 X Y R N-R w 0,12 0,44 m 0,07 0,37

Kontingenztafel Absolute Randhäufigkeiten Relative Randhäufigkeiten von aj für j=1,…,l und bk für k=1,...,m: Relative Randhäufigkeiten von aj für j=1,…,l und bk für k=1,…,m: Randhäufigkeiten ergeben die Häufigkeits-verteilung des Merkmals X bzw.Y (Randverteilung).

Kontingenztafel Kontingenztafel absoluten Häufigkeiten und Randhäufigkeiten X Y b1 … bm Σ a1 h11 h1m h1. : al hl1 hlm hl. h.1 h.m h..=n

Kontingenztafel Kontingenztafel relative Häufigkeiten und Randhäufigkeiten X Y b1 … bm Σ a1 f11 f1m f1. : al fl1 flm fl. f.1 f.m f..=1

Kontingenztafel Es gilt: Relative Randhäufigkeit = 1 / n · absolute Randhäufigkeit Summe der absoluten Randhäufigkeiten = n Summe der relativen Randhäufigkeiten = 1

Kontingenztafel Bsp. Geschlecht (X) Rauchverhalten (Y): absolute und relative Häufigkeiten und Randhäufigkeiten von (X,Y). X Y R N-R  w 9 32 41 m 5 27 14 59 73 X Y R N-R  w 0,12 0,44 0,56 m 0,07 0,37 0,19 0,81 1

Kontingenztafel Bsp. Geschlecht (X) Rauchverhalten (Y): Zeilenprozent: X Y R N-R  w 9 32 41 m 5 27 14 59 73 X Y R N-R  w 0,22 0,78 1 m 0,16 0,84 0,19 0,81

Kontingenztafel Bsp. Geschlecht (X) Rauchverhalten (Y): Spaltenprozent: X Y R N-R  w 9 32 41 m 5 27 14 59 73 X Y R N-R  w 0,64 0,54 0,56 m 0,36 0,46 0,44 1

Darstellung

Darstellung

Darstellung

Darstellung

Darstellung

Darstellung

Korrelation Yulesche Assoziationskoeffizient für eine Vierfeldertafel (X,Y) nominal skaliert Häufigkeitsverteilung von (X,Y) Es gilt: -1 ≤ AXY ≤ +1; falls ein hij=0, so gilt: |AXY|=1; Vorzeichen nur in Verbindung Vierfeldertafel interpretierbar

Korrelation Bsp. Geschlecht – Raucher/Nichtraucher Leicht positiver Zusammenhang zw. Merkmalsausprägungen „w“ und „R“ R N-R  w 9 32 41 m 5 27 14 59 73

Korrelation Bsp. Geschlecht – Raucher/Nichtraucher Leicht negativer Zusammenhang zw. Merkmalsausprägungen „m“ und „R“ R N-R  m 5 27 32 w 9 41 14 59 73

Korrelationskoeffizient Bravais-Pearson Korrelationskoeffizient rXY 2-dimensionales metrisch skaliertes Merkmal (X,Y) mit Ausprägungen (aj,bk) und Häufigkeiten hjk für j=1,…,l und k=1,…,m. Maß für den Zusammenhang zw. X und Y:

Korrelationskoeffizient rXY liegt immer im Intervall [-1,1] Extremfälle: -1 negativer linearer Zusammenhang rXY = 0 kein linearer Zusammenhang 1 positiver linearer Zusammenhang Interpretation: rXY < 0 d.h. große Werte von X treten mit kleinen Werten von Y auf rXY > 0 d.h. große Werte von X treten mit großen Werten von Y auf

Korrelationskoeffizient Probleme: Scheinkorrelation: X und Y hängen von einem dritten Merkmal Z ab Bsp. Gefahr eines Waldbrandes (X) und schlechter Kornertrag (Y) hängen von der Stärke der Sonneneinstrahlung (Z) ab. Nonsenskorrelation: sachlogischer Zusammenhang zw. X und Y Bsp. Korrelation zw. Anzahl der Störche und der Anzahl der Geburten in einem Land Nichtlinearer Zusammenhang: rXY misst nur einen linearer Zusammenhang

Korrelation

Korrelation

Korrelationskoeffizient Bsp. Körpergröße und Gewicht: r = 0,76 Positiver linearer Zusammenhang zw. Körpergröße und Gewicht.

Korrelation Fechnersche Korrelationskoeffizient (für 2 metrisch skalierte Merkmale X und Y): rF Basiert auf Vorzeichen der transformierten Paare x* und y* 1 x* und y* gleiches Vorzeichen od. beide 0 vi = ½ genau einer der Werte x* bzw. y* = 0 0 sonst

Korrelation Fechnersche Korrelationskoeffizient: Werte im Intervalle [-1,1] +1 nicht nur bei positivem linearen Zusammenhang, sonder auch wenn gilt: oder

Korrelation Bsp. Hennen, Körpergewicht, Legeleistung

Korrelation Rangkorrelationen für ordinal skalierte Merkmale: Verwendung von Rangzahlen: Merkmal Z, Ausprägungen z1,…,zn, der Größe nach ordnen (vom größten zum kleinsten Wert) z(1),…,z(n) und nummerieren. Rangzahl: R(z(i)) = i für i=1,…,n Tritt ein Ausprägung mehrmals auf (Auftreten von Bindungen), dann Rang = arithm. Mittel der Ränge, die sie einnehmen. Bsp: z(1)=8, z(2)=5, z(3)=5, z(4)=2, Ränge: R(z(1))=1, R(z(2))=2,5, R(z(3))=2,5, R(z(4))=4

Korrelation Spearmansche Rangkorrelationskoeffizient rS Entspricht dem Bravais-Pearson Koeffizienten der Rangzahlen Wert +1 schon bei monoton wachsenden Beobachtungen, d.h. es gilt für alle (xi,yi), (xj,yj): mit xi < xj ist auch yi < yj

Korrelation Bsp. Klausur- und Übungspunkte Einfachere Formel für den Spearman‘schen Korrelationskoeffizienten (falls alle xi und yi verschieden sind (und di=R(xi)–R(yi)):

Korrelation Bsp. Maturanoten Mathe, Deutsch, Englisch Mathe Deutsch 1 0,23 0,382 0,576