STATISIK LV Nr.: 1375 SS 2005 3.März 2005.

Slides:



Advertisements
Ähnliche Präsentationen
Univariate Statistik M. Kresken.
Advertisements

Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Mittlere absolute Abweichung vom Mittelwert(1)
Streuung Bezeichnung Streuung=Dispersion=Variabilität Fragestellung:
Lagemaße kritische Fragen
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Mehrfachregressionen
Statistische Methoden I
Statistische Methoden II SS 2008 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Makarenkostraße (Kiste)
Statistische Methoden I
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Statistische Methoden I WS 2006/2007 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial.
Mögliche Funktionenklassen
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Median Merkmal Geordneter Datensatz
Korrelationsrechnung
Streuungsparameter Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Die Vorlesung Mathematik I (Prof. Kugelmann) findet heute um 14:30 Uhr im Hörsaal Loefflerstraße 70 statt.
Rechenregeln für Mittelwert, Varianz und Streuung.
Statistische Maßzahlen
Datenmatrix.
Quantile.
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung.
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Streuungsparameter Median Mittlere Abweichung vom Median
Quantile.
Univariate Statistik M. Kresken.
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Das wars!.
(Gini-Koeffizient, Lorenz-Kurve)
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Wiederholung und Beispiele
Daten auswerten Boxplots
Ausgleichungsrechnung II
Aufgabenzettel V Statistik I
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 1375 SS März 2005.
Messwerte, Verteilung, Histogramm, Mittelwert und Standardabweichung
Kennwerte und Boxplots
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.
STATISIK LV Nr.: 1375 SS März 2005.
Referat über das Thema STOCHASTIK.
STATISIK LV Nr.: 1852 WS 2005/06 6. Dezember 2005.
Der Zentralwert.
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Statistik – Regression - Korrelation
Veranstaltung 4.
Statistik – Wahrscheinlichkeit
Erheben, berechnen und darstellen von Daten
Messen Zuordnung von Zahlen zu Objekten/Ereignissen gemäß Regeln
Mathematik für BiologInnen WS 05
setzt Linearität des Zusammenhangs voraus
Die Binomialverteilung
Verteilungen, Varianz Tamara Katschnig.
Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Statistik III Statistik III 2. Streuungsmaße (Dispersionsmaße)
- Seite 1 TIME INTELLIGENCE ® by Zeichenrand – Löschen! Titel.
- Seite 1 TIME INTELLIGENCE ® by Titel.
4 Spezifizierende Beschreibung
Univariate Statistik M. Kresken.
 Präsentation transkript:

STATISIK LV Nr.: 1375 SS 2005 3.März 2005

Streuungsmaße Varianz Standardabweichung Variationskoeffizient Mittlere absolute Abweichung Spannweite Quartilsabstand Schiefe Wölbung

Varianz Beobachtungswerte a1,...,an (metrisch skaliert) Streuungsmaß: Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel Varianz (Mittlere quadratische Abweichung)

Varianz Nicht Summe der Abweichungen von ai von ihrem arithm. Mittel, da gilt: Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

Varianz Verschiebungssatz (Beziehung zw. MQ(M) und Varianz): Das bedeutet: MQ(M)  Varianz MQ(M) = σ² wenn M = arithm. Mittel Minimumeigenschaft des arithm. Mittels.

Varianz Rechenvereinfachung: Liegt eine Häufigkeitsverteilung vor: k Merkmalswerte x1,...,xk mit abs. Häufigkeiten hi bzw. rel. Häufigkeiten fi (i=1,...,k) Varianz:

Varianz Klassifizierte Daten: Häufigkeitsverteilung Varianz näherungsweise berechnen, statt der Merkmalswerte xi werden die Klassenmitten xi´ verwendet:

Varianz Bei unimodalen Verteilungen, ist die Varianz, die aus den klassifizierten Daten berechnet wird, größer als die Varianz, die aus den Einzelwerten berechnet wird. Bei konstanten Klasseneinteilungen (Δx): Sheppardsche Korrektur: σ² ... die aus den klassifizierten Daten näherungsweise bestimmte Varianz

Varianz Dimension: Quadrat der Dimension der einzelnen Beobachtungen Eigenschaft: Varianz immer  0 Ist Varianz = 0, liegt keine Streuung vor, alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel.

Standardabweichung Quadratwurzel der Varianz

Varianz & Standardabweichung Eigenschaften: Lineare Transformation der Einzelwerte ai: ai*=α+βai (i=1,...,n) Dann: Varianz: Standardabweichung: Sonderfall: β=1 (Transformation ai*=α+ai) σ*² = σ² und σ* = σ

Varianz & Standardabweichung Eigenschaften: Varianz einer Grundgesamtheit, die aus 2 Teilgesamtheiten (n1, n2) besteht: mit

Varianz & Standardabweichung Standardisierung: Spezielle lineare Transformation Bildet aus Einzelwerten ai standardisierte Werte zi, indem von jedem ai das arithm. Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird. Arithm. Mittel der zi immer 0, Varianz der zi immer 1.

Variationskoeffizient Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen Relatives Streuungsmaß (für verhältnis-skalierte Merkmale mit ausschließlich positiven Merkmalswerten), bezieht die Standardabweichung σ (absolutes Streuungsmaß) auf das arithm. Mittel μ.

MAD Mittlere absolute Abw. Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (z.B. arithm. Mittel oder Median) Minimumeigenschaft des Medians: M beliebiger Wert

MAD Häufigkeitsverteilung der Daten MAD bezogen auf Mittelwert μ MAD aus Häufigkeitsverteilung von klassifizierte Daten: Merkmalswerte xi durch Klassenmitten xi´ ersetzen.

Spannweite (Range) Abstand zw. dem größten und dem kleinsten Wert. Einzelwerte der Größe nach ordnen: a[1],…,a[n] R = a[n] - a[1] Häufigkeitsverteilung von k Merkmalsausprägungen: R = xk - x1 Häufigkeitsverteilung von klassifizierten Daten: R = xko - x1u Spannweite ist instabil gegenüber Ausreißern

Quartilsabstand Quartile Q1, Q2 (=Median), Q3 teilen die Gesamtheit in 4 gleich große Teile. α-Quantil: a(k) falls n·α keine ganze Zahl (k die auf n·α folgende ganze Zahl) ãα= 1/2 (a(k)+a(k+1)) falls n·α ganze Zahl k=n·α Quartilsabstand (Interquartile Range) definiert als Spannweite der 50% mittleren Werte: QA = Q3 – Q1 Eigenschaft: stabil gegenüber Ausreißern

Schiefe Gibt Richtung (rechts- oder linksschief) und Größenordnung der Schiefe einer eingipfligen Häufigkeitsverteilung an. < 0 linksschiefe g1 = 0 symmetrisch > 0 rechtsschiefe Kein direkter Streuungsparameter

Schiefe Schiefe einer Häufigkeitsverteilung aus gruppierten Daten (k Klassen): Verwendung der Klassenmittel od. der Klassenmitten Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen führen.

Wölbung Wölbung od. Kurtosis od. Exzeß: Maßzahl für eingipflige Häufigkeitsvt. Gibt an, ob (bei gleicher Varianz) das absolute Maximum der Häufigkeitsvt. größer als bei der Dichte der Normalvt. ist.

Wölbung < 0 abs. Max. kleiner als bei N-Vt. g2 = 0 Normalverteilung > 0 abs. Max. größer als bei N-Vt. Wölbung einer Häufigkeitsverteilung aus gruppierten Daten (k Klassen): Verwendung der Klassenmittel od. der Klassenmitten

Konzentrationsmaße Metrisch skaliertes Merkmal X mit nur positiven Ausprägungen Frage: Wie teilt sich die Summe der Merkmalswerte x1,…,xn in der Beobachtungsreihe auf die Untersuchungs-einheiten auf? Bsp: n landwirtschaftliche Betriebe, Größe der Nutzflächen: x1,...,xn. Wie teilt sich die gesamte Nutzfläche auf die einzelnen Betriebe auf?

Konzentrationsmaße n Merkmalswerte werden durch q Merkmalsausprägungen a1<...<aq mit absoluten- und relativen Häufigkeiten hi bzw. fi bestimmt. Gesamtbetrag der Merkmalswerte in der Beobachtungsreihe:

Konzentrationsmaße Lorenzkurve: Grafische Darstellung der Konzentration der Merkmalswerte Koordinatenkreuz: Abszisse: es werden die nach der Größe der Merkmals-ausprägung geordneten relativen Häufigkeiten aufsummiert Ordinate: Ausprägungen werden der Größe nach aufsummiert und auf Summe aller Ausprägungen bezogen

Konzentrationsmaße Bsp: landwirtschaftliche Betriebe Abszisse: Es wird der Prozentsatz der Betriebe mit der kleinsten Fläche bestimmt, dann wird der Prozentsatz der Betriebe mit der zweit-kleinsten Fläche bestimmt und zum Prozentsatz der Betriebe mit der kleinsten Fläche addiert, usw. Ordinate: Flächenanteile der Betriebe bzgl. der Gesamtfläche werden der Flächengröße nach aufsummiert.

Konzentrationsmaße Verbinden der Punkte (ki,li) ergibt die Lorenzkurve, wobei immer k0=l0=0 und kq=lq=1 gilt. 1 li 1 ki

Konzentrationsmaße Interpretation: ein Punkt (ki,li) der Lorenz-kurve gibt an, dass auf ki · 100% der Untersuchungseinheiten li · 100% des Gesamtbetrages aller Merkmalsaus-prägungen entfallen. Bsp: auf ki · 100% der landwirtschaftlichen Betriebe entfallen li · 100% der gesamten Nutzfläche

Konzentrationsmaße Extremfälle: Keine Konzentration, alle Untersuchungs-einheiten haben den gleichen Anteil am Gesamtbetrag. Lorenzkurve ist Diagonale. Gesamtbetrag konzentriert sich (fast) vollständig auf eine Untersuchungseinheit. Lorenzkurve liegt (fast) auf Abszisse, ist also (fast) senkrecht.

Konzentrationsmaße Gini-Koeffizient od. Lorenzsche Konzentrationsmaß (LKM): Maßzahl für die Konzentration. Definiert als das 2-fache der Fläche F zw. Diagonale und Lorenzkurve. LKM = 2F. Es gilt immer: 0  LKM  (n-1)/n Standardisierter Gini-Koeffizient: LKMnor = n/(n-1) LKM

Verhältniszahlen Quotient zweier Maßzahlen: Verhältniszahl Gliederungszahlen Man bezieht eine Teilgröße auf eine ihr übergeordnete Gesamtgröße Beziehungszahlen Quotient zweier sachlich sinnvoll in Verbindung stehender Maßzahlen Index-Zahlen Quotient zweier Maßzahlen gleicher Art

Gliederungszahlen Gliederungszahlen Bsp: Tagesproduktion 1500 Teile, davon 300 fehlerhaft. Dann sind 20% der Tagesproduktion Ausschuss (300/1500·100). Ausschussanteil ist eine Gliederungszahl

Beziehungszahlen Beziehungszahlen: Verursachungszahlen: Bezieht Bewegungsmassen auf die zugehörigen Bestandsmassen. Entsprechungszahlen: Alle Beziehungszahlen, bei denen man Ereignisse nicht auf ihren Bestand beziehen kann.

Beziehungszahlen Bsp Verursachungszahlen: Geburtenziffer Bestandsmasse: Einwohner einer Stadt (E) Bewegungsmasse: Zahl der Lebend-geborenen (L) G = (L/E)*1000 Sagt, wie viele Geburten auf 1000 Einwohner einer Stadt entfallen.

Beziehungszahlen Bsp Entsprechungszahlen: Schüler-Lehrer-Verhältnis (Zahl der Schüler) / (Zahl der Lehrer) Sagt, wie viele Schüler (ungefähr) auf eine Lehrer entfallen. Dies entspricht aber i.A. nicht der durchschnittlichen Klassengröße.

Indexzahlen Indexzahlen: Es werden zwei Maßzahlen der gleichen Art in Beziehung gesetzt. Messzahlen oder Einfache Indizes Die zugehörigen Maßzahlen beschreiben eine realen Sachverhalt. (Zusammengesetzte) Indexzahlen Eine der Maßzahlen ist eine Zahl, die einen fiktiven Zustand beschreibt.

Indexzahlen Einfache Indizes: Reihe von Maßzahlen, die man in Beziehung zueinander setzen will. x0,...,xt Maßzahlen zu Zeitpunkten t, x0 Maßzahl zum Basiszeitpunkt 0. Dann ist I0t = xt / x0 für t = 0, 1, 2, ... eine Zeitreihe einfacher Indizes

Indexzahlen Messzahlen werden oftmals mit 100 multipliziert. Bsp: Umsatz im Jahr 5, bezogen auf Jahr 0: I05·100 = x5/x0 · 100 = 87 D.h. dass 87% des Umsatzes im Basisjahr im Jahr 5 umgesetzt werden. Oder: Es liegt eine Minderung des Umsatzes um 13% vor. Vergleich von I05·100=87 mit I06·100=90: Der Umsatz ist um 3 Prozentpunkte gestiegen.

Indexzahlen Umbasieren: Gegeben: Indizes I0t zur Basisperiode 0 Gesucht: Indizes Ikt zur Basisperiode k Berechung ohne Ursprungsdaten: Verkettung: Wenn für xt I0t berechnet werden soll, und x0 nicht bekannt ist. I0t = I0k · Ikt

Indexzahlen Zusammengesetzte Indexzahlen (Indizes): Betrachte Warenkorb: n Waren zu einem Zeitpunkt t Mengen qt1,...,qtn Preise pt1,...,ptn Wert des Warenkorbes in Periode t:

Indexzahlen Wertindex: Vergleich Wert eines Warenkorbes zur Berichtsperiode t mit dem zur Basisperiode 0

Indexzahlen Preisindizes: Aussagen über die Preisentwicklung Für verschiedene Perioden das gleiche Mengenschema verwenden

Indexzahlen Preisindex nach Paasche Man vergleicht den Wert eines Warenkorbes qt1,...,qtn zur jeweiligen Berichtsperiode t mit dem Wert, den dieser unter der Preissituation zur Basisperiode gehabt hätte.

Indexzahlen Preisindex nach Laspeyres Der Warenkorb q01,...,q0n der Basisperiode 0 wird für alle Berichtsperioden zugrundegelegt und ihr fiktiver Wert zur Berichtsperiode t wird mit seinem Wert zur Basisperiode verglichen.

Indexzahlen Vergleich Preisindizes nach Paasche und Laspeyres: L: Warenkorb muss nur für Basisperiode bestimmt werden, Kosten (+) Aktualität (-) P: Warenkorb muss für Berichtsperioden bestimmt werden, Kosten (-) Aktualität (+) Vergleich. Sind Abweichungen groß, muss der Warenkorb neu festgelegt werden. Fishersche Idealindex:

Indexzahlen Mengenindizes: Aussagen über Mengenentwicklung (unabhängig von der Preisentwicklung)

Indexzahlen Mengenindex nach Paasche Standardisierung nach den Preisen zur Berichtsperiode

Indexzahlen Mengenindex nach Laspeyres Standardisierung nach den Preisen zur Basisperiode