Betrachtung der Realität aus der Sicht der Statistik VARIABILITÄT

Slides:



Advertisements
Ähnliche Präsentationen
Statistik Die folgende Präsentation illustriert die Kapitel XIV und XV aus dem Buch „Chemie berechnen“ (Wawra/Dolznig/Müllner). Da die Texte teilweise.
Advertisements

Univariate Statistik M. Kresken.
Arbeiten mit Mittelwert- und Kovarianzstrukturmodellen
Mittlere absolute Abweichung vom Mittelwert(1)
Streuung Bezeichnung Streuung=Dispersion=Variabilität Fragestellung:
Lagemaße kritische Fragen
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Kapitel 1 Das Schubfachprinzip
Mittelwert, Median, Quantil
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Datenmatrix.
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Streuungsparameter Median Mittlere Abweichung vom Median
Univariate Statistik M. Kresken.
Deskriptive Statistik
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Das wars!.
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Wiederholung und Beispiele
Vorlesung: ANOVA I
Daten auswerten Boxplots
Mathematik STATISTIK Viktoria Kozdron, 5AK VBS Augarten.
Die t-Verteilung und die Prüfstatistik
Aufgabenzettel V Statistik I
Forschungsmethoden Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften, Universität Fribourg.
Kurvendiskussion Los geht´s Klick auf mich! Melanie Gräbner.
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Kennwerte und Boxplots
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.
Wahrscheinlichkeitsrechnung
Die Darstellung der Daten DIE DARSTELLUNG DER DATEN IN TABELLEN
Referat über das Thema STOCHASTIK.
Übersetzung: / Tradotto da:
Die Wahrscheinlichkeit
Die Darstellung der Daten
DAS ARITHMETISCHE MITTEL
Das ABC der Statistik DIE HÄUFIGKEITSTABELLEN 1
Das ABC der Statistik DIE KREUZTABELLEN 1
DIE PIKTOGRAMME Das ABC der Statistik 1
Das ABC der Statistik DIE SÄULENDIAGRAMME 1
Die ersten Schritte bei der Entdeckung der Statistik
1 (C) 2002, Hermann Knoll, HTW Chur, Fachhochschule Ostschweiz Wahrscheinlichkeitsverteilung Lernziele: Wahrscheinlichkeitsverteilung und der Wahrscheinlichkeitsdichte.
Übersetzung: / Tradotto da:
Der Zentralwert.
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Veranstaltung 4.
Statistik – Wahrscheinlichkeit
Erheben, berechnen und darstellen von Daten
Einführung in die amtliche Statistik I.Stat Die statistische Datenbank des Istat Wie man eine Tabelle anzeigt und exportiert Scuola Secondaria di secondo.
Mathematik für BiologInnen WS 05
setzt Linearität des Zusammenhangs voraus
Verteilungen, Varianz Tamara Katschnig.
Subnetting.
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
Statistik III Statistik III 2. Streuungsmaße (Dispersionsmaße)
Statistik I Statistik I Statistische Grundbegriffe
Übersetzung: / Tradotto da:
Das ABC der Statistik DIE HÄUFIGKEITSTABELLEN
Betrachtung der Realität aus der Sicht der Statistik VARIABILITÄT
Das ABC der Statistik DIE SÄULENDIAGRAMME
DER MODUS Das ABC der Statistik
Die ersten Schritte bei der Entdeckung der Statistik
DAS ARITHMETISCHE MITTEL
Das ABC der Statistik DIE KREUZTABELLEN
 Präsentation transkript:

Betrachtung der Realität aus der Sicht der Statistik VARIABILITÄT Übersetzung: / Tradotto da: Scuola Secondaria 1°grado; Argomento: Leggiamo - Variabilità; (30.09.13); Pacchetto: S1.A.4

Was ist die VARIABILITÄT? Wie misst man die Variabilität? Die Variabilität als Distanzmaß Die Variabilität als Distanzmaß von einem Zentrum Varianz Standardabweichung Relative Streuungsmaße

Was ist die VARIABILITÄT? Darunter versteht man, dass ein Phänomen bei den einzelnen Erhebungseinheiten der Grundgesamtheit verschiedene Ausprägungen annehmen kann. Die Variabilität ist umso größer, je größer die Unterschiede zwischen den einzelnen Fällen sind. Die Lagemaße wie Mittelwert, Median oder Modus geben keine Auskunft darüber, wie die Einheiten dazu tendieren, unterschiedliche Werte anzunehmen.

Reicht der Mittelwert, um die Daten darzustellen? Semesterende – um die schulischen Leistungen einzuschätzen, berechnen wir den Mittelwert der Noten in Mathematik. Das sind die Noten, die drei Schüler bekommen haben: MARCO 6 5 7 MITTELWERT=6 LUCA LUIGI 4 8 Die Schüler haben den gleichen Durchschnitt, aber die Noten sind sehr… UNTERSCHIEDLICH

Wie misst man die Variabilität? Der Mittelwert sagt nichts über die Variabilität der Daten aus. Dazu müssen wir ein STREUUNGSMASS verwenden. Nehmen wir an, dass jede Kugel eine Erhebungseinheit ist…

Die Variabilität als Distanzmaß Die Variabilität nimmt zu, wenn die Distanz zwischen den Beobachtungen zunimmt. SPANNWEITE=MAX-min Das ist das einfachste Maß, da es nur die Positionen von zwei Erhebungseinheiten berücksichtigt. Sie ist die Differenz zwischen dem beobachteten Maximum und Minimum.

Welcher unserer Schüler hat die größte Variabilität? Wir berechnen die SPANNWEITE, indem wir das Maximum heranziehen und das Minimum davon abziehen. MARCO 6 5 7 SPANNWEITE=7-5=2 LUCA SPANNWEITE=6-6=0 LUIGI 4 8 SPANNWEITE=8-4=4 Luigi hat die unterschiedlichsten Noten, während Lucas Noten überhaupt nicht variieren.

Die SPANNWEITE ist ein unmittelbares Maß, aber… …es ist sensibel: es berücksichtigt nur die Extremwerte, die durch außergewöhnliche und unnormale Werte beeinflusst sein können, während alle anderen beobachteten Werte außer Acht gelassen werden. Ein besser geeignetes Maß muss ALLE ERHEBUNGSEINHEITEN BERÜCKSICHTIGEN! Aber alle möglichen Unterschiede zwischen allen Erhebungseinheiten zu berücksichtigen ist zu aufwändig! Eine Lösung ist…

Die Variabilität als Distanzmaß von einem Zentrum Ein besser geeignetes Streuungsmaß muss also als Distanzmaß jeder Beobachtung vom Mittelwert der Daten funktionieren. Die Variabilität nimmt zu, wenn die Distanz zwischen den Beobachtungen und dem Zentrum der Beobachtungen steigt.

Lasst uns versuchen, ein Streuungsmaß zu erstellen! Um die Distanz jeder Beobachtung vom Mittelwert zu messen, können wir die Operation Differenz verwenden! Wir definieren unsere Daten X ist das beobachtete Phänomen (statistische Variable) x1,x2,x3,…,xi,…,xn sind die beobachteten Werte der n Erhebungseinheiten   ist der arithmetische Mittelwert von n beobachteten Werten x1 x2 x3 x4 x6 x5 x7 x8 M

Abweichungen oder Differenzen vom Mittelwert Mit welcher mathematischen Formel kann ich die Distanz zwischen zwei beobachteten Werten messen? Mit der Differenz! Wenn wir alle Differenzen (auch ABWEICHUNGEN genannt) nehmen und die Summe bilden erhalten wir jedoch… Der arithmetische Mittelwert ist der Punkt, an dem die Daten im Gleichgewicht sind. Der Mittelwert gleicht die niedrigsten und die höchsten Werte aus und genau deshalb ist die Summe der Abweichungen vom Mittelwert gleich NULL.

Die kleinsten Quadrate!!! Von den verschiedenen Eigenschaften des arithmetischen Mittelwerts könnten wir jene der kleinsten Quadrate nutzen. Diese besagt, dass die Summe der Quadrate der Abweichungen vom arithmetischen Mittelwert das Minimum der Summe der Abweichungen von jedem anderen Wert ist.

Die Summe der Quadrate der Abweichungen… ist immer größer als null ist nur dann gleich null, wenn die Variable nicht variiert steigt mit der Zunahme der Dispersion der Beobachtungen vom Mittelwert steigt auch mit der Zunahme der Anzahl der Beobachtungen (n) wird als Quadrat der Maßeinheit der Variablen ausgedrückt

Varianz Teilt man die Summe der Abweichungen zum Quadrat durch n, um die Auswirkung aufgrund der Anzahl der Beobachtungen auszuschalten, erhält man die VARIANZ. Sie wird allgemein mit s2 („Sigma hoch 2“) angegeben. Um ein Streuungsmaß in derselben Maßeinheit der beobachteten Daten zu erhalten, müssen wir die Quadratwurzel der Varianz ziehen!

Standardabweichung Die Varianz wird als Quadrat der Maßeinheit der beobachteten Variablen ausgedrückt. Ihr Wert ist also nicht unmittelbar verständlich. Häufiger wird die Standardabweichung verwendet. Eigenschaften: Gleiche Maßeinheit wie beim Merkmal Definiert die durchschnittliche Distanz der Beobachtungen vom arithmetischen Mittelwert Bei n Beobachtungen x1,x2,…,xn lautet die Formel

Wir rechnen mit Marcos Noten Im Falle von Daten in einer REIHE Noten von MARCO Abweichun-gen vom Mittelwert Quadrate der Abweichun-gen 6 (6-6)=0 5 (5-6)=-1 1 7 (7-6)=1 Insgesamt 24 2 Varianz 0,5 Standard-abweichung 0,71

Und jetzt auch für Luca und Luigi! Noten von LUCA Abwei-chungen vom Mittelwert Quadrate der Abwei-chungen Noten von LUIGI 6 4 (4-6)=-2 8 (8-6)=2 24 16 Varianz Standard-abweichung 2 Luigis Noten sind am unterschiedlichsten – wir bestätigen das, was wir bereits mit der SPANNWEITE erkannt haben!

Standardabweichung Wenn die Daten in einer Häufigkeitstabelle zusammengefasst sind, wird jede Abweichung mit der entsprechenden absoluten Häufigkeit gewichtet. Wir erstellen eine Häufigkeitstabelle mit den Daten der drei Schüler und berechnen den Mittelwert und die Standardabweichung. Insgesamt haben wir n=12 Beobachtungen.

Üben wir mit Daten in der Tabelle! 4 2 8 5 1 6 36 7 16 totale 12 72 10 18  

Streuungsmaße Sie messen die Variabilität eines Phänomens, einer Variablen, einer Verteilung. Man unterscheidet zwischen: absoluten Maßen, die in derselben Maßeinheit ausgedrückt werden wie das untersuchte Phänomen: Spannweite Standardabweichung … relativen Maßen, die unabhängig von der Maßeinheit sind und sich deshalb dazu eignen, unterschiedliche Phänomene zu vergleichen. Man erhält sie, indem man ein absolutes Maß mit einem Mittelwert oder mit dem Maximum in Beziehung setzt.

Relative Streuungsmaße Sie erlauben Vergleiche der Variabilität von Verteilungen, die mit unterschiedlichen Maßeinheiten dargestellt werden (z.B. Gewicht und Größe) von Verteilungen, die mit derselben Maßeinheit dargestellt werden, aber von der unterschiedlichen Intensität desselben Phänomens beeinflusst werden (z.B. Gewicht der Neugeborenen und Gewicht der Mütter). Das bekannteste Streuungsmaß ist der Variationskoeffizient.

Marco vergleicht sich mit seinem Bruder! Sein Bruder besucht die Universität und hat im letzten Semester die folgenden Noten (in Dreißigsteln) bekommen. Noten von Marcos Bruder Abweichungen vom Mittelwert Quadrate der Abweichungen 25 (25-22)=3 9 20 (20-22)=-2 4 22 (22-22)=0 21 (21-22)=-1 1 88 14      

Fassen wir alles in einer Tabelle zusammen! Wer weist die größere Variabilität auf? Indice Marco Fratello di Marco M 6 22 0,5 3,5 0,7 1,9 11,8% 8,6% Die größere Variabilität hat derjenige, der den höheren Variationskoeffizienten hat: Marco!

Versuchen wir es nun mit realen Daten! Welche der drei Getreideproduktionen (Weizen, Reis oder Mais) ist am variabelsten? Produktion einiger Getreidearten - Jahre 1921-2011 (Zentner je Hektar) Die Produktion von Mais hat die größte Spannweite. Die Produktion von Weizen hingegen schwankt am wenigsten! Quelle: Ministero di agricoltura, industria e commercio (fino al 1923); Istituto di economia e statistica agraria (anni 1924-1926); Istat, Stima delle superfici e produzioni delle coltivazioni agrarie, floricole e delle piante intere da vaso (dal 1927)

…und jetzt… Gute Arbeit! Rete per la promozione della cultura statistica Übersetzung: / Tradotto da: