Übersetzung: / Tradotto da:

Slides:



Advertisements
Ähnliche Präsentationen
Univariate Statistik M. Kresken.
Advertisements

Das wars!.
Daten auswerten Boxplots
STATISIK LV Nr.: 0028 SS Mai 2005.
Die Darstellung der Daten DIE DARSTELLUNG DER DATEN IN TABELLEN
Übersetzung: / Tradotto da:
Die Darstellung der Daten
DAS ARITHMETISCHE MITTEL
Das ABC der Statistik DIE HÄUFIGKEITSTABELLEN 1
Das ABC der Statistik DIE KREUZTABELLEN 1
Betrachtung der Realität aus der Sicht der Statistik VARIABILITÄT
Das ABC der Statistik DIE SÄULENDIAGRAMME 1
Die ersten Schritte bei der Entdeckung der Statistik
Übersetzung: / Tradotto da:
Der Zentralwert.
Mathematik für BiologInnen WS 05
Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.
Setzen 6!. Noten in Bremen 74 Grundschulen in Bremen davon sind über 40 Grundschulen notenfrei in Vegesack sind 4 von 6 Grundschulen notenfrei.
Мастер – класс. Работа с аутентичным текстом на уроках немецкого языка.
Die Figuren, besonders Hauptfigur, stehen im Zentrum des Leseinteresses. Ihr Verhalten und ihr Schicksal finden die groβe Aufmerksamkeit Mit dem Begriff.
Ein Dozent hat mittels eines Fragebogens die Körpergröße seiner Studenten festgestellt. Anhand der erfassten Daten weiß er, dass der kleinste Student 158.
Vorbereitungsseminar zum fachdidaktischen Blockpraktikum WS 2009/10 Seminarleiterin: Frau StDin Homberg-Halter Seminarsitzung: Oberstufe Stochastik -Planung.
AG Mathematik, Sankt Pölten Markus Binder Inhaltsbereich Wahrscheinlichkeit und Statistik.
Übersetzung: / Tradotto da:
DIE PIKTOGRAMME Das ABC der Statistik
Das ABC der Statistik DIE HÄUFIGKEITSTABELLEN
Betrachtung der Realität aus der Sicht der Statistik VARIABILITÄT
Das ABC der Statistik DIE SÄULENDIAGRAMME
DER MODUS Das ABC der Statistik
Die ersten Schritte bei der Entdeckung der Statistik
WIR SPIELEN STATISTIKER Unterhaltung mit der Wahrscheinlichkeit
Das Wichtigste auf einen Blick
Die Darstellung der Daten
DAS ARITHMETISCHE MITTEL
Grundlagen der Informationsverarbeitung
Das ABC der Statistik DIE KREUZTABELLEN
Die Wahrscheinlichkeit
Entdeckungsreise zur Statistik DATENSCHUTZ, STATISTISCHES GEHEIMNIS UND AUSKUNFTSPFLICHT Übersetzung: / Tradotto da:
Informationswirtschaft Wirtschaftsinformatik (Bachelor, 6. Semester)
Laufzeitverhalten beim Sortieren
TeD– Beratung in Schule
Start Verben und Adjektive lernen Mit Vera und Ali
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
Ökonometrie und Statistik Wiederholung
Paradoxien in der Stochastik
Fächerabwahl am Ende der Jahrgangsstufe Q2-1
Wir hören immer von Regeln aus Sicht der Frauen.
3 Gesamtbeschreibung empirischer Verteilungen.
Ökonometrie und Statistik Wiederholung
Statistik und Biometrie
Programmierung eines Computers (Funktionsweise)
Wir hören immer von Regeln aus Sicht der Frauen.
1. Die rekursive Datenstruktur Liste 1.3 Rekursive Funktionen
DSD – Schriftliche Kommunikation
Lernmodul Einführung Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Nutzungsbedingungen:
Erwartungswerte berechnen
Das Vektorprodukt Wir definieren erneut eine Multiplikation zwischen zwei Vektoren, das Vektorprodukt, nicht zu verwechseln mit dem Skalarprodukt. Schreibe.
Wissenschaftliches Projekt
Elemente von Datenbanken
Ökonometrie und Statistik Wiederholung
Übersicht Etwas Mathematik (ganz ohne geht es nicht).
Konfidenzintervalle und Tests auf Normalverteilung
Wir hören immer von Regeln aus Sicht der Frauen.
Beispiel für eine Grafik gebundene Textproduktion – DaF B1+/B2
Zusammengesetzte Ereignisse
Alphabetisierung Das Alphabet kann doch jeder?
Ökonometrie und Statistik Unabhängigkeitstest, c² - Test (Chi Quadrat Test) Dr. Bertram Wassermann.
Der DIA Deutschland-Trend-Vorsorge Einstellungen zur Altersvorsorge
Ökonometrie und Statistik Wiederholung
1.5 Verkettung von Funktionen
 Präsentation transkript:

Betrachtung der Realität aus der Sicht der Statistik DIE GRUNDLAGEN DER STATISTIK Übersetzung: / Tradotto da: Scuola Secondaria di 1°grado; Argomento: Leggiamo - Basi (30.10.14); Pacchetto: S1.A.1

INHALT Was untersucht die Statistik? Kollektive Phänomene Merkmale und Ausprägungen Erhebungseinheit und Grundgesamtheit Häufigkeiten (absolute, relative, prozentuelle)… Lagemaße (Modus, Median, Mittelwert) Streuungsmaße (Spannweite)

Was untersucht die Statistik? Die Hauptaufgabe der Statistik besteht darin, das, was in der Masse der Informationen unklar erscheint, verständlich zu machen. Wenn man Informationen zu einem bestimmten Phänomen sammelt, hat man mit sehr vielen unbearbeiteten Daten (Rohdaten) zu tun. Deshalb muss als erstes diese Menge an Rohdaten mit besonders aussagekräftigen Indikatoren zusammengefasst werden. Dazu werden numerische (d.h. mit Zahlen) oder grafische (d.h. bildliche) Methoden verwendet, welche die erhobenen Daten beschreiben können, ohne die gesamte Bedeutung zu verändern.

Kollektive Phänomene Die Statistik beschäftigt sich also mit den Phänomenen, bei denen sehr viele einzelne Ausprägungen (kollektive Phänomene) beobachtet werden müssen, damit man das Phänomen selbst untersuchen kann. Die Statistik fasst diese einzelnen Informationen zusammen. Anders gesagt: Die Statistik versucht, aus einer riesigen Menge an Informationen das Wichtigste herauszufiltern, den Zahlen Gehör zu verschaffen! Ist das aber wirklich nötig? Wäre es nicht besser, alle verfügbaren Informationen einzeln und im Detail anzuschauen?

Braucht es die Statistik? In einer Mittelschule haben die Lehrer eine Umfrage zu den Reisen und Sommerferien der Schüler gemacht. Sie haben jeden Schüler gebeten, eine der sechs folgenden Antworten auszuwählen: kein Urlaub, Meer, Berg, Land, Kunststadt, anderes. Meer Kulturstadt Anderes Berg Kein Urlaub Land Wie viele sind das? Was war das beliebteste Ziel? Können wir das in wenigen Sekunden sagen?

Wenn wir alles in eine Tabelle schreiben… Die Daten, die davor nacheinander eingetragen waren, sind jetzt in einer Tabelle zusammengefasst. Insgesamt waren es 50 Schüler. Das bevorzugte Ziel war das Meer! Art des Urlaubs Insgesamt Meer 17 Kein Urlaub 12 Berg 7 Anderes 6 Kulturstadt 5 Land 3 50

Lasst uns jetzt anfangen! Bevor wir „lustige“ Sachen mit den Daten machen können, müssen wir die richtigen Bezeichnungen dafür lernen!! WIR MÜSSEN EIN PAAR BEGRIFFE DER FACHSPRACHE LERNEN Neue Wörter oder „alte“ Wörter mit neuer Bedeutung

MERKMALE UND AUSPRÄGUNGEN MERKMAL oder VARIABLE oder PHÄNOMEN: ist eine interessante Eigenschaft wird erhoben / gemessen / beobachtet AUSPRÄGUNGEN: sind mögliche Werte des Merkmals, sie sind numerisch oder nicht numerisch und müssen: erschöpfend sein: sie müssen alle Wesensarten des betrachteten Merkmals enthalten nicht überschneidend sein: sie sind genau bestimmt oder schließen sich gegenseitig aus. z.B. das von den Lehrern erhobene Merkmal ist die ART DES URLAUBS und die Ausprägungen sind: Kein Urlaub, Meer, Berg, Land, Kulturstadt und anderes

ERHEBUNGSEINHEIT und GRUNDGESAMTHEIT Die ERHEBUNGSEINHEIT ist das Grundelement, an dem die Merkmale beobachtet werden In der Erhebung über die Variable ART DES URLAUBS sind die 50 Schüler die Erhebungseinheiten Es kann „natürlich“ z.B. ein Mensch, ein Auto oder konventionell sein z.B. die Familie Die Erhebungseinheit oder das Grundelement der Erhebung muss immer genau definiert werden. DIE GRUNDGESAMTHEIT ist die Summe aller berücksichtigten Erhebungseinheiten, die in einem oder mehreren Merkmalen übereinstimmen. Mit n wird die Gesamtanzahl der berücksichtigten Erhebungseinheiten bezeichnet.

Und jetzt geht’s mit der Praxis weiter...

Je nach Art der Ausprägung… Diskret Sie nehmen eine begrenzte Anzahl von eineindeutigen Werten an, die den ganzen Zahlen entsprechen (z.B.: Geschwisteranzahl) Quantitativ Werden über Zahlen (Werte) ausgedrückt, die sich auf eine Maßeinheit beziehen. Sie sind messbar. Stetig Sie nehmen eine unbegrenzte Anzahl an eineindeutigen Werten an, die den realen Zahlen entsprechen (z.B.:Alter) Merkmale Ordinal Natürliche Reihenfolge (z.B.: Bildungsgrad) Qualititativ Werden über Eigenschaften ausgedrückt. Sie sind nicht messbar. Nominal Keine Reihenfolge zwi-schen den Ausprägungen (z.B.: Geschlecht)

Instrumente der Statistik Mit der Statistik wird eine Menge an Daten einer Erhebung zusammengefasst und in eine Form gebracht, die leicht zu interpretieren ist. Damit wird die Zusammensetzung der Grundgesamtheit in Bezug auf die beobachteten Merkmale hervorgehoben und es werden Hinweise für die weiteren Bearbeitungen entnommen. Über welche Instrumente der Statistik werden wir sprechen? Häufigkeiten Häufigkeitstabellen Einfache charakteristische Konstanten (Lagemaße, Streuungsmaße...)

Die Häufigkeiten Die einfachste Messtechnik ist die Zählung, also die Anzahl, wie oft jede Ausprägung eines Merkmals auftritt. Jede Erhebungseinheit - muss klassifiziert werden können  erschöpfende Klassen - muss zu einer einzigen Klasse gehören  getrennte Klassen Um die Häufigkeiten zu berechnen, benötigt man die einheitliche Verteilung des Merkmals, also die Auflistung der Ausprägungen, die für jede einzelne Erhebungseinheit in der Grundgesamtheit beobachtet wurden Art des Urlaubs Insge-samt Meer 17 Kein Urlaub 12 Berg 7 Anderes 6 Kulturstadt 5 Land 3 Insgesamt 50 Meer Kulturstadt Anderes Berg Kein Urlaub Land Ausgehend von den aufgereihten Daten zählt man, wie oft jede Ausprägung vorkommt und erhält so die Häufigkeitstabelle!

Absolute Häufigkeiten Die statistische Tabelle ist eine Übersicht mit zwei Spalten: in der ersten Spalte sind die Ausprägungen (einzeln oder in Klassen zusammengefasst), die das Merkmal annehmen kann, aufgelistet in der zweiten Spalte sind die Häufigkeiten enthalten Der Teil oberhalb der Spalten heißt Tabellenkopf. Tipo di vacanza Frequenze assolute mare 17 nessun viaggio 12 montagna 7 altro 6 città d'arte 5 campagna 3 Totale 50 Ausprägung Absolute Häufigkeit x1 n1 x2 n2 … xj nj xk nk Insgesamt n Die absoluten Häufigkeiten sind die Anzahl, wie oft jede Ausprägung in der beob- achteten Grundgesamtheit vorkommt Mit nj werden die Häufigkeiten angegeben und mit xj die Ausprägungen mit dem Index j=1,2,…,K wobei K die Anzahl der Ausprägungen ist

Relative Häufigkeiten Teilt man die absoluten Häufigkeiten durch n, die Gesamtanzahl der Erhebungseinheiten, erhält man die relativen Häufigkeiten. Art des Urlaubs Absolute Häufigkeit Relative Häufigkeit Meer 17 0,34 Kein Urlaub 12 0,24 Berg 7 0,14 Anderes 6 0,12 Kulturstadt 5 0,10 Land 3 0,06 Insgesamt 50 1 Die ABSOLUTEN HÄUFIGKEITEN von zwei Datenverteilungen, auch derselben Art, sind nicht vergleichbar, da sie sich normalerweise auf eine unterschiedliche Gesamtanzahl an Einheiten beziehen.

Wieso werden relative Häufigkeiten berechnet? Da die absoluten Häufigkeiten von n abhängen, haben sie unterschiedliche Bedeutung je nach Gesamtanzahl der Einheiten. Dies ist besonders dann wichtig, wenn Häufigkeitsverteilungen von 2 oder mehr Grundgesamtheiten verglichen werden. Betrachten wir zwei Gruppen, die nach Geschlecht (M Männer und F Frauen) klassifiziert sind. Über die relativen Häufigkeiten können wir erkennen, in welcher Gruppe der Männeranteil höher ist. Gruppe 1 Absolute Häufigkeit Relative Häufigkeit Gruppe 2 M 2 0,333 12 0,207 F 4 0,667 46 0,793 Insge-samt 6 1 58

Prozentuelle Häufigkeiten Die prozentuelle Häufigkeit einer bestimmten Ausprägung ist das Verhältnis zwischen der absoluten Häufigkeit dieser Ausprägung und der Gesamtanzahl der Einheiten, multipliziert mit 100: Art des Urlaubs Absolute Häufigkeit Relative Häufigkeit Prozentuelle Häufigkeit Meer 17 0,34 34% Kein Urlaub 12 0,24 24% Berg 7 0,14 14% Anderes 6 0,12 12% Kulturstadt 5 0,1 10% Land 3 0,06 6% Insgesamt 50 1 100% Mit prozentuellen Häufigkeiten kann man sehr leicht Vergleiche machen!

Berechnung der prozentuellen Häufigkeiten! Die Schüler einer Klasse werden mit der qualitativen Variablen HAARFARBE klassifiziert. Hier ist die Häufigkeitstabelle: Berechnung der prozentuellen Häufigkeiten Haarfarbe (Merkmal) Absolute Häufigkeit Schwarz 10 Braun 6 Rot 1 Blond 5 INSGESAMT 22 Haarfarbe Absolute Häufigkeit Prozentuelle Häufigkeit Schwarz 10 45,46% Braun 6 27,27% Rot 1 4,55% Blond 5 22,72% INSGESAMT 22 100%

Ein Detail zu den AUSPRÄGUNGEN Bei den diskreten Variablen lassen sich die Ausprägungen ziemlich einfach bestimmen, aber bei den STETIGEN Variablen muss man eine DISKRETISIERUNG vornehmen, also KLASSEN der Werte ermitteln, die das Merkmal annimmt, das uns interessiert. Darstellung nach Gewichtsklassen GEWICHT (kg) ANZAHL SCHÜLER (Häufigkeit) 52 1 54 55 2 61 63 68 69 3 71 73 75 INSGESAMT 14 GEWICHTSKLASSE ANZAHL SCHÜLER (Häufigkeit) 50 – 60 kg 4 60 – 70 kg 7 70 – 80 kg 3 Insgesamt 14

Einige Informationen zu den KLASSEN Bei der KLASSIFIKATION müssen bestimmte Regeln eingehalten werden die Anzahl der Klassen muss ausgewogen sein weder zu viele, noch zu wenige die Klassen müssen normalerweise gleich groß sein offene Klassen sind möglichst zu vermeiden Die Informationen werden in einer Verteilung nach Klassen ungenauer, aber die Darstellung der Verteilung wird einfacher und schneller.

LAGEMASSE Um eine Verteilung mit einem einzigen Wert zusammen- zufassen, kann ein Lagemaß verwendet werden. Diese Maße informieren über die Größenordnung, die das Merkmal in der Grundgesamtheit aufweist. Die bekanntesten sind der arithmetische Mittelwert, der Modus und der Median, aber es gibt noch viele andere. Jedes hat seine Eigenheiten…. z.B. Welches ist die durchschnittliche Farbe eurer Haare? Achtung: Nicht alle Merkmale sind gleich und wir müssen deshalb unterschiedlich handeln… (erinnert ihr euch an die qualitativen und quantitativen Merkmale??)

MODUS Der MODUS einer Datenverteilung bezeichnet die GRÖSSTE HÄUFIGKEIT. Es handelt sich im Grunde genommen um den häufigsten Begriff. In dieser Tabelle sind die 19 Schüler nach dem Merkmal NOTE klassifiziert. Der Modus ist die häufigste Ausprägung: das ist die Note 6! NOTE Absolute Häufigkeit 5 4 6 8 7 2 9 1 Insge-samt 19 Er kann für jede Art von Merkmale ermittelt werden, auch für qualitative nominale.

MEDIAN Der MEDIAN ist der Wert, welcher an der MITTLEREN STELLE einer Verteilung von Daten steht, die aufsteigend geordnet sind. In dieser Tabelle sind die 19 Schüler nach dem Merkmal NOTE klassifiziert. Um den Median festzustellen, werden alle Daten aufsteigend angeordnet. Dann wird der ZENTRALE WERT festgestellt: Das ist der Wert in der Mitte, bei dem auf der rechten und linken Seite gleich viele Werte stehen. NOTE Absolute Häufigkeit 5 4 6 8 7 2 9 1 Insge-samt 19 5 5 5 5 6 6 6 6 6 6 6 6 7 7 7 7 8 8 9 Wenn es sich um eine gerade Anzahl von Daten handelt, gibt es zwei Werte, die genau in der Mitte stehen. Der Median ist der arithmetische Mittelwert dieser zwei Werte.

ARITHMETISCHER MITTELWERT Der MITTELWERT ist ein analytischer Mittelwert und kann also nur für QUANTITATIVE Merkmale berechnet werden. Man berechnet ihn, indem man alle beobachteten Werte addiert und durch die Gesamtanzahl der Erhebungseinheiten dividiert. Im vorigen Beispiel 5 5 5 5 6 6 6 6 6 6 6 6 7 7 7 7 8 8 9 Es scheint unlogisch, dass eine Dezimalzahl die Zusammen-fassung von diskreten Daten ist. Das lässt sich aber damit erklären, dass der Mittelwert ein stellvertretender Wert für alle beobachteten Werte ist und sich nicht auf eine einzelne Maßeinheit bezieht!

ARITHMETISCHER MITTELWERT Wenn die Daten in einer Tabelle dargestellt werden, ändert sich die Formel. Jeder beobachtete Wert wird mit der jeweiligen absoluten Häufigkeit gewichtet und alles durch n dividiert. NOTE xj Absolute Häufigkeit nj xj x nj 5 4 20 6 8 48 7 28 2 16 9 1 Insge-samt 19 121

STREUUNG Der MITTELWERT REICHT NICHT, um ein Bild von der Verteilung eines Merkmals darzustellen! Man braucht Indikatoren, die die VERSCHIEDENHEIT der beobachteten Einheiten, also ihre HETEROGENITÄT, beschreiben. z.B. zwei Verteilungen mit dem gleichen arithmetischen Mittelwert, die sich aber sehr voneinander unterscheiden Diese Indikatoren sind die STREUUNGSMASSE. Die STREUUNG einer Verteilung ist die Tendenz der Einheiten, verschiedene Ausprägungen des Merkmals anzunehmen.

SPANNWEITE Um die STREUUNG eines statistischen Phänomens zu verstehen, betrachten wir die folgende Tabelle. Dort wird angegeben, wie viele Fernseher ein Händler in den ersten drei Monaten der letzten drei Jahre verkauft hat. Im ersten Quartal wurden immer durchschnittlich 30 Fernseher verkauft, aber… um die Streuung einzuschätzen, können wir die SPANNWEITE zwischen dem beobachteten Höchstwert und Mindestwert berücksichtigen. 2011Spannweite=30-30=0 also KEINE STREUUNG 2013Spannweite=60-10=50 Die Verkäufe haben 2013 eine größere Streuung aufgewiesen! Monat 2011 2012 2013 Jänner 30 40 60 Februar 20 10 März Insgesamt 90 Spann-weite 50

…und jetzt… Gute Arbeit! Übersetzung: / Tradotto da: Rete per la promozione della cultura statistica