3 Gesamtbeschreibung empirischer Verteilungen.

Slides:

Advertisements

Ähnliche Präsentationen

Deskriptive Statistik und Explorative Datenanalyse

Advertisements

Klassen (Zweck) Wozu legt man Klassen an? Überblick

Hypothesen testen: Grundidee

Was sind Histogramme? (1)

Statistische Methoden I WS 2006/2007 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.

Statistische Methoden I WS 2004/2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.

Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)

Univariate Statistik M. Kresken.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

Vorlesung: Biometrie für Studierende der Veterinärmedizin

Wiederholung und Beispiele

Daten auswerten Boxplots

Aufgabenzettel V Statistik I

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Erheben von Daten kategoriale Merkmale

Theorie psychometrischer Tests, II

Erheben, berechnen und darstellen von Daten

2.4.2 Median Wiederholung (Kap. 2: Beschreibende Statistik)

Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.

Statistik I Statistik I Statistische Grundbegriffe

Klassenstufe 10 -Einführung des Ableitungsbegriffs Julia Klein.

Statistische Auswertung und Darstellungsmöglichkeiten von Messdaten Seminarvortrag von Christian Gorgels im Studiengang Scientific Programming.

Treffen der Faunistischen AG in Zeven Gänseerfassung in Niedersachsen 2016.

Ein Dozent hat mittels eines Fragebogens die Körpergröße seiner Studenten festgestellt. Anhand der erfassten Daten weiß er, dass der kleinste Student 158.

Vorbereitungsseminar zum fachdidaktischen Blockpraktikum WS 2009/10 Seminarleiterin: Frau StDin Homberg-Halter Seminarsitzung: Oberstufe Stochastik -Planung.

Page  1 Agenda  Beantwortung der Forschungsfragen  Datendarstellung für Präsentation und Bericht  Häufigkeitsverteilungen  Statistische Kennwerte.

Zinsrechnung Zuordnungen / Dreisatz Gleichungen Prozente Bruchrechnung

Einführung in Web- und Data-Science

Titel mit blauem Hintergrund

Betrachtung der Realität aus der Sicht der Statistik VARIABILITÄT

Kapitel 8.1 Auswertung statistischer Daten

4 Spezifizierende Beschreibung

Diagramme erstellen mit MS Excel

Österreichisches Wildeinflussmonitoring

Ergebnisse der Bedarfsermittlung zur Einrichtung von Ganztaggrundsschulen in der Gemeinde Kirchlinteln Oktober 2016.

Centre de Prospective et d’Evaluation (C.P.E.)

Deskriptive Statistik -

7.2 Theoretische Kennwerte

Ernährung, Lebensmittel und Umwelt 2017 Präsentation zentraler Umfrageergebnisse Christoph Hofinger Christian Glantschnigg Evelyn Hacker Juni 2017.

Median, Spannweite, Halbweite

Die Wahrscheinlichkeit

Einführung in die Wahrscheinlichkeitsrechnung

Deskriptive Statistik -

Netz des Prismas Aufgabenstellung: Von einem schiefen Prisma soll das Netz gezeichnet werden. Schiefes quadratisches Prisma, Basis in 2. Hauptlage. A(0/9/2),

Elternumfrage Feb Ergebnisse

Liniendiagramm Durch Liniendiagramme können Funktionen und Messungen

Rheinland Cup + ClickBall Rheinland Cup

3 Gesamtbeschreibung empirischer Verteilungen.

Bernhard Riemann und sein Integral

Ökonometrie und Statistik Wiederholung

Vorurteile gegenüber Flüchtlingen

ABC-Analyse Anwendungsbeispiel

UE/BiTS Berlin, ALBA BERLIN College Sommersemester 2018

Wieviele Säulen siehst du?

10 Statistisches Schätzen

12 Das lineare Regressionsmodell

Objektorientierte Programmierung und Vererbung

Statistik IV Statistik III

Ökonometrie und Statistik Wiederholung

4 Spezifizierende Beschreibung

5 Beschreibung und Analyse

Deskriptive Statistik -

Statistik und Biometrie

Kap. 12 R-Bäume GB B31 B245 Box 1: Box 2: Box 3: Box 4: Box 5:

Ökonometrie und Statistik Wiederholung

Übersicht Etwas Mathematik (ganz ohne geht es nicht).

Konfidenzintervalle und Tests auf Normalverteilung

Titel mit blauem Hintergrund

Ökonometrie und Statistik Wiederholung

Präsentation transkript:

3 Gesamtbeschreibung empirischer Verteilungen

3 Gesamtbeschreibung empirischer Verteilungen 3.1 Tabellarische Darstellungsmöglichkeiten 33 3.1.1 Elementare Begriffe und Notation 33 3.1.2 Häufigkeitstabellen bei Urlisten 35 3.1.3 Häufigkeitstabellen bei klassierten Daten 37 3.2 Grafische Darstellungsmöglichkeiten 39 3.2.1 Kreis-, Säulen- und Balkendiagramme 39 3.2.2 Stamm-Blatt-Diagramme 42 3.2.3 Histogramme (Häufigkeitsdichten) 44 3.2.4 Boxplots 48 3.3 Empirische Verteilungsfunktion (EVF) 53 3.3.1 Häufigkeitsfunktion und EVF bei Urlisten 53 3.3.2 Häufigkeitsdichtefunktion und EVF bei klassierten Daten 57 2

3.1 Tabellarische Darstellungsmöglichkeiten 3.1.1 Elementare Begriffe und Notation ● Urliste und Stichprobenumfang ● > Urliste: Nichtmanipulierte ursprünglich Beobachtungswerte > Stichprobenumfang: Anzahl an Beobachtungswerten; notiert mit n ● Merkmale und Ausprägungsmöglichkeiten ● > Merkmal (Variable): Interessierende Eigenschaft von Person, Objekt oder Vorgang. Variable betont die Variabilität hinsichtlich verschiedener Ausprägungsmöglichkeiten, meist notiert mit Großbuchstaben X, Y, Z, ... > Beobachtungswerte eines Merkmals werden mit Kleinbuchstaben notiert: 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 bzw. 𝑦 1 , 𝑦 2 ,…, 𝑦 𝑛 usw. > Ausprägungsmöglichkeiten: Menge aller Werte oder Kategorien, welche ein Merkmal (eine Variable) potenziell annehmen kann Im Falle von Klausuren könnte z. B. gelten 𝑎 1 = 1.3, 𝑎 2 = 1.3, 𝑎 3 = 1.7,... im Falle des Merkmal „Raucherstatus: 𝑎 1 = Raucher, 𝑎 2 = Nichtraucher, ...

3.1 Tabellarische Darstellungsmöglichkeiten

3.1 Tabellarische Darstellungsmöglichkeiten 3.1.2 Häufigkeitstabellen bei Urlisten ● Absolute und relative Häufigkeiten ● > Beispiel: 𝑛 1 =3, 𝑛 2 =2, 𝑛 3 =2, 𝑛 4 =1 𝑓 1 = 𝑛 1 𝑛 = 3 8 =0.375, 𝑓 2 = 𝑛 2 𝑛 = 2 8 =0.25, ... > Allgemein gilt: 𝑓 𝑗 = 𝑛 𝑗 𝑛 ● Tabellarische Darstellung der Häufigkeitsverteilung ●

3.1 Tabellarische Darstellungsmöglichkeiten

3.1 Tabellarische Darstellungsmöglichkeiten 3.1.2 Häufigkeitstabellen bei klassierten Daten ● Größenklassierung ● > Angenommen, bei einer Erhebung wurde die monatliche Absatzmenge einer bestimmten Brötchensorte in 30 Filialen eines Bäckereibetriebs erhoben: > Einteilung in Größenklassen mit jeweils „ähnlich großen“ Werten > Klassengrenzen: 𝑐 𝑗−1 und 𝑐 𝑗 für linke bzw. rechte Grenze der jten Klasse > Beispiel: 𝑐 0 =0, 𝑐 1 =10000 Klassengrenzen der 1. Klasse ● Absolute und relative Klassenhäufigkeiten ● Beispiel: 𝑛 1 =2, 𝑓 1 = 𝑛 1 𝑛 = 2 30≈ 0.067

3.1 Tabellarische Darstellungsmöglichkeiten

3.2 Grafische Darstellungsmöglichkeiten 3.2.1 Kreis-, Säulen- und Balkendiagramme ● Kreis- und Ringdiagramme ● ● Säulendiagramme ●

3.2 Grafische Darstellungsmöglichkeiten

3.2 Grafische Darstellungsmöglichkeiten ● Balkendiagramme ●

3.2 Grafische Darstellungsmöglichkeiten 3.2.2 Stamm-Blatt-Diagramme Hier nochmals die Urliste

3.2 Grafische Darstellungsmöglichkeiten

3.2 Grafische Darstellungsmöglichkeiten 3.2.3 Histogramme ● Konzept und Beispiel ● > Säulendiagramm über Größenklassen, dessen Flächen den relativen Klassenhäufigkeiten entsprechen > Es gilt: Säulenhöhe = Relative Klassenhäufigkeit / Klassenbreite > Der Wert 𝑓 𝑗 𝑑 𝑗 heißt auch Häufigkeitsdichte

3.2 Grafische Darstellungsmöglichkeiten > Beispiel anhand von Größenklasse 3, d. h. j = 3 𝑓 3 = 𝑛 3 𝑛 = 10 30 ≈0.3333 𝑓 3 𝑑 3 = 0.3333 10 ≈0.0333

3.2 Grafische Darstellungsmöglichkeiten ● Problem der Klassenwahl ●

3.2 Grafische Darstellungsmöglichkeiten ● Regeln zur Klassenwahl ● > Nur einige sehr elementarge Regeln: 1. Nach Möglichkeit sollten Klassen ohne Werte („leere Klassen“) vermieden werden. 2. Die Werte sollten innerhalb der Klassen möglichst gleichmäßig verteilt sein. 3. Nach Möglichkeit sollten gleich breite Klassen gewählt werden (erleichtert die Interpretation). > Theorie zur Konstruktion „optimaler“ Histogramme in nichtpara- metrischer Statistik im Rahmen der Dichteschätzung > Implementierung von Algorithmen zur Konstruktion „optimaler“ Histogramme in Software-Pakete

3.2 Grafische Darstellungsmöglichkeiten 3.2.4 Boxplots ● Konzept und Beispiel ● „firstchi“

3.2 Grafische Darstellungsmöglichkeiten > Unterer und oberer Hinge: ℎ 𝐿 ≈ 𝑥 0.25 bzw. ℎ 𝑈 ≈ 𝑥 0.75 > Interquartilsabstand: 𝑑 𝑄 = 𝑥 0.75 − 𝑥 0.25 > Oberer (unterer) Anrainer: nicht weiter als das 1.5-fache des Inter- quartilsabstands vom oberen (unteren) Boxende entfernt

3.2 Grafische Darstellungsmöglichkeiten ● Deutung ● ● Für Vergleichszwecke geeignet ●

3.2 Grafische Darstellungsmöglichkeiten

3.2 Grafische Darstellungsmöglichkeiten

3.3 Empirische Verteilungsfunktion 3.3.1 Häufigkeitsfunktion und EVF bei Urlisten ● Häufigkeitsfunktion ● Die Häufigkeitsfunktion ordnet jedem beliebigen Wert x die relative Häufigkeit seines Auftretens in der Urliste zu, z. B. 𝑓 𝑛 −0.4 =0, 𝑓 𝑛 1 =0.375, 𝑓 𝑛 3 =0.250, 𝑓 𝑛 1.15 =0, 𝑓 𝑛 4 =0.125, usw.

3.3 Empirische Verteilungsfunktion > Kumulatives Aufsummieren der Häufigkeitsfunktion > Gibt für jeden beliebigen Wert x an, wie groß der relative Anteil der Werte ist, die kleiner oder gleich x sind

3.3 Empirische Verteilungsfunktion > Beispiele: 𝐹 𝑛 1 = 𝑓 𝑛 1 =0.375, 𝐹 𝑛 2 = 𝑓 𝑛 1 + 𝑓 𝑛 2 =0.375+0.250=0.625, 𝐹 𝑛 3 = 𝑓 𝑛 1 + 𝑓 𝑛 2 + 𝑓 𝑛 3 =0.375+0.250+0.250=0.875 𝐹 𝑛 −12.3 =0, 𝐹 𝑛 0.98 =0, 𝐹 𝑛 1.99 = 𝑓 𝑛 1 =0.375 𝐹 𝑛 5.565 = 𝑓 𝑛 1 + 𝑓 𝑛 2 + 𝑓 𝑛 3 + 𝑓 𝑛 4 =1

3.3 Empirische Verteilungsfunktion

3.3 Empirische Verteilungsfunktion 3.3.2 Häufigkeitsdichtefunktion und EVF bei klassierten Daten ● Häufigkeitsdichtefunktion ● Die Häufigkeitsdichtefunktion ordnet jedem beliebigen Wert x die Häufigkeitsdichte an der Stelle x zu (klassierte Daten), z. B. 𝑓 𝑛 −0.5 =0, 𝑓 𝑛 0 =0, 𝑓 𝑛 8.5 =0.0067, 𝑓 𝑛 31.2 =0.0200, 𝑓 𝑛 60 =0.0033, 𝑓 𝑛 60.01 =0, usw.

3.3 Empirische Verteilungsfunktion ● EVF an den Klassengrenzen ● > EVF für klassierte Daten soll kumulativen Anteil von Werten bis zu einem bestimmten Wert angeben. > Kumulatives Integrieren der Häufigkeitsdichtefunktion 𝐹 𝑛 𝑥 = −∞ 𝑥 𝑓 𝑛 𝑡 𝑑𝑡 > Sie ordnet einem beliebigen Wert x die Fläche unterhalb der Häufigkeitsdichtefunktion bis zu diesem Wert zu > An einer Klassengrenze entspricht der Wert der EVF genau der kumulierten Summe der relativen Klassenhäufigkeiten bis zu dieser Klassengrenze

3.3 Empirische Verteilungsfunktion

3.3 Empirische Verteilungsfunktion ● Approximation innerhalb der Klassen ● Für einen Wert x innerhalb der j-ten Klasse gilt (als Approximation): 𝐹 𝑛 𝑥 = 𝐹 𝑛 𝑐 𝑗−1 + 𝑥− 𝑐 𝑗−1 𝑓 𝑗 𝑑 𝑗

3.3 Empirische Verteilungsfunktion ● 1. Ableitung der EVF ● Die Steigung der EVF für 𝑥∈ 𝑐 𝑗−1 , 𝑐 𝑗 entspricht der Häufigkeitsdichte 𝑑 𝐹 𝑛 𝑥 𝑑𝑥 = 𝑓 𝑗 𝑑 𝑗