Vorlesung 23.10.2006: Erste Auswertungen von erfassten Daten: absolute und relative Häufigkeiten; Lage- und Streuungsmaße Vorlesung 30.10.2006:

Slides:



Advertisements
Ähnliche Präsentationen
Was ist die Reihenfolge der Monate?
Advertisements

statistische Maßzahlen
Beispiel: Grundbegriffe Statistik/Stochastik
Lagemaße kritische Fragen
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Tagungskalender Januar Februar März April.
Niederschläge in Afrika
Multivariate Datenanalyse Datum: Betreuer: Dr. Bellmann Quellen: Multivariate Statistik, Hartung/Elpelt 1989 Stochastik für Ingenieure und Naturwissenschaftler,
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Kapitel 5 Stetigkeit.
Kapitel 1 Das Schubfachprinzip
Hypothesen testen: Grundidee
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Median Merkmal Geordneter Datensatz
Streuungsparameter Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Die Vorlesung Mathematik I (Prof. Kugelmann) findet heute um 14:30 Uhr im Hörsaal Loefflerstraße 70 statt.
Datenmatrix.
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung.
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Datentabelle für 2 Merkmale
Streuungsparameter Median Mittlere Abweichung vom Median
Univariate Statistik M. Kresken.
Das wars!.
(Gini-Koeffizient, Lorenz-Kurve)
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Diskrete Wahrscheinlichkeitsmodelle
Wiederholung und Beispiele
Daten auswerten Boxplots
1. Mengenlehre Grundbegriffe.
Chi Quadrat Test Tamara Katschnig.
Mathematik STATISTIK Viktoria Kozdron, 5AK VBS Augarten.
...ich seh´es kommen !.
Aufgabenzettel V Statistik I
1. Mengenlehre Grundbegriffe.
STATISIK LV Nr.: 1375 SS März 2005.
§3 Allgemeine lineare Gleichungssysteme
Präsentation läuft auch vollautomatisch ab … wie du möchtest
STATISIK LV Nr.: 0028 SS Mai 2005.
Theorie der Stichprobe
Wahrscheinlichkeitsrechnung
Referat über das Thema STOCHASTIK.
Vorlesung Mai 2000 Konstruktion des Voronoi-Diagramms II
Empirische Softwaretechnik
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
2014 Januar 2014 So Mo Di Mi Do Fr Sa So
Der Zentralwert.
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Der Erotik Kalender 2005.
Statistik – Regression - Korrelation
Januar, Februar, März, April - die Jahresuhr steht niemals still!
Mathematik für BiologInnen WS 05
Aufgabe 5 Gegeben sei folgende Graphik mit den zugehörigen Merkmalsdefinitionen. – Erstellen Sie die zugehörige Kontingenztabelle der absoluten Häufigkeiten.
...ich seh´es kommen !.
...ich seh´es kommen !.
Januar 2016 MONTAGDIENSTAGMITTWOCHDONNERSTAGFREITAGSAMSTAGSONNTAG 1 Neujahr
Gleichungen, Ungleichungen, Unbekannte, Variable – Auffassungen angehender Lehrkräfte Franz Embacher Fakultät für Mathematik der Universität Wien Vortrag.
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
Statistik I Statistik I Statistische Grundbegriffe
PLAYBOY-KALENDER 2020 Januar
Kalender 2004 String-Version
Januar 2018 MONTAG DIENSTAG MITTWOCH DONNERSTAG FREITAG SAMSTAG
JANUAR MONTAG DIENSTAG MITTWOCH
JANUAR MONTAG DIENSTAG MITTWOCH DONNERSTAG FREITAG SAMSTAG
Januar 2016 Montag Dienstag Mittwoch Donnerstag Freitag Samstag
 Präsentation transkript:

Vorlesung 23.10.2006: Erste Auswertungen von erfassten Daten: absolute und relative Häufigkeiten; Lage- und Streuungsmaße Vorlesung 30.10.2006: Gleichzeitige Untersuchung von 2 Merkmalen Mengentheoretische Grundbegriffe

Dem ersten Eindruck nicht bedingungslos trauen! Untersuchung von Datenmengen  geeignete (= aussagekräftige und intuitive) Darstellung finden Aber: Vorsicht beim Lesen von Diagrammen

Beeindruckende Ergebnisse – oder? Tipp: Achten Sie auf die Achsen-beschriftung!

Eine gute graphische Darstellung von statistischen Daten Eine gute graphische Darstellung von statistischen Daten? Vorsicht beim Lesen!

Lage- und Streuungsparameter für eine gegebene Stichprobe Beispiel: Clownspiel  meine Würfelserie: 5 3 1 2 2 5 6 3 5 6 1 2 5 2 4 Augenzahl H(a) h(a) 1 2 2/15 4 4/15 3 1/15 5 6 Stichprobenumfang Hier: Länge der Würfelserie = 15 Arithmetisches Mittel

1 2 3 4 5 6 Arithmetisches Mittel = Schwerpunkt= Unterstützungspunkt für das Gleichgewicht unserer Waage Frage: Wie schwanken, wie streuen die Ausprägungen um den „zentralen Wert“ , d. h. um das arithmetische Mittel?  Berechnung der Standardabweichung

Berechnen der Stichprobenvarianz und der Standardabweichung für meine Würfelserie:  Für meine Serie:  Übergang zur Standardabweichung:  Die gewürfelten Augenzahlen streuen im Bereich (3,46-1,6847 , 3,46 + 1,6847) = (1,7753 , 5,1447)

(durchschnittliche Streuung) Standardabweichung (durchschnittliche Streuung) 1 2 3 4 5 6 Streubereich um den Mittelwert 3,46 , in dem die meisten der Ausprägungen der (= meiner konkreten) Stichprobe liegen.

Gleichzeitige Untersuchung von zwei Merkmalen Vorgegeben: eine Gruppe von Merkmalsträgern Wir betrachten für diese Merkmalsträger gleichzeitig zwei Merkmale:  Jedem Merkmalsträger werden gleichzeitig zwei Ausprägungen zugeordnet: seine Ausprägung bezüglich des 1. Merkmals und seine Ausprägung bezüglich des 2. Merkmals Merkmalsträger Nr. j  Zuordnung (x (j), y(j))

Datenmatrix:. tabellarische Darstellung, die für jeden Merkmals- Datenmatrix: tabellarische Darstellung, die für jeden Merkmals- träger der untersuchten Gruppe die zu ihm gehörigen Merkmalsausprägungen enthält Beispiel: Erfassung von Geburtstagsdaten für eine Gruppe von 49 Studierenden Merkmalsträger, durch eine laufende Nummer „benannt“ Geburtsmonat Geburtsjahr 1 März 1985 2 Januar 1986 3 … 49 Oktober

Aus der Datenmatrix kann die Tabelle der zugehörigen absoluten (oder relativen ) Häufigkeiten abgelesen werden. laufende Nummer Geburts- monat Geburts- jahr 1 März 1985 2 Januar 1986 3 … 49 Oktober 1985 1986 1987 Januar 2 Februar 4 März 11 1 April 6 Mai Juni Juli August September Oktober 3 November Dezember Tabelle der absoluten Häufigkeiten

1985 1986 1987 Januar 2 Februar 4 März 11 1 April 6 Mai Juni Juli August September Oktober 3 November Dezember Darstellung der Merkmalsausprägungskombinationen (Geburtsmonat, Geburtsjahr) für jedes Mitglied unsere Gruppe in einem Punktediagramm: 1 Geb. 11 Geb. Achtung: Für die Monate ist die (willkürliche) Kodierung durch die Zahlen 1,2,…,12 gewählt, für die Jahre die (willkürliche) Kodierung durch 85,86,87. Achtung: hinter manchen dieser Punkte stehen mehrere Merkmalsträger!

Zweidimensionale Häufigkeitsverteilung zur gegebenen Datenmatrix: Zweidimensionale Häufigkeitsverteilung zur gegebenen Datenmatrix: für jede Ausprägungskombination wird die zugehörige absolute (oder relative) Auftrittshäufigkeit aufgetragen Hier: Verteilung der absoluten Häufigkeiten der Ausprägungskombinationen (Geburtsmonat, Geburtsjahr)

Frage:. Bestehen Zusammenhänge zwischen den beiden uns Frage: Bestehen Zusammenhänge zwischen den beiden uns interessierenden Merkmalen?  Lassen sich aus unseren Daten statistische Zusammenhänge zwischen den beiden Merkmalen vermuten? Vorgehen: n Merkmalsträger, jeweils bezüglich beider Merkmale befragt Merkmal 1: Merkmalsausprägungen x1, … , xn werden notiert, Merkmal 2: Merkmalsausprägungen y1, … , yn werden notiert, Die arithmetischen Mittel und werden berechnet, die Stichprobenvarianzen s2(Merkmal 1) und s2(Merkmal 2) werden berechnet.

Korrelationskoeffizient der beiden Merkmale bezüglich der untersuchten Stichprobe EXCEL-Befehle zur Berechnung der Standardabweichung und des Korrelationskoeffizienten für Datenreihen von Merkmalsausprägungspaaren: STABWN(A1:A49) , STABWN(B1:B49) KORREL(A1:A49;B1:B49)

Geburtstagsbeispiel: Monatsnummer 1985 1986 1987 1 (=Januar) 2 2 (=Februar) 4 3 (=März) 11 1 4 (=April) 6 5 (=Mai) 6 (=Juni) 7 (=Juli) 8 (=August) 9 (=September) 10 (=Oktober) 3 11 (=November) 12 (=Dezember) Geburtstagsbeispiel: = …

Berechnung von Zähler und Nenner der Formel für den Korrelationskoeffizienten Mögl. Merkmals-ausprägung Abweichung vom Mittelwert Quadratische Abweichung vom Mittelwert 1 1 - 6,16 = -5,16 (1 – 6,16) 2= 5,162 = 26,63 2 2 - 6,16 = -4,16 (2 – 6,16) 2= 4,162 =17,31 3 3 - 6,16 = -3,16 (3 – 6,16) 2= 3,162 =9,98 … 12 12 - 6,16 = 5,84 (12 – 6,16) 2= 5,842 =34,11 Achtung: Unter den 49 Merkmalsträgern kommen manche xj-Werte mehrmals vor!

yj Entsprechend für das 2. Merkmal: 85 85 - 85,78 = -0,78 (85 - 85,78)2 = 0,782 = 0,61 86 86 - 85,78 = 0,22 (86 - 85,78)2 = 0,222 = 0,048 87 87 – 85,78 = 1,22 (87 – 85,78)2 = 1,222 = 1,49 Achtung: Die 3 Ausprägungen treten sämtlich mehrmals für die Gruppe unserer 49 Merkmalsträger auf!

Daraus Berechnung des Korrelationskoeffizienten für unsere Stichprobe: laufende Nummer Geburts- monat Geburts- jahr 1 März 1985 2 Januar 1986 3 … 49 Oktober . . .  Interpretation: Es gilt für unsere Stichprobe r= 0,396925 Also besteht - gemäß unserer Stichprobe - nur ein niedriger Zusammenhang zwischen den beiden Merkmalen.

r = 0 kein (linearer ) Zusammenhang 0 < 0,4 niedriger Zusammenhang 0,4 < 0,7 mittlerer Zusammenhang 0,7 < < 1 starker Zusammenhang = 1 linearer Zusammenhang

Eigenschaften: Der Korrelationskoeffizient stellt ein Maß für die Abweichung des Zusammenhangs der beiden Merkmale vom strikt linearen Zusammenhang dar: r nimmt nur Werte zwischen -1 und +1 (jeweils einschließlilch) an. r=-1 oder r=+1 bedeutet, dass die beiden Merkmale linear voneinander abhängen. r nahe bei -1 oder nahe bei +1 bedeutet annähernd linearen Zusammenhang. Wenn beide Merkmale sich im gleichen Sinn verändern, ist r positiv. Wenn beide Merkmale sich im entgegengesetzten Sinn verändern, ist r negativ. Achtung: r = 0 bedeutet nicht, dass gar kein Zusammenhang zwischen den beiden Merkmalen besteht! Wir können ihn nur nicht mit unserer Datenmenge nachweisen!

Darstellung der Merkmalsausprägungskombinationen Darstellung der Merkmalsausprägungskombinationen (Geburtsmonat, Geburtsjahr) für jedes Mitglied unsere Gruppe in einem Punktediagramm  Versuch, eine „möglichst gut passende“ Gerade durch die Wolke zu legen: Also: Niedriger Zusammenhang! Die Geraden „passen nicht richtig“: viele Punkte liegen ober- und unterhalb.

Wichtige Grundbegriffe der Mengentheorie Die Sprache der Mathematik ist wie ein Code. Auf diese Weise kann man mathematische Gedanken sehr kurz fassen. Aus: K. Dahl, S. Nordquist: Zahlen, Spiralen und magische Quadrate

Menge: Familie von Objekten,. Zusammenstellung bestimmter Objekte, Menge: Familie von Objekten, Zusammenstellung bestimmter Objekte, Familie von Objekten, die eine bestimmte gemeinsame Eigenschaft haben  Menge der Merkmalsträger = Grundgesamtheit  Menge aller Studierenden, die jetzt in diesem Hörsaal sind Teilmenge  Menge der Merkmalsträger, die für eine bestimmter Stichprobe herangezogen werden Element einer Menge: jedes einzelne Objekt der Menge  jeder einzelne Merkmalsträger Das Element x ist enthalten in der Teilmenge A der Menge G.

A B Vereinigungsmenge, Vereinigung von zwei Mengen: Menge aller Objekte, die zu A oder zu B gehören A B Die Elemente aus der Vereinigungsmenge von A und B gehören jeweils zu mindestens einer der beiden Mengen A oder B. Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A B: Menge aller Studierenden im Hörsaal, die weiblich sind oder im Jahr 1985 geboren wurden

A B Durchschnittsmenge, Durchschnitt von zwei Mengen: Menge aller Objekte, die zu A und zu B gehören A B Die Elemente aus der Durchschnittsmenge von A und B gehören sowohl zu der beiden Menge A als auch zu der Menge B. Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A B: Menge aller Studierenden im Hörsaal, die sowohl weiblich sind als auch im Jahr 1985 geboren wurden

Differenzmengemenge, Differenz A - B: Menge aller Objekte, die zu A, aber nicht gleichzeitig auch zu B gehören Rein gelber Bereich: A-B Rein grüner Bereich: B-A Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A-B: Menge aller Studierenden im Hörsaal, die weiblich sind, aber nicht im Jahr 1985 geboren wurden B-A: Menge aller Studierenden im Hörsaal, die im Jahr 1985 geboren wurden, aber nicht weiblich (also männlich) sind.

Zum kommenden Montag zu lösende Übungsaufgaben:. Aufgabe Nr Zum kommenden Montag zu lösende Übungsaufgaben: Aufgabe Nr. 13 und Aufgabe Nr. 16 aus dem Skript

Wichtige Begriffe aus der heutigen Vorlesung: Arithmetisches Mittel (= „Durchschnittswert“ = erwarteter Wert einer Stichprobe) Standardabweichung vom erwarteten Wert einer Stichprobe Zwei Merkmale für ein und dieselbe Klasse von Merkmalsträgern Korrelationskoeffizient: Stärke (Ausmaß) des Zusammenhangs zwischen zwei Merkmalen Mengentheoretische Grundbegriffe: Menge, Element, Teilmenge, Vereinigung, Durchschnitt, Differenz 1 2 3 4 5 6