Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Vorlesung 23.10.2006: Erste Auswertungen von erfassten Daten: absolute und relative Häufigkeiten; Lage- und Streuungsmaße Vorlesung 30.10.2006: Gleichzeitige.

Ähnliche Präsentationen


Präsentation zum Thema: "Vorlesung 23.10.2006: Erste Auswertungen von erfassten Daten: absolute und relative Häufigkeiten; Lage- und Streuungsmaße Vorlesung 30.10.2006: Gleichzeitige."—  Präsentation transkript:

1 Vorlesung : Erste Auswertungen von erfassten Daten: absolute und relative Häufigkeiten; Lage- und Streuungsmaße Vorlesung : Gleichzeitige Untersuchung von 2 Merkmalen Mengentheoretische Grundbegriffe

2 Untersuchung von Datenmengen geeignete (= aussagekräftige und intuitive) Darstellung finden Aber: Vorsicht beim Lesen von Diagrammen Dem ersten Eindruck nicht bedingungslos trauen!

3 Beeindruckende Ergebnisse – oder? Tipp: Achten Sie auf die Achsen- beschriftung!

4

5 Eine gute graphische Darstellung von statistischen Daten? Vorsicht beim Lesen!

6

7

8 Lage- und Streuungsparameter für eine gegebene Stichprobe Beispiel: Clownspiel meine Würfelserie: AugenzahlH(a)h(a) 122/15 244/15 322/15 411/15 544/15 622/15 Stichprobenumfang Hier: Länge der Würfelserie = 15 Arithmetisches Mittel

9 Arithmetisches Mittel = Schwerpunkt= Unterstützungspunkt für das Gleichgewicht unserer Waage Frage: Wie schwanken, wie streuen die Ausprägungen um den zentralen Wert, d. h. um das arithmetische Mittel? Berechnung der Standardabweichung

10 Berechnen der Stichprobenvarianz und der Standardabweichung für meine Würfelserie: Würfelserie: Für meine Serie: Die gewürfelten Augenzahlen streuen im Bereich (3,46-1,6847, 3,46 + 1,6847) = (1,7753, 5,1447) Übergang zur Standardabweichung:

11 Standardabweichung (durchschnittliche Streuung) Streubereich um den Mittelwert 3,46, in dem die meisten der Ausprägungen der (= meiner konkreten) Stichprobe liegen.

12 Gleichzeitige Untersuchung von zwei Merkmalen Vorgegeben: eine Gruppe von Merkmalsträgern Wir betrachten für diese Merkmalsträger gleichzeitig zwei Merkmale: Jedem Merkmalsträger werden gleichzeitig zwei Ausprägungen zugeordnet: seine Ausprägung bezüglich des 1. Merkmals und seine Ausprägung bezüglich des 2. Merkmals Merkmalsträger Nr. j Zuordnung (x (j), y(j))

13 Datenmatrix: tabellarische Darstellung, die für jeden Merkmals- träger der untersuchten Gruppe die zu ihm gehörigen Merkmalsausprägungen enthält Beispiel: Erfassung von Geburtstagsdaten für eine Gruppe von 49 Studierenden Merkmalsträger, durch eine laufende Nummer benannt GeburtsmonatGeburtsjahr 1März1985 2Januar1986 3März1985 ……… 49Oktober1986

14 laufende Nummer Geburts- monat Geburts- jahr 1März1985 2Januar1986 3März1985 ……… 49Oktober1986 Aus der Datenmatrix kann die Tabelle der zugehörigen absoluten (oder relativen ) Häufigkeiten abgelesen werden Januar2 Februar42 März111 April6 Mai Juni Juli4 August2 September4 Oktober34 November4 Dezember2 Tabelle der absoluten Häufigkeiten

15 Darstellung der Merkmalsausprägungskombinationen (Geburtsmonat, Geburtsjahr) für jedes Mitglied unsere Gruppe in einem Punktediagramm: Achtung: hinter manchen dieser Punkte stehen mehrere Merkmalsträger! 11 Geb. 1 Geb Januar2 Februar42 März111 April6 Mai Juni Juli4 August2 September4 Oktober34 November4 Dezember2 Achtung: Für die Monate ist die (willkürliche) Kodierung durch die Zahlen 1,2,…,12 gewählt, für die Jahre die (willkürliche) Kodierung durch 85,86,87.

16 Zweidimensionale Häufigkeitsverteilung zur gegebenen Datenmatrix: für jede Ausprägungskombination wird die zugehörige absolute (oder relative) Auftrittshäufigkeit aufgetragen Hier : Verteilung der absoluten Häufigkeiten der Ausprägungskombinationen (Geburtsmonat, Geburtsjahr)

17 Frage: Bestehen Zusammenhänge zwischen den beiden uns interessierenden Merkmalen? Lassen sich aus unseren Daten statistische Zusammenhänge zwischen den beiden Merkmalen vermuten? Vorgehen: n Merkmalsträger, jeweils bezüglich beider Merkmale befragt Merkmal 1: Merkmalsausprägungen x 1, …, x n werden notiert, Merkmal 2: Merkmalsausprägungen y 1, …, y n werden notiert, Die arithmetischen Mittel und werden berechnet, die Stichprobenvarianzen s 2 (Merkmal 1) und s 2 (Merkmal 2) werden berechnet.

18 Korrelationskoeffizient der beiden Merkmale bezüglich der untersuchten Stichprobe EXCEL-Befehle zur Berechnung der Standardabweichung und des Korrelationskoeffizienten für Datenreihen von Merkmalsausprägungspaaren: STABWN(A1:A49), STABWN(B1:B49) KORREL(A1:A49;B1:B49)

19 Geburtstagsbeispiel: = … Monatsnummer (=Januar)2 2 (=Februar)42 3 (=März)111 4 (=April) 6 5 (=Mai) 6 (=Juni) 7 (=Juli)4 8 (=August)2 9 (=September)4 10 (=Oktober)34 11 (=November)4 12 (=Dezember)2

20 Mögl. Merkmals- ausprägung Abweichung vom MittelwertQuadratische Abweichung vom Mittelwert ,16 = -5,16(1 – 6,16) 2 = 5,16 2 = 26, ,16 = -4,16(2 – 6,16) 2 = 4,16 2 =17, ,16 = -3,16(3 – 6,16) 2 = 3,16 2 =9,98 … ,16 = 5,84(12 – 6,16) 2 = 5,84 2 =34,11 Berechnung von Zähler und Nenner der Formel für den Korrelationskoeffizienten Achtung: Unter den 49 Merkmalsträgern kommen manche xj-Werte mehrmals vor!

21 yjyj ,78 = -0,78( ,78) 2 = 0,78 2 = 0, ,78 = 0,22( ,78) 2 = 0,22 2 = 0, – 85,78 = 1,22(87 – 85,78) 2 = 1,22 2 = 1,49 Entsprechend für das 2. Merkmal: Achtung: Die 3 Ausprägungen treten sämtlich mehrmals für die Gruppe unserer 49 Merkmalsträger auf!

22 Daraus Berechnung des Korrelationskoeffizienten für unsere Stichprobe: Interpretation: Es gilt für unsere Stichprobe r= 0, Also besteht - gemäß unserer Stichprobe - nur ein niedriger Zusammenhang zwischen den beiden Merkmalen. laufende Nummer Geburts- monat Geburts- jahr 1März1985 2Januar1986 3März1985 ……… 49Oktober

23 r = 0 kein (linearer ) Zusammenhang 0 < 0,4 niedriger Zusammenhang 0,4 < 0,7 mittlerer Zusammenhang 0,7 < < 1starker Zusammenhang = 1 linearer Zusammenhang

24 Eigenschaften: Der Korrelationskoeffizient stellt ein Maß für die Abweichung des Zusammenhangs der beiden Merkmale vom strikt linearen Zusammenhang dar: r nimmt nur Werte zwischen -1 und +1 (jeweils einschließlilch) an. r=-1 oder r=+1 bedeutet, dass die beiden Merkmale linear voneinander abhängen. r nahe bei -1 oder nahe bei +1 bedeutet annähernd linearen Zusammenhang. Wenn beide Merkmale sich im gleichen Sinn verändern, ist r positiv. Wenn beide Merkmale sich im entgegengesetzten Sinn verändern, ist r negativ. Achtung: r = 0 bedeutet nicht, dass gar kein Zusammenhang zwischen den beiden Merkmalen besteht! Wir können ihn nur nicht mit unserer Datenmenge nachweisen!

25

26 Darstellung der Merkmalsausprägungskombinationen (Geburtsmonat, Geburtsjahr) für jedes Mitglied unsere Gruppe in einem Punktediagramm Versuch, eine möglichst gut passende Gerade durch die Wolke zu legen: Die Geraden passen nicht richtig: viele Punkte liegen ober- und unterhalb. Also: Niedriger Zusammenhang!

27 Wichtige Grundbegriffe der Mengentheorie Aus: K. Dahl, S. Nordquist: Zahlen, Spiralen und magische Quadrate Die Sprache der Mathematik ist wie ein Code. Auf diese Weise kann man mathematische Gedanken sehr kurz fassen.

28 Menge: Familie von Objekten, Zusammenstellung bestimmter Objekte, Familie von Objekten, die eine bestimmte gemeinsame Eigenschaft haben Menge der Merkmalsträger = Grundgesamtheit Menge aller Studierenden, die jetzt in diesem Hörsaal sind Teilmenge Menge der Merkmalsträger, die für eine bestimmter Stichprobe herangezogen werden Element einer Menge: jedes einzelne Objekt der Menge jeder einzelne Merkmalsträger Das Element x ist enthalten in der Teilmenge A der Menge G.

29 Vereinigungsmenge, Vereinigung von zwei Mengen: Menge aller Objekte, die zu A oder zu B gehören A B Die Elemente aus der Vereinigungsmenge von A und B gehören jeweils zu mindestens einer der beiden Mengen A oder B. Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A B: Menge aller Studierenden im Hörsaal, die weiblich sind oder im Jahr 1985 geboren wurden

30 Durchschnittsmenge, Durchschnitt von zwei Mengen: Menge aller Objekte, die zu A und zu B gehören A B Die Elemente aus der Durchschnittsmenge von A und B gehören sowohl zu der beiden Menge A als auch zu der Menge B. Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A B: Menge aller Studierenden im Hörsaal, die sowohl weiblich sind als auch im Jahr 1985 geboren wurden

31 Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A-B: Menge aller Studierenden im Hörsaal, die weiblich sind, aber nicht im Jahr 1985 geboren wurden B-A: Menge aller Studierenden im Hörsaal, die im Jahr 1985 geboren wurden, aber nicht weiblich (also männlich) sind. Differenzmengemenge, Differenz A - B: Menge aller Objekte, die zu A, aber nicht gleichzeitig auch zu B gehören Rein gelber Bereich: A-B Rein grüner Bereich: B-A

32 Zum kommenden Montag zu lösende Übungsaufgaben: Aufgabe Nr. 13 und Aufgabe Nr. 16 aus dem Skript

33 Wichtige Begriffe aus der heutigen Vorlesung: Arithmetisches Mittel (= Durchschnittswert = erwarteter Wert einer Stichprobe) Standardabweichung vom erwarteten Wert einer Stichprobe Zwei Merkmale für ein und dieselbe Klasse von Merkmalsträgern Korrelationskoeffizient: Stärke (Ausmaß) des Zusammenhangs zwischen zwei Merkmalen Mengentheoretische Grundbegriffe: Menge, Element, Teilmenge, Vereinigung, Durchschnitt, Differenz


Herunterladen ppt "Vorlesung 23.10.2006: Erste Auswertungen von erfassten Daten: absolute und relative Häufigkeiten; Lage- und Streuungsmaße Vorlesung 30.10.2006: Gleichzeitige."

Ähnliche Präsentationen


Google-Anzeigen