Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Vorlesung 23.10.2006: Erste Auswertungen von erfassten Daten: absolute und relative Häufigkeiten; Lage- und Streuungsmaße Vorlesung 30.10.2006:

Ähnliche Präsentationen


Präsentation zum Thema: "Vorlesung 23.10.2006: Erste Auswertungen von erfassten Daten: absolute und relative Häufigkeiten; Lage- und Streuungsmaße Vorlesung 30.10.2006:"—  Präsentation transkript:

1 Vorlesung : Erste Auswertungen von erfassten Daten: absolute und relative Häufigkeiten; Lage- und Streuungsmaße Vorlesung : Gleichzeitige Untersuchung von 2 Merkmalen Mengentheoretische Grundbegriffe

2 Dem ersten Eindruck nicht bedingungslos trauen!
Untersuchung von Datenmengen  geeignete (= aussagekräftige und intuitive) Darstellung finden Aber: Vorsicht beim Lesen von Diagrammen

3 Beeindruckende Ergebnisse – oder?
Tipp: Achten Sie auf die Achsen-beschriftung!

4

5 Eine gute graphische Darstellung von statistischen Daten
Eine gute graphische Darstellung von statistischen Daten? Vorsicht beim Lesen!

6

7

8 Lage- und Streuungsparameter für eine gegebene Stichprobe
Beispiel: Clownspiel  meine Würfelserie: Augenzahl H(a) h(a) 1 2 2/15 4 4/15 3 1/15 5 6 Stichprobenumfang Hier: Länge der Würfelserie = 15 Arithmetisches Mittel

9 Arithmetisches Mittel = Schwerpunkt= Unterstützungspunkt für das Gleichgewicht unserer Waage Frage: Wie schwanken, wie streuen die Ausprägungen um den „zentralen Wert“ , d. h. um das arithmetische Mittel?  Berechnung der Standardabweichung

10 Berechnen der Stichprobenvarianz und der Standardabweichung für meine Würfelserie:
 Für meine Serie:  Übergang zur Standardabweichung:  Die gewürfelten Augenzahlen streuen im Bereich (3,46-1,6847 , 3,46 + 1,6847) = (1,7753 , 5,1447)

11 (durchschnittliche Streuung)
Standardabweichung (durchschnittliche Streuung) Streubereich um den Mittelwert 3,46 , in dem die meisten der Ausprägungen der (= meiner konkreten) Stichprobe liegen.

12 Gleichzeitige Untersuchung von zwei Merkmalen
Vorgegeben: eine Gruppe von Merkmalsträgern Wir betrachten für diese Merkmalsträger gleichzeitig zwei Merkmale:  Jedem Merkmalsträger werden gleichzeitig zwei Ausprägungen zugeordnet: seine Ausprägung bezüglich des 1. Merkmals und seine Ausprägung bezüglich des 2. Merkmals Merkmalsträger Nr. j  Zuordnung (x (j), y(j))

13 Datenmatrix:. tabellarische Darstellung, die für jeden Merkmals-
Datenmatrix: tabellarische Darstellung, die für jeden Merkmals- träger der untersuchten Gruppe die zu ihm gehörigen Merkmalsausprägungen enthält Beispiel: Erfassung von Geburtstagsdaten für eine Gruppe von Studierenden Merkmalsträger, durch eine laufende Nummer „benannt“ Geburtsmonat Geburtsjahr 1 März 1985 2 Januar 1986 3 49 Oktober

14 Aus der Datenmatrix kann die Tabelle der zugehörigen absoluten (oder relativen ) Häufigkeiten abgelesen werden. laufende Nummer Geburts- monat Geburts- jahr 1 März 1985 2 Januar 1986 3 49 Oktober 1985 1986 1987 Januar 2 Februar 4 März 11 1 April 6 Mai Juni Juli August September Oktober 3 November Dezember Tabelle der absoluten Häufigkeiten

15 1985 1986 1987 Januar 2 Februar 4 März 11 1 April 6 Mai Juni Juli August September Oktober 3 November Dezember Darstellung der Merkmalsausprägungskombinationen (Geburtsmonat, Geburtsjahr) für jedes Mitglied unsere Gruppe in einem Punktediagramm: 1 Geb. 11 Geb. Achtung: Für die Monate ist die (willkürliche) Kodierung durch die Zahlen 1,2,…,12 gewählt, für die Jahre die (willkürliche) Kodierung durch 85,86,87. Achtung: hinter manchen dieser Punkte stehen mehrere Merkmalsträger!

16 Zweidimensionale Häufigkeitsverteilung zur gegebenen Datenmatrix:
Zweidimensionale Häufigkeitsverteilung zur gegebenen Datenmatrix: für jede Ausprägungskombination wird die zugehörige absolute (oder relative) Auftrittshäufigkeit aufgetragen Hier: Verteilung der absoluten Häufigkeiten der Ausprägungskombinationen (Geburtsmonat, Geburtsjahr)

17 Frage:. Bestehen Zusammenhänge zwischen den beiden uns
Frage: Bestehen Zusammenhänge zwischen den beiden uns interessierenden Merkmalen?  Lassen sich aus unseren Daten statistische Zusammenhänge zwischen den beiden Merkmalen vermuten? Vorgehen: n Merkmalsträger, jeweils bezüglich beider Merkmale befragt Merkmal 1: Merkmalsausprägungen x1, … , xn werden notiert, Merkmal 2: Merkmalsausprägungen y1, … , yn werden notiert, Die arithmetischen Mittel und werden berechnet, die Stichprobenvarianzen s2(Merkmal 1) und s2(Merkmal 2) werden berechnet.

18 Korrelationskoeffizient der beiden Merkmale bezüglich der untersuchten Stichprobe
EXCEL-Befehle zur Berechnung der Standardabweichung und des Korrelationskoeffizienten für Datenreihen von Merkmalsausprägungspaaren: STABWN(A1:A49) , STABWN(B1:B49) KORREL(A1:A49;B1:B49)

19 Geburtstagsbeispiel:
Monatsnummer 1985 1986 1987 1 (=Januar) 2 2 (=Februar) 4 3 (=März) 11 1 4 (=April) 6 5 (=Mai) 6 (=Juni) 7 (=Juli) 8 (=August) 9 (=September) 10 (=Oktober) 3 11 (=November) 12 (=Dezember) Geburtstagsbeispiel: = …

20 Berechnung von Zähler und Nenner der Formel für den Korrelationskoeffizienten
Mögl. Merkmals-ausprägung Abweichung vom Mittelwert Quadratische Abweichung vom Mittelwert 1 1 - 6,16 = -5,16 (1 – 6,16) 2= 5,162 = 26,63 2 2 - 6,16 = -4,16 (2 – 6,16) 2= 4,162 =17,31 3 3 - 6,16 = -3,16 (3 – 6,16) 2= 3,162 =9,98 12 12 - 6,16 = 5,84 (12 – 6,16) 2= 5,842 =34,11 Achtung: Unter den 49 Merkmalsträgern kommen manche xj-Werte mehrmals vor!

21 yj Entsprechend für das 2. Merkmal: 85 85 - 85,78 = -0,78
( ,78)2 = 0,782 = 0,61 86 ,78 = 0,22 ( ,78)2 = 0,222 = 0,048 87 87 – 85,78 = 1,22 (87 – 85,78)2 = 1,222 = 1,49 Achtung: Die 3 Ausprägungen treten sämtlich mehrmals für die Gruppe unserer 49 Merkmalsträger auf!

22 Daraus Berechnung des Korrelationskoeffizienten für unsere Stichprobe:
laufende Nummer Geburts- monat Geburts- jahr 1 März 1985 2 Januar 1986 3 49 Oktober . . .  Interpretation: Es gilt für unsere Stichprobe r= 0,396925 Also besteht - gemäß unserer Stichprobe - nur ein niedriger Zusammenhang zwischen den beiden Merkmalen.

23 r = 0 kein (linearer ) Zusammenhang
0 < ,4 niedriger Zusammenhang 0,4 < ,7 mittlerer Zusammenhang 0,7 < < 1 starker Zusammenhang = 1 linearer Zusammenhang

24 Eigenschaften: Der Korrelationskoeffizient stellt ein Maß für die Abweichung des Zusammenhangs der beiden Merkmale vom strikt linearen Zusammenhang dar: r nimmt nur Werte zwischen -1 und +1 (jeweils einschließlilch) an. r=-1 oder r=+1 bedeutet, dass die beiden Merkmale linear voneinander abhängen. r nahe bei -1 oder nahe bei +1 bedeutet annähernd linearen Zusammenhang. Wenn beide Merkmale sich im gleichen Sinn verändern, ist r positiv. Wenn beide Merkmale sich im entgegengesetzten Sinn verändern, ist r negativ. Achtung: r = 0 bedeutet nicht, dass gar kein Zusammenhang zwischen den beiden Merkmalen besteht! Wir können ihn nur nicht mit unserer Datenmenge nachweisen!

25

26 Darstellung der Merkmalsausprägungskombinationen
Darstellung der Merkmalsausprägungskombinationen (Geburtsmonat, Geburtsjahr) für jedes Mitglied unsere Gruppe in einem Punktediagramm  Versuch, eine „möglichst gut passende“ Gerade durch die Wolke zu legen: Also: Niedriger Zusammenhang! Die Geraden „passen nicht richtig“: viele Punkte liegen ober- und unterhalb.

27 Wichtige Grundbegriffe der Mengentheorie
Die Sprache der Mathematik ist wie ein Code. Auf diese Weise kann man mathematische Gedanken sehr kurz fassen. Aus: K. Dahl, S. Nordquist: Zahlen, Spiralen und magische Quadrate

28 Menge: Familie von Objekten,. Zusammenstellung bestimmter Objekte,
Menge: Familie von Objekten, Zusammenstellung bestimmter Objekte, Familie von Objekten, die eine bestimmte gemeinsame Eigenschaft haben  Menge der Merkmalsträger = Grundgesamtheit  Menge aller Studierenden, die jetzt in diesem Hörsaal sind Teilmenge  Menge der Merkmalsträger, die für eine bestimmter Stichprobe herangezogen werden Element einer Menge: jedes einzelne Objekt der Menge  jeder einzelne Merkmalsträger Das Element x ist enthalten in der Teilmenge A der Menge G.

29 A B Vereinigungsmenge, Vereinigung von zwei Mengen:
Menge aller Objekte, die zu A oder zu B gehören A B Die Elemente aus der Vereinigungsmenge von A und B gehören jeweils zu mindestens einer der beiden Mengen A oder B. Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A B: Menge aller Studierenden im Hörsaal, die weiblich sind oder im Jahr 1985 geboren wurden

30 A B Durchschnittsmenge, Durchschnitt von zwei Mengen:
Menge aller Objekte, die zu A und zu B gehören A B Die Elemente aus der Durchschnittsmenge von A und B gehören sowohl zu der beiden Menge A als auch zu der Menge B. Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A B: Menge aller Studierenden im Hörsaal, die sowohl weiblich sind als auch im Jahr 1985 geboren wurden

31 Differenzmengemenge, Differenz A - B:
Menge aller Objekte, die zu A, aber nicht gleichzeitig auch zu B gehören Rein gelber Bereich: A-B Rein grüner Bereich: B-A Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A-B: Menge aller Studierenden im Hörsaal, die weiblich sind, aber nicht im Jahr 1985 geboren wurden B-A: Menge aller Studierenden im Hörsaal, die im Jahr 1985 geboren wurden, aber nicht weiblich (also männlich) sind.

32 Zum kommenden Montag zu lösende Übungsaufgaben:. Aufgabe Nr
Zum kommenden Montag zu lösende Übungsaufgaben: Aufgabe Nr. 13 und Aufgabe Nr. 16 aus dem Skript

33 Wichtige Begriffe aus der heutigen Vorlesung:
Arithmetisches Mittel (= „Durchschnittswert“ = erwarteter Wert einer Stichprobe) Standardabweichung vom erwarteten Wert einer Stichprobe Zwei Merkmale für ein und dieselbe Klasse von Merkmalsträgern Korrelationskoeffizient: Stärke (Ausmaß) des Zusammenhangs zwischen zwei Merkmalen Mengentheoretische Grundbegriffe: Menge, Element, Teilmenge, Vereinigung, Durchschnitt, Differenz


Herunterladen ppt "Vorlesung 23.10.2006: Erste Auswertungen von erfassten Daten: absolute und relative Häufigkeiten; Lage- und Streuungsmaße Vorlesung 30.10.2006:"

Ähnliche Präsentationen


Google-Anzeigen