Grundbegriffe M. Kresken.

Slides:



Advertisements
Ähnliche Präsentationen
Quanti Tutorium
Advertisements

Beispiel: Grundbegriffe Statistik/Stochastik
Deskriptive Statistik und Explorative Datenanalyse
CATI-Übung 6. Begleitveranstaltung WS 09/10
1. 2 Untersuchungsdesign Zielgruppe:Bevölkerung ab 14 Jahre Befragungsgebiet:Land Brandenburg Stichprobe:Soll:3.000 Befragte Ist:3.052 Befragte Auswahl:telefonische.
Polynomial Root Isolation
Algebraische Zahlen: Exaktes Rechnen mit Wurzeln
Was ist Testtheorie?.
Definition der Statistik
Merkmale Beispiele Anwendung Träger Autos Menschen Völker Jahre
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Messen „Messen ist die Bestimmung der Ausprägung einer
Ein Modellansatz zur Beschreibung von Vagheiten
Java: Objektorientierte Programmierung
Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.
Gliederung Vertrauensintervalle Arten von Hypothesen
Forschungsstatistik I
Algorithmentheorie 04 –Hashing
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Kapitel 5 Stetigkeit.
Kapitel 1 Das Schubfachprinzip
Kapitel 6 Differenzierbarkeit. Kapitel 6: Differenzierbarkeit © Beutelspacher Juni 2005 Seite 2 Inhalt 6.1 Die Definition 6.2 Die Eigenschaften 6.3 Extremwerte.
Mittelwert, Median, Quantil
Wir suchen ‘ mit m = m    ‘ c  ‘ mod 26
1. Warum ist „Kartenkunde“ für die Feuerwehr wichtig ?
Statistiktutorat Sitzung 1: Grundbegriffe der Statistik
Statistiktutorat Thema 1: Grundbegriffe der Statistik
Deskriptive Statistik und Wahrscheinlichkeitstheorie
Statistische Methoden I WS 2004/2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.
Statistische Methoden I WS 2002/2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.
Univariate Statistik M. Kresken.
Das wars!.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Stetige Zufallsgrößen
Wiederholung und Beispiele
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Wahrscheinlichkeitsrechnung
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Histogramm/empirische Verteilung Verteilungen
Internetverwendung und Werbeaffinität APA-IT Forum 7. Mai 2008
Statistisches Basiswissen
Bewohnerumfrage 2009 durchgeführt vom
Aufgabenzettel V Statistik I
STATISIK LV Nr.: 1375 SS März 2005.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Fuzzymengen – Was ist das?
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
Theorie der Stichprobe
Erheben von Daten kategoriale Merkmale
Wahrscheinlichkeitsrechnung
Referat über das Thema STOCHASTIK.
Resultate Umfrage Partizipation Arbeitsgruppe DeLL Befragt wurden im Dezember 2010 alle 3., 4. und 5. Klassen Es wurde differenziert nach Ebenen: Schule,
1 Stichprobenverfahren zur Qualitätssicherung Hilfestellung der Statistik in der Wirtschaftsprüfung.
Einführung in die psychologische MethodenlehreFolie Nr. 1 Merkmale und ihre Erhebung Quantitative Merkmale z.B. Körpergröße sind messbar Qualitative.
Das ABC der Statistik DIE SÄULENDIAGRAMME 1
Die ersten Schritte bei der Entdeckung der Statistik
Reelle Zahlen Grundrechenarten √2, √3, √5, … V 0.1.
Erheben, berechnen und darstellen von Daten
Messen Zuordnung von Zahlen zu Objekten/Ereignissen gemäß Regeln
Mathematik für BiologInnen WS 05
Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.
Skalenniveaus Tamara Katschnig.
Statistik I Statistik I Statistische Grundbegriffe
Grundbegriffe M. Kresken.
Ökonometrie und Statistik Wiederholung
Ökonometrie und Statistik Wiederholung
Korrelation & Skalentransformation
 Präsentation transkript:

Grundbegriffe M. Kresken

Grundgesamtheit / Stichprobe Die Grundgesamtheit ist die Menge aller statistischen Einheiten (auch Merkmalsträger, Erhebungseinheit, Beobachtungseinheit) mit übereinstimmenden Identifikationskriterien (sachlich, zeitlich und örtlich). Die statistische Einheit ist Träger der Informationen für die statistische Untersuchung. Statistische Einheiten können natürliche Einheiten (Personen, Tiere, Pflanzen, Werkstücke), aber auch künstliche Einheiten, zum Beispiel sozio-ökonomische Einheiten (Familien, Haushalte, Unternehmen), sein. M. Kresken

Beispiel Kundenumfrage Grundgesamtheit Umfragen werden mit dem Ziel durchgeführt, neue Erkenntnisse über bestimmte Personen (z.B. Kunden, Mitarbeiter) zu erhalten bzw. gültige Aussagen über diese Personen treffen zu können. Die Grundgesamtheit ist dabei die Menge der Personen, für die die Aussagen einer Untersuchung gelten sollen, z.B „alle Mitarbeiter des Unternehmens X“ oder „alle Kunden im Alter von 18 bis 49 Jahren“. M. Kresken

Grundgesamtheit / Stichprobe Als Stichprobe bezeichnet man eine Teilmenge einer Grundgesamtheit, die unter bestimmten Gesichtspunkten ausgewählt wurde. Mit Stichproben wird in Anwendungen der Statistik (etwa in der Marktforschung, aber auch in der Qualitätskontrolle und in der naturwissenschaftlichen, medizinischen und psychologischen Forschung) häufig gearbeitet, da es oft nicht möglich ist, die Grundgesamtheit, etwa die Gesamtbevölkerung oder alle hergestellten Exemplare eines Produkts, zu untersuchen. Grundgedanke der Zuhilfenahme von Stichproben ist das Induktionsprinzip, bei dem von besonderen auf allgemeine Fälle geschlossen wird. M. Kresken

Beispiel Kundenumfrage Stichprobe Es wird nur ein Teil der „Mitarbeiter des Unternehmens X“ oder der „Kunden im Alter von 18 bis 49 Jahren befragt“. M. Kresken

Grundgesamtheit / Stichprobe Die Auswahl bzw. Zusammensetzung der Stichprobe kann auf verschiedene Arten erfolgen. Am gängigsten ist die so genannte Zufallsauswahl. Es ist wichtig, die Grundgesamtheit genau fest zu legen, um die Stichprobe nachvollziehbar auszuwählen und exakt angeben zu können, für wen die Untersuchungsergebnisse Gültigkeit beanspruchen. Auf der Basis der Daten der Stichprobe kann man dann Rückschlüsse auf die Grundgesamtheit ziehen. M. Kresken

Grundgesamtheit / Stichprobe Damit der Schluss von einer Stickprobe auf die Grundgesamtheit zulässig ist, müssen zwei Bedingungen erfüllt sein: Die Stichprobe muss groß genug sein. Die Untergrenze liegt bei 30 Personen, besser sind 100 Personen. Die Stichprobe muss „repräsentativ“ sein. Die Stichprobe soll die Zusammensetzung der Grundgesamtheit widerspiegeln, also z.B. ebenso viele Frauen oder Personen mit Hochschulbildung usw. enthalten wie die Grundgesamtheit, der sie entstammt. Dies ist per Definition bei einer Zufallsauswahl der Fall. M. Kresken

Arten von Merkmalen 1. Qualitativ versus quantitativ: qualitativ heißen diejenigen Merkmale, deren Ausprägungen unterschiedliche Arten darstellen (z.B. Farbe mit den Ausprägungen: blau, rot, grün, gelb; Familienstand) quantitativ heißen diejenigen Merkmale, die von vorneherein Zahlen als Ausprägungen haben (z.B. Alter, Kinderzahl, Entfernungen in KM, Umsatz in €, Blutdruck in mmHg) M. Kresken

Arten von Merkmalen 2. Diskret versus stetig: diskrete Merkmale können nur abzählbar viele Werte annehmen (z.B. Anzahl, Geschlecht) stetige Merkmale können jeden Wert eines Kontinuums annehmen (z.B. Gewicht: 63,786… kg, Länge: 4.387,35… cm) In der Praxis werden die Werte eines stetigen Merkmals oft in Klassen zusammengefasst und damit „diskreditiert“. M. Kresken

Skalenniveau Jeder Merkmalsausprägung kann eine Zahl als Code zugeordnet werden. Das Skalenniveau hängt davon ab, wie die Zuordnung der Zahl zur Merkmalsausprägung erfolgt. Man unterscheidet: Nominalskala Ordinalskala Intervallskala Verhältnisskala Absolutskala metrische Skalen M. Kresken

Nominalskala Ein Merkmal heißt nominal, wenn seine möglichen Ausprägungen zwar unterschieden, aber nicht in einer Rangfolge gebracht werden können. Verschiedenen Merkmalsausprägungen werden verschiedene Zahlenwerte zugeordnet, z.B. 1 = blau, 2 = rot. Die einzig zulässige Schlussfolgerung aus einer Nominalskala lautet: Gleiche Zahlen bedeuten gleiche Merkmalsausprägungen Unterschiedliche Zahlen bedeuten unterschiedliche Merkmalsausprägungen M. Kresken

Ordinalskala Ein Merkmal heißt ordinal, wenn jede Merkmalsausprägung der Untersuchungseinheit genau einer Kategorie zugeordnet wird. Die Kategorien lassen sich in eine Rangfolge bringen und mit Namen oder Zahlen bezeichnen. Die verschiedenen Merkmalsausprägungen stehen zueinander in einer „größer bzw. kleiner“ – Beziehung, d.h. die Zahlen drücken nicht nur die Verschiedenheit, sondern auch die zugrunde liegende Ordnung aus, z.B. 1 = sehr schwach, 2 = schwach, 3 = mittel, 4 = stark, 5 = sehr stark. M. Kresken

Ordinalskala Eine zulässige Aussage ist, dass die Rangfolge der Zahlen gleich der Rangfolge der Stärke der Merkmalsausprägungen ist: Jemand mit einem höheren Rang hat auch eine höhere Merkmalsausprägung als jemand mit einem niedrigeren Rang. Über die absolute Stärke der Merkmalsausprägung oder die Größe des Merkmalunterschiedes zwischen Objekten lässt sich aber keine Aussage machen. M. Kresken

Beispiele Ordinalskala Merkmal Kategorien Dekubitusrisiko geringes bis hohes Risiko nach der Norton-Skala Zufriedenheit mit einem Produkt sehr zufrieden > eher zufrieden > eher unzufrieden > sehr unzufrieden Selbsteinstufung des Einkommens1 hoch > mittel > niedrig Schulische Leistung sehr gut > gut > befriedigend > ausreichend > mangelhaft > ungenügend 1 wenn das Einkommen in Klassen eingeteilt wird (z. B. 0 – 999 €, 1.000 – 2.000 €, > 2.000 €) M. Kresken

Intervallskala Ein intervallskaliertes Merkmal ist ein Merkmal, dessen Ausprägung sich quantitativ mittels Zahlen darstellen lässt. Rangunterschiede und Abstände zwischen Werten können gemessen werden, d.h. quantitative Merkmale gehen in ihren Anforderungen über ordinale und nominale Eigenschaften hinaus. Bei den intervallskalierten Merkmalen lassen sich zu den Eigenschaften der Ordinalskala die Abstände zwischen den verschiedenen Merkmalsausprägungen exakt bestimmen. M. Kresken

Intervallskala Die Intervalle (=Abstände) zwischen benachbarten Merkmalsausprägungen sind gleich groß, allerdings existiert kein natürlicher Nullpunkt für die Skala. Willkürlich definierte Nullpunkte - wie bei der Celsius-Temperaturskala - zählen hier nicht als natürlicher Nullpunkt, während der Nullpunkt der Kelvin- Temperaturskala (absoluter Nullpunkt) ein natürlicher Nullpunkt ist. Jede Intervallskala ist so geartet, dass die Rangfolge der Differenz zwischen Zahlen gleich der Rangfolge der Merkmalsunterschiede zwischen den entsprechenden Objekten ist. M. Kresken

Beispiele Intervallskala Temperatur auf der Celsius-Skala Jahreszahlen Zeitpunkte IQ-Skala M. Kresken

IQ Skala Beispiel für eine IQ-Skala (es existiert bisher keine Norm) Prozentanteil in der Bevölkerung IQ   unter    20 schwerste Intelligenzminderung IQ   unter    62 extrem niedrige Intelligenz 2,2 % IQ   63 bis   78 sehr niedrige Intelligenz 6,7 % IQ   79 bis   90 niedrige (schwache) Intelligenz 16,1 % IQ   91 bis 109 durchschnittliche Intelligenz, normal begabt 50,0 % IQ 110 bis 117 hohe Intelligenz (Voraussetzung für einen Gymnasialbesuch) IQ 118 bis 126 sehr hohe Intelligenz (Voraussetzung für ein Studium) IQ ab 127 extrem hohe Intelligenz 2,2 % IQ 130 Genieschwelle IQ um 140 Weniger als 0,5 % der Bevölkerung haben einen höheren IQ als 140 IQ ab 155 genial (Bevölkerungsanteil unter 0,1 %) M. Kresken

Verhältnisskala Auf einer Verhältnisskala / Rationalskala werden Merkmalsausprägungen eingetragen, für die folgendes gilt: Merkmalsausprägungen werden als Zahl dargestellt für die Zahlenwerte existiert ein natürlicher Nullpunkt und die Maßeinheit ist willkürlich definiert M. Kresken

Beispiele Verhältnisskala Merkmal Nullpunkt Temperatur in Kelvin Absoluter Nullpunkt Zeitdauer in Sekunden keine Zeit* Gewicht in Kilogramm kein Gewicht Preis in € Kostenlos Geschwindigkeit in Kilometer pro Stunde keine Geschwindigkeit, Stillstand Prozentzahlen 0 bis 100 0 Prozent Entfernung keine Entfernung *Der absolute Nullpunkt ist der Urknall. M. Kresken

Univariate Statistik M. Kresken

Univariate Statistik Unter dem Begriff versteht man die isolierte Betrachtung einzelner Merkmale bzw. Variablen von Untersuchungseinheiten (z.B. Personen). M. Kresken

Beispiel Verteilung - Urliste M. Kresken

Häufigkeiten / Verteilungen Liegen n Beobachtungen für ein Merkmal vor, so nennt man die Anzahl k der Beobachtungen, die die gleiche Ausprägung x aufweisen, die absolute Häufigkeit dieser Merkmalsausprägung. M. Kresken

Beispiel Verteilung – sortierte Liste M. Kresken

Beispiel Verteilung – sortierte Liste Alter Anzahl 21 4 22 2 23 1 25 27 28 M. Kresken

Häufigkeiten / Verteilungen Der Quotient heißt relative Häufigkeit für die Merkmalsausprägung x. Die relative Häufigkeit liegt immer zwischen 0 und 1. Gebräuchlich ist die Angabe der relativen Häufigkeit in Prozent. = k n Zahl der Beobachtungen mit der Ausprägung x Gesamtzahl der Beobachtungen M. Kresken

Häufigkeiten / Verteilungen In praktischen Situationen ergibt sich bei der Erhebung der Gesamtzahl der Beobachtungen dann ein Problem, wenn die Angaben zur Merkmalsausprägung für eine oder mehrere Beobachtungseinheiten fehlen oder ungültig sind. In solchen Fällen ist der Bezug auf die „validen“ Beobachtungen zu empfehlen. Dabei sollte jedoch auf eine explizite Auszählung bzw. Erwähnung der ungültigen oder fehlenden Messergebnisse nicht verzichtet werden, da diese ggf. als informativ anzusehen sind. M. Kresken

Univariate Statistik Urliste anlegen M. Kresken