Grundbegriffe M. Kresken.

Slides:



Advertisements
Ähnliche Präsentationen
GrafStat Ausgabe 2009 Ein kurzer Überblick.
Advertisements

Quanti Tutorium
Deskriptive Statistik und Explorative Datenanalyse
CATI-Übung 6. Begleitveranstaltung WS 09/10
Auswertung der Befragung
Definition der Statistik
Lagemaße kritische Fragen
Merkmale Beispiele Anwendung Träger Autos Menschen Völker Jahre
Messen „Messen ist die Bestimmung der Ausprägung einer
Ein Modellansatz zur Beschreibung von Vagheiten
Numerik partieller Differentialgleichungen
Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.
Law of comparative judgement
Forschungsstatistik I
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
2. Univariate Regressionsanalyse 2.1 Das statische Regressionsmodell
Forschungsmethoden und Diagnostik
Statistiktutorat Sitzung 1: Grundbegriffe der Statistik
Statistiktutorat Thema 1: Grundbegriffe der Statistik
Deskriptive Statistik und Wahrscheinlichkeitstheorie
Was sind Histogramme? (1)
Univariate Statistik M. Kresken.
Grundbegriffe M. Kresken.
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Stetige Zufallsgrößen
Wiederholung und Beispiele
Wahrscheinlichkeitsrechnung
Statistisches Basiswissen
STATISIK LV Nr.: 1375 SS März 2005.
Fuzzymengen – Was ist das?
VORLESUNGSSTRUKTUR: ST. U. WT
Theoriereferat Indexes, Scales and Typologies The Logic of Sampling
Kapitel 10 Multikollinearität
Referat über das Thema STOCHASTIK.
Die ersten Schritte bei der Entdeckung der Statistik
Data Mining Georg Pölzlbauer.
Messen Zuordnung von Zahlen zu Objekten/Ereignissen gemäß Regeln
Merkmale und Merkmalstrukturen
Mathematik für BiologInnen WS 05
Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.
Skalenniveaus Tamara Katschnig.
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Preisfindung Rabattgruppen
Temperatur und Teilchenbewegung
Statistik I Statistik I Statistische Grundbegriffe
1. 2 Das Grundproblem der Beurteilenden Statistik ● Wir haben uns bisher mit Problemen der Wahrscheinlichkeitsrechnung beschäftigt: – Die Wahrscheinlichkeit.
Übersetzung: / Tradotto da:
Das ABC der Statistik DIE SÄULENDIAGRAMME
Die ersten Schritte bei der Entdeckung der Statistik
Ergebnisse der Bedarfsermittlung zur Einrichtung von Ganztaggrundsschulen in der Gemeinde Kirchlinteln Oktober 2016.
GrafStat Ausgabe 2009 Ein kurzer Überblick.
Deskriptive Statistik -
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Mathematik.
Deskriptive Statistik -
Prof. Dr. Uta Pohl-Patalong
Ökonometrie und Statistik Wiederholung
Ökonometrie und Statistik Unabhängigkeitstest, c² - Test (Chi Quadrat Test) Dr. Bertram Wassermann.
3 Gesamtbeschreibung empirischer Verteilungen.
Ökonometrie und Statistik Wiederholung
Deskriptive Statistik -
Ökonometrie und Statistik Unabhängigkeitstest, c² - Test (Chi Quadrat Test) Dr. Bertram Wassermann.
2. Die rekursive Datenstruktur Baum 2.1 Von der Liste zum Baum
Ökonometrie und Statistik Wiederholung
Korrelation & Skalentransformation
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Ökonometrie und Statistik Wiederholung
 Präsentation transkript:

Grundbegriffe M. Kresken

Grundgesamtheit / Stichprobe Die Grundgesamtheit ist die Menge aller statistischen Einheiten (auch Merkmalsträger, Erhebungseinheit, Beobachtungseinheit) mit übereinstimmenden Identifikationskriterien (sachlich, zeitlich und örtlich). Die statistische Einheit ist Träger der Informationen für die statistische Untersuchung. Statistische Einheiten können natürliche Einheiten (Personen, Tiere, Pflanzen, Werkstücke), aber auch künstliche Einheiten, zum Beispiel sozio-ökonomische Einheiten (Familien, Haushalte, Unternehmen), sein. M. Kresken

Beispiel Kundenumfrage Grundgesamtheit Umfragen werden mit dem Ziel durchgeführt, neue Erkenntnisse über bestimmte Personen (z.B. Kunden, Mitarbeiter) zu erhalten bzw. gültige Aussagen über diese Personen treffen zu können. Die Grundgesamtheit ist dabei die Menge der Personen, für die die Aussagen einer Untersuchung gelten sollen, z.B „alle Mitarbeiter des Unternehmens X“ oder „alle Kunden im Alter von 18 bis 49 Jahren“. M. Kresken

Grundgesamtheit / Stichprobe Als Stichprobe bezeichnet man eine Teilmenge einer Grundgesamtheit, die unter bestimmten Gesichtspunkten ausgewählt wurde. Mit Stichproben wird in Anwendungen der Statistik (etwa in der Marktforschung, aber auch in der Qualitätskontrolle und in der naturwissenschaftlichen, medizinischen und psychologischen Forschung) häufig gearbeitet, da es oft nicht möglich ist, die Grundgesamtheit, etwa die Gesamtbevölkerung oder alle hergestellten Exemplare eines Produkts, zu untersuchen. Grundgedanke der Zuhilfenahme von Stichproben ist das Induktionsprinzip, bei dem von besonderen auf allgemeine Fälle geschlossen wird. M. Kresken

Beispiel Kundenumfrage Stichprobe Es wird nur ein Teil der „Mitarbeiter des Unternehmens X“ oder der „Kunden im Alter von 18 bis 49 Jahren befragt“. M. Kresken

Grundgesamtheit / Stichprobe Die Auswahl bzw. Zusammensetzung der Stichprobe kann auf verschiedene Arten erfolgen. Am gängigsten ist die so genannte Zufallsauswahl. Es ist wichtig, die Grundgesamtheit genau fest zu legen, um die Stichprobe nachvollziehbar auszuwählen und exakt angeben zu können, für wen die Untersuchungsergebnisse Gültigkeit beanspruchen. Auf der Basis der Daten der Stichprobe kann man dann Rückschlüsse auf die Grundgesamtheit ziehen. M. Kresken

Grundgesamtheit / Stichprobe Damit der Schluss von einer Stickprobe auf die Grundgesamtheit zulässig ist, müssen zwei Bedingungen erfüllt sein: Die Stichprobe muss groß genug sein. Die Untergrenze liegt bei 30 Personen, besser sind 100 Personen. Die Stichprobe muss „repräsentativ“ sein. Die Stichprobe soll die Zusammensetzung der Grundgesamtheit widerspiegeln, also z.B. ebenso viele Frauen oder Personen mit Hochschulbildung usw. enthalten wie die Grundgesamtheit, der sie entstammt. Dies ist per Definition bei einer Zufallsauswahl der Fall. M. Kresken

Arten von Merkmalen 1. Qualitativ versus quantitativ: qualitativ heißen diejenigen Merkmale, deren Ausprägungen unterschiedliche Arten darstellen (z.B. Farbe mit den Ausprägungen: blau, rot, grün, gelb; Familienstand) quantitativ heißen diejenigen Merkmale, die von vorneherein Zahlen als Ausprägungen haben (z.B. Alter, Kinderzahl, Entfernungen in KM, Umsatz in €, Blutdruck in mmHg) M. Kresken

Arten von Merkmalen 2. Diskret versus stetig: diskrete Merkmale können nur abzählbar viele Werte annehmen (z.B. Anzahl, Geschlecht) stetige Merkmale können jeden Wert eines Kontinuums annehmen (z.B. Gewicht: 63,786… kg, Länge: 4.387,35… cm) In der Praxis werden die Werte eines stetigen Merkmals oft in Klassen zusammengefasst und damit „diskreditiert“. M. Kresken

Skalenniveau Jeder Merkmalsausprägung kann eine Zahl als Code zugeordnet werden. Das Skalenniveau hängt davon ab, wie die Zuordnung der Zahl zur Merkmalsausprägung erfolgt. Man unterscheidet: Nominalskala Ordinalskala Intervallskala Verhältnisskala Absolutskala metrische Skalen M. Kresken

Nominalskala Ein Merkmal heißt nominal, wenn seine möglichen Ausprägungen zwar unterschieden, aber nicht in einer Rangfolge gebracht werden können. Verschiedenen Merkmalsausprägungen werden verschiedene Zahlenwerte zugeordnet, z.B. 1 = blau, 2 = rot. Die einzig zulässige Schlussfolgerung aus einer Nominalskala lautet: Gleiche Zahlen bedeuten gleiche Merkmalsausprägungen Unterschiedliche Zahlen bedeuten unterschiedliche Merkmalsausprägungen M. Kresken

Ordinalskala Ein Merkmal heißt ordinal, wenn jede Merkmalsausprägung der Untersuchungseinheit genau einer Kategorie zugeordnet wird. Die Kategorien lassen sich in eine Rangfolge bringen und mit Namen oder Zahlen bezeichnen. Die verschiedenen Merkmalsausprägungen stehen zueinander in einer „größer bzw. kleiner“ – Beziehung, d.h. die Zahlen drücken nicht nur die Verschiedenheit, sondern auch die zugrunde liegende Ordnung aus, z.B. 1 = sehr schwach, 2 = schwach, 3 = mittel, 4 = stark, 5 = sehr stark. M. Kresken

Ordinalskala Eine zulässige Aussage ist, dass die Rangfolge der Zahlen gleich der Rangfolge der Stärke der Merkmalsausprägungen ist: Jemand mit einem höheren Rang hat auch eine höhere Merkmalsausprägung als jemand mit einem niedrigeren Rang. Über die absolute Stärke der Merkmalsausprägung oder die Größe des Merkmalunterschiedes zwischen Objekten lässt sich aber keine Aussage machen. M. Kresken

Beispiele Ordinalskala Merkmal Kategorien Dekubitusrisiko geringes bis hohes Risiko nach der Norton-Skala Zufriedenheit mit einem Produkt sehr zufrieden > eher zufrieden > eher unzufrieden > sehr unzufrieden Selbsteinstufung des Einkommens1 hoch > mittel > niedrig Schulische Leistung sehr gut > gut > befriedigend > ausreichend > mangelhaft > ungenügend 1 wenn das Einkommen in Klassen eingeteilt wird (z. B. 0 – 999 €, 1.000 – 2.000 €, > 2.000 €) M. Kresken

Intervallskala Ein intervallskaliertes Merkmal ist ein Merkmal, dessen Ausprägung sich quantitativ mittels Zahlen darstellen lässt. Rangunterschiede und Abstände zwischen Werten können gemessen werden, d.h. quantitative Merkmale gehen in ihren Anforderungen über ordinale und nominale Eigenschaften hinaus. Bei den intervallskalierten Merkmalen lassen sich zu den Eigenschaften der Ordinalskala die Abstände zwischen den verschiedenen Merkmalsausprägungen exakt bestimmen. M. Kresken

Intervallskala Die Intervalle (=Abstände) zwischen benachbarten Merkmalsausprägungen sind gleich groß, allerdings existiert kein natürlicher Nullpunkt für die Skala. Willkürlich definierte Nullpunkte - wie bei der Celsius-Temperaturskala - zählen hier nicht als natürlicher Nullpunkt, während der Nullpunkt der Kelvin- Temperaturskala (absoluter Nullpunkt) ein natürlicher Nullpunkt ist. Jede Intervallskala ist so geartet, dass die Rangfolge der Differenz zwischen Zahlen gleich der Rangfolge der Merkmalsunterschiede zwischen den entsprechenden Objekten ist. M. Kresken

Beispiele Intervallskala Temperatur auf der Celsius-Skala Jahreszahlen Zeitpunkte IQ-Skala M. Kresken

IQ Skala Beispiel für eine IQ-Skala (es existiert bisher keine Norm) Prozentanteil in der Bevölkerung IQ   unter    20 schwerste Intelligenzminderung IQ   unter    62 extrem niedrige Intelligenz 2,2 % IQ   63 bis   78 sehr niedrige Intelligenz 6,7 % IQ   79 bis   90 niedrige (schwache) Intelligenz 16,1 % IQ   91 bis 109 durchschnittliche Intelligenz, normal begabt 50,0 % IQ 110 bis 117 hohe Intelligenz (Voraussetzung für einen Gymnasialbesuch) IQ 118 bis 126 sehr hohe Intelligenz (Voraussetzung für ein Studium) IQ ab 127 extrem hohe Intelligenz 2,2 % IQ 130 Genieschwelle IQ um 140 Weniger als 0,5 % der Bevölkerung haben einen höheren IQ als 140 IQ ab 155 genial (Bevölkerungsanteil unter 0,1 %) M. Kresken

Verhältnisskala Auf einer Verhältnisskala / Rationalskala werden Merkmalsausprägungen eingetragen, für die folgendes gilt: Merkmalsausprägungen werden als Zahl dargestellt für die Zahlenwerte existiert ein natürlicher Nullpunkt und die Maßeinheit ist willkürlich definiert M. Kresken

Beispiele Verhältnisskala Merkmal Nullpunkt Temperatur in Kelvin Absoluter Nullpunkt Zeitdauer in Sekunden keine Zeit* Gewicht in Kilogramm kein Gewicht Preis in € Kostenlos Geschwindigkeit in Kilometer pro Stunde keine Geschwindigkeit, Stillstand Prozentzahlen 0 bis 100 0 Prozent Entfernung keine Entfernung *Der absolute Nullpunkt ist der Urknall. M. Kresken

Univariate Statistik M. Kresken

Univariate Statistik Unter dem Begriff versteht man die isolierte Betrachtung einzelner Merkmale bzw. Variablen von Untersuchungseinheiten (z.B. Personen). M. Kresken

Beispiel Verteilung - Urliste M. Kresken

Häufigkeiten / Verteilungen Liegen n Beobachtungen für ein Merkmal vor, so nennt man die Anzahl k der Beobachtungen, die die gleiche Ausprägung x aufweisen, die absolute Häufigkeit dieser Merkmalsausprägung. M. Kresken

Beispiel Verteilung – sortierte Liste M. Kresken

Beispiel Verteilung – sortierte Liste Alter Anzahl 21 4 22 2 23 1 25 27 28 M. Kresken

Häufigkeiten / Verteilungen Der Quotient heißt relative Häufigkeit für die Merkmalsausprägung x. Die relative Häufigkeit liegt immer zwischen 0 und 1. Gebräuchlich ist die Angabe der relativen Häufigkeit in Prozent. = k n Zahl der Beobachtungen mit der Ausprägung x Gesamtzahl der Beobachtungen M. Kresken

Häufigkeiten / Verteilungen In praktischen Situationen ergibt sich bei der Erhebung der Gesamtzahl der Beobachtungen dann ein Problem, wenn die Angaben zur Merkmalsausprägung für eine oder mehrere Beobachtungseinheiten fehlen oder ungültig sind. In solchen Fällen ist der Bezug auf die „validen“ Beobachtungen zu empfehlen. Dabei sollte jedoch auf eine explizite Auszählung bzw. Erwähnung der ungültigen oder fehlenden Messergebnisse nicht verzichtet werden, da diese ggf. als informativ anzusehen sind. M. Kresken

Univariate Statistik Urliste anlegen M. Kresken