STATISIK LV Nr.: 1852 WS 2005/06 29.November 2005.

Slides:



Advertisements
Ähnliche Präsentationen
Quanti Tutorium
Advertisements

Beispiel: Grundbegriffe Statistik/Stochastik
Deskriptive Statistik und Explorative Datenanalyse
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Was ist Testtheorie?.
Definition der Statistik
Klassen (Zweck) Wozu legt man Klassen an? Überblick
Lagemaße kritische Fragen
Merkmale Beispiele Anwendung Träger Autos Menschen Völker Jahre
Bewegungswissenschaft
Untersuchungsarten im quantitativen Paradigma
Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Forschungsstatistik I
Der Binomialtest Man habe einen wahren Anteil P.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Quantitative Methoden I
Diskurs Fragebögen Auswertung.
Statistiktutorat Sitzung 1: Grundbegriffe der Statistik
Statistiktutorat Thema 1: Grundbegriffe der Statistik
Deskriptive Statistik und Wahrscheinlichkeitstheorie
Statistische Methoden I WS 2004/2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.
Statistische Methoden I WS 2002/2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.
Univariate Statistik M. Kresken.
Grundbegriffe M. Kresken.
Das wars!.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: Biometrie für Studierende der Veterinärmedizin Helmut Küchenhoff 1 Zusammenfassung zur Vorlesung Begriff der biologischen Variabilität.
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Stetige Zufallsgrößen
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Bild 1.1 Copyright © Alfred Mertins | Signaltheorie, 2. Auflage Vieweg+Teubner PLUS Zusatzmaterialien Vieweg+Teubner Verlag | Wiesbaden.
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Histogramm/empirische Verteilung Verteilungen
Grundlagen und Probleme quantitativer Studien
Statistisches Basiswissen
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 1375 SS März 2005.
VORLESUNGSSTRUKTUR: ST. U. WT
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
Die Struktur von Untersuchungen
Phasen einer empirischen Untersuchung
STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.
Was soll und kann eine fachdidaktische Vorlesung leisten? Maximilian Selinka.
Erheben von Daten kategoriale Merkmale
PI Statistik Peter Hackl Sprechstunde: Fr, 10:45-11:45 Tel.: Di, Do, 9:00-11:30.
Referat über das Thema STOCHASTIK.
Einführung in die psychologische MethodenlehreFolie Nr. 1 Merkmale und ihre Erhebung Quantitative Merkmale z.B. Körpergröße sind messbar Qualitative.
Managemententscheidungsunterstützungssysteme (Ausgewählte Methoden und Fallstudien) ( Die Thesen zur Vorlesung 3) Thema der Vorlesung Lösung der linearen.
Die ersten Schritte bei der Entdeckung der Statistik
STATISIK LV Nr.: 1852 WS 2005/06 6. Dezember 2005.
Statistik Peter Hackl Sprechstunde: Fr, 10:45-11:45 Tel.:
Analyseprodukte numerischer Modelle
Studentisches Seminar
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Testgütekriterien Tamara Katschnig.
Erheben, berechnen und darstellen von Daten
Empirische Sozialforschung am Beispiel der Limburger Nordstadt
Gegenstand der Psychologie
Messen Zuordnung von Zahlen zu Objekten/Ereignissen gemäß Regeln
Mathematik für BiologInnen WS 05
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Statistik I Statistik I Statistische Grundbegriffe
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Ökonometrie und Statistik Wiederholung
Korrelation & Skalentransformation
 Präsentation transkript:

STATISIK LV Nr.: 1852 WS 2005/06 29.November 2005

Folien & Lernplattform http://eeyore.wu-wien.ac.at/stat4/gumprecht.html http://www.wu-wien.ac.at/statmath/ Mitarbeiter/Lektoren/Gumprecht Lernplattform: https://learn.wu-wien.ac.at/ Common body of Knowledge: Statistik Kontrollfragen Musterklausuren …

Literatur Bleymüller, Gehlert, Gülicher: „Statistik für Wirtschaftswissenschaftler“, Verlag Vahlen Hartung: „Statistik. Lehr- und Handbuch der angewandten Statistik“, Oldenburg Verlag München Wien

Inhalt Statistik? Was? Warum? Wie? Statistische Daten und Merkmale, Begriffe Deskriptive – und Induktive Statistik Datenverteilungen und Darstellungsformen Absolute Häufigkeiten Relative Häufigkeiten Maßzahlen Lagemaße / Mittelwerte

Einführung „Statistik“: Abgeleitet vom neulateinischen Begriff „status“ (Bed.: „Staat“, „Zustand“) 18. und 19. Jhdt: „Lehre von der Zustandsbeschreibung des Staates“ (Sammeln und verbales oder numerisches Beschreiben von Daten) Heute: im doppelten Sinne gebraucht Quantitative Informationen (z.B. Bevölkerungsstatistik) Formale Wissenschaft

Statistik Statistik befasst sich mit von (numerischen) Daten. Erhebung (Sammeln von Daten. Wie kommt man zu der benötigten Information?) Aufbereitung (Präsentation; Reduktion von Daten, wobei ein Großteil der Information erhalten bleiben soll; wenige Kenngrößen; einfache Grafiken) Analyse (Welche Schlüsse kann man ziehen? Allgemeine Aussagen basierend auf Stichproben?) von (numerischen) Daten.

Warum? Warum Statistik? Entscheidungshilfe z.B. 2 verschiedene Produkte – welches soll am Markt eingeführt werden? Tieferes Verständnis bei Problemen z.B. Welche Faktoren beeinflussen die Kaufentscheidung? Richtung des Einflusses?

Wie? Wie Statistik? Planung (Untersuchungsziel, Organisation, ...) Erhebung Befragung (schriftlich, mündlich, telefonisch) Beobachtung (in Wirtschaftswissenschaften selten) Experiment (v.a. in Naturwissenschaften) Automatische Erfassung (z.B. Scannerkassen) Aufbereitung (Verdichtung der Daten) Analyse (deskriptive u. induktive Methoden) Interpretation

Fragestellung Klarer Aufbau / Struktur Offene oder geschlossene Frage? Fragen exakt und neutral formulieren Antwortalternativen: klar und ausgewogen Reihenfolge der Antwortalternativen Suggestive Fragestellungen vermeiden Kontrolle: sinngemäß gleiche Fragen

Befragungen Schriftliche Befragung Mündliche Befragung Befragungssituation nicht kontrollierbar Keine Zusatzauskünfte, Erklärungen usw. Antworten nicht spontan Reihenfolge der Fragenbeantwortung? Rücklaufquote oft gering Mündliche Befragung Aufhebung der Anonymität Interviewereffekt Zeitlicher Antwortdruck

Deskriptiv - Induktiv Deskriptive Statistik beschreibende Statistik Beschreibung und Zusammenfassung Darstellung von Daten (Tabellen u. Grafiken) Kennzahlen (z.B. Mittelwerte, Streuungs-maße) Induktive Statistik schließende Statistik Von Stichproben auf Grundgesamtheiten Schätzer Tests Entscheidungstheorie

Statistische Daten Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten, Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten, statistische Massen). Reale und hypothetische Gesamtheiten z.B. Bevölkerung eines Staates, Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Würfels Endliche und unendliche Gesamtheiten

Statistische Massen Bestandsmassen (Streckenmassen): Objekte mit Lebensdauer Werden zu einem Zeitpunkt erfasst z.B. Einwohner Österreichs am 1.1.2005, Lagerbestand am 31.12.2004 Bewegungs- oder Ereignismassen (Punktmassen) Ereignisse Werden innerhalb einer Zeitspanne erfasst z.B. Geburten in Österreich im Jahr 2004, bei einer Bank eingegangene Schecks im April 2004

Statistische Massen Beziehung Bestands- und Bewegungsmasse: Für jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar Fortschreibungsformel: Anfangsbestand + Zugang – Abgang = Endbestand Bestandsmasse Bewegungsmasse

Statistische Daten Angehörige der Massen: Merkmalsträger / Beobachtungseinheit (Personen, Objekte) Erhoben werden Werte von Merkmalen / Variablen (Merkmalsausprägungen) der Merkmalsträger (statistische) Population: Gesamtheit aller Beobachtungseinheiten Bsp: Haarfarbe = Merkmal, Person X = Merkmalsträger, blond = Merkmalsausprägung des Merkmals Haarfarbe des Merkmalsträgers X

Datenerhebung Vollerhebung Stichprobenerhebung Es werden Daten von allen Elementen der Population erhoben. Stichprobenerhebung Es werden Daten von einer Teilmenge (Stichprobe) der Population erhoben.

Stichprobenerhebung Aufgabe: Aussagen über Grundgesamtheit Stichprobe (Kosten, Zeit, Möglichkeit) Zufallsstichprobe (theoretisch fundierte Aussagen über Zuverlässigkeit der Ergebnisse sind möglich) Quotenstichprobe (keine theoretisch fundierten Aussagen über die Zuverlässigkeit der Ergebnisse) Stpr. heißt repräsentativ, wenn ein Schluss auf Grundgesamtheit erlaubt ist Stichprobe „verkleinertes Abbild“ der Grundgesamtheit.

Datenerhebung Messen von Merkmalsausprägungen Kriterien für Messungen: Objektivität das zu ermittelnde Merkmal wird eindeutig festgestellt, Ergebnis ist unabhängig von der Person die misst Validität (Gültigkeit) Messinstrument misst, was es messen soll Reliabilität (Zuverlässigkeit) Ergebnis der Messung wird exakt festgestellt, bei mehrmaligem Messen (approximativ) gleiches Ergebnis

Statistische Merkmale Qualitative Merkmale Messen durch Klassifikation (z.B. Geschlecht) Quantitative Merkmale Messen durch Zählen (z.B. Alter, Körpergröße) Diskrete Merkmale Messen mit ganzen Zahlen (z.B. Anzahl Familienmitglieder) Stetige Merkmale Messen mit reellen Zahlen (z.B. Körpergröße)

Merkmalsskalen Nominalskala Ordinalskala Intervallskala Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (z.B. Farbe, Geschlecht, ...) Ordinalskala Werte unterliegen einer Rangfolge, Abstände zw. verschiedenen Ausprägungen lassen sich nicht interpretieren (z.B. Schulnoten, Güteklassen, ...) Intervallskala Rangfolge, Abstände zw. verschiedenen Ausprägungen sind interpretierbar (z.B. Temperatur in Grad Celsius, Kalenderzeitrechung, ...) Verhältnisskala Rangfolge, interpretierbare Abstände, absoluter Nullpunkt (z.B. Körpergröße, Alter)

Merkmalsskalen Zulässige Transformationen (informationserhaltend) Nominalskala: symmetrische Transformationen nur Änderung der Klassenbezeichnungen Ordinalskala: streng monotone Transformationen x*=f(x) so dass für x1< x2 auch x1*< x2* Intervallskala: lineare Transformationen x*=ax + b (a > 0) Verhältnisskala: Ähnlichkeitstransformationen x*=ax (a > 0)

Empirische Verteilungen Häufigkeitsverteilung Beobachtete Daten, n Untersuchungseinheiten, Merkmal X k Merkmalsausprägungen (x1, ..., xk) j-te Untersuchungseinheit (j=1,...,n), Ausprägung xi (i=1,...,k) Liste der beobachteten Merkmalsaus-prägungen: Beobachtungsreihe oder Urliste

Empirische Verteilungen Absolute Häufigkeiten: hi = „Anzahl der Elemente, welche Merkmalsausprägung xi besitzen“, i=1,...,k hi  [0,n] und Σi hi = n (i=1,...,k) Relative Häufigkeit: fi = 1/n·hi fi  [0,1] und Σi fi = 1 (i=1,...,k) Vorsicht: Anzahl der möglichen Werte oft  Anzahl der tatsächlichen Werte

Empirische Verteilungen Diskrete Merkmale: Einzelwerte Stetige Merkmale: Klasseneinteilung In beiden Fällen werden Häufigkeiten gezählt. Sind xi Zahlen, werden sie ansteigend geordnet.

Darstellungsformen Stetige Merkmale: Klassen bilden Klassengrenzen: x0, x1, ..., xk Häufigkeiten hi: Anzahl der Werte zwischen xi-1 und xi. Liegt ein Wert genau auf der Klassengrenze, wird er üblicherweise der unteren Klasse zugerechnet

Darstellungsformen Tabelle Häufigkeitsverteilung

Darstellungsformen Grafik: Balkendiagramm für absolute und relative Häufigkeiten gleich – Skalierung der y-Achse

Darstellungsformen Grafik: Histogramm

Darstellungsformen Balkendiagramm: Abstand zwischen den Balken. Die Höhe stellt die Häufigkeit dar. Histogramm: Kein Abstand zwischen den Balken. Bei ungleich breiten Klassen ist die Fläche – nicht die Höhe – Maß für die Häufigkeit. Die Balkenhöhe entsteht durch Division von Häufigkeit und Klassenbreite (Höhe=hi/bi).

Darstellungsformen Tortendiagramm

Darstellungsformen Liniendiagramm:

Summenhäufigkeitsfunktion Absoluten Summenhäufigkeiten Hi: Fortlaufende Summierung (Kumulierung) der absoluten Häufigkeiten. Hi Anzahl der Elemente mit Merkmalswert  xi. Hi = h1+h2+...+hi = Σj hj für j=1,...,i und i=1,...,k Relative Summenhäufigkeiten Fi: Fortlaufende Summierung der relativen Häufigkeiten. Fi = f1+f2+...+fi = Σj fj für j=1,...,i und i=1,...,k Fi = Hi/n für i=1,...,k

Summenhäufigkeitsfunktion Häufigkeiten aus Summenhäufigkeiten berechnen: hi = Hi – Hi-1 (i=1,...,k) fi = Fi – Fi-1 (i=1,...,k) wobei H0 = F0 = 0

Summenhäufigkeitsfunktion Summenhäufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhäufigkeiten bestimmt. F(x) gibt den Anteil der Elemente mit einem Merkmalswert  x an. 0 für x < x1 F(x) = Fi für xi  x < xi+1 (i=1,...,k-1) 1 für x  xk

Summenhäufigkeitsfunktion Diskrete Merkmale

Summenhäufigkeitsfunktion Stetige Merkmale