Erheben von Daten Kategoriale Merkmale

Slides:

Advertisements

Ähnliche Präsentationen

EINFÜHRUNG IN DIE METHODEN DER UMFRAGEFORSCHUNG

Advertisements

Quanti Tutorium

Patrick Rössler Einführung in die Methoden der empirischen Kommunikationsforschung Vorlesung BA Kommunikationswissenschaft.

„Spielt der Zufall eine Rolle?“

Stichprobe im qualitativen Forschungsprozess

Definition [1]: Sei S eine endliche Menge und sei p eine Abbildung von S in die positiven reellen Zahlen Für einen Teilmenge ES von S sei p definiert.

Definition der Statistik

Merkmale Beispiele Anwendung Träger Autos Menschen Völker Jahre

Mie-Streuung an leviterten Flüssigkeitströpfchen

Bewegungswissenschaft

Untersuchungsarten im quantitativen Paradigma

Zufallsgrößen und Beschreibung – Wiederholung Sek. I

Kommunikationskompetenz als Schlüsselqualifikation für Informationsdienstleister WS 2004/05 Dr. Inka Tappenbeck.

Spezielle Informationsdienstleistungen und -produkte

Aufbau von Substanzbibliotheken für das High thoughput screening (I)

Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.

Gliederung Der Begriff der Stichprobe, Stichprobenfehler

Integrierte Managementsysteme

Computerkurs: Quantitative Auswertung biochemischer Experimente

Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.

Michel-Parameter im µ-Zerfall

Modul B.MZS.01.a: Quantitative Methoden

Süntje Böttcher Proseminar eVoting SS

Institut für Kartographie und Geoinformation Dipl.-Ing. J. Schmittwilken Diskrete Mathe II Übung

Institut für Kartographie und Geoinformation Dipl.-Ing. J. Schmittwilken Diskrete Mathe II Übung

Konfidenzintervalle Intervallschätzung

TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)

Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur - statt Vorlesungen -

Statistische Methoden I WS 2004/2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.

Statistische Methoden I WS 2002/2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.

Univariate Statistik M. Kresken.

Grundbegriffe M. Kresken.

Definition Messmittelfähigkeitsuntersuchung

Vorlesung: Biometrie für Studierende der Veterinärmedizin

Vorlesung: Biometrie für Studierende der Veterinärmedizin

Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014

Daten auswerten Boxplots

Histogramm/empirische Verteilung Verteilungen

Peter Hackl, Abteilung für Wirtschaftsstatistik, UZA II, 4. Ebene

Schwimmkerlchen News 05/051 Arcen, Niederlande! Heimtückischer ANSCHLAG auf den Musikdirektor der BBK ! Arcen, Niederlande! Heimtückischer ANSCHLAG auf.

Ausgleichungsrechnung I

Aufgabenzettel V Statistik I

Wahrscheinlichkeit Zufallsexperiment:

Wiederholung BSP 2.1.

Theorie der Stichprobe

STATISIK LV Nr.: 1852 WS 2005/06 29.November 2005.

Konfidenzintervall und Testen für den Mittelwert und Anteile

Erheben von Daten kategoriale Merkmale

PI Statistik Peter Hackl Sprechstunde: Fr, 10:45-11:45 Tel.: Di, Do, 9:00-11:30.

Peter Hackl, Abteilung für Wirtschaftsstatistik, UZA II, 4. Ebene

Mehr zum Testen von Hypothesen

Referat über das Thema STOCHASTIK.

1 Stichprobenverfahren zur Qualitätssicherung Hilfestellung der Statistik in der Wirtschaftsprüfung.

Einführung in die psychologische MethodenlehreFolie Nr. 1 Merkmale und ihre Erhebung Quantitative Merkmale z.B. Körpergröße sind messbar Qualitative.

Die ersten Schritte bei der Entdeckung der Statistik

Statistik Peter Hackl Sprechstunde: Fr, 10:45-11:45 Tel.:

Lernen durch Vergleiche

Statistik – Regression - Korrelation

Internetbasierte Fragebogenuntersuchungen und Surveys Christine Surer

Einführung zur Fehlerrechnung

Erheben, berechnen und darstellen von Daten

Stochastik Grundlagen

Empirische Sozialforschung am Beispiel der Limburger Nordstadt

Methoden der Sozialwissenschaften

K. Desch - Statistik und Datenanalyse SS05

Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.

EIN NEUES ENSEMBLE- KLASSIFIKATIONSVERFAHREN Tim Schneider Rotation Forest.

Statistik I Statistik I Statistische Grundbegriffe

Die ersten Schritte bei der Entdeckung der Statistik

Ökonometrie und Statistik Wiederholung

Präsentation transkript:

Erheben von Daten Kategoriale Merkmale Statistik: 14.10.04 Erheben von Daten Kategoriale Merkmale

Datenquellen Primäre Daten, aus Sekundäre Daten Vollerhebung Stichprobenerhebung Sekundäre Daten Volkszählungsdaten Daten von Statistik Austria, von der OeNB Daten aus der Hörerevidenz der WU Personal-, Lagerkartei 11.10.04 PI Statistik, WS 2004/05

Messen Messen: Ist Ergebnis eines Messprozesses mit Messinstrumenten Messverfahren messenden Personen Beispiele: gemessen werden (1) die Länge eines Tisches, (2) die Länge eines Eies, (3) die Härte von Stahl, (4) die Zufriedenheit des Käufers eines PKW 11.10.04 PI Statistik, WS 2004/05

Qualität von Messungen Kriterien für die Qualität von Messungen Genauigkeit (accuracy): bezieht sich auf einzelnen Messvorgang systematischer Fehler (Bias) Präzision, Variabilität Reproduzierbarkeit: bezieht sich auf Messsystem Stabilität: zeitlicher Aspekt des Messsystems 11.10.04 PI Statistik, WS 2004/05

Prozesse: Messen - Variabilität Beobachten (Messen) ist zentrales Element für Qualität von Produktions- und Dienstleistungsprozessen Prozessvariabilität Messvariabilität Beispiele: Qualität des Kaffees Wartezeit im Call-Center 11.10.04 PI Statistik, WS 2004/05

Datenerhebungen (surveys) Vollerhebung (census) und Stichprobe Grundgesamtheit (Umfang N; N meist sehr groß) Statistische Einheiten, Elemente Stichprobenrahmen (Liste aller Elemente der Grundgesamtheit) Stichprobe (Umfang n; n meist klein) 11.10.04 PI Statistik, WS 2004/05

Auswahl der Stichprobe Auswahl ohne Zufallsmechanismus (non-probability sample survey) Bequemlichkeits-Stichprobe (convenience sampling) Systematische Stichprobe Auswahl nach Zufallsprinzip (probability sample survey) Einfache Zufallsstichprobe (simple random sample) Geschichtete Zufallsstichprobe (stratified random sample) Systematische Zufallsstichprobe Klumpen- (Cluster)stichprobe 11.10.04 PI Statistik, WS 2004/05

Einfache Zufallsstichprobe jede mögliche Stichprobe vom Umfang n hat die gleiche Wahrscheinlichkeit, gezogen zu werden 11.10.04 PI Statistik, WS 2004/05

Beispiel: Einfache Zufalls-SP G = {a,b,c,d,e}, n=2: es gibt 10 mögliche Stichproben: (a,b), (a,c), ..., (a,e), ..., (d,e) Urne enthält 10 Zettel mit den 10 Paaren; wir wählen zufällig einen aus Urne enthält 5 Zettel mit den 5 Buchstaben; wir wählen zufällig zwei (ohne Zurücklegen) aus Zufallszahlen 11.10.04 PI Statistik, WS 2004/05

Zufallszahlen In Büchern; z.B. in Hackl & Katzenbeisser, S. 434 Statistik-Software kann Pseudozufallszahlen erzeugen, z.B. EXCEL: Analyse-Funktionen >> Zufallszahlengenerierung >> Diskrete Verteilung 11.10.04 PI Statistik, WS 2004/05

Einfache ZSP: Vor-/Nachteile Vorteile Ergebnisse haben keinen systematischen Fehler (Bias); sie sind "unverzerrt" kontrollierter Stichprobenfehler Nachteil in Praxis nicht leicht realisierbar, oft aufwendig 11.10.04 PI Statistik, WS 2004/05

Geschichtete Zufallsstichprobe Zerlegung der Grundgesamtheit in Schichten Innerhalb jeder Schicht: einfache Zufallsstichprobe Vorteil: reduzierter Stichprobenfehler 11.10.04 PI Statistik, WS 2004/05

Beispiel: Einkommen Reine ZSP Geschichtete ZSP a=2, b=3, MW=2.5 nicht möglich a=2, c=6, MW=4.0 a=2, d=7, MW=4.5 b=3, c=6, MW=4.5 b=3, d=7, MW=5.0 c=6, d=7, MW=6.5 11.10.04 PI Statistik, WS 2004/05

Klumpenstichprobe Vollerhebung in zufällig ausgewählten Teilmengen (Klumpen; Teilmengen, die die Grundgesamtheit gut repräsentieren) Geschichtete und Klumpenstichprobe: sind Beispiele für zweistufige Stichprobenverfahren 11.10.04 PI Statistik, WS 2004/05

Erhebungsfehler Reiner Stichprobenfehler (pure sampling error) Variation des Ergebnisses dadurch, dass bestimmte Elemente ausgewählt werden; quantifizierbar Stichprobenverfälschungen, z.B. Fehler im Stichprobenrahmen Nicht-Stichprobenfehler (non-sampling error): Fehlende Antwort (non-response), Fehler der beteiligten Personen (Interviewer, Interviewter), Fehler bei Verarbeitung; schlechte Fehlerkontrolle, etc.; kaum messbar 11.10.04 PI Statistik, WS 2004/05

Kategoriale Merkmale Auch qualitative und kategorielle Merkmale genannt Ordnet der Beobachtungs- oder Untersuchungseinheit eine von endlich vielen Klassen (Kategorien) zu; Dazu gehören nominale und ordinale Merkmale Ist immer diskret (die Menge der Merkmalsausprägungen ist endlich oder abzählbar) Population Merkmal M-Ausprägungen WU-Studierende Geschlecht m, w Note 1, 2, 3, 4, 5 Produktion Qualität gut, schlecht 11.10.04 PI Statistik, WS 2004/05

Kreisdiagramm Beispiel: Augenfarbe von Studierenden Augenfarbe Häuf'kt blau 15 grün 12 braun 19 grau 2 schwarz 1 11.10.04 PI Statistik, WS 2004/05

Kreisdiagramm Explodierter 3D-Kreis Augenfarbe Häuf'kt blau 15 grün 12 braun 19 grau 2 schwarz 1 11.10.04 PI Statistik, WS 2004/05

Säulen-, Stabdiagramm Augenfarbe Häuf'kt blau 15 grün 12 braun 19 grau schwarz 1 11.10.04 PI Statistik, WS 2004/05

Absolute & relative Häufigkeit (absolute) Häufigkeit: gibt an, wie oft eine bestimmte Kategorie in der Datenmenge vorkommt; typisches Symbol: H i z.B.: 15 Studierenden haben blaue Augen relative Häufigkeit (Anteil) h i n: Umfang der Datenmenge Oft als Prozente (Prozentanteil) angegeben 11.10.04 PI Statistik, WS 2004/05

Kumulierte (relative) Häufigkeiten Summe der relativen Häufigkeiten aller vorhergehenden Kategorien, einschließlich der aktuellen Nur für ordinale Merkmale sinnvoll 11.10.04 PI Statistik, WS 2004/05

Noten von 52 Studierenden abs H'kt rel H'kt kum rel H'kt 1 7 13,5% 2 22 42,3% 55,8% 3 15 28,8% 84,6% 4 6 11,5% 96,2% 5 3,8% 100,0% 52 11.10.04 PI Statistik, WS 2004/05

Pivot Table-Bericht „Ein PivotTable-Bericht ist eine interaktive Tabelle, die große Datenmengen rasch kombinieren und vergleichen kann.“ Wichtige Hilfe zum Auszählen von Datenmengen 11.10.04 PI Statistik, WS 2004/05

Fragestellungen Kommen alle Kategorien gleich häufig vor ? Entsprechen die Häufigkeiten in den Kategorien einer bestimmten Vorgabe ? Entspricht die Häufigkeit (Prozentsatz, Anteil) in einer bestimmten Kategorie einem bestimmten Wert? In welchem Bereich kann man den Anteil einer Kategorie in der Grundgesamtheit erwarten ? 11.10.04 PI Statistik, WS 2004/05