Erheben von Daten Kategoriale Merkmale

Slides:



Advertisements
Ähnliche Präsentationen
EINFÜHRUNG IN DIE METHODEN DER UMFRAGEFORSCHUNG
Advertisements

Quanti Tutorium
Patrick Rössler Einführung in die Methoden der empirischen Kommunikationsforschung Vorlesung BA Kommunikationswissenschaft.
„Spielt der Zufall eine Rolle?“
Stichprobe im qualitativen Forschungsprozess
Definition [1]: Sei S eine endliche Menge und sei p eine Abbildung von S in die positiven reellen Zahlen Für einen Teilmenge ES von S sei p definiert.
Definition der Statistik
Merkmale Beispiele Anwendung Träger Autos Menschen Völker Jahre
Mie-Streuung an leviterten Flüssigkeitströpfchen
Bewegungswissenschaft
Untersuchungsarten im quantitativen Paradigma
Zufallsgrößen und Beschreibung – Wiederholung Sek. I
Kommunikationskompetenz als Schlüsselqualifikation für Informationsdienstleister WS 2004/05 Dr. Inka Tappenbeck.
Spezielle Informationsdienstleistungen und -produkte
Aufbau von Substanzbibliotheken für das High thoughput screening (I)
Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.
Gliederung Der Begriff der Stichprobe, Stichprobenfehler
Integrierte Managementsysteme
Computerkurs: Quantitative Auswertung biochemischer Experimente
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Michel-Parameter im µ-Zerfall
Modul B.MZS.01.a: Quantitative Methoden
Süntje Böttcher Proseminar eVoting SS
Institut für Kartographie und Geoinformation Dipl.-Ing. J. Schmittwilken Diskrete Mathe II Übung
Institut für Kartographie und Geoinformation Dipl.-Ing. J. Schmittwilken Diskrete Mathe II Übung
Konfidenzintervalle Intervallschätzung
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur - statt Vorlesungen -
Statistische Methoden I WS 2004/2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.
Statistische Methoden I WS 2002/2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.
Univariate Statistik M. Kresken.
Grundbegriffe M. Kresken.
Definition Messmittelfähigkeitsuntersuchung
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Daten auswerten Boxplots
Histogramm/empirische Verteilung Verteilungen
Peter Hackl, Abteilung für Wirtschaftsstatistik, UZA II, 4. Ebene
Schwimmkerlchen News 05/051 Arcen, Niederlande! Heimtückischer ANSCHLAG auf den Musikdirektor der BBK ! Arcen, Niederlande! Heimtückischer ANSCHLAG auf.
Ausgleichungsrechnung I
Aufgabenzettel V Statistik I
Wahrscheinlichkeit Zufallsexperiment:
Wiederholung BSP 2.1.
Theorie der Stichprobe
STATISIK LV Nr.: 1852 WS 2005/06 29.November 2005.
Konfidenzintervall und Testen für den Mittelwert und Anteile
Erheben von Daten kategoriale Merkmale
PI Statistik Peter Hackl Sprechstunde: Fr, 10:45-11:45 Tel.: Di, Do, 9:00-11:30.
Peter Hackl, Abteilung für Wirtschaftsstatistik, UZA II, 4. Ebene
Mehr zum Testen von Hypothesen
Referat über das Thema STOCHASTIK.
1 Stichprobenverfahren zur Qualitätssicherung Hilfestellung der Statistik in der Wirtschaftsprüfung.
Einführung in die psychologische MethodenlehreFolie Nr. 1 Merkmale und ihre Erhebung Quantitative Merkmale z.B. Körpergröße sind messbar Qualitative.
Die ersten Schritte bei der Entdeckung der Statistik
Statistik Peter Hackl Sprechstunde: Fr, 10:45-11:45 Tel.:
Lernen durch Vergleiche
Statistik – Regression - Korrelation
Internetbasierte Fragebogenuntersuchungen und Surveys Christine Surer
Einführung zur Fehlerrechnung
Erheben, berechnen und darstellen von Daten
Stochastik Grundlagen
Empirische Sozialforschung am Beispiel der Limburger Nordstadt
Methoden der Sozialwissenschaften
K. Desch - Statistik und Datenanalyse SS05
Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.
EIN NEUES ENSEMBLE- KLASSIFIKATIONSVERFAHREN Tim Schneider Rotation Forest.
Statistik I Statistik I Statistische Grundbegriffe
Die ersten Schritte bei der Entdeckung der Statistik
Ökonometrie und Statistik Wiederholung
 Präsentation transkript:

Erheben von Daten Kategoriale Merkmale Statistik: 14.10.04 Erheben von Daten Kategoriale Merkmale

Datenquellen Primäre Daten, aus Sekundäre Daten Vollerhebung Stichprobenerhebung Sekundäre Daten Volkszählungsdaten Daten von Statistik Austria, von der OeNB Daten aus der Hörerevidenz der WU Personal-, Lagerkartei 11.10.04 PI Statistik, WS 2004/05

Messen Messen: Ist Ergebnis eines Messprozesses mit Messinstrumenten Messverfahren messenden Personen Beispiele: gemessen werden (1) die Länge eines Tisches, (2) die Länge eines Eies, (3) die Härte von Stahl, (4) die Zufriedenheit des Käufers eines PKW 11.10.04 PI Statistik, WS 2004/05

Qualität von Messungen Kriterien für die Qualität von Messungen Genauigkeit (accuracy): bezieht sich auf einzelnen Messvorgang systematischer Fehler (Bias) Präzision, Variabilität Reproduzierbarkeit: bezieht sich auf Messsystem Stabilität: zeitlicher Aspekt des Messsystems 11.10.04 PI Statistik, WS 2004/05

Prozesse: Messen - Variabilität Beobachten (Messen) ist zentrales Element für Qualität von Produktions- und Dienstleistungsprozessen Prozessvariabilität Messvariabilität Beispiele: Qualität des Kaffees Wartezeit im Call-Center 11.10.04 PI Statistik, WS 2004/05

Datenerhebungen (surveys) Vollerhebung (census) und Stichprobe Grundgesamtheit (Umfang N; N meist sehr groß) Statistische Einheiten, Elemente Stichprobenrahmen (Liste aller Elemente der Grundgesamtheit) Stichprobe (Umfang n; n meist klein) 11.10.04 PI Statistik, WS 2004/05

Auswahl der Stichprobe Auswahl ohne Zufallsmechanismus (non-probability sample survey) Bequemlichkeits-Stichprobe (convenience sampling) Systematische Stichprobe Auswahl nach Zufallsprinzip (probability sample survey) Einfache Zufallsstichprobe (simple random sample) Geschichtete Zufallsstichprobe (stratified random sample) Systematische Zufallsstichprobe Klumpen- (Cluster)stichprobe 11.10.04 PI Statistik, WS 2004/05

Einfache Zufallsstichprobe jede mögliche Stichprobe vom Umfang n hat die gleiche Wahrscheinlichkeit, gezogen zu werden 11.10.04 PI Statistik, WS 2004/05

Beispiel: Einfache Zufalls-SP G = {a,b,c,d,e}, n=2: es gibt 10 mögliche Stichproben: (a,b), (a,c), ..., (a,e), ..., (d,e) Urne enthält 10 Zettel mit den 10 Paaren; wir wählen zufällig einen aus Urne enthält 5 Zettel mit den 5 Buchstaben; wir wählen zufällig zwei (ohne Zurücklegen) aus Zufallszahlen 11.10.04 PI Statistik, WS 2004/05

Zufallszahlen In Büchern; z.B. in Hackl & Katzenbeisser, S. 434 Statistik-Software kann Pseudozufallszahlen erzeugen, z.B. EXCEL: Analyse-Funktionen >> Zufallszahlengenerierung >> Diskrete Verteilung 11.10.04 PI Statistik, WS 2004/05

Einfache ZSP: Vor-/Nachteile Vorteile Ergebnisse haben keinen systematischen Fehler (Bias); sie sind "unverzerrt" kontrollierter Stichprobenfehler Nachteil in Praxis nicht leicht realisierbar, oft aufwendig 11.10.04 PI Statistik, WS 2004/05

Geschichtete Zufallsstichprobe Zerlegung der Grundgesamtheit in Schichten Innerhalb jeder Schicht: einfache Zufallsstichprobe Vorteil: reduzierter Stichprobenfehler 11.10.04 PI Statistik, WS 2004/05

Beispiel: Einkommen Reine ZSP Geschichtete ZSP a=2, b=3, MW=2.5 nicht möglich a=2, c=6, MW=4.0 a=2, d=7, MW=4.5 b=3, c=6, MW=4.5 b=3, d=7, MW=5.0 c=6, d=7, MW=6.5 11.10.04 PI Statistik, WS 2004/05

Klumpenstichprobe Vollerhebung in zufällig ausgewählten Teilmengen (Klumpen; Teilmengen, die die Grundgesamtheit gut repräsentieren) Geschichtete und Klumpenstichprobe: sind Beispiele für zweistufige Stichprobenverfahren 11.10.04 PI Statistik, WS 2004/05

Erhebungsfehler Reiner Stichprobenfehler (pure sampling error) Variation des Ergebnisses dadurch, dass bestimmte Elemente ausgewählt werden; quantifizierbar Stichprobenverfälschungen, z.B. Fehler im Stichprobenrahmen Nicht-Stichprobenfehler (non-sampling error): Fehlende Antwort (non-response), Fehler der beteiligten Personen (Interviewer, Interviewter), Fehler bei Verarbeitung; schlechte Fehlerkontrolle, etc.; kaum messbar 11.10.04 PI Statistik, WS 2004/05

Kategoriale Merkmale Auch qualitative und kategorielle Merkmale genannt Ordnet der Beobachtungs- oder Untersuchungseinheit eine von endlich vielen Klassen (Kategorien) zu; Dazu gehören nominale und ordinale Merkmale Ist immer diskret (die Menge der Merkmalsausprägungen ist endlich oder abzählbar) Population Merkmal M-Ausprägungen WU-Studierende Geschlecht m, w Note 1, 2, 3, 4, 5 Produktion Qualität gut, schlecht 11.10.04 PI Statistik, WS 2004/05

Kreisdiagramm Beispiel: Augenfarbe von Studierenden Augenfarbe Häuf'kt blau 15 grün 12 braun 19 grau 2 schwarz 1 11.10.04 PI Statistik, WS 2004/05

Kreisdiagramm Explodierter 3D-Kreis Augenfarbe Häuf'kt blau 15 grün 12 braun 19 grau 2 schwarz 1 11.10.04 PI Statistik, WS 2004/05

Säulen-, Stabdiagramm Augenfarbe Häuf'kt blau 15 grün 12 braun 19 grau schwarz 1 11.10.04 PI Statistik, WS 2004/05

Absolute & relative Häufigkeit (absolute) Häufigkeit: gibt an, wie oft eine bestimmte Kategorie in der Datenmenge vorkommt; typisches Symbol: H i z.B.: 15 Studierenden haben blaue Augen relative Häufigkeit (Anteil) h i n: Umfang der Datenmenge Oft als Prozente (Prozentanteil) angegeben 11.10.04 PI Statistik, WS 2004/05

Kumulierte (relative) Häufigkeiten Summe der relativen Häufigkeiten aller vorhergehenden Kategorien, einschließlich der aktuellen Nur für ordinale Merkmale sinnvoll 11.10.04 PI Statistik, WS 2004/05

Noten von 52 Studierenden abs H'kt rel H'kt kum rel H'kt 1 7 13,5% 2 22 42,3% 55,8% 3 15 28,8% 84,6% 4 6 11,5% 96,2% 5 3,8% 100,0% 52 11.10.04 PI Statistik, WS 2004/05

Pivot Table-Bericht „Ein PivotTable-Bericht ist eine interaktive Tabelle, die große Datenmengen rasch kombinieren und vergleichen kann.“ Wichtige Hilfe zum Auszählen von Datenmengen 11.10.04 PI Statistik, WS 2004/05

Fragestellungen Kommen alle Kategorien gleich häufig vor ? Entsprechen die Häufigkeiten in den Kategorien einer bestimmten Vorgabe ? Entspricht die Häufigkeit (Prozentsatz, Anteil) in einer bestimmten Kategorie einem bestimmten Wert? In welchem Bereich kann man den Anteil einer Kategorie in der Grundgesamtheit erwarten ? 11.10.04 PI Statistik, WS 2004/05