Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistik: 14.10.04 Erheben von Daten Kategoriale Merkmale.

Ähnliche Präsentationen


Präsentation zum Thema: "Statistik: 14.10.04 Erheben von Daten Kategoriale Merkmale."—  Präsentation transkript:

1 Statistik: Erheben von Daten Kategoriale Merkmale

2 PI Statistik, WS 2004/052 Datenquellen Primäre Daten, aus Vollerhebung Stichprobenerhebung Sekundäre Daten Volkszählungsdaten Daten von Statistik Austria, von der OeNB Daten aus der Hörerevidenz der WU Personal-, Lagerkartei

3 PI Statistik, WS 2004/053 Messen Messen: Ist Ergebnis eines Messprozesses mit Messinstrumenten Messverfahren messenden Personen Beispiele: gemessen werden (1) die Länge eines Tisches, (2) die Länge eines Eies, (3) die Härte von Stahl, (4) die Zufriedenheit des Käufers eines PKW

4 PI Statistik, WS 2004/054 Qualität von Messungen Kriterien für die Qualität von Messungen Genauigkeit (accuracy): bezieht sich auf einzelnen Messvorgang systematischer Fehler (Bias) Präzision, Variabilität Reproduzierbarkeit: bezieht sich auf Messsystem Stabilität: zeitlicher Aspekt des Messsystems

5 PI Statistik, WS 2004/055 Prozesse: Messen - Variabilität Beobachten (Messen) ist zentrales Element für Qualität von Produktions- und Dienstleistungsprozessen Prozessvariabilität Messvariabilität Beispiele: Qualität des Kaffees Wartezeit im Call-Center

6 PI Statistik, WS 2004/056 Datenerhebungen ( surveys) Vollerhebung (census) und Stichprobe Grundgesamtheit (Umfang N; N meist sehr groß) Statistische Einheiten, Elemente Stichprobenrahmen (Liste aller Elemente der Grundgesamtheit) Stichprobe (Umfang n; n meist klein)

7 PI Statistik, WS 2004/057 Auswahl der Stichprobe Auswahl ohne Zufallsmechanismus (non- probability sample survey) Bequemlichkeits-Stichprobe (convenience sampling) Systematische Stichprobe Auswahl nach Zufallsprinzip (probability sample survey) Einfache Zufallsstichprobe (simple random sample) Geschichtete Zufallsstichprobe (stratified random sample) Systematische Zufallsstichprobe Klumpen- (Cluster)stichprobe

8 PI Statistik, WS 2004/058 Einfache Zufallsstichprobe jede mögliche Stichprobe vom Umfang n hat die gleiche Wahrscheinlichkeit, gezogen zu werden

9 PI Statistik, WS 2004/059 Beispiel: Einfache Zufalls-SP G = {a,b,c,d,e}, n=2: es gibt 10 mögliche Stichproben: (a,b), (a,c),..., (a,e),..., (d,e) Urne enthält 10 Zettel mit den 10 Paaren; wir wählen zufällig einen aus Urne enthält 5 Zettel mit den 5 Buchstaben; wir wählen zufällig zwei (ohne Zurücklegen) aus Zufallszahlen

10 PI Statistik, WS 2004/0510 Zufallszahlen In Büchern; z.B. in Hackl & Katzenbeisser, S. 434 Statistik-Software kann Pseudozufallszahlen erzeugen, z.B. EXCEL: Analyse-Funktionen >> Zufallszahlengenerierung >> Diskrete Verteilung

11 PI Statistik, WS 2004/0511 Einfache ZSP: Vor-/Nachteile Vorteile Ergebnisse haben keinen systematischen Fehler (Bias); sie sind "unverzerrt" kontrollierter Stichprobenfehler Nachteil in Praxis nicht leicht realisierbar, oft aufwendig

12 PI Statistik, WS 2004/0512 Geschichtete Zufallsstichprobe Zerlegung der Grundgesamtheit in Schichten Innerhalb jeder Schicht: einfache Zufallsstichprobe Vorteil: reduzierter Stichprobenfehler

13 PI Statistik, WS 2004/0513 Beispiel: Einkommen Reine ZSPGeschichtete ZSP a=2, b=3, MW=2.5 nicht m ö glich a=2, c=6, MW=4.0 a=2, d=7, MW=4.5 b=3, c=6, MW=4.5 b=3, d=7, MW=5.0 c=6, d=7, MW=6.5 nicht m ö glich

14 PI Statistik, WS 2004/0514 Klumpenstichprobe Vollerhebung in zufällig ausgewählten Teilmengen (Klumpen; Teilmengen, die die Grundgesamtheit gut repräsentieren) Geschichtete und Klumpenstichprobe: sind Beispiele für zweistufige Stichprobenverfahren

15 PI Statistik, WS 2004/0515 Erhebungsfehler Reiner Stichprobenfehler (pure sampling error) Variation des Ergebnisses dadurch, dass bestimmte Elemente ausgewählt werden; quantifizierbar Stichprobenverfälschungen, z.B. Fehler im Stichprobenrahmen Nicht-Stichprobenfehler (non-sampling error): Fehlende Antwort (non-response), Fehler der beteiligten Personen (Interviewer, Interviewter), Fehler bei Verarbeitung; schlechte Fehlerkontrolle, etc.; kaum messbar

16 PI Statistik, WS 2004/0516 Kategoriale Merkmale Auch qualitative und kategorielle Merkmale genannt Ordnet der Beobachtungs- oder Untersuchungseinheit eine von endlich vielen Klassen (Kategorien) zu; Dazu gehören nominale und ordinale Merkmale Ist immer diskret (die Menge der Merkmalsausprägungen ist endlich oder abzählbar) PopulationMerkmalM-Ausprägungen WU-StudierendeGeschlechtm, w Note1, 2, 3, 4, 5 ProduktionQualitätgut, schlecht

17 PI Statistik, WS 2004/0517 Kreisdiagramm AugenfarbeHäuf'kt blau15 grün12 braun19 grau2 schwarz1 Beispiel: Augenfarbe von Studierenden

18 PI Statistik, WS 2004/0518 Kreisdiagramm Explodierter 3D-Kreis Augenfarbe Häuf'k t blau15 grün12 braun19 grau2 schwarz1

19 PI Statistik, WS 2004/0519 Säulen-, Stabdiagramm AugenfarbeHäuf'kt blau15 grün12 braun19 grau2 schwarz1

20 PI Statistik, WS 2004/0520 Absolute & relative Häufigkeit (absolute) Häufigkeit: gibt an, wie oft eine bestimmte Kategorie in der Datenmenge vorkommt; typisches Symbol: H i z.B.: 15 Studierenden haben blaue Augen relative Häufigkeit (Anteil) h i n: Umfang der Datenmenge Oft als Prozente (Prozentanteil) angegeben

21 PI Statistik, WS 2004/0521 Kumulierte (relative) Häufigkeiten Summe der relativen Häufigkeiten aller vorhergehenden Kategorien, einschließlich der aktuellen Nur für ordinale Merkmale sinnvoll

22 PI Statistik, WS 2004/0522 abs H'ktrel H'kt kum rel H'kt 1713,5% 22242,3%55,8% 31528,8%84,6% 4611,5%96,2% 523,8%100,0% 52 Noten von 52 Studierenden

23 PI Statistik, WS 2004/0523 Pivot Table-Bericht Ein PivotTable-Bericht ist eine interaktive Tabelle, die große Datenmengen rasch kombinieren und vergleichen kann. Wichtige Hilfe zum Auszählen von Datenmengen

24 PI Statistik, WS 2004/0524 Fragestellungen Kommen alle Kategorien gleich häufig vor ? Entsprechen die Häufigkeiten in den Kategorien einer bestimmten Vorgabe ? Entspricht die Häufigkeit (Prozentsatz, Anteil) in einer bestimmten Kategorie einem bestimmten Wert? In welchem Bereich kann man den Anteil einer Kategorie in der Grundgesamtheit erwarten ?


Herunterladen ppt "Statistik: 14.10.04 Erheben von Daten Kategoriale Merkmale."

Ähnliche Präsentationen


Google-Anzeigen