Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
1
Ökonometrie und Statistik Wiederholung
Dr. Bertram Wassermann
2
Übersicht I Grundbegriffe II Verfahren für nominal - skalierte Daten
III Verfahren für ordinal - skalierte Daten IV Verfahren für intervall – skalierte Daten
3
Was sind Daten? Daten sind eine Sammlung von Merkmalen bzw. Messungen von Informationen über eine gegebene Menge von Objekten bzw. Beobachtungseinheiten. Beobachtungseinheiten Konsumenten Kunden Firmen Patienten Versuchstiere Abteilungen Vulkane Regionen … Merkmale, Messungen Gekaufte Einheiten Qualität (Gold, Silber, Bronze) Größe Heilung (ganz, teils, gar nicht) Aufgabe erfolgreich gelöst? Produktivität letzte Aktivität Kaufkraft …
4
Typisches Datenformat: Tabelle
Merkmale bilden die Spalten (werden auch Variablen oder Variaten genannt) Beobachtungseinheiten bilden die Zeilen M1 M2 M3 M(m-1) Mm Nr.1 Nr.2 Nr.3 Nr. n-1 Nr. n M M G K Mai 50 Jun 68 Jan 67 Dez 84 12,5 1 2 5 4 M 1,3 W 27,4 W 18,8 M Merkmalsausprägungen werden gemessen, beobachtet und in den Zellen eingetragen.
5
Ablauf: Der statistische Analyseprozess
Grundgesamtheit (Population von Individuen für die eine Fragen beantwortet werden soll) Schließende Statistik Rückschlüsse auf die Grundgesamtheit mittels der durch die Stichprobe gewonnenen Informationen Ziehen einer Stichprobe. Stichprobe Daten-management Beschreibung der Stichprobe. Datensatz Nr.1 Nr.2 Nr.3 Nr. n-1 Nr. n M1 M2 M3 M(m-1) Mm M W 12,5 1,3 27,4 18,8 1 2 5 4 G K Mai 50 Jun 68 Jan 67 Dez 84 Deskriptive Statistik
6
Skalenniveaus Skalenniveaus Aus- prägungen Zulässige Operation
Beispiel Haarfarbe, Religionsbekenntnis, Nationalität, Name einer Firma, etc. sind nur Namen Nominal = Abschlussnote, Versicherungskategorien (Hohes, mittleres, geringes Risiko); Subjektives Temperaturempfinden (,,heiß“, ,,warm“ ,,lauwarm“, ,,kalt“) etc. Skalenniveaus haben eine Reihenfolge = < > Ordinal Differenzen sind interpretierbar Temperatur (in Celsius oder Fahrenheit) Alter (in Jahren) Gewicht (in kg) Einkommen (in Euro) Telefonieminuten = + / - < > Intervall Verhältnisse sind interpretierbar = + / - < > * / : Alter (in Jahren) Gewicht (in kg) Einkommen (in Euro) Telefonieminuten Verhältnis
7
Skalenniveaus Informationsgehalt hoch gering Metrische Skala
(Intervall- und Verhältnisskala) Ordinalskala Nominalskala Informationsgehalt hoch gering
8
Alternative Einteilung von Merkmalen
Kategoriales Merkmal: endlich viele Ausprägungen (nach oben beschränkt); z.B. Geschlecht, Noten Spezialfall: Dichotome Variable Diskretes Merkmal: Ausprägung entspricht einer beliebigen natürlichen Zahl. Jedes kategoriale Merkmal ist auch diskret, aber nicht umgekehrt z.B. Telefonieminuten pro Monat und Kunde Stetiges Merkmal: Ausprägung entspricht einer reellen Zahl, theoretisch können alle Werte in einem bestimmten Intervall angenommen werden. z.B. Alter, Temperatur.
9
Unterscheidung der Methoden in der deskriptiven Statistik
Anzahl der Variablen in der Analyse Beispiel Univariat Bivariat Multivariat Nominal Häufigkeiten Kreuztabelle Ordinal Ranking Etc. Intervall Mittelwert Regression Verhältnis Skalenniveaus Bei Bivariaten und Multivariaten Analysen kommt es in der Regel zu einer Mischung der Skalenniveaus
10
Übersicht I Grundbegriffe II Verfahren für nominal - skalierte Daten
III Verfahren für ordinal - skalierte Daten IV Verfahren für intervall – skalierte Daten
11
Maßzahlen für eine nominale Variable
Für jede Ausprägung: absolute Häufigkeit relative Häufigkeit und prozentuelle Häufigkeit. Für das Merkmal insgesamt: Der Modus, die häufigste Ausprägung.
12
Maßzahlen für zwei nominale Variable
Für jede Ausprägung: zusätzlich … Kreuztabelle mit den Kennzahlen Absolute Häufigkeit Gesamtprozent Zeilenprozent Spaltenprozent Grün Gelb Blau Gesamt Frau 5 5,5% 16,6% 14,3% 10 11,1% 33,3% 15 50,0% 60,0% 30 100,0% Mann 85,7% 20 22,2% 66,6% 10 11,1% 40,0% 60 35 38,8% 25 27,7% 90
13
Übersicht I Grundbegriffe II Verfahren für nominal - skalierte Daten
III Verfahren für ordinal - skalierte Daten IV Verfahren für intervall – skalierte Daten
14
Maßzahlen für eine ordinale Variable
Für jede Ausprägung: Alle Maßzahlen wie für nominal skalierte Daten und zusätzlich kumulierte absolute Häufigkeit kumulierte relative Häufigkeit
15
Weitere Maßzahlen für eine ordinale Variable
Für das Merkmal insgesamt: Alle Maßzahlen wie für nominal skalierte Daten und zusätzlich kleinster Wert oder Minimum größter Wert oder Maximum q – Quantil oder q*100% – Perzentil Spezialfälle 0.25 – Quantil = 1. Quartil 0.50 – Quantil = 2. Quartil = der Median 0.75 – Quantil = 3. Quartil
16
Übersicht I Grundbegriffe II Verfahren für nominal - skalierte Daten
III Verfahren für ordinal - skalierte Daten IV Verfahren für intervall – skalierte Daten
17
Maßzahlen für eine metrische Variable
Für das Merkmal insgesamt: Alle Maßzahlen für nominal oder ordinal skalierte Daten und zusätzlich Lagemaße wie arithmetisches, geometrisches oder harmonisches Mittel, gewichtet oder ungewichtet. Streuungsmaße wie Varianz, Standardabweichung, Variationskoeffizient, Spannweite oder Quartilsabstand Schiefemaße
18
Mittelwert und Varianz
Größe der Stichprobe = n Daten der Stichprobe: x1, x2, …, xn Arithmetisches Mittel: Varianz: Standardabweichung: Variationskoeffizient: Spannweite: Maximum - Minimum Quartilsabstand: 3. Quartil - 1. Quartil
19
Die Schiefe Verteilung symmetrisch: α3= 0 rechts schief: α3> 0
links schief: α3< 0 Verteilung symmetrisch: Mittelwert = Median rechts schief: Mittelwert rechts von Median links schief: Mittelwert links von Median
20
Zusammenfassung Kennzahlen
Univariat Bivariat Nominal absolute Häufigkeit Kreuztabelle relative Häufigkeit Spaltenprozent prozentuelle Häufigkeit Zeilenprozent Modus Ordinal kumulierte absolute Häufigkeit kumulierte relative Häufigkeit kumulierte prozentuelle Häufigkeit Minimum, Maximum, (Nicht die Spannweite!) Lage Streuung Schiefe Median Quartile, Perzentile Metrisch Mittelwert Standartabweichung tes Moment Spannweite Quartilsabstand Mittelwert - Median Skalenniveaus
21
Zusammenfassung Grafik
Univariat Bivariat Nominal Säulendiagramm gruppiertes Balkendiagramm Balkendiagramm Kreisdiagramm gestapeltes Balkendiagramm Ordinal Summenpolygone Metrisch Histogramm Mittelwertsplots Box-Whiskers - Plot Skalenniveaus
22
Prüfungsbeispiel: Analyseplanung
Beschreibung: Die ÖBB möchten über die Zufriedenheit ihrer Pendler auf einer bestimmten Strecke bescheid wissen. Sie führt in den Zügen eine Befragung durch. Es wird erhoben: Wie zufrieden ist der Befragte mit den Verbindungen auf dieser Strecke grundsätzlich? Bewertet wird auf einer Skala von 0 bis 10, 0 bedeutet absolut unzufrieden, 10 bedeutet absolut zufrieden Anzahl der Verspätungen, die die Person im letzten Monat erlebt hat. (Durchschnittliche) Dauer der Fahrt der Person (in Minuten) Geschlecht Alter (in Jahren) Beruf (Arbeiter, Angestellter, Beamter)
23
Prüfungsbeispiel: Analyseplanung
Detailfragen: Kategorisieren Sei die Variablen, strukturell so wie das Skalenniveau. 1. Var: kategorial und metrisch 2. Var: diskret und metrisch 3. Var: stetig und metrisch 4. Var: kategorial (dichotom) und nominal 5. Var: diskret und metrisch 6. Var: kategorial und nominal
24
Prüfungsbeispiel: Analyseplanung
Detailfragen: Welche Analysemethode wenden Sie hier an? Bei den univariaten Voranalysen kann man hier welche Methoden verwenden, grafische wie auch Kennzahlen? 1. Var: Box-Whiskers Plot, Mittelwert, Standardabweichung, Schiefe 2. Var: wie 1. Var 3. Var: wie 1. Var 4. Var: Säulendiagramm oder Tortendiagramm, absolute und relative Häufigkeiten 5. Var: wie 1. Var 6. Var: wie 4. Var
25
Prüfungsbeispiel: Analyseplanung
Detailfragen: Welche Analysemethode wenden Sie hier an? Bei den bivariaten Voranalysen kann man hier welche Methoden verwenden, grafische wie auch Kennzahlen? Kommt noch.
26
Übersicht V Bivariate Verfahren für metrische Daten A Reduktion B
Eine nominale Variable und eine metrische Variable C Zwei metrische Variablen
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.