Ökonometrie und Statistik Wiederholung

Slides:



Advertisements
Ähnliche Präsentationen
Quanti Tutorium
Advertisements

Deskriptive Statistik und Explorative Datenanalyse
Lagemaße kritische Fragen
Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.
Statistische Methoden I
Achtung Terminänderung !!!
Statistische Methoden I WS 2004/2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.
Median Merkmal Geordneter Datensatz
Die Vorlesung Mathematik I (Prof. Kugelmann) findet heute um 14:30 Uhr im Hörsaal Loefflerstraße 70 statt.
Quantile.
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Statistische Methoden I WS 2002/2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.
Quantile.
Lehrstuhl für Algebra und funktionalanalytische Anwendungen
Univariate Statistik M. Kresken.
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Stetige Zufallsgrößen
Aufgabenzettel V Statistik I
STATISIK LV Nr.: 1375 SS März 2005.
Seminar: Datenerhebung
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) 3. Ausgaben ( ) Wiederholung Tabellen,
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.
Data Mining Georg Pölzlbauer.
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Veranstaltung 4.
Erheben, berechnen und darstellen von Daten
Messen Zuordnung von Zahlen zu Objekten/Ereignissen gemäß Regeln
Mathematik für BiologInnen WS 05
K. Desch - Statistik und Datenanalyse SS05
Datenmatrix HKI Proseminar Philipp Cielen.
Verteilungen, Varianz Tamara Katschnig.
Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.
Skalenniveaus Tamara Katschnig.
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Mathe Hausaufgabe Von Joschka und Niklas.
Page  1 Agenda  Beantwortung der Forschungsfragen  Datendarstellung für Präsentation und Bericht  Häufigkeitsverteilungen  Statistische Kennwerte.
Betrachtung der Realität aus der Sicht der Statistik VARIABILITÄT
Übersetzung: / Tradotto da:
4 Spezifizierende Beschreibung
Die ersten Schritte bei der Entdeckung der Statistik
Deskriptive Statistik -
7.2 Theoretische Kennwerte
Analysen univariater Stichproben
Deskriptive Statistik -
Grundbegriffe M. Kresken.
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
Ökonometrie und Statistik Wiederholung
Ökonometrie und Statistik Mehrfachregression
Univariate Statistik M. Kresken.
Ökonometrie und Statistik Unabhängigkeitstest, c² - Test (Chi Quadrat Test) Dr. Bertram Wassermann.
UE/BiTS Berlin, ALBA BERLIN College Sommersemester 2018
3 Gesamtbeschreibung empirischer Verteilungen.
Forschungsstrategien Johannes Gutenberg Universität Mainz
Statistik IV Statistik III
4 Spezifizierende Beschreibung
Statistik und Biometrie
ReduSoft Ltd. Kurzbeschreibungen zu einigen Modulen, die im Programm MathProf 5.0 unter dem Themenbereich Stochastik implementiert sind.
Ökonometrie und Statistik Unabhängigkeitstest, c² - Test (Chi Quadrat Test) Dr. Bertram Wassermann.
Ökonometrie und Statistik Prüfungsthemen
Ökonometrie und Statistik Wiederholung
Übersicht Etwas Mathematik (ganz ohne geht es nicht).
Konfidenzintervalle und Tests auf Normalverteilung
Korrelation & Skalentransformation
Ökonometrie und Statistik Unabhängigkeitstest, c² - Test (Chi Quadrat Test) Dr. Bertram Wassermann.
Ökonometrie und Statistik Datamining und Big Data anhand von Fallbeispielen Dr. Bertram Wassermann.
Ökonometrie und Statistik Wiederholung
 Präsentation transkript:

Ökonometrie und Statistik Wiederholung Dr. Bertram Wassermann

Übersicht I Grundbegriffe II Verfahren für nominal - skalierte Daten III Verfahren für ordinal - skalierte Daten IV Verfahren für intervall – skalierte Daten

Was sind Daten? Daten sind eine Sammlung von Merkmalen bzw. Messungen von Informationen über eine gegebene Menge von Objekten bzw. Beobachtungseinheiten. Beobachtungseinheiten Konsumenten Kunden Firmen Patienten Versuchstiere Abteilungen Vulkane Regionen … Merkmale, Messungen Gekaufte Einheiten Qualität (Gold, Silber, Bronze) Größe Heilung (ganz, teils, gar nicht) Aufgabe erfolgreich gelöst? Produktivität letzte Aktivität Kaufkraft …

Typisches Datenformat: Tabelle Merkmale bilden die Spalten (werden auch Variablen oder Variaten genannt) Beobachtungseinheiten bilden die Zeilen M1 M2 M3 M(m-1) Mm Nr.1 Nr.2 Nr.3 Nr. n-1 Nr. n M M G K Mai 50 Jun 68 Jan 67 Dez 84 12,5 1 2 5 4 M 1,3 W 27,4 W 18,8 M Merkmalsausprägungen werden gemessen, beobachtet und in den Zellen eingetragen.

Ablauf: Der statistische Analyseprozess Grundgesamtheit (Population von Individuen für die eine Fragen beantwortet werden soll) Schließende Statistik Rückschlüsse auf die Grundgesamtheit mittels der durch die Stichprobe gewonnenen Informationen   Ziehen einer Stichprobe. Stichprobe Daten-management Beschreibung der Stichprobe. Datensatz Nr.1 Nr.2 Nr.3 Nr. n-1 Nr. n M1 M2 M3 M(m-1) Mm M W 12,5 1,3 27,4 18,8 1 2 5 4 G K Mai 50 Jun 68 Jan 67 Dez 84 Deskriptive Statistik

Skalenniveaus Skalenniveaus Aus- prägungen Zulässige Operation Beispiel Haarfarbe, Religionsbekenntnis, Nationalität, Name einer Firma, etc. sind nur Namen Nominal = Abschlussnote, Versicherungskategorien (Hohes, mittleres, geringes Risiko); Subjektives Temperaturempfinden (,,heiß“, ,,warm“ ,,lauwarm“, ,,kalt“) etc. Skalenniveaus haben eine Reihenfolge = < > Ordinal Differenzen sind interpretierbar Temperatur (in Celsius oder Fahrenheit) Alter (in Jahren) Gewicht (in kg) Einkommen (in Euro) Telefonieminuten = + / - < > Intervall Verhältnisse sind interpretierbar = + / - < > * / : Alter (in Jahren) Gewicht (in kg) Einkommen (in Euro) Telefonieminuten Verhältnis

Skalenniveaus Informationsgehalt hoch gering Metrische Skala (Intervall- und Verhältnisskala) Ordinalskala Nominalskala Informationsgehalt hoch gering

Alternative Einteilung von Merkmalen Kategorielles Merkmal: endlich viele Ausprägungen (nach oben beschränkt); z.B. Geschlecht, Noten Spezialfall: Dichotome Variable Diskretes Merkmal: Ausprägung entspricht einer beliebigen natürlichen Zahl. Jedes kategorielle Merkmal ist auch diskret, aber nicht umgekehrt z.B. Telefonieminuten pro Monat und Kunde Stetiges Merkmal: Ausprägung entspricht einer reellen Zahl, theoretisch können alle Werte in einem bestimmten Intervall angenommen werden. z.B. Alter, Temperatur.

Unterscheidung der Methoden in der deskriptiven Statistik Anzahl der Variablen in der Analyse Beispiel Univariat Bivariat Multivariat Nominal Häufigkeiten Kreuztabelle Ordinal Ranking Etc. Intervall Mittelwert Regression Verhältnis Skalenniveaus Bei Bivariaten und Multivariaten Analysen kommt es in der Regel zu einer Mischung der Skalenniveaus

Übersicht I Grundbegriffe II Verfahren für nominal - skalierte Daten III Verfahren für ordinal - skalierte Daten IV Verfahren für intervall – skalierte Daten

Maßzahlen für eine nominale Variable Für jede Ausprägung: absolute Häufigkeit relative Häufigkeit und prozentuelle Häufigkeit. Für das Merkmal insgesamt: Der Modus, die häufigste Ausprägung.

Maßzahlen für zwei nominale Variable Für jede Ausprägung: zusätzlich … Kreuztabelle mit den Kennzahlen Absolute Häufigkeit Gesamtprozent Zeilenprozent Spaltenprozent Grün Gelb Blau Gesamt Frau 5 5,5% 16,6% 14,3% 10 11,1% 33,3% 15 50,0% 60,0% 30 100,0% Mann 85,7% 20 22,2% 66,6% 10 11,1% 40,0% 60 35 38,8% 25 27,7% 90

Übersicht I Grundbegriffe II Verfahren für nominal - skalierte Daten III Verfahren für ordinal - skalierte Daten IV Verfahren für intervall – skalierte Daten

Maßzahlen für eine ordinale Variable Für jede Ausprägung: Alle Maßzahlen wie für nominal skalierte Daten und zusätzlich kumulierte absolute Häufigkeit kumulierte relative Häufigkeit

Weitere Maßzahlen für eine ordinale Variable Für das Merkmal insgesamt: Alle Maßzahlen wie für nominal skalierte Daten und zusätzlich kleinster Wert oder Minimum größter Wert oder Maximum q – Quantil oder q*100% – Perzentil Spezialfälle 0.25 – Quantil = 1. Quartil 0.50 – Quantil = 2. Quartil = der Median 0.75 – Quantil = 3. Quartil

Übersicht I Grundbegriffe II Verfahren für nominal - skalierte Daten III Verfahren für ordinal - skalierte Daten IV Verfahren für intervall – skalierte Daten

Maßzahlen für eine metrische Variable Für das Merkmal insgesamt: Alle Maßzahlen für nominal oder ordinal skalierte Daten und zusätzlich Lagemaße wie arithmetisches, geometrisches oder harmonisches Mittel, gewichtet oder ungewichtet. Streuungsmaße wie Varianz, Standardabweichung, Variationskoeffizient, Spannweite oder Quartilsabstand Schiefemaße

Mittelwert und Varianz Größe der Stichprobe = n Daten der Stichprobe: x1, x2, …, xn Arithmetisches Mittel: Varianz: Standardabweichung: Variationskoeffizient: Spannweite: Maximum - Minimum Quartilsabstand: 3. Quartil - 1. Quartil

Die Schiefe Verteilung symmetrisch: α3= 0 rechts schief: α3> 0 links schief: α3< 0 Verteilung symmetrisch: Mittelwert = Median rechts schief: Mittelwert rechts von Median links schief: Mittelwert links von Median

Zusammenfassung Kennzahlen Univariat Bivariat Nominal absolute Häufigkeit Kreuztabelle relative Häufigkeit Spaltenprozent prozentuelle Häufigkeit Zeilenprozent Modus Ordinal kumulierte absolute Häufigkeit kumulierte relative Häufigkeit kumulierte prozentuelle Häufigkeit Minimum, Maximum, (Nicht die Spannweite!) Lage Streuung Schiefe Median Quartile, Perzentile Metrisch Mittelwert Standartabweichung 3.tes Moment Spannweite Quartilsabstand Mittelwert - Median Skalenniveaus

Zusammenfassung Grafik Univariat Bivariat Nominal Säulendiagramm gruppiertes Balkendiagramm Balkendiagramm Kreisdiagramm gestapeltes Balkendiagramm Ordinal Summenpolygone Metrisch Histogramm Mittelwertsplots Box-Whiskers - Plot Skalenniveaus

Übersicht V Bivariate Verfahren für metrische Daten A Reduktion B Eine nominale Variable und eine metrische Variable C Zwei metrische Variablen