Seminar: Datenerhebung

Slides:



Advertisements
Ähnliche Präsentationen
Darstellung der Notenverteilung einer Probearbeit in einem Diagramm (Excel) Hier lernst Du, wie Du die Notenverteilung einer Probe in einem Diagramm darstellen.
Advertisements

Aufgabe Analyse (Friedman-Test) von letzter Stunde wiederholen
Aufgabe Analyse (Friedman-Test) von letzter Stunde wiederholen
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Forschungsstatistik II
Eine Einführung in OpenOffice. Was? Freies Office-Paket mit offenem Quellcode Erste funktionierende Version im Oktober 2001 veröffentlicht Basiert auf.
Einführung in SPSS 16 Die Software SPSS ist ein modular aufgebautes Programmpaket zur statistischen Analyse von Daten. Das Basismodul ermöglicht das grundlegende.
Hypothesen testen: Grundidee
Deskriptive Statistik und Wahrscheinlichkeitstheorie
Nachholung der Vorlesung vom Freitag
Vorlesung Die Vorlesung Statistische Methoden II nächste Woche vom 6. Juni ( nächste Woche ) wird auf den 4. Juni (Mittwoch) vorverlegt ! 14 – 16 Zeit:
Vorlesung Die Vorlesung Statistische Methoden II in 2 Wochen vom 6. Juni ( in 2 Wochen ) wird auf den 4. Juni (Mittwoch) vorverlegt ! 14 – 16 Zeit: 14.
Chi-Quadrat-Test auf Unabhängigkeit I
Median Merkmal Geordneter Datensatz
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Chi-Quadrat-Tests. Satz von Karl Pearson I X: Stichprobenvariable, die r > 2 verschieden Werte annehmen kann: Die Verteilung von X ist durch einen Wahrscheinlichkeitsvektor.
Univariate Statistik M. Kresken.
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Das wars!.
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Seminar: Datenerhebung
Daten auswerten Boxplots
Histogramm/empirische Verteilung Verteilungen
Sarah Brodhäcker. Fragestellung: Wirkt sich der zweistündige Konsum einer Dauerwerbesendung (Die multifunktionale Gemüsereibe) eines nationalen Homeshopping-
Seminar: Datenerhebung
Mathematik STATISTIK Viktoria Kozdron, 5AK VBS Augarten.
Gesunde Ernährung 10 Regeln bei der Ernährung
SPSS für Windows Auswertung von Marktforschungsdaten mit SPSS für Windows WINDER Thomas Porzellangasse 32, 1090 Wien.
Aufgabenzettel V Statistik I
Fast Food – Big Body !.
Seminar: Datenerhebung
Seminar: Datenerhebung
Seminar: Datenerhebung
Seminar: Datenerhebung
Seminar: Datenerhebung
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) 3. Ausgaben ( ) Wiederholung Tabellen,
Seminar: Datenerhebung
Einführung in SPSS/PASW. Eckdaten Ort: ZIP-Pool Zielgruppe: Primär 3. Semester Bachelor, sekundär Diplomstudierende Zeiten: Dienstags: 10:15-11:45 Uhr.
Seminar: Datenerhebung
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Messwerte, Verteilung, Histogramm, Mittelwert und Standardabweichung
Mittelwert und Standardabweichung
Kennwerte und Boxplots
Tabellen erstellen und aufbereiten
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.
Übergewicht und Untergewicht Von Kathrin, Marina und Martina St.
1 Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Einführung Lernmodul Nutzungsbedingungen:
Willkommen in der Welt der effizienten Datenanalyse! Seite 1 Dr. Franz Weissenböck.
Referat über das Thema STOCHASTIK.
Data Mining Georg Pölzlbauer.
Deskriptive Statistik
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Veranstaltung 4.
Statistik – Wahrscheinlichkeit
Erheben, berechnen und darstellen von Daten
Dick, Dünn und dazwischen
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Verteilungen, Varianz Tamara Katschnig.
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Mathe Hausaufgabe Von Joschka und Niklas.
Statistik III Statistik III 2. Streuungsmaße (Dispersionsmaße)
Statistik I Statistik I Statistische Grundbegriffe
SPSS – Kurs Übungen.
Ökonometrie und Statistik Wiederholung
Ökonometrie und Statistik Wiederholung
Ökonometrie und Statistik Wiederholung
 Präsentation transkript:

Seminar: Datenerhebung Einführung in SPSS/PASW Seminar: Datenerhebung

Inhaltsübersicht Intro (02.11.2010) Deskriptive Statistik (09.11.2010) Ausgaben (16.11.2010) Wiederholung Tabellen, Kreuztabellen Diagramme So far so good. Ich werde abhängig davon wie weit wir kommen immer nur 1 Woche im Voraus Inhalte planen. Prinzipiell geht es darum alle Inhalte abzuarbeiten, die in Statistik II gelesen wurden, um anschließend vorlesungsbegleitend Statistik I aufzuarbeiten.

Aufgaben zur Festigung (1/2) Laden Sie die SPSS Datendatei „broca-01.sav“. Berechnen Sie als neue Variablen des sogenannte Broca-Idealgewicht (groesse-100) und den sogenannten Broca-Index (gewicht/Broca-Idealgewicht) aus den Variablen gewicht (Gewicht in Kilogramm) und groesse (Körpergröße in Zentimeter). Berechnen Sie als neue Variable den sogenannten Body-Mass- Index (BMI). Der Wert berechnet sich gemäß folgender Formel, wobei vorher die Größe in Meter umgerechnet werden muß: bmi= gewicht / (groesse_in_m * groesse_in_m) Berechnen Sie für die Datendatei „broca-01.sav“ als neue Variable zusätzlich die Gruppe „bmi_gruppe“ gemäß der Tabelle „BMI – Einteilung in Gruppen“. Broca-Index Der Broca-Index ist ein, nach dem französischen Chirurgen und Anthropologen Pierre Broca (1824 bis 1880) benannter Index um das Normalgewicht zu berechnen. Als Normalgewicht wird das Gewicht bezeichnet, bei dem ein Mensch weder unter- noch übergewichtig ist. Das Broca-Normalgewicht wird, wie folgt berechnet: Körpergröße in cm minus 100. (Beispiel: 175 cm - 100 = 75 kg) Der Broca-Index wird, wie folgt berechnet: Körpergewicht dividiert durch Broca-Normalgewicht. (Beispiel: 70 kg / 75 kg = 0,93) Entspricht das Körpergewicht dem Normalgewicht, liegt der Broca-Index bei 1,0. Wünschenswert ist ein Index zwischen 0,85 und 1,0. Neben dem Normalgewicht lässt sich mit dem Broca-Index das Idealgewicht wie folgt berechnen: Bei Männern werden 10 Prozent, bei Frauen 15 Prozent vom Broca-Normalgewicht abgezogen. (Beispiel (Mann): 75 kg - 11,25kg = 63,75 kg) Nach früheren Vorstellungen war das Idealgewicht das Gewicht mit den geringsten Gesundheitsrisiken und der höchsten Lebenserwartung. Untersuchungen haben jedoch ergeben, dass das Gewicht, welches mit der höchsten Lebenserwartung korreliert, meist über dem Broca-Index liegt. Übergewicht liegt dann vor, wenn das Körpergewicht über zehn Prozent über dem Normalgewicht der Broca Formel liegt. Gesundheitsgefährdendes Übergewicht beginnt bei Überschreiten um 20 Prozent des Normalgewichts. Kritisiert wird, dass der Broca Index vor allem bei kleinen Menschen ein zu niedriges, bei großen Menschen ein zu hohes Normal- bzw. Idealgewicht ergibt. BMI Präadipositas (Übergewicht im engeren Sinne) 25–29,9 Adipositas Grad I 30–34,9 Adipositas Grad II 35–39,9 Adipositas Grad III > 40 Werte-Etikett BMI-Bereich BMI-Gruppe Untergewichtig > 18.5 -1 Normal 18.5 – 25 BMI Präadipositas 25-29,9 1 Adipositas Grad I 30-34,9 2 Adipositas Grad II 35-39,9 3 Adipositas Grad III 40 4

Aufgaben zur Festigung (2/2) Berechnen Sie für die SPSS Datendatei „schueler.sav“ für die Variable physik die Kennzahlen Mittelwert, Minimum, Maximum, Spannweite, Varianz, Standardabweichung und Median. Wie können Sie die Klasse hinsichtlich der Variablen „physik“ in 3 gleichgrosse Leistungsgruppen einteilen (stark, mittel, schwach)? Welche Schüler, identifiziert anhand der Variablen „nr“ befinden sich in der Gruppe „mittel“? Berechnen Sie die Kennzahlen Mittelwert, Minimum, Maximum, Spannweite,Varianz, Standardabweichung und Median für die Variable „physik“ getrennt nach Mädchen und Jungen. Ermitteln Sie bezogen auf die SPSS Datendatei „schueler.sav“ in welchem Fach es jeweils die größte Spannweite, die größte Varianz und den größten bzw. kleinsten Mittelwert gibt. Welche Schlüsse würden Sie als Klassenlehrer aus diesen Ergebnissen ziehen? (für Leute, die frühzeitig fertig sind) Was ist die Schiefe einer empirischen Verteilung? Kann eine Stichprobe mit "extrem schiefer" empirischer Verteilung approximativ normal-verteilt sein? Was ist die Kurtosis einer empirischen Verteilung? Schiefe – wird vom Kolmogorow-Smirnow-Test verwendet – Optimierung von KS auf Normalverteilung ist Lilliefors-Test Kurtosis (Wölbung) – Maßzahl für die Steilheit einer (eingipfeligen Verteilung)

Weitere Kennzahlen Kurtosis (β2) / Exzess (γ2) β2 =3 / γ2 = 0  normalgipfelig (Normalverteilung) γ2 > 0  steilgipfelig: γ2 < 0  flachgipfelig: Schiefe einer Verteilung rechtsschief (v > 0): linksschief (v < 0): Der Kolmogorow-Smirnow-Test verwendet die Schiefe als Maßzahl, um zu prüfen ob etwas noch normalverteilt ist. Grafiken von: www.wikipedia.org

Einschub: Skalierung Welche Skalenniveaus gibt es und was bedeuten sie? Nominalskalenniveau Gleich/ungleich Ordinalskalenniveau Größer/kleiner Intervalskalenniveau Plus/minus Verhältnisskalenniveau Mal/geteilt Geschlecht Schulnoten Zeitskale (Datum) Alter

Aufgabe zur Skalierung Welche Skalierung (Wertebereich, Maßeinheit, Messniveau, ggf. Meßgenauigkeit) würden Sie für folgende Variablen wählen? Sympathiewerte für Politiker Schulnoten Europäische Staaten Bundesländer Zeitmessung für 50km-Skilanglauf Zeitmessung für 100-m-Lauf

Erstellen einfacher Tabellen Berechnen von Häufigkeiten Wir öffnen: sonntagsfrage-01.sav Wählt: Analysieren > Deskriptive Statistiken > Häufigkeiten Wählt die Variable: partei

Erstellen von Kreuztabellen Mittels Kreuztabellen lassen sich die Häufigkeiten für mehrere Variablen und deren Kombinationen gleichzeitig auszählen. Wählt: Analysieren > Deskriptive Statistiken > Kreuztabellen Zeilen: partei Spalten: Geschlecht (sex) Einkommenssteuer – Allgemeine Zufriedenheit

Aufgaben zu Tabellen Führen Sie für die SPSS Datendatei "schueler.sav" (Noten einer Klasse in einzelnen Fächern) Häufigkeitsauszählungen für die Variablen „deutsch“ und „physik“ durch. Führen Sie die Häufigkeitsauszählungen erneut aus, diesmal in einer Kreuztabelle, getrennt nach Jungen und Mädchen. Fügen Sie einen (fiktiven) Datensatz für einen Schüler hinzu, für den keine Noten in Deutsch und Physik vorliegen, und führen Sie die Berechnungen erneut durch. Wo ergeben sich Unterschiede? In der SPSS Datendatei „sonntagsfrage-03.sav“ ist offensichtlich ein Eingabefehler, welcher? Wie können Sie diesen Fehler erkennen und beseitigen? Erzeugen Sie für die SPSS Datendatei „sonntagsfrage-01.sav“ eine neue Variable "a_gruppe" mit der Einteilung 1=„bis 25“, 2=„25-40“ und 3=„40-65“ und 4="über 65". Erstellen Sie eine Kreuztabelle mit "agruppe/ partei" (Partei: horizontal und Altersgruppe: vertikal). Führen Sie für die SPSS Datendatei „sonntagsfrage-01.sav“ eine Kreuztabelle mit "agruppe/partei" und der zusätzlichen Gruppierung (Schichtung) nach der Variablen „sex“ durch.

Erstellen von Diagrammen Die visuelle Darstellung dient als Ergänzung zur tabellarischen Darstellung und hilft häufig, Verhältnisse und absolute Werte zu verdeutlichen und ggf. auch interessante Zusammenhänge im Datenmaterial zu entdecken, getreu dem Motto: 1 picture is worth a 1000 words

Erstellen eines Balkendiagrams Öffnet: sonntagsfrage-01.sav Wählt: Diagramme > Veraltete Dialogfelder > Balken Wählt: Einfach Auswertung über Kategorien einer Variablen Anzahl der Fälle

Erstellen eines gruppierten Balkendiagrams Wählt: Diagramme > Veraltete Dialogfelder > Balken Wählt: Gruppiert Auswertung über Kategorien einer Variablen Anzahl der Fälle

Übungen zu Diagrammen Erzeugen Sie folgende Diagramme für die SPSS Datendatei „sonntagsfrage-01.sav“: Tortendiagramm für partei gestapeltes Balkendiagramm für partei mit Gruppierung nach einer Altersgruppe, zum Beispiel nach „g_alter“. Exportieren Sie das Tortendiagramm aus Übung 1a in das Format PNG (Portable Network Graphic) oder „WMF“ (Windwos Metafile) und fügen sie das Diagramm in ein Word- bzw. OpenOffice- Dokument ein - oder in eine Powerpoint Präsentation Vergleichen Sie mit einem Kopieren/Einfügen über die Windows Zwischenablage.

Referenzen Übungen und Datensätze adaptiert aus: Statistische Datenanalyse mit SPSS für Windows: Grundlegende Konzepte und Techniken, Universität Osnabrück. Rechenzentrum, Dipl.-Math. Frank Elsner

Vielen Dank für Eure Aufmerksamkeit