Deskriptive Statistik und Wahrscheinlichkeitstheorie

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
Was ist Testtheorie?.
Merkmale Beispiele Anwendung Träger Autos Menschen Völker Jahre
CPCP Institute of Clinical Pharmacology AGAH Annual Meeting, 29. Februar 2004, Berlin, Praktischer Umgang mit den Genehmigungsanträgen gemäß 12. AMG Novelle.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
Messen „Messen ist die Bestimmung der Ausprägung einer
Bewegungswissenschaft
Workshop zur Medienarbeit der katholischen Kirche Aspekte des Religionsmonitors Berlin, 02. April 2008.
1 JIM-Studie 2010 Jugend, Information, (Multi-)Media Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Forschungsstatistik I
WS Algorithmentheorie 02 - Polynomprodukt und Fast Fourier Transformation Prof. Dr. Th. Ottmann.
Kapitel 6 Differenzierbarkeit. Kapitel 6: Differenzierbarkeit © Beutelspacher Juni 2005 Seite 2 Inhalt 6.1 Die Definition 6.2 Die Eigenschaften 6.3 Extremwerte.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Grundkurs Theoretische Informatik, Folie 2.1 © 2006 G. Vossen,K.-U. Witt Grundkurs Theoretische Informatik Kapitel 2 Gottfried Vossen Kurt-Ulrich Witt.
Internet facts 2008-II Graphiken zu dem Berichtsband AGOF e.V. September 2008.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Astronomisch, Physikalische und Mathematische Geodäsie II
AC Analyse.
Diskurs Fragebögen Auswertung.
Statistiktutorat Sitzung 1: Grundbegriffe der Statistik
Statistiktutorat Thema 1: Grundbegriffe der Statistik
Schieferdeckarten Dach.ppt
Statistische Methoden I WS 2004/2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.
Univariate Statistik M. Kresken.
Grundbegriffe M. Kresken.
Prof. Dr. Bernhard Wasmayr VWL 2. Semester
Heute: Scherenzange zeichnen
Distanzbasierte Sprachkommunikation für Peer-to-Peer-Spiele
2 Distanzbasierte Sprachkommunikation für Peer-to-Peer-Spiele.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
20:00.
Die Geschichte von Rudi
Chi Quadrat Test Tamara Katschnig.
Statistisches Basiswissen
für Weihnachten oder als Tischdekoration für das ganze Jahr
STATISIK LV Nr.: 1375 SS März 2005.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
NEU! 1 2. Wo kommt diese Art von Rezeptor im Körper vor?
PROCAM Score Alter (Jahre)
Referat über das Thema STOCHASTIK.
Geometrische Aufgaben
Vorlesung Mai 2000 Konstruktion des Voronoi-Diagramms II
Symmetrische Blockchiffren DES – der Data Encryption Standard
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Großer Altersunterschied bei Paaren fällt nicht auf!
Zahlentheorie und Zahlenspiele Hartmut Menzer, Ingo Althöfer ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List.
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
1 Mathematical Programming Nichtlineare Programmierung.
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
Es war einmal ein Haus
J-Team: Gymnasium Ulricianum Aurich und MTV Aurich Ein Projekt im Rahmen von UlricianumBewegt.de Euro haben wir schon…  8000 mal habt ihr bereits.
1 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt Wie.
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Monatsbericht Ausgleichsenergiemarkt Gas – Oktober
Messen Zuordnung von Zahlen zu Objekten/Ereignissen gemäß Regeln
Ökonometrie und Statistik Wiederholung
Korrelation & Skalentransformation
 Präsentation transkript:

Deskriptive Statistik und Wahrscheinlichkeitstheorie Tutorat Deskriptive Statistik und Wahrscheinlichkeitstheorie theotoppe@gmail.com rau.ricky@gmail.com

In Kleingruppen Kurze Vorstellung Was erwarten wir von dem Fach Statistik? Was erwarten wir vom Tutorat? Warum brauchen Psychologen Statistik? Schätzt euch individuell auf einer Skala von 1 (gar nicht) bis 5 (völlig zutreffend) ein und berichtet den Mittelwert (arithmetisches Mittel). Ich freue mich auf die Methodenausbildung. Der Gedanke an die Prüfungen macht mir Angst. Statistik wird mir schwerer fallen als andere Fächer.

Statistik?

Statistik?

Warum Statistik? Voraussetzung, um Forschung kritisch zu betrachten und um ihre Denklogik zu verstehen Zur Beurteilung, wann welche Methoden für eigene Untersuchungen geeignet sind Zur Anwendung und Auswertung psychologischer Tests Um den Bachelor zu erlangen uvm.

Lernziele Wissen,… wie Objekte zu statistisch auswertbaren Daten werden. was Skalenniveaus sind und wovon sie abhängen. welche Transformationen verlustfrei gerechnet werden können. welche große Grauzone in puncto Skalenniveaus existiert.

Was ist deskriptive Statistik? Der Bereich der Statistik, der eine Menge von erhobenen Daten summarisch (und damit überschaubar) darstellt bzw. beschreibt. Die Veranschaulichung kann grafisch oder rein numerisch erfolgen. Wortwörtlich: Beschreibende Statistik.

Daten als Balkendiagramm Eine rein numerische Darstellung dieser Daten wäre z.B: Der mittlere (durchschnittliche) Nitratgehalt in Säuglingsnahrung liegt in unserer Stichprobe bei 52 mg/kg. 

Was ist Inferenzstatistik? Inferenzstatistik bedeutet, aus Stichproben einer Population Rückschlüsse auf die Gesamtpopulation zu ziehen. Wortwörtlich: Schließende Statistik.

Die Verbindung Die Verfahren der Inferenzstatistik verwenden als Datengrundlage ihrer Berechnungen die mittels deskriptiver Statistik erhobenen Kennwerte. Die mathematische Grundlage der Inferenzstatistik bildet die Wahrscheinlichkeitsrechnung oder – theorie.

Der große Rahmen

Datenerhebung Bevor wir Daten deskriptiv beschreiben (und später eventuell inferentiell auswerten) können, müssen selbige Daten zunächst erhoben werden. In einem ersten Schritt werden die Merkmale der untersuchten Personen/Objekte zunächst klassifiziert. In einem zweiten Schritt werden die nun klassifizierten Merkmale in Zahlen überführt.

Klassifikationskriterium I Qualitativ vs. Quantitativ Qualitative Merkmale beschreiben die Zugehörigkeit einer Person oder eines Objektes zu einer Kategorie. Beispiele: Studienfach, Geschlecht Quantitative Merkmale beschreiben die Ausprägung eines Merkmals auf einem Kontinuum. Beispiele: Extraversion, Zeit, Anzahl

Klassifikationskriterium II Manifest vs. Latent Manifeste Merkmale können direkt beobachtet oder gemessen werden. Latente Merkmale (synonym: Konstrukte) sind nur indirekt zu erfassen. Dies geschieht durch Rückschluss aus manifesten Merkmalen. Wie sind unsere Merkmale Haarfarbe, Herkunftsland, Körpergröße und Extraversion einzuordnen? Manifest: Haarfarbe, Nationalität, Körpergröße Latent: Extraversion, Mut, Intelligenz

Überblick: Klassifikation von Merkmalen

Vom Merkmal zur Variable In Schritt 2 der Datenerhebung müssen wir die nun klassifizierten Merkmale in Zahlen überführen. Dies geschieht durch eine Operationalisierung. Die Operationalisierung definiert, wie unterschiedliche Ausprägungen eines Merkmals in Zahlen übertragen (=kodiert) werden. Man spricht nun von einer Variable.

Beispiele für Operationalisierungen Die Variable „Haar“ soll die Haarfarbe erfassen. Es wird der Wert 1 für blond, der Wert 2 für schwarz und der Wert 3 für rot verwendet. Die Variable „Größe“ soll die Körpergröße der untersuchten Personen in cm erfassen. Die Variable „extr“ soll die mittels Fragebogen selbst eingeschätzte Extraversion auf einer Skala von 0 (maximal introvertiert) bis 10 (maximal extravertiert) erfassen.

Definition „Messung“ Messen ist eine Zuordnung von Zahlen zu Objekten oder Ereignissen, sofern diese Zuordnung eine homomorphe Abbildung eines empirischen Relativs in ein numerisches Relativ ist (Ort, 1983).

Tutorat Deskriptive Statistik Numerisches Relativ Empirisches Relativ

Tutorat Deskriptive Statistik

Klassifikation von Variablen Analog zu Merkmalen werden auch Variablen klassifiziert. Manifest vs. latent: entspricht dem zugrunde liegenden Merkmal Diskret vs. kontinuierlich (→ qualitativ vs. quantitativ)

Diskrete vs. kontinuierliche Variablen Die Anzahl der möglichen Werte ist endlich und damit genau abzählbar. Beispiel: Anzahl Personen in einem Tutorat Kontinuierlich / Stetig Die Variable kann auf einem beliebig genauem Kontinuum beschrieben werden, d.h. ihre Anzahl geht potentiell gegen unendlich. Beispiel: Temperatur, Körpergröße

Diskrete vs. kontinuierliche Variablen Diskret oder kontinuierlich? Beruf (Bezeichnung) diskret Reaktionszeit (in ms) kontinuierlich Parteizugehörigkeit Tierart Gewicht (in kg)

Schaubild Merkmal & Variable Operationalisierung Merkmal Variable latent/manifest diskret kontinuierlich qualitativ quantitativ

Variable und Skalenniveau In der Statistik ordnet man Variablen ein so genanntes Skalenniveau zu. Diese Skalenniveau hat folgende Konsequenzen: Es bestimmt, welche mathematischen Operationen (Tests) mit einer Variable durchgeführt werden können. Welche Transformationen von Variablen möglich sind, ohne Information zu verlieren (d.h. das Skalenniveau zu senken). Welche Aussagen meine Daten zulassen.

Transformationen Man rechnet alle Daten mit einer bestimmten Formel um. Beispiel: Sekunden in Millisekunden umrechnen. Jedes Skalenniveau erlaubt bestimmte verlustfreie Transformationen !

Die 4 Skalenniveaus Die Nominalskala Die Ordinalskala Man unterscheidet 4 Skalenniveaus: Die Nominalskala Die Ordinalskala Die Intervallskala (metrisch) Die Verhältnisskala (metrisch)

Die 4 Skalenniveaus Dabei steigt die Messgenauigkeit bzw. Aussagekraft der Daten von 1 nach 4 an. Viele für die Psychologie relevante Testverfahren setzten mindestens Intervallskalenniveau voraus.  Daten auf einem möglichst hohem Skalenniveau erfassen!

Wovon hängt das Skalenniveau ab? Vom untersuchten Merkmal selbst: Geschlecht kann z.B. nur auf Nominalskalenniveau erhoben werden. Von der Operationalisierung des Merkmals: Schulleistung in Note oder in „sitzen geblieben“ vs. „nicht sitzen geblieben“

Welches Skalenniveau? Drei Arten der Erfassung des Merkmals „Depressivität“ Typologie: 0 = keine Störung 1 = Störung nominal Abgestufte Typologie: 0 = nicht beeinträchtigt 1 = wenig beeinträchtigt 2 = eher beeinträchtigt 3 = klinisch relevante Beeinträchtigung ordinal Kontinuierliche (dimensionale) Erfassung: Testergebnis in einem klinischen Interview (z.B. BDI 0-63) metrisch

Die Nominalskala Es werden „Namen“ (Zahlenwerte) für jede Merkmalsausprägung vergeben. Beispiel: Geschlecht („m“ / „w“); in SPSS wird dann eingegeben m=1, w=2 Zwei Annahmen müssen berücksichtigt werden: Exklusivität: Unterschiedliche Merkmalsausprägungen werden unterschiedlichen Zahlen zugeordnet. Exhaustivität: Jeder beobachteten Merkmalsausprägung wird eine Zahl zugeordnet.

Die Nominalskala Aussagekraft von Variablenwerten: Information über Gleichheit / Verschiedenheit der Merkmalsausprägung (Keine Aussagen zu größer/kleiner Relationen). Mögliche Transformationen: Es sind alle eineindeutigen Transformationen erlaubt: weiblich = 1; männlich = 2 oder weiblich = 2; männlich = 1 oder weiblich = 100; männlich = 200

Eineindeutig? Eindeutig: Jedem Element der Menge A kann ein Element der Menge B zugeordnet werden. Eineindeutig: Zusätzlich kann jedem Element der Menge B auch genau ein Element der Menge A zugeordnet werden. Merkmal „Herkunft“ (Menge A) Variable „stadt“ (Menge B) Bochum „1“ Ulm „2“ Heidelberg „3“ „4“ Kassel

Die Ordinalskala Beispiel: Schulabschluss Bei der Ordinalskala (Sonderfall: Rangskala) geben die Variablenwerte Aufschluss über die Rangfolge der Merkmalsträger bezüglich des gemessenen Merkmals. Beispiel: Schulabschluss 0 = kein SA 1 = Hauptschule 2 = Realschule 3 = Gymnasium Zusätzliche Annahme der Operationalisierung: Die zugeordneten Zahlen repräsentieren eine Rangreihe der Merkmalsausprägung.

Die Ordinalskala Aussagekraft von Variablenwerten: Information über Gleichheit / Verschiedenheit der Merkmalsausprägung, Größer / Kleiner Relationen Mögliche Transformationen: Erlaubt sind nur noch alle monotonen Transformationen. Beispiele: y = x + 3 y = 2x y = log(x)

Monotone Funktion A

Monotone Funktion B

Nicht-monotone Funktion A

Transformationen y =x², monoton oder nicht monoton? Antwort: Kommt darauf an. Nur wenn für unseren Definitionsbereich gilt x ≥ 0. Wer nicht sattelfest in Algebra ist, braucht sich keine Sorgen machen. Es werden keine fiesen Transformationen abgefragt und eure eigenen dürft ihr so einfach (und so auswendig) wie nötig gestalten.

Die Intervallskala Bei der Intervallskala geben die Variablenwerte Aufschluss über die Abstände zwischen Merkmalsausprägungen. Beispiel: Ergebnisse eines Intelligenztests: Peter = 115; Anne = 130 → Differenz 15 Punkte Zusätzliche Annahme der Operationalisierung: Gleich große Intervalle zwischen Zahlenwerten der Variable repräsentieren gleich große Abstände in der Merkmalsausprägung.

Die Intervallskala Aussagekraft von Variablenwerten: Information über Gleichheit / Verschiedenheit der Merkmalsausprägung, Größer / Kleiner Relationen Größe von Unterschieden Mögliche Transformationen: Erlaubt sind nur noch lineare Transformationen (y = ax+b). Beispiele: y = x -100 y = 0.1 x

Die Verhältnisskala Die Verhältnisskala kann vor allem bei der Messung physikalischer Größen (Länge, Gewicht, Zeit) angenommen werden. Beispiel: Reaktionszeit (ms). Zusätzliche Annahme für die Operationalisierung: Die Skala hat einen definierten Null-Punkt.

Die Verhältnisskala Aussagekraft von Variablenwerten: Information über Gleichheit / Verschiedenheit der Merkmalsausprägung Größer / Kleiner Relationen Größe von Unterschieden Verhältnis von Merkmalsausprägungen (z.B. doppelte Reaktionszeit) Mögliche Transformationen: Erlaubt sind nur noch alle multiplikativen Transformationen (y = ax). Beispiele: y = 0.001 ∙ x (Umrechnung von Millisekunden in Sekunden) y = 24 ∙ x (Umrechnung von Jahren in Monate) → Transformationen können z.B. dazu dienen, Daten aus verschiedenen Studien zusammenzuführen.

Überblick Skalenniveaus

Skalenniveaus und Informationsgewinn

Die große Grauzone Oft ist nicht eindeutig, ob eine Variable als ordinal- oder als intervallskaliert zu betrachten ist. Die Grauzone beginnt dort, wo die Variable mehr Information als „Größer/Kleiner“ Relation beinhaltet und endet dort, wo gesichert ist, dass Gleichheit der Intervalle gegeben ist. Letzteres muss in jedem Einzelfall theoretisch begründet werden.

Lernziele Wissen,… wie Objekte zu statistisch auswertbaren Daten werden. was Skalenniveaus sind und wovon sie abhängen. welche Transformationen verlustfrei gerechnet werden können. welche große Grauzone in puncto Skalenniveaus existiert.

Arbeitsblatt Aufgabe 1.1

Arbeitsblatt Aufgabe 1.2

Arbeitsblatt Aufgabe 1.3

Arbeitsblatt Aufgabe 1.4

Arbeitsblatt Aufgabe 1.5

Arbeitsblatt Aufgabe 1.6

Vielen Dank für eure Aufmerksamkeit! Bis nächste Woche Fragen an rau.ricky@gmail.com theotoppe@gmail.com