Statistische und testtheoretische Grundlagen für die Anwendung, Auswertung und Interpretation psychometrischer Verfahren.

Slides:



Advertisements
Ähnliche Präsentationen
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Advertisements

Was ist Testtheorie?.
Berechnung des Korrelationskoeffizienten Vorbemerkung. Der Korrelationskoeffizient ist im Grunde ein Bruch aus 3 unvollständig berechneten statistischen.
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Bewegungswissenschaft
Evaluation – Grundlagen im Rahmen des Moduls zur Qualifizierung der SLK in Niedersachsen.
Theorie psychometrischer Tests, III
Lautbildungstest für Vorschulkinder
Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.
Gliederung Definition des Wahrscheinlichkeitsbegriffes
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Heute Prüfung der Produkt-Moment Korrelation
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Optimale Kombination mehrerer Datenquellen durch Kriging
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Mehrfachregressionen
Hypothesen testen: Grundidee
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Konfidenzintervalle Intervallschätzung
Die Student- oder t-Verteilung
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Forschungsprozess Car
Univariate Statistik M. Kresken.
Über den Einsatz normierter diagnostischer Verfahren in der Arbeitstherapie Von der Anwendung bestehender psychometrischer Tests zur Normierung der eigenen.
Deskriptive Statistik
VL Diagnostische Kompetenz (Bewegungslehre 2) 3
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Diagnostische Statistik
VL Diagnostische Kompetenz (Bewegungslehre 2) 3. Korrelation und Gütekriterien.
Das wars!.
Vorlesung: ANOVA I
Multikollinearität Wann spricht man von Multikollinearität?
Daten auswerten Boxplots
Histogramm/empirische Verteilung Verteilungen
Objektivität, Reliabilität, Validität
Ausgleichungsrechnung I
Ausgleichungsrechnung II
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Chi Quadrat Test Tamara Katschnig.
© Forschungsgruppe Metrik – Damm Deringer & Zinn GbR Streifzug durch die Testtheorie Winfried Zinn.
Aufgabenzettel V Statistik I
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Messwerte, Verteilung, Histogramm, Mittelwert und Standardabweichung
Die Gaußverteilung.
STATISIK LV Nr.: 0028 SS Mai 2005.
Grundlagen der Messtechnik
Referat über das Thema STOCHASTIK.
Theorie psychometrischer Tests, II
Der Zentralwert.
Deskriptive Statistik
Forschungsmethodik II, SS 2010 Vesna Pavlovski & Julia Pichlhöfer
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Testgütekriterien Tamara Katschnig.
Statistik – Regression - Korrelation
Methodische Grundlagen zu standardisierten Erhebungsinstrumenten
Veranstaltung 4.
Vom graphischen Differenzieren
Einführung zur Fehlerrechnung
Empirische Sozialforschung am Beispiel der Limburger Nordstadt
Gegenstand der Psychologie
setzt Linearität des Zusammenhangs voraus
Testtheorie (Vorlesung 13: ) Wiederholung: Richtigstellung
Testtheorie (Vorlesung 12: ) Wiederholung: Reliabilität
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
Statistik III Statistik III 2. Streuungsmaße (Dispersionsmaße)
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Grafische Darstellung von Gruppenunterschieden.
 Präsentation transkript:

Statistische und testtheoretische Grundlagen für die Anwendung, Auswertung und Interpretation psychometrischer Verfahren

Messung / Erfassung von Persönlichkeitsmerkmalen Lassen sich zeitlich stabile Persönlichkeitsmerkmale wie Intelligenz, Kreativität, Motivation, Handgeschick, Ausdauer, Konzentration, Selbstkontrolle, Fleiß… messen wie z. B. die Körpergröße oder das Gewicht eines Menschen?

Hypothetische oder theoretische Konstrukte Die genannten Merkmale einer Person setzen sich in der Regel aus einer Vielzahl innerer Voraussetzungen (Variablen) zusammen, die auf Anlagen und/oder Lernerfahrungen eines Menschen zurückgehen. Da man sie selber nicht unmittelbar beobachten kann, sondern nur ihre Auswirkungen im Verhalten, spricht man von „Hypothetischen Konstrukten“ Eine begründete Anweisung wie bzw. durch welches Verhalten man ein theoretisches Konstrukt messen kann heißt Operaionalisierung

Normen / Vergleichswissen Die Ausprägung eines Merkmals erschließt sich nur durch den Vergleich der Ausprägungen dieses Merkmals bei einer Vielzahl anderer Personen: Beispiel: Nur wenn ich weiß, dass die meisten Menschen zwischen 1,60 und 1,90 m groß sind, kann ich sagen, dass ein 1,95 m großer Mensch größer ist als die Mehrzahl der Menschen

Um also eine genaue Aussage über den Ausprägungsgrad eines (arbeits-)verhaltens-bestimmenden Merkmals zu machen ist es nötig, ein für dieses Merkmal relevantes (Arbeits)Verhalten möglichst exakt zu erfassen (messen) und das Beobachtungsergebnis (Messung) mit einer möglichst repräsentativen Menge an anderen Messergebnissen zu vergleichen zu können. Die Vergleichbarkeit ist nur dann gegeben, wenn die unterschiedlichen Messungen unter den gleichen Bedingungen ablaufen. Die Messung muss also objektiv sein (Bedingungskonstanz, einschließlich des Verhaltens der untersuchenden Person).

Die Mittel, Instrumente, die ich zur Datenerfassung benötige, sollten zuverlässig sein, also bei wiederholtem Einsatz am gleichen Menschen nicht zu unterschiedlichen Ergebnissen führen (Zuverlässigkeit, Fachbegriff = Reliabilität eines Tests). Beispiel: Ein Zollstock wäre ein reliables Instrument zur Messung der Körpergröße, ein Gummiband hingegen wäre unzuverlässig, nicht reliabel.

Schließlich sollte die Messung eine gültige Aussage über das zu erfassende Persönlichkeitsmerkmal liefern, es sollte valide sein. Beispiel: Ein Test , der vorgibt die Konzentration zu messen, sollte auch wirklich einen starken Bezug zur Konzentrationsfähigkeit von Menschen haben und nicht z. B. deren Angst messen.

Testgütekriterien nach Lienert (1969): Objektivität Reliabilität (Zuverlässigkeit) Validität (Gültigkeit) Normierung (statistisches Vergleichswissen) Vergleichbarkeit (Parallelformen bzw. Alternativen) Ökonomie Nützlichkeit

Wie nun lassen sich Messergebnisse statistisch anschaulich aufbereiten bzw. präsentieren und welche Kennwerte sind dabei von besonderer Bedeutung? Hierzu ein Beispiel: Es wurde ein arbeitsdiagnostischer Test / eine Arbeitsprobe entwickelt, bei dem Patienten / Probanden unter gleichen Bedingungen ein Produkt erstellen bzw. eine Leistung erbringen, der man anschließend nach genau festgelegten Kriterien 0 – 10 Punkte zuordnen kann, also einen numerischen Wert.

1. Schritt: Erfassung des Ergebnisses auf einem Protokollbogen:

2. Schritt: Zusammenfassung der Daten in einer Gesamtdatei: Erkrankung 1 = Patient mit Schizophrenie-Erkrankung 2 = Patient mit Depressions-Erkrankung 3 = Patient mit Persönlichkeitsstörung 4 = Patient mit Suchterkrankung 5 = Patient mit unbekannter oder anderer Erkrankung 6 = Mitarbeiter der Klinik Diagnose: ICD-Nr. Aufnahme-Nr. (nur bei Patienten ausfüllen) Höchster Schulabschluß 0= Hauptschule ohne Abschluß oder Sonderschulabschluß 1= Hauptschulabschluß 2= Realschulabschluß 3= Fachhochschulreife 4= Abitur Beschäftigungsstatus 0= keine Arbeit 1= geschützt beschäftigt 2 = Hausfrau/mann 3 = Schüler(in) 4 = Student(in) 5 = allgem. Arbeitsmarkt (ungelernte Tätigk.) / vergleichbare selbstständige Tätig. 6 = allgem. Arbeitsmarkt (Fach- /Ausbildungsberuf) / vergleichb. selbstst. Tätig. 7 = akademische Tätigkeit / leitende(r) Angestellte(r) / vergleichb. selbstst. Tätig. Nr. Test-Datum 9 = sonstig. (nicht Patient)   9 =unbek. Geschl w/m Alter 9= unbekannt Zeit in Sek. (1. Durchgang) Zeit in Sek. (2. Durchgang) Muster 00.00.2000 6 F20.0 4 m 44 7 420 350 1 27.03. 3 F65.4 62 333 272 2 F70.1 F60.8 31 1465 Abbruch F32.1 w 24 5 687 541 28.03. F32.2 43 669 443 F10.2 39 424 389 F20 63 1369 5.04. F25.2 37 394 396 8 F19 47 767 738 9 6.04. 28 678 677 F33 817 793 11 12.04. 801 786 12 515 507 13 19.04. F07.8 36 2037 2016 14 22 587 589

3. Schritt: Darstellung aller Messergebnisse in einer Häufigkeitstabelle

Wesentliche Kennwerte einer Häufigkeitsverteilung Anhand einer Häufigkeitsverteilung können verschiedene Kennwerte berechnet werden: Der Mittelwert, das arithmetische Mittel aller Werte (Durchschnittswert: Summe aller Werte geteilt durch die Anzahl der Werte); Die Standardabweichung oder Streuung ist ein Wert, der angibt wie weit oder eng die verschiedenen Werte sich um den Mittelwert herum verteilen. Je kleiner die Streuung desto schmaler ist die Verteilung und umgekehrt. Die Standardabweichung wird aus der sog Varianz der Verteilung berechnet (mathematisch berechnet sich die Varianz aus der Summe der quadratischen Abweichungen aller Werte vom Mittelwert, geteilt durch die Anzahl der Werte – die Standardabweichung oder Streuung ist die Wurzel der Varianz). Weitere beschreibende statistische Kennwerte sind der Modalwert (der Wert, der am häufigsten vorkommt) und der Medianwert (Mitte der Verteilung mittlerer Wert).

Beispiele unterschiedlicher Formen von Häufigkeitsverteilungen:

Die Standard-Normalverteilung und unterschiedliche Normskalen:

Jetzt noch eine Zumutung aus der schlussfolgernden Statistik und dann haben Sie es geschafft: Der Korrelationskoeffizient ist ein Begriff aus der Statistik / lineare Regression: es wird mathematisch geprüft wie stark der lineare Zusammenhang zwischen zwei Messungen ist; das Ergebnis kann zischen 0 und 1 liegen; bei 0 besteht kein, bei 1 ein perfekter lineare Zusammenhang zwischen beiden Messungen

Darstellung einer Korrelation (Viersener Sortierprobe)