Tests zur Messung von Arbeitszufriedenheit 13.12.2004 Tests zur Messung von Arbeitszufriedenheit Ein Test ist ein wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale. Der Test soll eine möglichst quantitative Aussage über den relativen Merkmalsausprägungsgrad geben (Gruppenvergleiche möglich) Persönlichkeitsmerkmal=relativ dauerhafte Eigenschaft eines Menschen ein Referat von Linda Bohnert und Ina Kaup
Qualitätskriterien für die Beurteilung empirischer Instrumente Hauptgütekriterien Reliabilität Validität Objektivität Nebengütekriterien Operationalität Verständlichkeit Relevanz Innovationspotential Aufwand
Ein Test ist... reliabel, wenn bei wiederholter Messung unter gleichen Bedingungen dasselbe Ergebnis erzielt wird valide, wenn der Test das misst, was er zu messen vorgibt objektiv, wenn das Testergebnis nicht beeinflusst ist Objektiv, wenn weder Durchführung, noch Auswertung oder Versuchsleiter das Ergebnis beeinflussen
Reliabilität Prüfkriterien Retest Paralleltest Innere Konsistenz Kein verfahren ist absolut, da bei jedem unrealistische Voraussetzungen erfüllt sein müssen: Zeitkonstanz des Untersuchungsobjekts bei Retest (=derselbe Test, dieselbe Stichprobe,anderer Zeitpunkt) Ein bereits auf Reliabitiltä geprüftes Instrument für Paralleltest (ein anderer Test, der dasselbe misst soll dieselben Ergebnisse erzielen) Teilbarkeit des Tests und Homogenität des Untersuchungsobjektes bei Innerer/Interner Konsistenz (=die einzelnen Items hängen mit der Gesamtheit zusammen, geprüft durch Testhalbierung(:Test in konstitutive Teile zerlegen und Interkorrelation bestimmmen) oder Cronbach´s Alpha(:Schätzformel zur Inneren Konsistenz auf Grundlage der Varianzanalyse, bei homogenen Tests universell anwendbar, Bedingung: alle Testteile sind gleich lang, perfekte Konsistenz:+1)) Mehrer Prüfverfahren anzuwenden erhöht natürlich die Sicherheit
Validität Prüfkriterien Inhaltsvalidität Konstruktvalidität Kriteriumsvalidität Inhaltsvalidität durch Expertenratings (die schätzen ein, ob Items geeignet sind) geprüft Konstruktvalidität über theoretischen Hintergrund (Kenntnis der zugehörigen Theorien und empirischen Befunde), geringe K. spricht nicht unbedingt gegen Messung, evtl. gegen das Konstrukt Kriteriumsvalidität (=Teil der Konstruktvalidität) über Korrelation mit anderen konstruktvaliden Messungen Konstruktvalidität über theoretisch abgestütze Beziehung zu ausgewählten Variablen Kriteriumsvalidität über Vorhersage, Übereinstimmung und Extremgruppen
Objektivität Prüfkriterien Durchführungsobjektivität Auswertungsobjektivität Interpretationsobjektivität Durchführungsobjektivität wird durch standardisierte Erhebungssituation erreicht (bes. bei vollstrukturiertem Fragebogen und Verhaltensanweisungen für Versuchsleiter) Auswertungsobjektivität durch Auswertungsschablonen oder vorgegebene statistische Verfahren Interpretationsobjektivität ist durch vorliegende Vergleichswerte einer Eichpopulation erreichbar
Operationalität Direkte/indirekte Messbarkeit Messniveau qualitativ/quantitativ Arbeitszufriedenheit ist nicht direkt messbar Quantität der AZ informiert über Handlungsbedarf Qualität der AZ ist Ansatzpunkt für gestalterische Maßnahmen Operationalität= wie gut ist ein Phänomen direkt bzw. indirekt messbar? Wieviele Stufen bis zur direkten Messbarkeit von Indikatoren? (je mehr, desto schlechter Operationalität)
Verständlichkeit bezieht sich auf Probanden und Versuchsleiter wird durch Pretests sichergestellt
Relevanz Ein Test muss wichtige Variablen mit Merkmalen, die für die Zielsetzung der Untersuchung wesentlich sind erfassen. Diskriminierungsfähigkeit Spezifität Entscheidungsrelevanz Diskriminierungsfähigkeit: ? Spezifität bei AZ hoch, wenn sich die Untersuchung auf bestimmte Berufsgruppe bezieht Entscheidungsrelevanz= Bedeutung des untersuchten Phänomens für die Praxis (wird mit der Untersuchung überhaupt ein Problem der Praxis angesprochen?)
Innovationspotential Eine Untersuchung zur AZ sollte diese nicht nur beschreiben, sondern auch Beiträge zu ihrer Verbesserung leisten.
Aufwand ist Entscheidungskriterium, wenn verschiedene Instrumente für die Untersuchung zur Verfügung stehen die Untersuchung ist optimal, wenn ein intelligenter Laie den Test sachgemäß anwenden kann Durchführungs- und Auswertungszeit kurz sind außer Papier und Stift keine Hilfsmittel gebraucht werden
SAZ Skala zur Messung von Arbeitszufriedenheit Langform mit 37 Items, Kurzform mit 8 Items 9 Subskalen: - Aufstiegsmöglichkeiten - Entfaltung und Anwendung eigener Fähigkeiten - Firmenbewertung - Führungsstil - Respektierung und Mitbestimmung - Belastung und Arbeitsstress - Bezahlung - Resignation - Wechselbereitschaft
ABB Arbeitsbeschreibungsbogen erfasst Zufriedenheit mit einzelnen Aspekten der Arbeitssituation 7 Subskalen, 4-stufige Likert-Skala - Kollegen (8 Items) - Vorgesetzte (13 Items) - Arbeitsinhalt (13 Items) - Arbeitsbedingungen (12 Items) - Organisation und Leitung (14 Items) - Entwicklung (10 Items) - Bezahlung (8 Items)
Beurteilung von ABB und SAZ nach den Qualitätskriterien
Reliabilität ABB SAZ Innere Konsistenz ausreichend befriedigend Retest gut
Validität ABB SAZ Inhaltsvalidität befriedigend ausreichend Konstruktvalidität gut Kriteriumsvalidität mangelhaft Inhaltsvalidität bei ABB unstrittig, allerdings fraglich, ob die 7 Bereiche hinreichend sind Inhaltsvalidität bei SAZ mit Hilfe von Expertenratings hineinkonstruiert, allerdings fehlt Zufriedenheit mit Kollegen völlig Konstruktvalidität ABB gut, viele andere sozialwissenschaftliche Untersuchungen zum gemessenen Konstrukt wie etwa Position-Analysis-Questionnaire oder Freiburger Persönlichkeitsinventar liegen vor Kriteriumsvalidität ABB : Übereinstimmung zwischen den einzelnen 7 Skalen und Korrelation zu anderen Instrumenten recht gering (keine 5, sondern Mängel) Kriteriumsvalidität SAZ: nur die Zufriedenheit mit der Tätigkeit wird erfasst.
Objektivität ABB (gute Objektivität) Normierte Durchführung, Auswertung und Interpretation SAZ (befriedigende Objektivität) Normierte Durchführung, Hinweise zur Auswertung, Vergleichswerte für Interpretation vorhanden ABB: Normierte Durchführung durch standardisierten Fragebogen, Auswertung durch exakte Vorschriften, Interpretation durch umfangreiche Vergleichswerte, Normwerte einer Eichpopulation liegen vor SAZ: Normierte Durchführung durch vollstrukturierten Fragebogen, lediglich Hinweise zur Auswertung, keine genauen Angaben, Vergleichswerte für Interpretation in verschiedenen Publikationen vorhanden, keine Normwerte aus Eichpopulation
Operationalität Generelle Messbarkeit des Phänomens AZ bei ABB und SAZ unterstellt Messniveau quantitativ, bei ABB auch stark qualitativ durch sieben Teilskalen ABB: gute Ansatzmöglichkeiten für gestalterische Maßnahmen durch quantitatives und qualitatives Messniveau SAZ: für Langfassung auch qualitative Differenzierung möglich
Verständlichkeit ABB für Probanden gut verständlich, für erfahrenen Versuchsleiter auch SAZ für Probanden gut verständlich, für Versuchsleiter nicht ABB: für Laien trotz Auswertungs- und Interpretationsanweisungen zu schwierig SAZ: keine Anweisungen für Versuchsleiter
Relevanz des ABB Diskriminierungsfähigkeit ausreichend Erklärungs- und Prognosefähigkeit mangelhaft Spezifität gering Entscheidungsrelevanz von Arbeitsmarktlage abhängig
Relevanz der SAZ Diskriminierungsfähigkeit ausreichend Erklärungs- und Prognosefähigkeit mangelhaft Spezifität höher als bei ABB Entscheidungsrelevanz ebenfalls von Arbeitsmarktlage abhängig
Innovationspotential Sowohl bei ABB als auch bei SAZ begrenzt Beide nicht vollständig, da Spezifität zu gering Strukturierungsfähigkeit bei ABB besser
Aufwand Handhabbarkeit für intelligenten Laien bei ABB schwierig, bei SAZ unmöglich Durchführungszeit bei beiden 20 Minuten, bei SAZ Kurzform 2-3 Minuten Auswertungszeit und Aufwand für Versuchsleiter bei beiden überschaubar
Bewertung des AVEM - AVEM: arbeitsbezogenes Verhaltens- und Erlebensmuster - 11 Skalen mit jeweils 6 Items - jeweils fünfstufige Bewertungsskala - Drei Sekundärfaktoren: *Arbeitsengagement *persönliche Widerstandsfähigkeit und Bewältigungsverhalten gegenüber Belastung *wesentliche Seiten des Lebensgefühls
Skalen subjektive Bedeutsamkeit der Arbeit beruflicher Ehrgeiz Verausgabungsbereitschaft Perfektionsstreben Distanzierungsfähigkeit Resignationstendenz bei Misserfolg Offensive Problembewältigung innere Ruhe und Ausgeglichenheit Erfolgserleben im Beruf Lebenszufriedenheit Erleben sozialer Unterstützung
Typen Typ G: entspricht etwa dem Gesundheitsideal Typ S: neigt zur Schonung Risikotyp A: zeigt überhöhtes Engagement Risikotyp B: Resignation, Unzufriedenheit, herabgesetzte Widerstandsfähigkeit
Auswertung der Ergebnisse skalenweise Betrachtung der individuellen Messwerte Betrachtung der Sekundärfaktoren Vergleich des individuellen Profils mit den 4 Typen auch Vergleich mit der Normstichprobe möglich
Validität und Reliabilität Reliabilität hat gute bis befriedigende Werte Validität bei Korrelation mit etablierten Fragebögen gut typenbezogene Gültigkeitsprüfung Vergleich mit Selbsteinschätzung Vergleich Herzpatienten und Gesunde bezüglich Risikotyp A
Vielen Dank für Eure Aufmerksamkeit!