Experimentaufbau und -design

Slides:



Advertisements
Ähnliche Präsentationen
Metaanlysen klinischer Studien Rainer Schalnus
Advertisements

Programmieren im Großen von Markus Schmidt und Benno Kröger.
Das Studium der Informatik
6σ - Anwendungsbeispiel: Road Map
Auswertung der Befragung
Zusammenfassung der Vorwoche
B-Bäume.
Evaluation. Gliederung Definition von Evaluation Charakterisierung Ziele und Aufgaben Formen und Methoden Richtlinien Methodenkoffer Literatur.
Bewegungswissenschaft
Untersuchung und szenariobasierte Entwicklung von Websites zur Orientierung in Universitätsstudiengängen unter Berücksichtigung von Prinzipien des Web.
1© The Delos Partnership 2006 January 2006 LEAN ENTERPRISE Implementierungsworkshop.
Spezifikation, Verifikation, Testtheorie Prof. Dr. Holger Schlingloff Institut für Informatik und Fraunhofer FIRST.
„Wissenschaftliches Arbeiten“ Was soll denn das sein?
Falk Howe Sönke Knutzen
Java: Objektorientierte Programmierung
Gliederung Vertrauensintervalle Arten von Hypothesen
Die Varianzanalyse Jonathan Harrington.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
K-Modeler Engineering
Das Allgemeine lineare Modell (ALM) - Varianz als Schlüsselkonzept
Wie passt unser Projekt in die Entwicklung des Paradigmas der Digitalen Bibliothek? Referat von Lukas Jörgens.
Patrick Rössler Einführung in die Methoden der empirischen Kommunikationsforschung Vorlesung BA Kommunikationswissenschaft.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
PKJ 2005/1 Stefan Dissmann Zusammenfassung Bisher bekannt: Einfache Variable Feld Vereinbarung Zuweisung Block while-Schleife Bedingte Anweisung (if) Typ.
– Team 2 Aktueller Projektleiter: Christian Krapp
Objektorientierte DBMS Klassen und Beziehungen Seminar: Verteilte Datenbanken Manuela Fischer.
Experimentdaten.
Experimente in Medizin, Psychologie und Informatik im Stilvergleich
Programmiermethodik SS2006 © 2005 Albert Zündorf, University of Kassel 1 6. Tipps, Tricks, Idiome Gliederung: 1. Einführung 2. Anforderungsdefinition 3.
Ralf KüstersDagstuhl 2008/11/30 2 Ralf KüstersDagstuhl 2008/11/30 3.
Eigenschaften der OLS-Schätzer
Entwicklung standardorientierter Aufgaben – am Beispiel naturwissenschaftliche Erkenntnisgewinnung Jürgen Mayer.
Self Organizing Tree Algorithm
Studie Einfluss der Sitzposition in den Vorlesungsräumen auf die studentische Leistung Jochen Jung, Larry Maus und Steffen Brünske.
Mit 3 Schichte zum Erfolg
Problemstellung und Hypothesenbildung
1. Verhalten der Objekte: Operationen Werden in den Klassen definiert Werden (i.d.R.) auf einem Objekt aufgerufen Wird das Empfängerobjekt genannt Weitere.
WiSe 2010/11 LR 13: Klassenmanagment
Projektpräsentation der Bücherei
Auslegung eines Vorschubantriebes
Phasen einer empirischen Untersuchung
Theoriereferat Indexes, Scales and Typologies The Logic of Sampling
Modul Statistische Datenanalyse
Kathrin Grummich1, Katrin Jensen2 Christoph M Seiler1 Markus K Diener1
Empirische Softwaretechnik
J. M. L. Pasquay 1 Scan-Vorgang. 2 Vorschau J. M. L. Pasquay 3 Auswahl 1. Festlegen der Größe Web75 DPI Tintenstrahl 300 DPI Laser 150 DPI Foto 600 DPI.
Anna-Katherina Hölscher, Kerstin Von Minden, Birthe Albach, Mona Rittermeier, Rebekka Braun, Jennifer Bergmann, Mustafa Aktepe.
Experimentelle und quasi-experimentelle Designs
Software-Qualitätssicherung UE h Inst. f. Softwaretechnik und Interaktive Systeme Anrechenbarkeit: Bakk. 526 Wirtschaftsinformatik KfK Software.
Studentisches Seminar

Pflanzenlernkartei 3 Autor: Rudolf Arnold. Pflanze 1 Gattung Merkmale Schädigung Bekämpfung.
Pflanzenlernkartei 2 Autor: Rudolf Arnold. Pflanze 1 Gattung Merkmale Schädigung Bekämpfung.
Vorschlag zur Abfassung einer PPT-Präsentation des Planungsreferats
Grafische Visualisierung von Softwarestrukturen
Software Engineering Grundlagen
01-1-Anfang. 01a-1-Vortrag-Inhalt 14-4-Gründe-Masterplan.
Studienverlaufsanalyse
Methoden Die klassische Methode der Psycholinguistik (genauso wie der experimentellen Psychologie im Allgemeinen) ist die Messung von Reaktionszeiten.
Zum Einfluss subjektiver und objektiver Merkmale auf die Wiedererkennung von Werbeplakaten Antje Bauer & Stefanie Frehse Institut für Allgemeine Psychologie.
Methoden der empirischen Kommunikations- und Medienforschung Di., 9-11 Uhr Prof. Hans-Jörg Stiehler Sitzung.
TEST. 2 SK / Ressort Regeltechnik Täter Gegenspieler Zuschauer Mitspieler.
Universität Karlsruhe (TH) Forschungsuniversität · gegründet 1825 Lehrstuhl für Programmiersysteme Fakultät für Informatik 1 Anforderungen und Probleme.
Gegenstand der Psychologie
Methoden der Sozialwissenschaften
Sozial-kognitive Lerntheorie nach Bandura
K. Desch - Statistik und Datenanalyse SS05
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
1. Betreuer: Prof. Dr. Jörg Striegnitz 2. Betreuer: Dr. Martin Schindler Kontextsensitive Autocompletion für Klassendiagramme in der UML/P Florian Leppers.
 Präsentation transkript:

Experimentaufbau und -design Radoslaw Rudnicki 11.01.2006

Gliederung Wir sammeln Daten Was ist eigentlich ein Experiment? Definition Planung Durchführung Probleme

Wir sammeln Daten

15 Sekunden Zeit je Aufgabe keine Kommunikation untereinander Wir sammeln Daten zwei Computer jeweils zwei Fragen 15 Sekunden Zeit je Aufgabe keine Kommunikation untereinander Entschädigung: Ferrero Küsschen 1

Wir sammeln Daten 2

3

Rudnicki 3

Rudnicki Fabig 3

Gliederung Wir sammeln Daten Was ist eigentlich ein Experiment? Definition Planung Durchführung Probleme

Was ist eigentlich ein Experiment? Definition

Was ist eigentlich ein Experiment? Definition (1) methodisch kontrolliert quantifizierbar reproduzierbar randomisiert 4

Was ist eigentlich ein Experiment? Definition (2) Analyse des Arbeitsprozesses hinsichtlich der Richtigkeit und des Zeitbedarfs in der Absicht Einflüsse der Farbe rot zu erkennen aus der Sicht eines Softwareentwicklers im Kontext der Oberflächengestaltung 5

Gliederung Wir sammeln Daten Was ist eigentlich ein Experiment? Definition Planung Durchführung Probleme

Was ist eigentlich ein Experiment? Planung

Was ist eigentlich ein Experiment? Planung definition Experiment planning Context selection Hypothesis formulation Variables selection Selection of subjects Experiment design Instrumen- tation Experiment Design != Experiment Design Validity evaluation Experiment design 6

Was ist eigentlich ein Experiment? Planung – Context selection (1) Offline vs. Online Student vs. Professional Toy vs. Problems Specific vs. General Offline: parallel zu „echten Projekten“ Online: Experimente zu aktuellen Projekten, an denen gearbeitet wird 7

Was ist eigentlich ein Experiment? Planung – Context selection (1) Offline vs. Online Student vs. Professional Toy vs. Problems Specific vs. General 7

Was ist eigentlich ein Experiment? Planung – Hypothesis formulation (2) Nullhypothese Alternative Hypothese Nullhypothese1: rot hat keine Auswirkung auf die Korrektheit der Antwort Nullhypothese2: rot hat keine Auswirkung auf die Antwortzeit Alternativ1: rot beeinflusst Korrektheit negativ Alternativ2: rot beeinflusst Antwortzeit negativ 8

Was ist eigentlich ein Experiment? Planung – Variables selection (3) unabhängige Variablen abhängige Variable Prozess Unabhängige Variablen: Schwierigkeitsgrad der Fragen, Motivation, Farbe Abhängige Variable: Beantwortungszeit, Richtigkeit 9

Was ist eigentlich ein Experiment? Planung – Variables selection (3) unabhängige Variablen abhängige Variable Prozess Unabhängige Variablen: Schwierigkeitsgrad der Fragen, Motivation, Farbe Abhängige Variable: Antwortungszeit, Richtigkeit 9

Was ist eigentlich ein Experiment? Planung – Selection of subject (4) Personenauswahl Kontrollgruppe Versuchsgruppe M1 X M2 Kontrollgruppe P M1' Fortgeschrittener Computerbenutzer Gleich, weil alle ungefähr das gleiche Bildungsniveau haben 10

Was ist eigentlich ein Experiment? Planung – Experiment design (5) was wird gemessen wie wird getestet Anzahl der Personen festlegen Anzahl der Tests Was wird gemessen: Zeit, Richtigkeit Wie: Fragen werden gestellt #Personen: Minimum, hier: alle die da sind #Test: hier: 2 11

Was ist eigentlich ein Experiment? Planung – Experiment design (5) randomisieren blocking balancing Randomisieren: zufällig, wer welche Farbe bekommt Blocking: unerwünschte Effekte ausgleichen Alex nicht dabei, weil er es kennt zum Beispiel kann ein teil OOP und die anderen nicht, dann gesondert testen Balancing: Gruppen ausgleichen (ein gut Ausgebildeter gegen 3 Anfänger) 12

Was ist eigentlich ein Experiment? Planung – Instrumentation (6) Leitfaden Messung Leitfaden: Beschreibung wie das ganze Experiment abläuft, evtl. Checklisten Messung: Womit, wie?  Ergebnis unabhängig von Instrumentation, sonst ist es ungültig 13

Was ist eigentlich ein Experiment? Planung – Validity evaluation (7) interne Gültigkeit externe Gültigkeit Intern: Korrektheit des Experiments, Ergebnis kann auch die Einstellung der Variablen zurück geführt werden Extern: Verallgemeinerung auf höhere Komplexitätsebenen 14

Was ist eigentlich ein Experiment? Planung definition Experiment planning Context selection Hypothesis formulation Variables selection Selection of subjects Experiment design Instrumen- tation Experiment Design != Experiment Design Validity evaluation Experiment design 15

Gliederung Wir sammeln Daten Was ist eigentlich ein Experiment? Definition Planung Durchführung Probleme

Was ist eigentlich ein Experiment? Durchführung

{ Was ist eigentlich ein Experiment? Durchführung abhängige Variable Prozess unabhängige Variablen Experiment design Unabhängige Variablen: Schwierigkeitsgrad der Fragen, Motivation, Farbe Abhängige Variable: Antwortungszeit, Richtigkeit unabh.Variablen in def. Zuständen 16

Gliederung Wir sammeln Daten Was ist eigentlich ein Experiment? Definition Planung Durchführung Probleme

Probleme

Hypothesis formulation (2) Type-1-Error Type-2-Error Probleme Hypothesis formulation (2) Type-1-Error Type-2-Error Type-I-Error -> Nullhyphotese stimmt, aber wir stellen was anderes fest Type-II-Error -> Nullhypothese falsch, aber wir können sie mit den Messungen bestätigen 17

Variables selection (3) nicht alle bekannt nicht alle kontrollierbar Probleme Variables selection (3) nicht alle bekannt nicht alle kontrollierbar Nicht kontrollierbar: Lesegeschwindigkeit (bei 15 Sekunden Antwortzeit, durchaus entscheidend) 18

Männer/Frauen unterscheiden? Was ist ein Plazebo im SE? Probleme Experiment design (5) Männer/Frauen unterscheiden? Was ist ein Plazebo im SE? Bei uns zu wenig Frauen für eine sinnvolle Auswertung Plazebo: Ist Farbe weiss neutral? Oder steigert sie vielleicht sogar die Leistung? Man weiss es nicht. 19

Validity evaluation (7) Anzahl der Personen? Anzahl der Aufgaben? Probleme Validity evaluation (7) Anzahl der Personen? Anzahl der Aufgaben? Wie viele Personen: Ab wann kann man das Ergebnis als Gültig ansehen? U.a. abhängig von Auswertung Bei uns: Alle die da waren mussten mitmachen, trotzdem vermutlich zu wenige Ab wann kann man davon ausgehen, dass das Ergebnis nicht zufällig ist. 20

Interne Gültigkeit Externe Gültigkeit 21

neue Methoden meist schlecht Zeit/Kosten Probleme Allgemein neue Methoden meist schlecht Zeit/Kosten Das Erlernen neuer Methoden/Programme ist immer aufwändig, warum die Mühe, wenn es doch mit dem alten geht (Bsp.: Eclipse) LAST 22

Zusammenfassung 23

Literatur Claes Wohlin, Per Runeson, Martin Höst, Magnus C. Ohlsson, Björn Regnell Anders Wesslen: Experimentation in Software Engineering, Lund University, Schweden Stefan Opferkuch: Eine Untersuchung zum Einsatz komplexer Simulationsmodelle in der Projektmanagementausbildung, Diplomarbeit, 2002 Wolfram Twelker: Experimente in Medizin, Psychologie und Informatik im Stilvergleich, Seminararbeit, 2005 Jörg Eggermann: Konzept und Realisierung eines Werkzeuges zur Charakterisierung und Analyse von Software-Engineering Experimenten, Bachelorarbeit, 2005 24