Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Projektgruppe STETZ Statistische Grundlagen Jan Christian Halfbrodt SPSS.

Ähnliche Präsentationen


Präsentation zum Thema: "Projektgruppe STETZ Statistische Grundlagen Jan Christian Halfbrodt SPSS."—  Präsentation transkript:

1 Projektgruppe STETZ Statistische Grundlagen Jan Christian Halfbrodt SPSS

2 Übersicht: - Grundbegriffe der Statistik - Einführung in „SPSS“ - Einführung in „Statistiklabor“ - Einführung in „R“ - Zusammenfassung

3 Grundbegriffe der Statistik: - Empirische Sozialforschung Erhebung und Interpretation von Daten über soziale Tatsachen anhand von Stichproben. Diese werden auf Merkmale untersucht, welche in jeweils verschiedenen Ausprägungen auftreten können. Man unterscheidet dabei zwischen qualitativ und quantitativ. - Zentralmaße Wichtigstes Maß ist der Mittelwert (arithmetisches Mittel) Bei häufig vorkommenden Werten wird mit relativen Häufigkeiten (gewichtetes a.M.) gerechnet. Bei „Ausreisser-Werten“ ist das a.M. nicht sinnvoll: Hier wird der Median benutzt (Mitte einer geordneten Liste) Der am häufigsten vorkommender Wert wird als Modus bezeichnet. X = x (n+1)/2 für ungerades n X = 1/2 (xn/2 + xn/2+1) für gerades n (xi: Werte aus geordneter Urliste)

4 Weitere Grundbegriffe - Streuungsmaße geben an, wie gemessene Werte vom Mittelwert abweichen - Varianz: Abweichung des Wertes vom erwarteten Wert - Standardabweichung: Streuung einer Zahl um ihren Mittelwert - Spannweite: Differenz zwischen kleinstem und größtem Wert - metrische Daten: Wert (Grad, Meter, Uhrzeit) - nominale Daten: Kategorisierte Daten (Farbe, Automarke, Heimatland) - ordinale Daten: Daten werden mit einer Rangfolge kategorisiert (Gehalt: arm (0-500 €), normal (500€-4000€), reich (<4000€)

5 SPSS - steht für „Statistical Product and Service Solution“ SPSS - Programm der gleichnamigen Firma wird seit 1968 entwickelt und erweitert - umfangreiche Software für Datenanalyse und Datenmanagment - statistische und grafische Auswertung der Eingabedaten - modularer Aufbau: lässt sich beliebig erweitern - Enthält in der Basisversion alle gängigen statistischen Auswertungsverfahren - Prinzipiell gilt: Mit SPSS ist alles möglich!

6 SPSS (Forts.) Vorteile: SPSS - Vielseitigkeit - Kompatibilität - Handhabung Nachteile: - Lizenzproblem -Programmfunktionen lassen sich nicht (bzw. sehr eingeschränkt) extern nutzen --> Dimensions-Paket hilft hier weiter!

7 SPSS – Die Oberfläche SPSS Spalte für Variablen: In Umfragen stehen die einzelnen Variablen für die jeweiligen Fragen Zeilen, wobei jede Zeile einer befragten Person entpricht. Diese werden in SPSS als „Fälle“ bezeichnet Wechsel zwischen Datenansicht und Variablenansicht

8 SPSS - Variablenansicht SPSS Hier können die einzelnen Variablen exakt definiert werden und an die entsprechenden Situationen angepasst werden. Dies umfasst sowohl den Variablentyp, die Darstellung und eine Ausnahmenbehandlung.

9 SPSS – Grafische Darstellung SPSS -Eine Vielzahl am Diagramm- typen verfügbar. -Jeder Diagrammtyp ist dabei noch in Unterkategorien konfigurierbar. -Variablen können nun den jeweiligen Achsen oder anderen Diagrammkomponenten zugeordnet werden. -SPSS-Viewer zur interaktiven Darstellung der Ergebnisse. Vielseitiges Tool zum Browsen durch die erstellten Reports. -Darstellung und Aufbau, z.B. von Tabellen läßt sich hier anpassen. Auch ausblenden irrelevanter Daten ist möglich.

10 Statistiklabor -Open Source Projekt der freien Universität Berlin - Interaktive Arbeitsumgebung zum Erlernen und Verwenden statistischer Methoden -Setzt auf die statistische Programmiersprache „GNU R“ auf, und kann auch mit dieser erweitert werden -Entwickelt mit dem Ziel, in der Lehre eingesetzt zu werden bietet es trotzdem alle Funktionen für einen sinnvollen Einsatz - Enthält Werkzeuge zum „Laden“, „Bearbeiten“ und „Ausgeben“ von Daten -Lange nicht so umfangreich wie SPSS, dafür aber mit dem Nötigsten ausgestattet und kostenlos einsetzbar! (für nicht kommerzielle Zwecke) -Ähnlich wie SPSS sind die Funktionalitäten nur „programmintern“ nutzbar

11 Statistiklabor Die Oberfläche des Statistik- labors ist ein „Point&Click“ Editor, mit dessen Hilfe unterschiedliche Objekte gesetzt werden können. Der Datenfluss wird über Pfeile realisiert, welche an Konnektoren an den Objekten gesetzt werden. Die Objekte lassen sich aus der linken Menüleiste auswählen und platzieren Daten können entweder über einen internen Zufallsgenerator, oder über einen Dateiimport eingelesen werden. Möglich sind dabei *.xls oder *.txt - Dateien Die eingelesenen Daten lassen sich in unterschiedlichen Tabellenvarianten anzeigen: Urliste, Datensatz, Matrix oder Häufigkeitstabelle Zur grafischen Darstellung lassen sich sog. R-Grafiken erzeugen. Es gibt dabei eine Vielzahl an Diagrammtypen die frei konfiguriert werden können Um die eigentlichen statistischen Operationen an den Daten durchzuführen, gibt es den R-Kalkulator. Mit diesem können R-Befehle formuliert und auf die Daten angewandt werden. Für den vereinfachten Umgang ist ein Tool enthalten, welches beim Formulieren der gewüschten Befehle unterstützt. Die bearbeiteten Daten lassen sich schließlich wieder in ihr ursprüngliches Dateiformat exportieren

12 Statistiklabor Um die erstellten Daten visuell zu gestalten und für z.B. Präsentationen aufzubereiten gibt es im Statistiklabor einen Assistenten für die Erstellung von Berichten. Die einzelnen Komponenten werden dabei in gewünschter Reihenfolge in das rechte Fenster gezogen und können mit Text ergänzt werden.

13 GNU R -Open Source Statistik Software - Programmiersprache für statistische Berechnungen und deren grafische Darstellung -In allen wesentlichen Bereichen der angewandten Statistik etabliert -Durch eine Vielzahl von Paketen erweiterbar (ähnlich wie LaTeX) - Funktioniert durch direkte Konsoleneingabe -Es kann auf externe Daten zugegriffen werden (bevorzugt ASCII- Dateien) -Erstellte Grafiken können gespeichert werden (z.B. JPG, Postscript) -R läßt sich mit Scriptdateien automatisieren, diese können auch Online abgerufen werden -ABER: Zuerst muss die Konsole gestartet werden!

14 goettingen.de/r/files/prog_befinden_gewicht.txt Demonstration von R

15 Zusammenfassung : - SPSS - nahezu alles möglich - aber lizenzgebunden - schwer von aussen steuerbar (teure Zusatzpakete) - Statistiklabor - kennt die nötigsten Funktionen, aber eingeschränkt - dafür (fast) lizenzfrei - nicht von aussen ansteuerbar - R - konsolenbasiert - aber das lässt sich umgehen - frei verwendbar Vielen Dank für die Aufmerksamkeit! Fragen?


Herunterladen ppt "Projektgruppe STETZ Statistische Grundlagen Jan Christian Halfbrodt SPSS."

Ähnliche Präsentationen


Google-Anzeigen