Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Workshop Einführung in R Florian Pargent, Philipp Sckopke, Sven Hilbert Methodenlehre & Psychologische Diagnostik.

Ähnliche Präsentationen


Präsentation zum Thema: "Workshop Einführung in R Florian Pargent, Philipp Sckopke, Sven Hilbert Methodenlehre & Psychologische Diagnostik."—  Präsentation transkript:

1 Workshop Einführung in R Florian Pargent, Philipp Sckopke, Sven Hilbert Methodenlehre & Psychologische Diagnostik

2 Allgemeine Einführung Methodenlehre & Psychologische Diagnostik

3 Organisatorisches HERZLICH WILLKOMMEN! Der Workshop dient der Einführung in die Bedienung von R und der Übung von ersten Befehlen und des Arbeitens mit Datensätzen. Datensätze, Präsentation und kommentiertes Skript werden auf der Homepage des Lehrstuhls Methodenlehre bereitgestellt. Der Workshop besteht aus zwei Teilen: 1.Tag: Einführung in die Funktionsweise von R und Erlernen einfacher Befehle. 2.Tag: Arbeiten mit Datensätzen und weiterführende Analysen. Für den Brückentag (Mittwoch) wird ein Online-Tutorium empfohlen, welches unter folgender Adresse abgerufen werden kann: tryr.codeschool.com Literatur zum Nachschlagen und Weiterlernen: Navarro, D. (2014). Learning Statistics with R. A tutorial for psychology students and other beginners (Version 0.4). Abgerufen von http://ua.edu.au/ccs/teaching/lsr 3

4 R (I) R ist ein open-source Statistikprogramm Beim Öffnen des Programms wird die „Konsole“ angezeigt. Dort können einfache Befehle eingegeben werden – durch Drücken der Enter-Taste werden sie ausgeführt. Es können beispielsweise schon einfache Rechenoperationen direkt in der Konsole durchgeführt werden. Addieren (+), Subtrahieren (-), Multiplizieren (*), Dividieren (/), Potenzieren (^) erfordern teilweise andere Symbole als gewohnt. Dezimaltrennzeichen ist der. und nicht das, 4

5 R (II) Auch logische Vergleiche sind möglich, also ob ein Wert größer (>) oder kleiner (<) oder gleich (==) einem zweiten Wert ist. WICHTIG: das einfache Gleichheitszeichen (=) hat eine andere Bedeutung und darf für solche Vergleiche nicht verwendet werden. Möchten wir unsere Befehle kommentieren, also weitere Informationen bspw. für die spätere Bearbeitung hinzufügen, verwenden wir das # Zeichen. Alles was hinter der # steht, wird von R nicht als Befehl ausgeführt. 5

6 Datentypen In R können unterschiedliche Typen von Daten verwendet werden: Numerische Werte (numeric) Numerische Werte können beispielsweise für mathematische Operationen verwendet werden. Characterwerte (character) Auch längerer Text („Zeichenketten“) kann in R verwendet werden. Damit funktionieren mathematische Operationen wie z.B. die Bildung einer Summe nicht, dafür können damit Benennungen o.ä. vorgenommen werden. Zeichenketten sind immer dadurch gekennzeichnet, dass Sie mit einem „ beginnen und mit einem “ enden. Logische Werte (logical) Logische Werte gibt es nur in den beiden Ausprägungen TRUE und FALSE. Sie können beispielsweise als Ergebnisse von logischen Vergleichen auftreten. 6

7 Objekte Wie auch beim Taschenrechner sind Daten in R grundsätzlich erstmal flüchtig. Für die spätere Verwendung können wir alles in R einem Objekt zuweisen. Hierfür benötigen wir den Zuweisungsoperator <- a <- 5 Das was auf der rechten Seite des Pfeils steht (der numerische Wert 5) wird dem Objekt a zugewiesen. Verwenden wir im Folgenden das Objekt a, nimmt es dabei ebenfalls den gerade zugewiesenen numerischen Wert 5 an. Auch Ergebnisse von komplexeren Operationen können einem Objekt zugewiesen werden. a <- 5 + 7 * 2 Nun wird das Objekt a bei nachfolgender Verwendung den Wert (das Ergebnis) der Rechenoperation 5 + 7 * 2 annehmen (der numerische Wert 19) 7

8 Einfache Funktionen Komplexere Operationen mit Daten können über Funktionen vorgenommen werden. Funktionen haben einen eindeutigen Namen (Groß-/Kleinschreibung beachten!) Das, womit die Funktion etwas machen soll, steht direkt hinter dem Namen in runden Klammern. Die Informationen die man angibt, damit die Funktion das tut was sie soll, nennt man Argumente. Eine Funktion zur Berechnung der Quadratwurzel (z.B. der Zahl 4): sqrt(4) Funktionen können verschachtelt werden (dabei wird immer von innen nach außen gelesen). exp(sqrt(1)) berechnet sqrt(exp(1)) berechnet 8

9 Was kann schief gehen? Sobald die Syntax der Befehle nicht korrekt ist, macht R nicht was wir wollen... Hier wurde die Klammer am Ende des Befehls vergessen. R wartet auf diese Klammer um den Befehl auszuführen und macht gar nichts (es werden lediglich + Zeichen angezeigt), bevor wir nicht die Klammer geschlossen haben. Das gleiche ist hier passiert, nur fehlt hier ein “ am Ende der Zeichenkette „Markus“. Auch hier wartet R so lange bis wir manuell ein “ eingefügt haben (das ist gar nicht so einfach, weil R oft automatisch zwei “ setzt. Sobald wieder das > am Beginn der Zeile der Konsoleauftaucht, ist R bereit für neue Eingaben. 9

10 Übung im Skript (1) Methodenlehre & Psychologische Diagnostik

11 Vektoren, Matrizen, Dataframes Methodenlehre & Psychologische Diagnostik

12 Vektoren Vektoren enthalten mehrere Elemente eines Typs und werden mit der „Combine“ Funktion c( ) erstellt. Ein numerischer Vektor: a <- c(2, 4, 5, 3, 18, 20154, 3.5) Ein Character-Vektor: b <- c(„Philipp“, „Eva“, „Felix“) Wenn wir nur einzelne Elemente eines Vektors verwenden möchten, brauchen wir [] In den [] direkt hinter dem Vektor steht die Position des Elements, das ich entnehmen möchte. Im Beispiel also das dritte Element des Vektors a Der Befehl length( ) gibt die Länge (= Anzahl Elemente) des Vektors aus 12

13 Matrix Eine Matrix enthält auch mehrere Elemente eines Typs, allerdings in Zeilen und Spalten angeordnet Genauso wie ein Vektor mit der Funktion c( ) gebildet wird, wird eine Matrix mit der Funktion matrix( ) erstellt. Dabei muss angegeben werden, in wie vielen Zeilen und Spalten die Werte angeordnet sein sollen: In diesem Fall werden die Werte des Vektors a (den wir eine Folie vorher gebildet haben) in einer Matrix angeordnet, die drei Zeilen (nrow = 3) und zwei Spalten (ncol = 2) hat. Wenn wir jetzt einzelne Werte aus einer Zeile und/oder Spalte auswählen wollen, brauchen wir in den [] beide Informationen, die durch ein „, „ voneinander getrennt sind. 13

14 Matrix Auch eine Matrix können wir mit [] indizieren Wenn wir jetzt einzelne Werte aus einer Zeile und/oder Spalte auswählen wollen, brauchen wir in den [] beide Informationen, die durch ein „, „ voneinander getrennt sind. Hier speichern wir zunächst die Matrix auf das Objekt m und wählen dann das 2. Element der 1. Spalte aus. In den [] steht immer der Zeilenindex vor – und der Spaltenindex nach dem Komma. Möchte ich alle Werte einer Zeile oder Spalte auswählen, lasse ich den Platz vor oder hinter dem Komma einfach leer: hier erhalte ich alle Werte der 2. Zeile hier erhalte ich alle Werte der 1. Spalte 14

15 Dataframes Ein Dataframe ist ebenfalls in Zeilen und Spalten angeordnet, kann jedoch auch Spalten unterschiedlichen Typs beinhalten. Zunächst erstellen wir den Vektor Namen mit den Namen, dann den Vektor Alter mit dem Alter der Probanden. Mit der Funktion data.frame( ) verknüpfen wir beide Vektoren zu einem einzelnen data.frame, den wir gleich dem Objekt Daten zugewiesen und danach angezeigt haben. Bei einem data.frame können wir mit auch direkt auf die Spalten über ihren Namen zugreifen: 15

16 Übung im Skript (2) Methodenlehre & Psychologische Diagnostik Mit Aufgaben

17 Übungsaufgaben 1.Erstellen Sie einen numerischen Vektor c(...) 2.Nutzen Sie einen Befehl, der die Länge dieses Vektors ausgibt 3.Erstellen Sie einen zweiten numerischen Vektor gleicher Länge 4.Erstellen Sie einen dritten Vektor, dessen Elemente die Differenzen der Elemente der anderen beiden Vektoren sind 5.Erstellen Sie eine 2 x 2 Matrix mit Namen (also mit Charactern als Elementen) 6.Erstellen Sie einen Dataframe, in dem eine Spalte aus numerischen Werten und die zweite aus Charactern besteht 17

18 Übungsaufgaben (2) 7.Erstellen Sie einen Dataframe mit fünf Fällen. In der ersten Spalte geben Sie Namen ein, in der zweiten Spalte Testergebnisse und in der dritten Spalte Ergebnisse eines anderen Tests (alles beliebig) 8.Nutzen Sie den summary( ) Befehl, um sich eine Zusammenfassung der zweiten Spalte ausgeben zu lassen 9.Ordnen Sie diese Zusammenfassung einem Objekt zu und bestimmen Sie Klasse und Modus des Objekts 10.Nutzen Sie den table( ) Befehl, um sich die Häufigkeiten der dritten Spalte ausgeben zu lassen 11.Orden Sie diese Häufigkeiten einem weiteren Objekt zu und bestimmen Sie Klasse und Modus des Objekts 12.Suchen Sie per Befehl die Person mit dem niedrigsten Ergebnis in Test 1 und jene mit dem höchsten Ergebnis in Test 2 13.Erstellen Sie eine Matrix mit den Namen dieser beiden Personen in der ersten Spalte und den Ziffern „1“ und „2“ in der zweiten Spalte 18

19 Funktionen und Packages Methodenlehre & Psychologische Diagnostik

20 Funktionen Funktionen haben wir bereits kennen gelernt. Mit ihnen können Daten aller Art in R bearbeitet werden. Funktionen haben einen eindeutigen Namen (Groß-/Kleinschreibung beachten!) Das, womit die Funktion etwas machen soll, steht direkt hinter dem Namen in runden Klammern. Die Informationen, die man angibt, damit die Funktion das tut, was sie soll, nennt man Argumente. Funktionen können auch mehrere Argumente haben, diese sind dann mit einem „, „ voneinander getrennt. Beispiel: Wenn wir einen Wert runden möchten, müssen wir der Funktion sagen, auf wie viele Stellen gerundet werden soll: 20

21 Ein paar Funktionen zur Datengenerierung ● rep( ) ● Generiert eine Reihe gleicher Zahlen ● seq( ) ● Generiert eine Sequenz von Zahlen ● sample( ) ● Generiert eine Zufallsauswahl ganzer Zahlen ● Gleichverteilt mit oder ohne Zurücklegen  Zur Reproduzierbarkeit der Daten empfiehlt es sich einen Seed zu setzen:  set.seed( ) 21

22 Ein paar Funktionen zur Datenübersicht ● mode( ) ● Zeigt den Typ des Objekts an ● class( ) ● Zeigt an, als welcher Datentyp das Objekt von anderen Befehlen behandelt wird ● str( ) ● Zeigt die Struktur des Objektes in Kompakter Form an ● table( ) ● Gibt eine Häufigkeitstabelle für einen Datensatz aus ● summary( ) ● Gibt eine Übersicht eines Datensatzes oder Objektes aus: 22

23 Ein paar Funktionen für Graphiken ● plot( ) kreiert einen simplen simplen Scatterplot ● Verschiedene graphische Argumente können angegeben werden ● col = „red“ oder col = “blue“ etc. ● type = „p“ (für Punkte), type = „l“ (für Linien), type = „b“ (für beides) ● xlim = c(-5,5) setzt die abgebildete X-Achse von -5 bis +5 ● ylim analog ● etc. ● hist( ) erzeugt ein Histogramm ● barplot( ) erzeugt ein Balkendiagramm ● Um mehrere Graphiken nebeneinander darzustellen, kann durch par(mfrow = c(2,2)) der Grafikbereich geteilt werden (hier: 2 x 2 Plotbereiche) 23

24 Funktionen - Hilfe Wenn wir wissen möchten, wie eine Funktion arbeitet, also z.B. wie die einzelnen Argumente heißen, brauchen wir die Hilfe (Im „Zauberfenster“ unter Help). 24 In diesem Suchfenster können wir den Namen der Funktion angeben, zu der wir Hilfe benötigen

25 Funktionen - Hilfe 25 Eine kurze Beschreibung der Funktion Welche Argumente kann ich mit der Funktion verwenden (hier nur sehr wenige) Eines der Argumente hat einen Standardwert (FALSE) In diesem Abschnitt werden die Argumente erklärt Hier werden Details zur Funktionsweise erklärt Hier wird erklärt, was als Ergebnis der Funktion ausgegeben wird Nicht dargestellt: Example Hier werden kurze Beispiele gezeigt, wie die Funktion funktioniert.

26 Pakete – Packages - Libraries Der Funktionsumfang von R kann mit Paketen (synonym: Library) erweitert werden. Pakete müssen nur einmal installiert werden (außer nach einem größeren Update von R). Pakete müssen jedes Mal, wenn R bzw. R-Studio geöffnet wird und sie verwendet werden sollen, geladen werden. Pakete installieren: „Zauberfenster“ -> Packages -> Install -> Name des Pakets eingeben -> Install Pakete laden: Im R-Skript mit der Funktion library(Name des Pakets). Für das Paket psych also so: 26

27 Umgang mit Daten Um komfortabel mit externen Daten arbeiten zu können, ist es zweckmäßig ein Arbeitsverzeichnis (working directory) zu setzen. Im working directory werden standardmäßig Dateien geschrieben und zu öffnende Dateien gesucht (sofern nicht ein anderer Pfad angegeben wird). Das working directory muss jedes Mal, wenn R bzw. R-Studio neu gestartet wird, gesetzt werden. Die Verwendung eines working directory ist praktisch, da dann nicht ein „ellenlanger“ Pfad angeben werden muss, wo die Datei liegt/hin soll, wenn wir externe Daten lesen oder schreiben wollen. 27

28 Übung im Skript (3) Methodenlehre & Psychologische Diagnostik

29 Übungsaufgaben 1.Erstellen Sie drei Vektoren, indem Sie (für alle drei separat) Daten per Befehl generieren 2.Erstellen Sie ein lineares Modell mit diesen drei Vektoren (zwei UVs eine AV) Der Befehl für ein lineares Modell lautet wie folgt: lm( AV ~ UV1 + UV2 ) 3.Ordnen Sie die Ergebnisse dieses linearen Modells einem Objekt zu 4.Ordnen Sie eine Zusammenfassung dieser Ergebnisse einem weiteren Objekt zu 29

30 RStudio Methodenlehre & Psychologische Diagnostik

31 R-Studio R-Studio ist ein Editor von R, kann also zusätzlich zur (einfacheren) Bedienung von R verwendet werden. Beim Öffnen des Programms werden drei Bereiche – darunter auch die schon bekannte „Konsole“ – angezeigt. Um unsere Befehle einfacher anpassen und abspeichern zu können, verwenden wir ein „R Skript“ (Datei -> Neu -> R Skript). 31

32 Die Konsole  Führt Befehle aus  Zeigt die Ergebnisse der Befehle an Das Skript  Beinhaltet Code  Der Code besteht aus Befehlen  Diese können an die Konsole gesendet werden  Alle zusammen oder getrennt Das Zauberfenster  Kann verschiedene praktische Informationen anzeigen, z.B. die Hilfefunktion oder Grafiken  Wird zu einem späteren Zeitpunkt noch genauer besprochen Die Arbeitsumgebung  Zeigt das „Gedächtnis“ von R an  Wird zu einem späteren Zeitpunkt noch erklärt R-Studio 32

33 R-Studio R-Studio ist ein Editor von R, kann also zusätzlich zur (einfacheren) Bedienung von R verwendet werden. Beim Öffnen des Programms werden drei Bereiche – darunter auch die schon bekannte „Konsole“ – angezeigt. Um unsere Befehle einfacher anpassen und abspeichern zu können, verwenden wir ein „R Skript“ (Datei -> Neu -> R Skript). Im Skript-Fenster können wir jetzt mehrere Befehle hintereinander eingeben und auch wieder verändern, zunächst ohne dass sie auch dabei ausgeführt werden. Um Befehle im Skript-Fenster an die Konsole zu ‚schicken‘ und auszuführen, verwenden wir bspw. die Tasten Strg+Enter (oder bei Mac Command+Enter) 33


Herunterladen ppt "Workshop Einführung in R Florian Pargent, Philipp Sckopke, Sven Hilbert Methodenlehre & Psychologische Diagnostik."

Ähnliche Präsentationen


Google-Anzeigen