Workshop Einführung in R Florian Pargent, Philipp Sckopke, Sven Hilbert Methodenlehre & Psychologische Diagnostik.

Slides:



Advertisements
Ähnliche Präsentationen
Support.ebsco.com Lernprogramm zum Erstellen einer lokalen Sammlung.
Advertisements

OStR Dipl. Ing. Carsten Kraft
Seminar Stochastik im WS 02/03
Klicke Dich mit der linken Maustaste durch das Übungsprogramm!
Der Präprozessor. Bevor der Compiler das Programm in Maschinencode übersetzt (nur dieser kann von der CPU, dem Herz des Computers, bearbeitet werden)
Dynamischer Speicher. In einer Funktion wird z.B. mit der Deklaration int i; Speicher auf dem sogenannten Stack reserviert. Wenn die Funktion verlassen.
Datenbankanbindung mit ASP Wilhelm-Schickard-Schule Tübingen
EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido
Excel Kurs Teil I Excel starten, Verknüpfungen auf dem Desktop anlegen. F. Bäumer.
Eine Homepage für die Fachberatung Thomas Scholz.
DVG Klassen und Objekte
Heute: Scherenzange zeichnen
Kakuro Regeln und Strategien
Klicken Sie in der Meldungsleiste auf Bearbeitung aktivieren,
Histogramm/empirische Verteilung Verteilungen
Wie man eine einfache Präsentation erstellt...
Hyperlinks und Anker Links notieren
Übungsaufgaben für Microsoft Excel
Javakurs FSS 2012 Lehrstuhl Stuckenschmidt
Was macht eigentlich dieses ExsoForm? Ein Beispiel für eine Dokumentendefinition in Screenshots.
Klicken Sie in der Meldungsleiste auf Bearbeitung aktivieren,
Anlegen von Ordnern, speichern und Öffnen von Bildern und Briefen
Wie man eine einfache Präsentation erstellt...
Ganzheitliches Projekt-, Ressourcen- und Qualitätsmanagement 1 Reports und AddOns Auf den folgenden Seiten wird Ihnen die Funktionsweise der Reports und.
Freiwillige Feuerwehr der Stadt Perg
Vor dem Einlesen eines LV wird ein Projekt definiert. Für die Bedienung von x:plan sind folgende Elemente anwählbar:
DATEISPEICHER in der S P S
PHP: Operatoren und Kontrollstrukturen
1 Tagesüberblick 2 Lösung Hausaufgabe/Fragen Datei- ein- und ausgabe Schleifen Vergleiche Wahrheit.
Der Windows-Desktop Beispiel für den Windows-Desktop.
Einführungstutorial: Linux Konsole
Grundlagen von PowerPoint
Excel Grundlagen.
Übung 2 - MdMT Methoden der Medizintechnik Übung zur Vorlesung Folge 2 – Basics Vom ersten Befehl zum Plot.
Die Vereinsverwaltung unter Windows 2000 Anhand der folgenden Präsentation werden Sie mit der Verwaltung des Vereins unter Windows 2000 vertraut gemacht.
(Syntax, Strings/Zahlen, Variablen, Arrays)
Java-Kurs Übung Besprechung der Hausaufgabe
Pool Informatik, Sj 11/12 GZG FN W.Seyboldt 1 Pool Informatik 5 GZG FN Sj. 11/12 Kopieren, Daten, Programme.
WiWi WS2015 Excel Grundlagen Fachbereich Wirtschaftswissenschaften.
Vorstellen und Herleiten der Horner Schemas
Arbeiten mit WordSmith 4. Inhalt 1. Arbeiten mit der Funktion Wortliste (im getaggten Korpus) 1. Arbeiten mit der Funktion Wortliste (im getaggten Korpus)
1 Suchprofile erstellen und verwalten. 2 Suchprofile bei Registrierung Hier können Sie bis zu drei Suchprofile einrichten. Diese finden Sie später unter.
Tutorium Software-Engineering SS14 Florian Manghofer.
Pointer, Arrays und verkettete Listen. Mehrdimensionale Arrays  Pointer auf ein Array von Pointern  int32 **matrix = new int32*[3];  matrix: Zeiger.
J. Nürnberger2007 / 081 Tabellenkalkulation (3) Arbeiten mit Formeln am Beispiel von OpenOffice.org Calc.
Lars Tremmel ETH Informatikdienste Managed Services September 2013
SurveyCAU Handbuch - Dozent*innen -.
Das Entwurfsmuster Model-View-Controller
Graphen.
Klausur „Diskrete Mathematik II“
Das IT - Informationssystem
Serienbrief erstellen mit LibreOffice Writer
General Download Finder
Zusammenfassende Übung 2
VERRÜCKT ! Dies ist eine kleine Mathe Übung die Dich mehr als einmal staunen lassen wird !!!
Effizientes Arbeiten am PC
Grundlagen und Grundbegriffe
Fachbereich Wirtschaftswissenschaften
Installation und Beispiele
Lernmodul Einführung Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Nutzungsbedingungen:
Arrays in Java Ein Array ist eine Variable, die aus einer An-zahl von Elementen des gleichen Datentyps besteht, die aufeinanderfolgend im Speicher liegen.
Hilfe Dokumente.
Implementieren von Klassen
Lernmodul Einführung Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Nutzungsbedingungen:
Was kann oder bietet Outlook XP
[Titel des überzeugenden Vortrags hier eingeben]
Vorstellen und Herleiten der Horner Schemas
E-Aufgaben in Stud.IP mit ViPS – erste Schritte –
Microsoft Excel S-Verweis Excel: SVerweis.
 Präsentation transkript:

Workshop Einführung in R Florian Pargent, Philipp Sckopke, Sven Hilbert Methodenlehre & Psychologische Diagnostik

Allgemeine Einführung Methodenlehre & Psychologische Diagnostik

Organisatorisches HERZLICH WILLKOMMEN! Der Workshop dient der Einführung in die Bedienung von R und der Übung von ersten Befehlen und des Arbeitens mit Datensätzen. Datensätze, Präsentation und kommentiertes Skript werden auf der Homepage des Lehrstuhls Methodenlehre bereitgestellt. Der Workshop besteht aus zwei Teilen: 1.Tag: Einführung in die Funktionsweise von R und Erlernen einfacher Befehle. 2.Tag: Arbeiten mit Datensätzen und weiterführende Analysen. Für den Brückentag (Mittwoch) wird ein Online-Tutorium empfohlen, welches unter folgender Adresse abgerufen werden kann: tryr.codeschool.com Literatur zum Nachschlagen und Weiterlernen: Navarro, D. (2014). Learning Statistics with R. A tutorial for psychology students and other beginners (Version 0.4). Abgerufen von 3

R (I) R ist ein open-source Statistikprogramm Beim Öffnen des Programms wird die „Konsole“ angezeigt. Dort können einfache Befehle eingegeben werden – durch Drücken der Enter-Taste werden sie ausgeführt. Es können beispielsweise schon einfache Rechenoperationen direkt in der Konsole durchgeführt werden. Addieren (+), Subtrahieren (-), Multiplizieren (*), Dividieren (/), Potenzieren (^) erfordern teilweise andere Symbole als gewohnt. Dezimaltrennzeichen ist der. und nicht das, 4

R (II) Auch logische Vergleiche sind möglich, also ob ein Wert größer (>) oder kleiner (<) oder gleich (==) einem zweiten Wert ist. WICHTIG: das einfache Gleichheitszeichen (=) hat eine andere Bedeutung und darf für solche Vergleiche nicht verwendet werden. Möchten wir unsere Befehle kommentieren, also weitere Informationen bspw. für die spätere Bearbeitung hinzufügen, verwenden wir das # Zeichen. Alles was hinter der # steht, wird von R nicht als Befehl ausgeführt. 5

Datentypen In R können unterschiedliche Typen von Daten verwendet werden: Numerische Werte (numeric) Numerische Werte können beispielsweise für mathematische Operationen verwendet werden. Characterwerte (character) Auch längerer Text („Zeichenketten“) kann in R verwendet werden. Damit funktionieren mathematische Operationen wie z.B. die Bildung einer Summe nicht, dafür können damit Benennungen o.ä. vorgenommen werden. Zeichenketten sind immer dadurch gekennzeichnet, dass Sie mit einem „ beginnen und mit einem “ enden. Logische Werte (logical) Logische Werte gibt es nur in den beiden Ausprägungen TRUE und FALSE. Sie können beispielsweise als Ergebnisse von logischen Vergleichen auftreten. 6

Objekte Wie auch beim Taschenrechner sind Daten in R grundsätzlich erstmal flüchtig. Für die spätere Verwendung können wir alles in R einem Objekt zuweisen. Hierfür benötigen wir den Zuweisungsoperator <- a <- 5 Das was auf der rechten Seite des Pfeils steht (der numerische Wert 5) wird dem Objekt a zugewiesen. Verwenden wir im Folgenden das Objekt a, nimmt es dabei ebenfalls den gerade zugewiesenen numerischen Wert 5 an. Auch Ergebnisse von komplexeren Operationen können einem Objekt zugewiesen werden. a < * 2 Nun wird das Objekt a bei nachfolgender Verwendung den Wert (das Ergebnis) der Rechenoperation * 2 annehmen (der numerische Wert 19) 7

Einfache Funktionen Komplexere Operationen mit Daten können über Funktionen vorgenommen werden. Funktionen haben einen eindeutigen Namen (Groß-/Kleinschreibung beachten!) Das, womit die Funktion etwas machen soll, steht direkt hinter dem Namen in runden Klammern. Die Informationen die man angibt, damit die Funktion das tut was sie soll, nennt man Argumente. Eine Funktion zur Berechnung der Quadratwurzel (z.B. der Zahl 4): sqrt(4) Funktionen können verschachtelt werden (dabei wird immer von innen nach außen gelesen). exp(sqrt(1)) berechnet sqrt(exp(1)) berechnet 8

Was kann schief gehen? Sobald die Syntax der Befehle nicht korrekt ist, macht R nicht was wir wollen... Hier wurde die Klammer am Ende des Befehls vergessen. R wartet auf diese Klammer um den Befehl auszuführen und macht gar nichts (es werden lediglich + Zeichen angezeigt), bevor wir nicht die Klammer geschlossen haben. Das gleiche ist hier passiert, nur fehlt hier ein “ am Ende der Zeichenkette „Markus“. Auch hier wartet R so lange bis wir manuell ein “ eingefügt haben (das ist gar nicht so einfach, weil R oft automatisch zwei “ setzt. Sobald wieder das > am Beginn der Zeile der Konsoleauftaucht, ist R bereit für neue Eingaben. 9

Übung im Skript (1) Methodenlehre & Psychologische Diagnostik

Vektoren, Matrizen, Dataframes Methodenlehre & Psychologische Diagnostik

Vektoren Vektoren enthalten mehrere Elemente eines Typs und werden mit der „Combine“ Funktion c( ) erstellt. Ein numerischer Vektor: a <- c(2, 4, 5, 3, 18, 20154, 3.5) Ein Character-Vektor: b <- c(„Philipp“, „Eva“, „Felix“) Wenn wir nur einzelne Elemente eines Vektors verwenden möchten, brauchen wir [] In den [] direkt hinter dem Vektor steht die Position des Elements, das ich entnehmen möchte. Im Beispiel also das dritte Element des Vektors a Der Befehl length( ) gibt die Länge (= Anzahl Elemente) des Vektors aus 12

Matrix Eine Matrix enthält auch mehrere Elemente eines Typs, allerdings in Zeilen und Spalten angeordnet Genauso wie ein Vektor mit der Funktion c( ) gebildet wird, wird eine Matrix mit der Funktion matrix( ) erstellt. Dabei muss angegeben werden, in wie vielen Zeilen und Spalten die Werte angeordnet sein sollen: In diesem Fall werden die Werte des Vektors a (den wir eine Folie vorher gebildet haben) in einer Matrix angeordnet, die drei Zeilen (nrow = 3) und zwei Spalten (ncol = 2) hat. Wenn wir jetzt einzelne Werte aus einer Zeile und/oder Spalte auswählen wollen, brauchen wir in den [] beide Informationen, die durch ein „, „ voneinander getrennt sind. 13

Matrix Auch eine Matrix können wir mit [] indizieren Wenn wir jetzt einzelne Werte aus einer Zeile und/oder Spalte auswählen wollen, brauchen wir in den [] beide Informationen, die durch ein „, „ voneinander getrennt sind. Hier speichern wir zunächst die Matrix auf das Objekt m und wählen dann das 2. Element der 1. Spalte aus. In den [] steht immer der Zeilenindex vor – und der Spaltenindex nach dem Komma. Möchte ich alle Werte einer Zeile oder Spalte auswählen, lasse ich den Platz vor oder hinter dem Komma einfach leer: hier erhalte ich alle Werte der 2. Zeile hier erhalte ich alle Werte der 1. Spalte 14

Dataframes Ein Dataframe ist ebenfalls in Zeilen und Spalten angeordnet, kann jedoch auch Spalten unterschiedlichen Typs beinhalten. Zunächst erstellen wir den Vektor Namen mit den Namen, dann den Vektor Alter mit dem Alter der Probanden. Mit der Funktion data.frame( ) verknüpfen wir beide Vektoren zu einem einzelnen data.frame, den wir gleich dem Objekt Daten zugewiesen und danach angezeigt haben. Bei einem data.frame können wir mit auch direkt auf die Spalten über ihren Namen zugreifen: 15

Übung im Skript (2) Methodenlehre & Psychologische Diagnostik Mit Aufgaben

Übungsaufgaben 1.Erstellen Sie einen numerischen Vektor c(...) 2.Nutzen Sie einen Befehl, der die Länge dieses Vektors ausgibt 3.Erstellen Sie einen zweiten numerischen Vektor gleicher Länge 4.Erstellen Sie einen dritten Vektor, dessen Elemente die Differenzen der Elemente der anderen beiden Vektoren sind 5.Erstellen Sie eine 2 x 2 Matrix mit Namen (also mit Charactern als Elementen) 6.Erstellen Sie einen Dataframe, in dem eine Spalte aus numerischen Werten und die zweite aus Charactern besteht 17

Übungsaufgaben (2) 7.Erstellen Sie einen Dataframe mit fünf Fällen. In der ersten Spalte geben Sie Namen ein, in der zweiten Spalte Testergebnisse und in der dritten Spalte Ergebnisse eines anderen Tests (alles beliebig) 8.Nutzen Sie den summary( ) Befehl, um sich eine Zusammenfassung der zweiten Spalte ausgeben zu lassen 9.Ordnen Sie diese Zusammenfassung einem Objekt zu und bestimmen Sie Klasse und Modus des Objekts 10.Nutzen Sie den table( ) Befehl, um sich die Häufigkeiten der dritten Spalte ausgeben zu lassen 11.Orden Sie diese Häufigkeiten einem weiteren Objekt zu und bestimmen Sie Klasse und Modus des Objekts 12.Suchen Sie per Befehl die Person mit dem niedrigsten Ergebnis in Test 1 und jene mit dem höchsten Ergebnis in Test 2 13.Erstellen Sie eine Matrix mit den Namen dieser beiden Personen in der ersten Spalte und den Ziffern „1“ und „2“ in der zweiten Spalte 18

Funktionen und Packages Methodenlehre & Psychologische Diagnostik

Funktionen Funktionen haben wir bereits kennen gelernt. Mit ihnen können Daten aller Art in R bearbeitet werden. Funktionen haben einen eindeutigen Namen (Groß-/Kleinschreibung beachten!) Das, womit die Funktion etwas machen soll, steht direkt hinter dem Namen in runden Klammern. Die Informationen, die man angibt, damit die Funktion das tut, was sie soll, nennt man Argumente. Funktionen können auch mehrere Argumente haben, diese sind dann mit einem „, „ voneinander getrennt. Beispiel: Wenn wir einen Wert runden möchten, müssen wir der Funktion sagen, auf wie viele Stellen gerundet werden soll: 20

Ein paar Funktionen zur Datengenerierung ● rep( ) ● Generiert eine Reihe gleicher Zahlen ● seq( ) ● Generiert eine Sequenz von Zahlen ● sample( ) ● Generiert eine Zufallsauswahl ganzer Zahlen ● Gleichverteilt mit oder ohne Zurücklegen  Zur Reproduzierbarkeit der Daten empfiehlt es sich einen Seed zu setzen:  set.seed( ) 21

Ein paar Funktionen zur Datenübersicht ● mode( ) ● Zeigt den Typ des Objekts an ● class( ) ● Zeigt an, als welcher Datentyp das Objekt von anderen Befehlen behandelt wird ● str( ) ● Zeigt die Struktur des Objektes in Kompakter Form an ● table( ) ● Gibt eine Häufigkeitstabelle für einen Datensatz aus ● summary( ) ● Gibt eine Übersicht eines Datensatzes oder Objektes aus: 22

Ein paar Funktionen für Graphiken ● plot( ) kreiert einen simplen simplen Scatterplot ● Verschiedene graphische Argumente können angegeben werden ● col = „red“ oder col = “blue“ etc. ● type = „p“ (für Punkte), type = „l“ (für Linien), type = „b“ (für beides) ● xlim = c(-5,5) setzt die abgebildete X-Achse von -5 bis +5 ● ylim analog ● etc. ● hist( ) erzeugt ein Histogramm ● barplot( ) erzeugt ein Balkendiagramm ● Um mehrere Graphiken nebeneinander darzustellen, kann durch par(mfrow = c(2,2)) der Grafikbereich geteilt werden (hier: 2 x 2 Plotbereiche) 23

Funktionen - Hilfe Wenn wir wissen möchten, wie eine Funktion arbeitet, also z.B. wie die einzelnen Argumente heißen, brauchen wir die Hilfe (Im „Zauberfenster“ unter Help). 24 In diesem Suchfenster können wir den Namen der Funktion angeben, zu der wir Hilfe benötigen

Funktionen - Hilfe 25 Eine kurze Beschreibung der Funktion Welche Argumente kann ich mit der Funktion verwenden (hier nur sehr wenige) Eines der Argumente hat einen Standardwert (FALSE) In diesem Abschnitt werden die Argumente erklärt Hier werden Details zur Funktionsweise erklärt Hier wird erklärt, was als Ergebnis der Funktion ausgegeben wird Nicht dargestellt: Example Hier werden kurze Beispiele gezeigt, wie die Funktion funktioniert.

Pakete – Packages - Libraries Der Funktionsumfang von R kann mit Paketen (synonym: Library) erweitert werden. Pakete müssen nur einmal installiert werden (außer nach einem größeren Update von R). Pakete müssen jedes Mal, wenn R bzw. R-Studio geöffnet wird und sie verwendet werden sollen, geladen werden. Pakete installieren: „Zauberfenster“ -> Packages -> Install -> Name des Pakets eingeben -> Install Pakete laden: Im R-Skript mit der Funktion library(Name des Pakets). Für das Paket psych also so: 26

Umgang mit Daten Um komfortabel mit externen Daten arbeiten zu können, ist es zweckmäßig ein Arbeitsverzeichnis (working directory) zu setzen. Im working directory werden standardmäßig Dateien geschrieben und zu öffnende Dateien gesucht (sofern nicht ein anderer Pfad angegeben wird). Das working directory muss jedes Mal, wenn R bzw. R-Studio neu gestartet wird, gesetzt werden. Die Verwendung eines working directory ist praktisch, da dann nicht ein „ellenlanger“ Pfad angeben werden muss, wo die Datei liegt/hin soll, wenn wir externe Daten lesen oder schreiben wollen. 27

Übung im Skript (3) Methodenlehre & Psychologische Diagnostik

Übungsaufgaben 1.Erstellen Sie drei Vektoren, indem Sie (für alle drei separat) Daten per Befehl generieren 2.Erstellen Sie ein lineares Modell mit diesen drei Vektoren (zwei UVs eine AV) Der Befehl für ein lineares Modell lautet wie folgt: lm( AV ~ UV1 + UV2 ) 3.Ordnen Sie die Ergebnisse dieses linearen Modells einem Objekt zu 4.Ordnen Sie eine Zusammenfassung dieser Ergebnisse einem weiteren Objekt zu 29

RStudio Methodenlehre & Psychologische Diagnostik

R-Studio R-Studio ist ein Editor von R, kann also zusätzlich zur (einfacheren) Bedienung von R verwendet werden. Beim Öffnen des Programms werden drei Bereiche – darunter auch die schon bekannte „Konsole“ – angezeigt. Um unsere Befehle einfacher anpassen und abspeichern zu können, verwenden wir ein „R Skript“ (Datei -> Neu -> R Skript). 31

Die Konsole  Führt Befehle aus  Zeigt die Ergebnisse der Befehle an Das Skript  Beinhaltet Code  Der Code besteht aus Befehlen  Diese können an die Konsole gesendet werden  Alle zusammen oder getrennt Das Zauberfenster  Kann verschiedene praktische Informationen anzeigen, z.B. die Hilfefunktion oder Grafiken  Wird zu einem späteren Zeitpunkt noch genauer besprochen Die Arbeitsumgebung  Zeigt das „Gedächtnis“ von R an  Wird zu einem späteren Zeitpunkt noch erklärt R-Studio 32

R-Studio R-Studio ist ein Editor von R, kann also zusätzlich zur (einfacheren) Bedienung von R verwendet werden. Beim Öffnen des Programms werden drei Bereiche – darunter auch die schon bekannte „Konsole“ – angezeigt. Um unsere Befehle einfacher anpassen und abspeichern zu können, verwenden wir ein „R Skript“ (Datei -> Neu -> R Skript). Im Skript-Fenster können wir jetzt mehrere Befehle hintereinander eingeben und auch wieder verändern, zunächst ohne dass sie auch dabei ausgeführt werden. Um Befehle im Skript-Fenster an die Konsole zu ‚schicken‘ und auszuführen, verwenden wir bspw. die Tasten Strg+Enter (oder bei Mac Command+Enter) 33