Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistiken und Tabellen Referat am 4.12.2006 von Maria Wieländer.

Ähnliche Präsentationen


Präsentation zum Thema: "Statistiken und Tabellen Referat am 4.12.2006 von Maria Wieländer."—  Präsentation transkript:

1 Statistiken und Tabellen Referat am von Maria Wieländer

2 Gliederung Datensatz Datensatz Statistiken Statistiken Tabellen Tabellen Vergleich mit Excel Vergleich mit Excel Zusammenfassung Zusammenfassung

3 Datensatz Amerikanische DNNB – Umfrage von 1998 Amerikanische DNNB – Umfrage von 1998 Religiosität von Personen verschiedener Schichten Religiosität von Personen verschiedener Schichten Kategorien: Kategorien: Häufigkeit der Kirchenbesuche Häufigkeit der Kirchenbesuche Fundamentalismus als Gefahr Fundamentalismus als Gefahr Bedeutung von Religion im eigenen Leben Bedeutung von Religion im eigenen Leben Alter Alter Kinder Kinder Stadt – Land Stadt – Land Bildung Bildung Bildung des Ehepartners Bildung des Ehepartners Region der Umfrage Region der Umfrage Einkommen Einkommen

4 Arbeiten mit dem Datensatz Datensatz in R laden: File -> Load Datafile Datensatz in R laden: File -> Load Datafile >BowlAl1998 BowlAl1998 <- read.table("C:/Dokumente und Einstellungen/Maria/Desktop/Testprogramme/Bo wlAl1998.txt",header=T,sep="\t", quote="");attach(BowlAl1998) Zuordnen von Abkürzungen: Zuordnen von Abkürzungen: > C C<-CHURCH > A A<-AGE > CHI CHI<-CHILDREN > E E<-EDUC

5 Kritik Wenn attach nicht aktiviert ist, ist es sehr kompliziert, mit dem Datensatz in R zu arbeiten Wenn attach nicht aktiviert ist, ist es sehr kompliziert, mit dem Datensatz in R zu arbeiten (C<-BowlAl1998$CHURCH) (C<-BowlAl1998$CHURCH)

6 Statistiken

7 Arithmetisches Mittel Allgemein: Allgemein: > t t<-c(7,8,4,1,5,0,9,8,9,3) > mean(t) > mean(t) [1] 5.4 [1] 5.4 Datensatz: Datensatz: > mean(A) > mean(A) [1] [1]

8 Median 50% der Werte liegen unterhalb des Medians und 50% der Werte oberhalb 50% der Werte liegen unterhalb des Medians und 50% der Werte oberhalb Allgemein: Allgemein: > w w<-c(4,6,2,8,0,9,7,3,4,4) > median(w) > median(w) [1] 4 [1] 4 Datensatz: Datensatz: > median(A) > median(A) [1] 45 [1] 45

9 Minimum und Maximum Allgemein: Allgemein: > min(4,4,7,3,3,8,9,1,6,9) > min(4,4,7,3,3,8,9,1,6,9) [1] 1 [1] 1 > max(4,4,7,3,3,8,9,1,6,9) > max(4,4,7,3,3,8,9,1,6,9) [1] 9 [1] 9 > range(4,4,7,3,3,8,9,1,6,9) > range(4,4,7,3,3,8,9,1,6,9) [1] 1 9 [1] 1 9 Datensatz: > min(A) [1] 18 > max(A) [1] 92 > range(A) [1] 18 92

10 Quantile Allgemein: Allgemein: > p p<-c(2,4,6,7,9,8,1,4,7,8) > quantile(p,0.25) > quantile(p,0.25) 25% 25% 4 > quantile(p,0.75) > quantile(p,0.75) 75% 75% Datensatz: > quantile(A,0.25) 25% 35 > quantile(A,0.75) 75% 60

11 Standardabweichung Allgemein: Allgemein: > u u<-c(4,6,3,6,3,1,9,0,7,4) > sd(u) > sd(u) [1] [1] Datensatz: Datensatz: > sd(A) > sd(A) [1] [1]

12 Varianz Allgemein: Allgemein: > e e<-c(5,3,6,9,2,1,6,8,4,6) > var(e) > var(e) [1] [1] Datensatz: Datensatz: > var(A) > var(A) [1] [1]

13 Einfacher Allgemein: Allgemein: > d d<-c(4,8,4,1,4,2,9,0,5,4) > summary(d) > summary(d) Min. 1st Qu. Median Mean 3rd Qu. Max. Min. 1st Qu. Median Mean 3rd Qu. Max Datensatz: Datensatz: > summary(A) > summary(A) Min. 1st Qu. Median Mean 3rd Qu. Max Min. 1st Qu. Median Mean 3rd Qu. Max

14 Statistiken nach Klassen Datensatz: Datensatz: >tapply(A,C,mean) >tapply(A,C,mean) >tapply(A,C,median) >tapply(A,C,median)

15 tapply(A,C,summary) tapply(A,C,summary)$`1` Min. 1st Qu. Median Mean 3rd Qu. Max. Min. 1st Qu. Median Mean 3rd Qu. Max $`2` Min. 1st Qu. Median Mean 3rd Qu. Max. Min. 1st Qu. Median Mean 3rd Qu. Max $`3` Min. 1st Qu. Median Mean 3rd Qu. Max. Min. 1st Qu. Median Mean 3rd Qu. Max $`4 Min. 1st Qu. Median Mean 3rd Qu. Max. Min. 1st Qu. Median Mean 3rd Qu. Max $`5` Min. 1st Qu. Median Mean 3rd Qu. Max. Min. 1st Qu. Median Mean 3rd Qu. Max $`6` Min. 1st Qu. Median Mean 3rd Qu. Max. Min. 1st Qu. Median Mean 3rd Qu. Max $`7` Min. 1st Qu. Median Mean 3rd Qu. Max. Min. 1st Qu. Median Mean 3rd Qu. Max

16 Auswertung Positives: Positives: Schnelle Ergebnisse auch bei großen Datensätzen Schnelle Ergebnisse auch bei großen Datensätzen Kritik: Kritik: Viele Befehle nicht leicht zu erschließen, Handbuch wäre nötig Viele Befehle nicht leicht zu erschließen, Handbuch wäre nötig c nötig bei per Hand eingegebenen Zahlen c nötig bei per Hand eingegebenen Zahlen (z.B. mean(c(1,2,3,4)) statt mean(1,2,3,4)) (z.B. mean(c(1,2,3,4)) statt mean(1,2,3,4)) Unübersichtliches Layout Unübersichtliches Layout

17 Tabellen

18 Tabellen mit einer Variablen Kirchenbesuche: > table(C) C Alter: > table(A) A

19 Tabellen mit zwei Variablen Kirchenbesuche und Bildung: > table(C,E) E C

20 Alter und Kirchenbesuche: > table(A,C) C A

21 Bilden von Klassen Ermitteln von Minimum und Maximum: Ermitteln von Minimum und Maximum: > range(A) > range(A) [1] [1] Klasseneinteilung: Klasseneinteilung: > table(cut(A,breaks=c(17,25,35,40,50,60,70,80,92))) > table(cut(A,breaks=c(17,25,35,40,50,60,70,80,92))) (17,25] (25,35] (35,40] (40,50] (50,60] (60,70] (70,80] (80,92] (17,25] (25,35] (35,40] (40,50] (50,60] (60,70] (70,80] (80,92]

22 Tabellen mit drei Variablen Kinder, Kirchenbesuch, Bildung > table(C,E,CHI),, CHI = 0 E C ,, CHI = 1 E C

23 Fehlende Werte im Datensatz Summe der fehlenden Werte: Summe der fehlenden Werte: > fC fC<-is.na(C) > sum(fC) > sum(fC) [1] 40 [1] 40 Tabelle mit den fehlenden Werten: Tabelle mit den fehlenden Werten: > ftC ftC<-table(C,exclude=0) > ftC > ftCC

24 Prozentangaben Kirchenbesuche: Kirchenbesuche: > tC tC<-table(C) > tC > tCC In Prozent: In Prozent: > pC pC<-100*tC/sum(tC) > pC > pCC Gerundet: Gerundet: > round(pC,2) > round(pC,2)C

25 Zusammenfügen der Tabellen: Zusammenfügen der Tabellen: > tt tt<-rbind(tC,pC) > tt > tt tC pC

26 Tabellen in Prozent: >t t<- table(C,E)>t E C > pt<-round(100*t/sum(t),2) > pt E C

27 Zeilen- und Spaltensummen Tabelle: > t t<-table(C,E) > t E C Tabelle mit fehlenden Werten: > ee<-table(C,E,exclude=c(0)) > ee E C

28 Spaltensumme: > e e<-table(E,exclude=0) > e E Zeilensumme: > l l<-table(C,exclude=0) > l C Gesamtsumme: > s s<-sum(e) > s [1] 3350 Anfügen der Gesamtsumme: > gs gs<-c(e,s) > gs

29 Anfügen der Zeilensummen: Anfügen der Zeilensummen: > v v<-cbind(ee,l) > v l l Anfügen derSpaltensummen: > w<-rbind(v,gs) > w l gs

30 Auswertung Positives: Positives: einfache Tabellen können schnell erstellt werden einfache Tabellen können schnell erstellt werden Kritik: Kritik: gerade bei großen Tabellen unübersichtlich, da keine Linien gerade bei großen Tabellen unübersichtlich, da keine Linien Tabellen mit Klassenbildung zu aufwändig Tabellen mit Klassenbildung zu aufwändig fehlende Daten tauchen nur bei gesondertem Befehl auf fehlende Daten tauchen nur bei gesondertem Befehl auf kein expliziter Befehl für Prozentangaben kein expliziter Befehl für Prozentangaben Bildung von Tabellen mit angefügten Zeilen- und Spaltensummen sehr umständlich Bildung von Tabellen mit angefügten Zeilen- und Spaltensummen sehr umständlich

31 Vergleich mit Excel

32 Laden des Datensatzes in Excel

33

34 Statistiken Auswählen der Funktion Auswählen der Funktion

35 Angeben des Datenbereiches Angeben des Datenbereiches

36 Alternativ Alternativ

37 Ergebnis Ergebnis

38

39 Erstellen von Tabellen Einfügen von Einsern Einfügen von Einsern

40 Tabellenfunktion Tabellenfunktion

41 Auswählen der Kategorien und Ziehen von x in den Datenfelderbereich Auswählen der Kategorien und Ziehen von x in den Datenfelderbereich

42 Tabelle Tabelle

43 Auswertung Befehle für Statistiken in Excel leichter zu finden, da schon vorgegeben Befehle für Statistiken in Excel leichter zu finden, da schon vorgegeben Aber Excel gibt nur das Ergebnis zurück, ohne konkrete Benennung Aber Excel gibt nur das Ergebnis zurück, ohne konkrete Benennung Summary - Funktion in R nützlich Summary - Funktion in R nützlich Tabellen in Excel einfacher zu erstellen und übersichtlicher, aber wenn Einser nicht eingefügt, werden nicht immer alle Werte berücksichtigt Tabellen in Excel einfacher zu erstellen und übersichtlicher, aber wenn Einser nicht eingefügt, werden nicht immer alle Werte berücksichtigt

44 Fazit Positives: Positives: Einsatz von R bei großen Datensätzen sinnvoll Einsatz von R bei großen Datensätzen sinnvoll Besonders bei Statistiken hilfreich Besonders bei Statistiken hilfreich Kritik: Kritik: R für Tabellen weniger geeignet R für Tabellen weniger geeignet Befehle müssen den Schülern vorgegeben werden Befehle müssen den Schülern vorgegeben werden Handbuch mit den für die Schule wichtigen Befehlen nötig Handbuch mit den für die Schule wichtigen Befehlen nötig


Herunterladen ppt "Statistiken und Tabellen Referat am 4.12.2006 von Maria Wieländer."

Ähnliche Präsentationen


Google-Anzeigen