Aufgabenzettel V Statistik I © by Ewald Krawitz & Oliver Schattmann
Aufgabe 2a) //Einlesen der Ereignisse > x<- c(58,49,58,57,50,60,64,65,65,59,65,65,45, 54,52,59,65,57,63,54,65,60,61,47,60,52,63, 61,54,63,62,56,56,65,56,64,65,55,59,65,64, 49,65,50,65,61,64,61,59,63,58,57,65,60,55, 64,65,59,62,65,64,54,56,58,40,85,53,61,56, 65,58,58,55,52,65,60,65,63,64,63,60,61,61, 65,56,62,65,54,64,63,57,64,62,58,60,52,53, 62,56,65)
Aufgabe 2a) //Ereignisse in tabellierter Form darstellen > table(x) 40 45 47 49 50 52 53 54 55 56 1 2 4 5 3 7 57 58 59 60 61 62 63 64 65 85 4 7 5 9 20 1
Aufgabe 2a) Berechnung der 5 Zahlenzusammenfassung per Hand: Median = (x50+x51)/2=(60+60)/2=60 1.Angel = (x25+x26)/2=(56+56)/2=56 2. Angel = (x75+x76)/2=(64+64)/2=64 Minimum = x1=40 Maximum =x100=85
Aufgabe 2a) //Berechnung der wichtigen Werte > summary(x) 5 Zahlenzusammenfassung //Berechnung der wichtigen Werte > summary(x) Min. 1st Qu. Median 3rd Qu. Max. 40.00 56.00 60.00 64.00 85.00
Aufgabe 2a) //Ausgabe des Boxplots > boxplot(x,ylab="Rockwell",xlab="Stahlhärte")
Aufgabe 2a) Erste 25% sind relativ weit verstreut Der Mittelwert ist nahe dem Median nämlich 59.59 zu 60. Dies zeigt, dass der Ausreißer mit 85, nicht zu stark ins Gewicht fällt. Die letzten Werte liegen dicht beieinander hinter der letzten Angel
Aufgabe 2a) //Ausgabe des Stabdiagramm > plot(table(x))
Aufgabe 2a) Zwischen 52 und 65 existieren die meisten Beobachtungen 65 ist Modalwert, da es doppelt so oft vor kommt, wie alle anderen Werte
Aufgabe 2B) (cj-1)<xj≤(cj) ni hi ∆xi fi [30-40] 1 1/100 10 0,001 Entwerfen der Häufigkeitstabelle: (cj-1)<xj≤(cj) ni hi ∆xi fi [30-40] 1 1/100 10 0,001 (40-50] 6 6/100 0,006 (50-60] 44 44/100 0,044 (60-70] 48 48/100 0,048 (70-80] - (80-90] (90-100]
Aufgabe 2B) //Ausgabe des Histogramms > hist(x,breaks=c(30,40,50,60,70,80,90,100))
Aufgabe 2b) Am Histogramm kann man gut erkennen, dass in der Mitte eine Stauung des Datensatzes ist, da dort ca. 90% aller Ereignisse auftreten
Boxplotdiagramm Aufbau des Datensatzes Gut geeignet Schlecht geeignet Aufbau des Datensatzes Um größere Stichproben zu bewältigen Eignet sich, verschiedene Datensätze miteinander zu vergleichen Über absolute und relative Häufigkeiten einzelner Ausprägungen kann keine Aussage getroffen werden Boxplotdiagramm
Histogramm Aussage über die Dominanz einzelner Klassen möglich Gut geeignet Schlecht geeignet Aussage über die Dominanz einzelner Klassen möglich Struktur der Daten gut erkennbar Häufigkeiten einzelner Ausprägungen sind nicht zu erkennen Histogramm
Stabdiagramm Gibt genauen Aufschluss über absolute Häufigkeiten Gut geeignet Schlecht geeignet Gibt genauen Aufschluss über absolute Häufigkeiten Gibt den Modalwert zu erkennen Die Häufigkeitsverhältnisse verschiedener Ausprägungen lassen sich bei einer größeren Menge von Ausprägungen unter Umständen nicht veranschaulichen Stabdiagramm
Man sieht, in welchem Bereich alle Daten liegen Aufgabe 2b) Welche Fragen lassen sich mittels statistischer Maßzahlen beantworten? Man sieht, in welchem Bereich alle Daten liegen Die statistischen Maßzahlen enthalten alle Informationen, die auch Box-Plot Diagramm enthält, allerdings in grafischer Form Mit der Varianz als Zahl kann man kaum arbeiten Die Standardabweichung kann eine Aussage über die Streuung der Daten treffen. Je kleiner sie ist, desto dichter liegen die Werte am arithmetischen Mittel Über Ausreißer lässt sich mithilfe der statistischen Maßzahlen keine Aussage treffen Minimum, Maximum des Datensatzes erkennbar