Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
1
Empirische Softwaretechnik
Prof. Dr. Walter F. Tichy Dr. Frank Padberg Sommersemester 2007
2
Boxplots
3
Graphische Darstellung
veranschaulicht die Werte einer Stichprobe
4
Median gegeben eine sortierte Stichprobe
Median gibt den „mittleren“ Wert der sortierten Stichprobe an eine Hälfte der Stichproben-Werte ist kleiner als der Median, die andere Hälfte ist größer
5
Berechnung des Median Stichprobenumfang N ungerade, dann Median gleich Stichprobenwert Nummer N gerade, dann Median mittig zwischen den Stichprobenwerten Nummer und
6
Median (Forts.) Median ist unempfindlicher gegen Ausreißer als der Mittelwert Beispiele: Stichprobe 3,4,8,9,15 hat Median 8,Mittelwert 7,8 Stichprobe 3,4,8,9,100 hat auch Median 8,Mittelwert 24,8. Stichprobe 1,3,4,8,9,15 hat Median
7
Quartile das erste und dritte Quartil Q1 und Q3 geben (in etwa) die Schranken für das untere und obere Viertel der sortierten Stichprobe an der Interquartil-Bereich umfasst (in etwa) die „mittlere“ Hälfte der Datenpunkte das zweite Quartil Q2 ist genau der Median
8
Berechnung der Quartile
Vorsicht: es gibt mehrere Berechnungs- vorschriften, die aber leicht unterschiedliche Ergebnisse liefern das liegt daran, daß J. W. Tukey für seine Boxplots mit den sogenannten „hinges“ gearbeitet hat, die aber nur für genau die Quartile liefern
9
Berechnung der Quartile (Forts.)
Stichprobenumfang Q1 auf 3/4 der Strecke zwischen den Stichprobenwerten Nummer k und k +1 Q2 mittig zwischen den Stichprobenwerten Nummer 2k und 2k +1 Q3 auf 1/4 der Strecke zwischen den Stichprobenwerten Nummer 3 k und 3 k +1
10
Berechnung der Quartile (Forts.)
Stichprobenumfang Q1 = H1 gleich dem Stichprobenwert Nummer k +1 Q2 = M gleich dem Stichprobenwert Nummer 2 k +1 Q3 = H2 gleich dem Stichprobenwert Nummer 3 k +1 hinge = Angelpunkt, Scharnier
11
Berechnung der Quartile (Forts.)
Stichprobenumfang Q1 auf 1/4 der Strecke zwischen den Stichprobenwerten Nummer k +1 und k +2 Q2 mittig zwischen den Stichprobenwerten Nummer 2 k +1 und 2 k +2 Q3 auf 3/4 der Strecke zwischen den Stichprobenwerten Nummer 3 k +1 und 3 k +2 D.h. im Interquartil-Bereich liegen 2 k Werte, außerhalb 2 k +2 Werte
12
Berechnung der Quartile (Forts.)
Stichprobenumfang Q1 mittig zwischen den Stichprobenwerten Nummer k +1 und k +2 Q2 ist der Stichprobenwerten Nummer 2 k +2 Q3 mittig zwischen den Stichprobenwerten Nummer 3 k +2 und 3 k +3
13
Berechnung der Quartile (Forts.)
Beispiel: Stichprobe 10,15,18,33,34,36,51,73,80,86,92 Median ist 36 (mittlerer Datenpunkt) das erste Quartil ist 25,5 (mittig zwischen 18 und 33) das dritte Quartil ist 76,5 (mittig zwischen 73 und 80) der Interquartilbereich ist [25,5; 76,5] .... ....und hat die Länge
14
Quartile mit R a <- c(10,15,18,33,34,36,51,73,80,86,92)
median(a) [1] 36 quantile(a) 0% 25% 50% 75% 100%
15
Quartile mit R (Forts.) b <- c(99,61,18,98,80,95,118,93,36,14)
sort(b) [1] quantile(b) % 25% 50% 75% 100%
16
Quartile mit R (Forts.) c <- c(10,15,18,33,34,36,51,73,80,86,92,93)
quantile(c) % 25% 50% 75% 100%
17
Whiskers der untere whisker („Schnurrhaar“) entspricht dem kleinsten Datenpunkt, der um nicht mehr als unterhalb des ersten Quartils liegt der obere whisker ist analog definiert die whisker verdeutlichen die Schwankung in der Stichprobe Außerhalb der whisker liegende Punkte heißen Ausreisser.
18
Boxplots mit R a <- c(10,15,18,33,34,36,51,73,80,86,92) boxplot(a)
19
Multiple Boxplots mit R
b <- c(99,61,18,98,80,95,118,93,36,14) boxplot(list(eins=a,zwei=b))
Ähnliche Präsentationen
© 2025 SlidePlayer.org Inc.
All rights reserved.