2.4.2 Median Wiederholung (Kap. 2: Beschreibende Statistik) Eine gegebene Liste von n Messwerten sei der Größe nach angeordnet: X = { x1 x2 …. xn } Der Median ist der (evtl. gemittelte) Wert “in der Listen-Mitte” x_med = x k mit k = [n/2] +1 falls n ungerade = (x k + x k+1)/2 mit k = n/2 falls n gerade Bsp a: Bsp b: X = { 3 3 4 6 } X = { 3 3 3 3 3 4 6 } x_med = 3.5 x_med = 3 Hier: Links und rechts von 3.5 liegen …hier liegen auch links und rechts genau so viele Werte, der “3 in der Listen-Mitte” genau so viele Werte, die kleiner bzw. größer sind aber die Werte können auch gleich 3 sein!!! Bemerkung: Die Werte können auch rein ordinal sein: Bsp c: (Schmetterlinge) Werte (Insekten-Stadien) Anzahlen Gesamtzahl: n = 29, k = [n/2]+1 = 15, x_med = Larve 1, denn x 15 hat den Wert: “Larve 1” Für eine reele Zahl z bezeichnet die “Gauss-Klammer” k = [z] die kleinste ganze Zahl k z. Beispiel: [3.75] = 3 Ei Larve 1 Larve 2 Puppe Adult 10 5 7 3 4
Schwalbenpositionen X = [1 3 4 7] q = 1 Blaue Punkte: Position y = y(t) einer zusätzlichen Schwalbe während ihrer dynamischen Gradienten-Suche nach der Minimum-Position = „Mitte“ Grüne Kurve: SUM1 (y)
SUM = Summe der quadratischen Abstände von einem Punkt y zu den (roten) Positionen Blaue Punkte: Position y = y(t) einer zusätzlichen Schwalbe während ihrer dynamischen Gradienten-Suche nach der Minimum-Position = „Mitte“ Grüne Kurve: SUM2 (y) Schwalbenpositionen X = [1 1 2 3 4 7] q = 2 y
2.4.3 Kumulatives Häufigkeitsdiagramm Neue Form der beschreibenden Darstellung von Daten 2.4.3 Kumulatives Häufigkeitsdiagramm Bsp: X = [ 1 1 2 3 4 7 ] Der Median ist x_med = 2.5 (rot) Die empirische (kumulative) Verteilungsfunktion ist die Kumulative Häufigkeit auf 1 normiert: F(x) = KH(x) / n Diese bezeichnet die relative Häufigkeit von Daten mit Werten x Beispiel: F(5) = 0.83 = 5/6 dh.: Unterhalb von 5 (magenta) liegen 5/6 aller Werte !
Haufigkeitsdiagramme der Ausflugweiten von Schmetterlingen
P-Quantile der Datenreihe X = { 3 3 3 4 7} ¼ - ¾ Interquantil (blue) P = 0.60 - Quantil Linie bei (1 + P*(n-1)) / n (magenta)
Boxplot erstellt von 15 Datenwerten X1, ...... Xn, welche um den Mittelwert m = 11.2 (schwarz) herum streuen mit Standardabweichung S = 3.67 [m – S, m + S] (schwarzer Balken) Der Median ist x_med = 10.0 (rot) P = 0.20 – Quantil xP = 8.1 (magenta) Dh. die unteren 20 % der Werte liegen im Bereich bis 8.1
Erststimmen -Daten
Unimodale Verteilung der Körperlängen in der Lachszucht (Canadische Küste) Bimodale Verteilung der Körperlängen nach Auswanderung (kleinere in Flüssen, größere in der Meeresbucht)
Entsprechende Kumulative Verteilungsfunktionen: Unimodal (blau) und Bimodal (rot)