Fallstudie Biometrie III Michael Klüken Inhalt: HENKE (1996): Zum Auftreten und zur Bekämpfung von Phytophthora-Fäule an Gesneriaceen: Experimente zur biol. Bekämpfung mit vers. Antagonisten - ²-Test - ²-Test mit -Adjustierung (HOLM) geordnet-kategoriale Daten: KRUSKAL-WALLIS-Test I) mit -Adjustierung (HOLM) II) mit Abschlusstestprinzip gemischt-kategoriale Daten: Verfahren nach GAUTAM
Anzahl d. Blätter mit brauner Weichfäule Antagonistenprüfung an 2 Saintpaulia ionantha-Sorten gegenüber dem Schaderreger Phytophthora nicotianae im Gewächshaus. 7 Antagonisten, 1 Kontrolle (mit Phytophthora nicotianae behandelt) Pro Behandlung: je 35 Versuchspflanzen, keine Wdh. Herz krank Hk Herz abgestorben X Anzahl d. Blätter mit brauner Weichfäule 1 2 3... symptomlos Krankheitssymptome Boniturnote Boniturschema: Antagonisten: Ko = Kontrolle T6 = Trichoderma viride T7 = T. koningii T8 = T. harzianum G1 = Gliocladium roseum Ao = Acremonium ochraceum Bm =Bacillus mycoides Pr = Previcur
Bonitur: Boniturnoten: 1 2 Hk X Saintpaulia ionantha Sorten mit Befall durch den Schaderreger Phytophthora nicotianae : Boniturnoten: 1 2 Hk X
Daten: ‚Loni‘ Bonit. Ko T6 T7 T8 G1 Ao Bm Pr 1 26 33 32 27 29 2 26 33 32 27 29 2 1 bis 2 4 3 3 bis 6 > 7 5 Hk 6 X
Daten: ‚Heidrun‘ Bonit. Ko T6 T7 T8 G1 Ao Bm Pr 1 23 33 31 29 32 28 2 23 33 31 29 32 28 2 1 bis 2 3 3 bis 6 4 > 7 5 Hk 8 6 X
Anzahl d. Blätter mit brauner Weichfäule Auswertung der Daten: HENKE: „Boniturnoten zu Gruppen zusammengefasst“ dichotome Daten: befallen vs. nicht befallen ²-Test : (α=0,05; n=35) Boniturnote Krankheitssymptome symptomlos 1 2 3... Anzahl d. Blätter mit brauner Weichfäule Hk Herz krank X Herz abgestorben 1
Vergleich der p-Werte: Sorte: ‚Loni‘ Ko T6 T7 T8 G1 Ao Bm Pr p-asym - 0,011 0,029 0,390 0,191 p-mid 0,013 0,034 0,395 0,201 Sorte: ‚Heidrun‘ Ko T6 T7 T8 G1 Ao Bm Pr p-asym - 0,001 0,011 0,050 0,004 0,090 p-mid 0,002 0,013 0,056 0,005 0,097
² mit -Adjustierung (HOLM): Sorte: ‚Heidrun‘ p-mid Ko - T6 0,002 T7 0,013 T8 0,056 G1 0,005 Ao 0,097 Bm 0,013 Pr 0,005 Signifikanz p-Werte T6 0,002 0.007 Pr 0,005 0.008 G1 0.010 T7 0,013 0.013 Bm 0.017 - (T8) 0,056 0.025 - (Ao) 0,097 0.050
geordnet-kategoriale Daten: Verfahren: Überführen der Daten in singly ordered RxC-Tables Ordnung: ohne Befall / nur Blätter befallen / Herz krank / Herz abgestorben Ordnung ist nicht trivial! Behandlung nicht geordnet [nicht: doubled ordered RxC-Tables] (weil: keine Dosis abhängige Behandlung) Festlegen der Scores: „Welcher Befall ist für Pflanzen nicht so schlimm?“ freie Auswahl! Vergleich: KRUSKAL-WALLIS p-Werte I) mit -Adjustierung (HOLM) II) mit Abschlusstestprinzip
geordnet-kategoriale Daten: Sorte: ‚Heidrun‘ *KRUSKAL-WALLIS TEST, using MonteCarlo
KRUSKAL-WALLIS mit Abschlusstestprinzip Sorte: ‚Heidrun‘ Globalhypothese: Ko T6 T7 T8 G1 Ao Bm Pr p=0,012 Ko T6 T7 T8 G1 Ao Bm p=0,011 Partitions-/ Schnitthypothesen: Ko T6 T7 T8 p=0,006 Ko T6 T7 p= 0,001 Ko T7 T8 p=0,037 Ko T6 T8 p= 0,03 Ko T6 p=0,001 Ko T7 p=0,001 Ko T8 p=0,102 Ko G1 Ko Ao Ko Bm Ko Pr Lokal- oder Elementarhypothesen
Analyse gemischt-kategorialer Daten in einer 2 x K -Tafel S. GAUTAM (2002) Datensituation: - nominal: rot, grün, lebend, moribund,... - ordinal: Alter, Anzahl befallener Blätter, rangskaliert Voraussetzungen: nominale und ordinale Daten 2xK-Tafel mit K 3, C 2 (ordinal), K – C = M (nominal) df = M + 1 Herz krank Hk Herz abgestorben X Anzahl d. Blätter mit brauner Weichfäule 1 2 3... symptomlos Krankheitssymptome Boniturnote 1
Gemischt-Kategoriale Daten ‚Heidrun‘: Ko vs. T6 Bonit. Kontrolle T6 1 23 33 2 1 bis 2 3 3 bis 6 4 > 7 5 Hk 8 6 X K = 6 C 2 (ordinale Daten: 1-4) K – C = 2 (nominale Daten: 5+6) K-C=M=2 df= M+1 = 3 (²-Verteilung)
Gemischt-Kategoriale Daten bisheriger Lösungswege: Verwerfen d. nominalen ( COCHRAN-ARMITAGE) oder der ordinalen ( ²-Test) Kategorien: bereinigte Tafel, aber Informationen gehen verloren! mögliche Verbesserung: Re-Klassifikation der ordinalen Kategorien in nominale Kategorie bestes Verfahren: Analyse gemischt-kategorialer Daten nach GAUTAM: Vergabe von Scores, Errechnen der Korrelation zwischen Spalten u. Reihen, p-Werte mit spez. Teststatistik
Gemischt-Kategoriale Daten Annahme: Y = (Spaltenvariable): Y = 1 bzw. Y = 0 U = (Reihenvariable): U = 0, 1, 2, 3 (f. Reihen: 1-4) U = 0 (f. Reihen: 5 + 6) Z1, Z2 = Indikatorvariabeln f. Reihen: 5 + 6 Y = 0 + 1U + 1Z1 + 2Z2 Regressionsanalyse in SAS
Gemischt-Kategoriale Daten Bonitur Kontrolle T6 U Z1 Z2 1 23 33 2 1 bis 2 8 7 3 3 bis 6 4 > 7 5 Hk 6 X Y
Gemischt-Kategoriale Daten ‚Heidrun‘: Ko vs. T6 2-seitige Fragestellung: „Gibt es einen Unterschied?“ Gemischt-Kategoriale Daten: R²m = 0,1878, n++= 70 Tm besitzt ²-Verteilung mit df = M + 1= 3 (M=K-C) Tm, df=3, 1- = n++ * R²m = 70 (0,1878 )² = 2,47 p-Wert (Programm Quantil): pm = 0,004 COCHRAN-ARMITAGE-Test: p = 0,84 (nur ordinale Daten: 0, 1+2, 3-6, >7) 2-Test: pmid = 0,001 (nur nominale Daten: ohne Befall, nur Blätter befallen, Hk, X)
Gemischt-Kategoriale Daten Teststatistik: Tm = n++ * R²m Vorteil: - exakte, trennscharfe Auswertung von ordinal und nominal kategorialen Daten - Hinweis, ob Unterschied durch nominal- oder ordinal kategorisierten Daten entsteht Nachteil: - Vergabe v. äquidistanten Scores ( realitätsbezogen) - nicht-parametrischer Test für n > 10 - z. Z.: nur als asymptotische Variante
Gemischt-Kategoriale Daten SAS-Listing: data example; input wert col row z1 z2; cards; 23 0 0 0 0 33 1 0 0 0 0 0 1 0 0 1 1 1 0 0 0 0 2 0 0 1 1 2 0 0 1 0 3 0 0 0 1 3 0 0 8 0 0 1 0 0 1 0 1 0 3 0 0 0 1 0 1 0 0 1 run; data ex; set example; do i=1 to wert;output;end; run; Proc reg data=ex; model col = row z1 z2; run; proc print;run;
Fallstudie Biometrie III Literatur: CYTEL Software Corporation (1998): STATXACT 4 for Windows - user manual. Cambridge MA, USA. GAUTAM, S. (2002): Analysis of mixed categorical data in 2xK contingency tables. Statistics in medicine, 2002, 21: 1471-1484. HENKE, B. (1996): Zum Auftreten und zur Bekämpfung von Phytophthora-Fäule an Gesneriaceen: Experimente zur biologischen Bekämpfung mit verschiedenen Antagonisten. HOTHORN, L.A. (2002): Scriptum. SAS 8e-Version: Online-Dokumentation (1999-2001) by SAS Institute Inc., Cary, NC, USA.
Gemischt-Kategoriale Daten The REG Procedure Model: MODEL1 Dependent Variable: col Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 3 3.28608 1.09536 5.09 0.0031 Error 66 14.21392 0.21536 Corrected Total 69 17.50000 Root MSE 0.46407 R-Square 0.1878 Dependent Mean 0.50000 Adj R-Sq 0.1509 Coeff Var 92.81433 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept 1 0.59747 0.06178 9.67 <.0001 row 1 -0.04177 0.12682 -0.33 0.7429 z1 1 -0.59747 0.17532 -3.41 0.0011 z2 1 -0.59747 0.27496 -2.17 0.0334
Gemischt-Kategoriale Daten ‚