Zweifaktorielle Blockanlage Fruchtart Winterweizen Faktor N = Stickstoffdüngung (0, 80, 160, 240 kg /ha) Faktor S = Sorte (Monopol, Batis, Hybnos)
Landwirtschaftliche Versuchsanlagen (Skript Seite 27)
Grundsätzliches Messwerte im Experiment werden durch verschiedene Fehlerkomponenten verzerrt: Grobe Fehler: Irrtum, Nachlässigkeit oder extreme Witterungsverhältnisse Systematische Streuungsursachen: z.B. kontinuierliche Bodenunterschiede Zufällige Streuungsursachen: zufällige Bodenunterschiede, Einwirkungen auf die Pflanzengesundheit, Technisch bedingte ungenaue Arbeitsweise von Maschinen und Geräten, genetisch bedingte Variabilität, Wildverbiss
Ziel der Versuchsplanung Systematische Fehler kontrollieren gleichmäßig auf Prüfglieder verteilen Zufällige Fehler minimieren Fehlervarianz schätzen
Prinzipien der Versuchsplanung Fehlervarianz (Versuchsfehler) kann geschätzt werden wenn WIEDERHOLUNGEN vorhanden Prüfglieder zufällig auf Parzellen verteilen RANDOMISATION Randomisation ist wichtig, um zufällige Effekte tatsächlich zufällig auf die Prüfglieder zu verteilen Benachbarte Parzellen sind sich ähnlicher als weit entfernte Blockbildung
Vollständig randomisierte Anlage (CRD) (-) Kein Ausgleich von Trends im Boden möglich (+) maximale Anzahl Freiheitsgrade
Blockanlage (RCB) (+) Bodenunterschiede zwischen Blöcken gehen nicht in Versuchsfehler ein! (-) Blöcke kosten (r-1) Freiheitsgrade Bodenunterschiede innerhalb Blöcken gehen in Versuchsfehler > Blöcke nicht zu groß
Modell Blockanlage yij = µ + ai + bj + eij wobei: µ Allgemeiner Mittelwert ai Effekt der i-ten Behandlung bj Effekt des j-ten Blocks eij Fehler der Parzelle mit i-ter Behandlung im j-ten Block ~N(0, σ²e) F-Test Faktor A F = MQA / MQe Blockeffekt F = MQB / MQe
Lateinisches Quadrat (Latin Square) (+) Bodenausgleich in 2 Richtungen (-) Blöcke und Säulen kosten Freiheitsgrade Blöcke sollten nicht zu groß sein
Modell Lateinisches Quadrat yij = µ + ai + bj + ck + eij wobei: µ Allgemeiner Mittelwert ai Effekt der i-ten Behandlung bj Effekt des j-ten Blocks cj Effekt der k-ten Säule eijk Fehler der Parzelle mit i-ter Behandlung im j-ten Block ~N(0, σ²e) F-Test Faktor A F = MQA / MQe Blockeffekt F = MQB / MQe Säuleneffekt F = MQC / MQe
Gitteranlage (Lattice) Ziel kleinere Blöcke > unvollständige Blöcke Nicht mehr alle Prüfglieder in jedem Block Prüfgliedmittelwerte werden um Blockeffekte (Bodeneffekte) adjustiert Beliebt: Zwei- und Dreisatzgitter (=Gitterquadrate)
Entwickeln von Gitterplänen Nicht alle Vergleiche mit gleicher Präzision möglich! Prüfglieder 1, 6 und 8 niemals im gleichen Block, d.h. nur indirekte Vergleiche möglich
7 x 7 Gitter (49 Prüfglieder) Jeweils sieben Parzellen bilden einen Block Jeweils sieben Blöcke bilden eine Wiederholung
yij = µ + ai + rk + b(r)jk + eij Modell Gitteranlage yij = µ + ai + rk + b(r)jk + eij wobei: µ Allgemeiner Mittelwert ai Effekt der i-ten Behandlung rk Effekt der k-ten vollständigen Wiederholung b(r)jk Effekt des j-ten unvollständigen Blocks innerhalb der k-ten Wiederholung ~N(0, σ²b) eijk Fehler der Parzelle mit i-ter Behandlung im j-ten Block der k-ten Wdh. ~N(0, σ²e)
Mehrfaktorielle Versuchsanlagen
Pläne für mehrfaktorielle Versuche Prinzipiell kann jeder mehrfaktorielle Versuch auch als Block- oder Gitteranlage angelegt werden! Kombination der Faktorstufen ist dann Versuchsglied Normalfall jedoch Spaltanlage
Spaltanlage (Split-Plot) 2 Fungizidstufen, 10 Sorten > Großteilstücke / Kleinteilstücke
Spaltanlage Vorteil: Einfache Anlage auf dem Feld Nachteil: Statistische Analyse wird komplizierter (zweiter Fehlerterm: Großteilstückfehler) Weil mehr als ein Fehlerterm: „Gemischtes Modell“
Modell Spaltanlage yijk = µ + ai + rk + raik + bj + abij + eijk µ Allgemeiner Mittelwert rk Effekt der k-ten Wiederholung ai Effekt der i-ten Saatzeit raik Fehler des ik-ten Großteilstücks ~N(0, σ²ra) bj Effekt der j-ten Sorte abij Interaktion zwischen i-ter Saatzeit und j-ter Sorte eijk Fehler der Parzelle mit i-ter Saatzeit und j-ter Sorte in der k-ten Wiederholung ~N(0, σ²e) F-Tests Faktor A F = MQA / MQRA Faktor B F = MQB / MQe Interaktion A*B F = MQA*B / MQe
Standardfehler der Differenz für Vergleich der Stufen des Großteilstückfaktors (A) Anzahl Freiheitsgrade = (a-1)(r-1) MQra Großteilstückfehler (Behandlung*Wdh) rb Anzahl Parzellen je Großteilstückfaktorstufe (= Anzahl Kleinteilstückfaktorstufen x Anzahl Wiederholungen)
Standardfehler der Differenz für Vergleich der Stufen des Kleinteilstückfaktors (B) Anzahl Freiheitsgrade = a(b-1)(r-1) MQe Kleinteilstück- bzw. Restfehler ra Anzahl Parzellen je Kleinteilstückfaktorstufe (= Anzahl Großteilstückfaktorstufen x Anzahl Wiederholungen)
Standardfehler der Differenz für Vergleich der Stufen des Kleinteilstückfaktors (B) auf gleicher Stufe des Großteilstückfaktors (A) Anzahl Freiheitsgrade = a(b-1)(r-1) MQe Kleinteilstück- bzw. Restfehler r Anzahl Wiederholungen
Standardfehler der Differenz für Vergleiche von Kleinteilstückfaktorstufen (A) auf unterschiedlichen Großteilstückfaktorstufen (B) MQra Großteilstückfehler MQe Kleinteilstück- bzw. Restfehler a Anzahl Großteilstückfaktorstufen b Anzahl Kleinteilstückfaktorstufen r Anzahl Wiederholungen
Streifenanlage (Split-Block) Faktor A (z.B. Saatzeit) : In Großteilstücken, in horizontaler Richtung, Stufen A-C Faktor B (z.B. Düngung) : In Großteilstücken, in vertikaler Richtung, Stufen 1 -2
Modell Streifenanlage yijk = µ + ai + rk + raik + bj + abij + eijk µ Allgemeiner Mittelwert rk Effekt der k-ten Wiederholung ai Effekt der i-ten Saatzeit raik Fehler des ik-ten Großteilstücks ~N(0,σ²ra) bj Effekt der j-ten Düngung rbjk Fehler des jk-ten Großteilstücks ~N(0,σ²rb) abij Interaktion zwischen i-ter Saatzeit und j-ter Düngung eijk Fehler der ijk-ten Parzelle ~N(0,σ²e) F-Tests Faktor A F = MQA / MQRA Faktor B F = MQB / MQRB Interaktion A*B F = MQA*B / MQe
Dreifaktorieller Versuch Einfluss pflanzenbaulicher Maßnahmen auf Fusarium-Befall von Winterweizen. Zielvariable: DON-Gehalt (Deoxynivalenol) - Sorte (2 Stufen) - Bodenbearbeitung (2 Stufen) - Fungizid (2 Stufen) - 4 Wiederholungen Zweijähriger Versuch auf gleicher Fläche Messwiederholung in der Zeit
Versuchsdesign Fungizidbehandlung in Streifen
Versuchsdesign Bodenbearbeitung in Spalten
Versuchsdesign Sorten in Unterspalten
yijkl = i+ j+ γk+ ij+ γik+ γjk+ γijk+ rl Modell yijkl = i+ j+ γk+ ij+ γik+ γjk+ γijk+ rl + ril+ rjl+ rijl+ rγjkl+ eijkl rl Effekt der l-ten Wiederholung i Effekt der i-ten Fungizidstufe j Effekt der j-ten Bodenbearbeitung γk Effekt der k-ten Sorte γijk Interaktionen Fungizid*Bodenbearbeitung*Sorte ril Fehler des il-ten Großteilstücks ~ N(0,s²ra) rjl Fehler des jl-ten Großteilstücks ~ N(0,s²rb) rijl Fehler des ijl-ten Mittelteilstücks (Kombination Zeile/Spalte) ~ N(0,s²rab) rγjkl Fehler des ikl-ten Mittelteilstücks (Kombination Spalte/Unterspalte) ~ N(0,s²rbc) eijkl Fehler der ijkl-ten Parzelle ~ N(0,s²e) fix zufällig
SAS hilft... SAS führt automatisch die richtigen F-Tests durch und berechnet die korrekten Standardfehler Was muss der User tun? Die Daten einfüttern Das Modell in SAS-Code übersetzen Computer-Output korrekt interpretieren Beratungsangebot des FG Bioinformatik nutzen!
Statistik Basics
Störfaktor Bodenunterschiede Bodenunterschiede in Praxisschlag: Biomasse Getreide
Störfaktor Bodenunterschiede Bodenunterschiede in Praxisschlag: Ertragsvariabilität im Oberrheingraben
Störfaktor Bodenunterschiede Versuchsflächen sind niemals homogen! Beispiel für Bodenunterschiede
Einfluss von Bodenunterschieden Angenommen die beiden Felder des Landwirts unterscheiden sich in der Ertragsfähigkeit… Feld 1 im Mittel Ertrag 1,5 dt/ha über Durchschnitt Feld 2 im Mittel Ertrag 1,5 dt/ha unter Durchschnitt Wahrer Mittelwert von Sorte A = 48 dt/ha Wahrer Mittelwert von Sorte B = 50 dt/ha
Zwei denkbare Experimente Feld 1 Sorte A 48 +1,5 = 49,5 dt/ha Feld 2 Sorte B 50 - 1,5 = 48,5 dt/ha Entscheidung: A ist besser Feld 1 Sorte B 50 +1,5 = 51,5 dt/ha Feld 2 Sorte A 48 - 1,5 = 46,5 dt/ha Entscheidung: B ist besser
Sinn der statistischen Analyse Zwischen „echten“ und zufälligen Effekten unterscheiden Wahrscheinlichkeit von Fehlentscheidungen minimieren Aber: 100%ige Sicherheit gibt es nicht! Tolerierbare Irrtumswahrscheinlichkeit - 5% im Pflanzenbaulichen Versuchswesen üblich
Wiederholung Statistik-Grundlagen
Grundlagen (1) Nullhypothese zwischen den Prüfgliedern keine Unterschiede im Feldversuch ermittelte Differenzen rein zufällig Irrtumswahrscheinlichkeit Wenn Nullhypothese richtig wie wahrscheinlich zufälliges Auftreten des beobachteten oder eines noch größeren Effekts
Grundlagen (2) Fehler erster Art (Alpha-Fehler) Zwischen den Prüfgliedern besteht kein Unterschied, zufällig wird im Experiment jedoch ein solcher ermittelt. Fehler zweiter Art (Beta-Fehler) Es bestehen tatsächlich Unterschiede, diese werden im Experiment aber nicht nachgewiesen bzw. können nicht statistisch abgesichert werden.
Grundlagen (3) Grenzdifferenz Wenn Differenz zwischen zwei Prüfgliedmittelwerten größer als Grenzdifferenz, so gilt sie als signifikant, also statistisch abgesichert. Berechnen aus Versuchsfehler Irrtumswahrscheinlichkeit Anzahl Wiederholungen je Prüfglied
Grundlagen (4) Skalen Intervallskala (z.B. °Celcius) Verhältnisskala (metrische Einheiten) Ordinalskala (Ränge, z.B. Schulnoten) Nominalskala (Klassen, z.B. Blütenfarben)
Grundlagen (5) Median der mittlere der nach der Größe sortierten Werte
Grundlagen (6) Varianz einer Stichprobe Standardabweichung Variationskoeffizient
Beispiel Kulturdeckungsgrad von Winterweizen-Sorten bestimmt in jeder Parzelle an drei zufällig ausgewählten Punkten Mittel auf Parzellenebene gebildet Vier Parzellen je Sorte Sorte „Monopol“ am 29. April 2003 folgende Parzellenmittelwerte (in Prozent, nach Größe geordnet): 11,67 20,33 25,00 30,00 arithmetisches Mittel beträgt 21,75 %. Median 22,67% (arithm. Mittel aus 20,33 und 25,00).
Beispiel (2) Summe der Abweichungsquadrate (SQ) berechnen
Beispiel (3) Varianz Standardabweichung Variationskoeffizient
Grundlagen (7) Standardfehler des Mittelwertes Im Beispiel
Grundlagen (8) 95%-Vertrauensbereich (Konfidenzintervall) für den wahren Mittelwert µ Mittelwert +/- (1,96 * Std.fehler Mittelwert) 1-(/2) Quantil der Standardnormalverteilung wenn =5%
Grundlagen (9) Besser t-Verteilung nehmen 95%-Vertrauensbereich (Konfidenzintervall) für den wahren Mittelwert µ Mittelwert +/- (t * Std.fehler Mittelwert) 1-(/2) Quantil der t-Verteilung wenn =5% Abhängig von Fehler-FG
Beispiel (4) = 0.05 n=4 Mittelwert = 21,7 n-1 = 3 Freiheitsgrade Vertrauensbereich = 21,7 -(3,18*3,9) bis 21,7 + (3,18*3,9) [9,3 ; 34,1]
t-Test Zwei Sorten Monopol: 11,67 20,33 25,00 30,00 Batis: 24,00 25,00 41,67 83,33 Mittelwert Monopol: 21,75 Mittelwert Batis: 43,50 Differenz signifikant?
t-Test (2) Mittelwert Monopol: 21,75 Mittelwert Batis: 43,50 Differenz signifikant? Fehlervarianz berechnen Standardfehler der Differenz
t-Test (3) Grenzdifferenz nach t-Test GD(t-Test) = LSD = Sd * t –Tabellenwert Grenzdifferenz ist größer als Differenz zwischen den Mittelwerten Differenz ist nicht signifikant
Varianzanalyse Fünf Sorten zufällig auf 20 Parzellen verteilt Mittelwertdifferenzen signifikant oder zufällig?
Varianzanalyse (2) Varianzanalyse-Tabelle F-Tabellenwert für 4 Zähler- und 15 Nenner-FG = 3,06. GD nach Tukey:
Varianzanalyse (3) Multipler Mittelwertvergleich Mittelwerte mit dem gleichen Buchstaben unterscheiden sich nicht signifikant
Computer zur Datenanalyse einsetzen
Software zur Datenauswertung SAS SPSS (Sozialwissenschaften) Systat Statistica PlabStat (Schwerpunkt Züchtung) Agrobase (Schwerpunkt Züchtung) ARM (Schwerpunkt Pflanzenschutz) Diverse kleinere Programme EXCEL
Das Statistikpaket SAS teuer (Uni hat Sonderkonditionen, sonst ca. 2500 € pro Jahr) zeilenorientiert = schwierig in der Handhabung (eigener Programmcode) bietet das größte Methodenspektrum („state of the art“) > Trotz bekannter Nachteile erste Wahl für die Auswertung von Feldversuchen
Datenanalyse mit dem SAS-System data Beispiel; input sorte$ @@; do Parzelle=1 to 4; input ertrag @@; output; end; cards; A 31 32 37 32 B 21 23 25 19 C 27 29 34 34 D 34 32 31 27 E 24 23 27 26 ; run;
Datenanalyse mit dem SAS-System (2) Proc glm data = Beispiel; class Sorte; model Ertrag = Sorte ; means Sorte / lsd tukey; run;
Computer-Output (1) The GLM Procedure Dependent Variable: ertrag Sum of Source DF Squares Mean Square F Value Pr > F Model 4 348.8000000 87.2000000 11.28 0.0002 Error 15 116.0000000 7.7333333 Corrected Total 19 464.8000000
Computer-Output (2) t Tests (LSD) for ertrag NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 15 Error Mean Square 7.733333 Critical Value of t 2.13145 Least Significant Difference 4.1912 Means with the same letter are not significantly different. Mean N sorte A 33.000 4 A A 31.000 4 D A 31.000 4 C B 25.000 4 E B 22.000 4 B
Computer-Output (3) Tukey's Studentized Range (HSD) Test for ertrag NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher TypeII error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 15 Error Mean Square 7.733333 Critical Value of Studentized Range 4.36699 Minimum Significant Difference 6.072 Means with the same letter are not significantly different. Mean N sorte A 33.000 4 A B A 31.000 4 D B A 31.000 4 C B C 25.000 4 E C 22.000 4 B
Praktische Übung
Praktische Übung Im AB-Praktikum 2003 wurden in der ungedüngten Stufe im April folgende Kulturdeckungsgrade ermittelt: Monopol 11,67 20,33 25,00 30,00 Batis 24,00 25,00 41,67 83,33 Hybnos 2,67 16,67 2,33 23,33 Vergleichen Sie die Sortenmittelwerte mit Varianzanalyse, t-Test und Tukey-Test. Nutzen Sie hierfür das SAS-Programm
Mehrfaktorielle Varianzanalyse
Mehrfaktorielle Varianzanalyse Zum Beispiel: Versuch mit 3 Winterweizensorten und 4 Stickstoffstufen (0, 80, 160, 140 kg N/ha) Varianzanalyse-Tabelle
Mehrfaktorielle Varianzanalyse Modell: yijk = µ + si + nj + snij + eijk yijk Ertrag der k-ten Parzelle mit i-ter Sorte und j-ter Düngung µ der allgemeine Mittelwert si Effekt der i-ten Sorte nj Effekt der j-ten Düngung snij Interaktion der i-ten Sorte mit der j-ten Düngung eijk Restfehler k-te Parzelle der i-ten Sorte mit der j-ten Düngung
Ordinale Interaktion A B
Hybride Interaktion A B
Disordinale Interaktion B
Keine Interaktion A B
Keine Interaktion A B
Keine Interaktion A B
Datenbeispiel aus Praktikum SS 2003 Kulturdeckungsgrade (in Prozent, jeweils Mittel aus drei Messungen je Parzelle)
Datenbeispiel aus Praktikum SS 2003 Kulturdeckungsgrade (in Prozent, jeweils Mittel aus drei Messungen je Parzelle)
Auswertung mit SAS data weizen3; input N Sorte Wdh KDG; datalines; 1 1 1 20.33 1 1 2 25.00 1 1 3 30.00 1 1 4 11.67 2 1 1 19.33 2 1 2 26.67 weitere Daten... 4 3 3 26.67 4 3 4 13.33 ; run;
yijk = µ + si + nj + snij + eijk Auswertung mit SAS Proc glm data=weizen3; class N Sorte; model kdg = Sorte N Sorte*N ; means Sorte N / lsd; run; yijk = µ + si + nj + snij + eijk
SAS-Output Sum of Source DF Squares Mean Square FValue Pr > F Sorte 2 5756.22 2878.11 12.09 <.0001 N*Sorte 6 2288.56 381.42 1.60 0.1751 Error 36 8573.45 238.15 Total 47 16779.61
SAS-Output (2) t Tests (LSD) for KDG Alpha 0.05 Alpha 0.05 Error Degrees of Freedom 36 Error Mean Square 238.1516 Critical Value of t 2.02809 Least Significant Difference 11.065 Means with the same letter are not significantly different. Mean N Sorte A 41.875 16 2 B 27.770 16 1 C 15.063 16 3
Alternative Auswertung Skalierung Sorte nominal Stickstoffdüngung metrisch, kardinalskaliert Auswertungsansatz für Stickstoffdüngung: > Regression
Korrelation Kovarianz Korrelation
Regression wobei y abhängige Variable a absolutes Glied bzw. Achsenabschnitt ß Regressionskoeffizient, Steigung x unabhängige Variable e zufälliger Restfehler
Lineare Regression z.B. Ertragssteigerung durch Stickstoffdüngung
Kovarianzanalyse Eine nominale und eine metrische Variable: Verknüpfung zwischen Varianzanalyse und Regressionsanalyse Kovarianzanalyse Anwendung ebenfalls sinnvoll um Störgrößen auszuschalten
Beispiel Kovarianzanalyse Ertrag von Winterweizen nach verschiedenen Vorfrüchten Datenerhebung auf Praxisschlägen
Beispiel Kovarianzanalyse