Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistische Tests in der Phylogenie Likelihood-Based Tests of Topologies in Phylogenetics Nick Goldman, Jon P. Anderson, Allen G. Rodrigo -Lisha Naduvilezhath.

Ähnliche Präsentationen


Präsentation zum Thema: "Statistische Tests in der Phylogenie Likelihood-Based Tests of Topologies in Phylogenetics Nick Goldman, Jon P. Anderson, Allen G. Rodrigo -Lisha Naduvilezhath."—  Präsentation transkript:

1 Statistische Tests in der Phylogenie Likelihood-Based Tests of Topologies in Phylogenetics Nick Goldman, Jon P. Anderson, Allen G. Rodrigo -Lisha Naduvilezhath

2 2 Gliederung 1. Hintergrund-“wissen“ -Signifikanz-/ Hypothesentest -Bootstrap 2. Verschiedene Tests -KH- / SH- / SOWH- Test -Beispiel HIV-1 / Säugetiere 3. Zusammenfassung/ Ausblick

3 3 Thema Seq1 : CGGTTCA… Seq2 : AGGTTCA… Seq3 : ATGTTCA… Seq4 : AGGTTCT… Seq5 : CGATTGA… T 1 / L 1 T 2 / L 2 L X ist log- Likelihood für T X

4 4 Signifikanz-/ Hypothesentest Statistische Hypothese: Annahme über Wahrscheinlichkeitsverteilung der Grundgesamtheit, die wahr oder falsch sein kann Nullhypothese (H 0 ): statistische Hypothese, die meist verworfen wird z.B.: Aussage: „Münze präpariert“ Hypothese: Münze fair H 0 : p= 0,5für Kopf

5 5 Signifikanz-/ Hypothesentest Alternativhypothese (H A, H 1 ): jede von H 0 andere Hypothese (z.B.: p<0,5) Signifikanztest: Verfahren zum Errechnen, ob beobachtete Daten unter Annahme von H 0 signifikant sind Beobachtete Daten sind signifikant, wenn geneigt H 0 abzulehnen

6 6 Signifikanz-/ Hypothesentest Signifikanzlevel/ -niveau/ Irrtumswahrscheinlichkeit (α): maximale WS mit der Hypothese abgelehnt wurde, die akzeptiert werden sollte; oft α=5% oder 1% P-Wert: WS den beobachteten oder extremeren Wert anzutreffen/ kleinstes α, auf dem H 0 abgelehnt wird

7 7 Signifikanz-/ Hypothesentest Einseitiger Test Zweiseitiger Test

8 8 Bootstrap Bootstrap- Gedanke: Neu erzeugte Parameter sind genauso weit entfernt vom ML- Schätzer wie ML- vom wahren Parameter. Nichtparametrischer (NP) Bootstrap: Bootstrap- Stichproben durch Ziehen mit Zurücklegen aus Originaldaten erzeugen Parametrischer (P) Bootstrap (Monte Carlo Simulation) : durch zugrunde gelegte Verteilung für benötigten Parameter Schätzung einsetzen und Bootstrap- Daten simulieren

9 9 Bootstrap In der Phylogenie: Aufgrund der Verteilungsannahme parametrischer Tests abhängiger von zugrunde gelegten Modellen Seq1 : C G G T T C A… Seq2 : A G G T T C A… Seq3 : A T G T T C A… Seq4 : A G G T T C T… Seq5 : C G A T T G A… Site

10 10 Kishino- Hasegawa Test (KH-Test) Gegeben: Topologien T 1 (L 1 ) und T 2 (L 2 ) Fragestellung: Unterstützen T 1 und T 2 die Daten gleichermaßen? H 0 : E[δ] =0 mit δ = L 1 - L 2 (H A : E[δ] =0) keine Verteilung für δ gegeben in H 0 nichtparametrischer Bootstrap

11 11 KH- Test (=Test priNPfcd) 1. Test Statistik: δ = L 1 - L 2 2. Mit NP-Bootstrap Datenmengen i erzeugen 3. Für jedes i: - Schätzen von Θ 1 und Θ 2 für maximale log-likelihoods L 1,(i) und L 2,(i) - δ (i) = L 1,(i) - L 2,(i) 4. Zentrieren der δ (i) Δ (i) (Verteilung der Δ (i) ist Schätzung für δ- Verteilung) 5. Zwei-seitiger Test: Fällt δ in Konfidenz- intervall für E[δ]?

12 12 Resampling estimated log- likelihood (RELL- Methode) Zeitgewinn RELL-Methode: für L 1,(i) - bzw. L 2,(i) - Berechnung stets Θ ML,1 und Θ ML,2 verwenden ( Θ ML,X : optimierter Parameter für Originaldaten) Vorrausetzung für Anwendung: 1. Korrektes Evolutionäres Modell 2. Ausreichend große Datenmengen

13 13 Test priNPncd 1. Test Statistik: δ = L 1 - L 2 2. Mit NP-Bootstrap Datenmengen i erzeugen 3. Für jedes i: - Mit Θ ML,1 und Θ ML,2 bestimmen von Ľ 1,(i) und Ľ 2,(i) („΄“ bedeutet Schätzung) - δ̛ (i) = Ľ 1,(i) - Ľ 2,(i) 4. Zentrieren der δ̛ (i) Δ̛ (i) 5. Zwei-seitiger Test: Fällt δ in Konfidenz- intervall für E[δ]?

14 14 Test priNPncn Kishino und Hasegawa (1989): δ ist normalverteilt (mit Varianz und Mittel abhängig von δ (i) ) Zentralem Grenzwertsatz: (normierte) Summe einer großen Zahl von unabhängigen, identisch verteilten Zufallsvariablen ist fast (standard) normalverteilt

15 15 Test priNPncn Im Test priNPncd letzten Schritt mit folgendem austauschen: 5. Berechne Varianz von Δ̛ (i) (=ν²) und teste, ob δ bei N(0, ν²)- Verteilung im Konfidenzintervall liegt

16 16 Test priNPnca := log- Wahrscheinlichkeit am Site k von Baum T X (k= 1,2,… S) Zusätzliche Annahme: Varianz von δ mit Varianz über δ(k) berechenbar

17 17 Test priNPnca 1. Test Statistik: δ = L 1 - L 2 2. Mit Θ ML,1 und Θ ML,2 bestimmen von L 1 (k) und L 2 (k) der Sites k der Originaldaten δ(k) = L 1 (k) - L 2 (k) 3. Zentrieren der δ(k) Δ(k)

18 18 Test priNPnca 4. Schätzen der Varianz von Δ(k) (=Var( δ(k) )) mit ν²= Σ K (Δ(k))²/(S-1) Varianz von δ = S * ν² 5. Zweiseitiger Test: Liegt δ im Konfidenzintervall bei einer N(0, S*ν²)- Verteilung? Implementiert in PHYLIP, PUZZLE (MOLPHY)

19 19 Test priNPncs Letzte beiden Schritte von Test priNPnca ersetzen mit: 4. paired- t- Test von L 1 (k) und L 2 (k) (Paare {L 1 (1), L 2 (1)}, {L 1 (2), L 2 (2)},…, {L 1 (S), L 2 (S)}) zur Überprüfung, ob Mittelwerte gleich sind (E[μ 1 - µ 2 ] =0)

20 20 Students t- Verteilung Nach dem Pseudonym des „Entdeckers“ William S. Gosset benannt m = Anzahl Freiheitsgrade (m ∞: Normverteilung)

21 21 Test priNPncs implementiert in PAUP* Keine theoretische Erklärung denkbar für zusätzliche Annahme Trotzdem ähnliche Signifikanzlevels in Anwendung wie bei DNAML (Unterprogramm von PHYLIP)

22 22 Falscher Gebrauch des KH-Tests T 1 und T 2 müssen unabhängig voneinander UND ohne vorherige Analyse der Daten ausgewählt sein zur Rechtfertigung von H 0 Falls T X = T ML INKORREKTER KH-T - Keine Ergebnisse stützen E[δ] =0, stattdessen E[δ] >0 ! einseitige Tests erforderlich

23 23 Korrektes Vorgehen Trainer: Unterscheiden sich die Zeiten von Asterix und Obelix im 100m Sprint im Mittel signifikant? Vorgehen: Über viele Rennen δ(Asterix, Obelix)= t(Asterix)- t(Obelix) (wenn gleich gut E[δ] 0)

24 24 Korrektes Vorgehen Team- Statistiker: H 0 : E[δ(Asterix, Obelix)] =0 H A : E[δ(Asterix, Obelix)] =0

25 25 Verdeutlichen des Fehlers Trainer glaubt Idefix ist schnellster δ(Idefix, schnellster)= t(Idefix) – t(schnellster) Vermutung: wenn gleich gut E[δ] 0 Team-Statistiker: Falsch!! - Grund: Es gilt stets δ(Idefix, schnellster) ≥ 0

26 26 Shimodaira- Hasegawa Test (SH- Test) Vergleicht gleichzeitig alle Topologien einer Menge M (= Menge aller möglichen Topologien) a priori Wahl der Topologien in M H 0 : alle T x ε M sind gleichgute Erklärungen

27 27 SH- Test (=Test posNPfcd) 1. Für jedes T X ε M : δ X :=L ML – L X 2. Mit NP-Bootstrap Datenmengen i erzeugen 3. Für jedes i und jedes T X : maximiere L X,(i) über Θ X 4. Für jedes T X : L X,(i) L ̃X,(i) durch Zentrieren (=Abziehen der Mittel über i von L X,(i) )

28 28 SH- Test (=Test posNPfcd) 5. Für jedes i: -Finde L ̃ML,(i) (Maximum über L ̃X,(i) ) -Bootstrap-Statistik: δ X,(i) = L ̃ML,(i) - L X,(i) 6. Einseitiger Test (da, L ̃ML,(i) ≥ L X,(i) ) : Liegt δ X im Konfidenzintervall für E[δ X ] bei einer δ X,(i) - Verteilung?

29 29 Test posNPncd Zeitgewinn mit RELL-Methode 1. Für jedes T X ε M : δ X := L ML – L X 2. Mit NP-Bootstrap Datenmengen i erzeugen 3. Für jedes i und jedes T X : approximiere L X,(i) mit Θ ML,X 4. Rest wie bei Test posNPncd

30 30 SH- Test … … schätzt gleichzeitig Signifikanzlevels für jede Topologie T X … als modifizierte Version des KH- Tests mit a priori- gewählte T 1 und a posteriori- gewählte T ML (Unterschied: bei Verteilungsbestim- mung Menge aller Topologien M betrachtet)

31 31 Rettung falscher KH- Test- Ergebnisse Wenn P-Wert mindestens doppelt so groß wie Signifikanzlevel ist Vorgehen: P-Wert des zweiseitigen Tests zu dem eines einseitigen abändern den P-Wert p des falsch angewandten KH- Tests halbieren, da im SH- Test P- Wert ≥ p/2 beträgt Beispiel: p/2 > 0,05 SH- Test erlaubt ebenfalls keine Ablehnung von H 0

32 32 Keine Rettung der KH- Ergebnisse Wenn p/2 zu klein ist, d.h. p führt zur Ablehnung im KH-Test oder lag in der Nähe des Signifikanzlevels Grund: SH- Test liefert Ergebnis ≥ p/2 Beispiel: a. p< 0,05 p/2<0,025 b. 0,05< p< 0,1 (keine H 0 -Ablehnung) 0,025< p/2< 0,05 Wie viel größer?

33 33 SOWH- Test (=Test posPfud) Von Swofford et al. beschrieben und Hillis et al. implementiert Schätzt, ob a priori- gewählte Topologie T 1 Daten unterstützt oder für andere verwerfen werden sollte H 0 : T 1 ist wahre Topologie H A : wahre Topologie ist andere

34 34 SOWH- Test (=Test posPfud) 1. Test Statistik: δ = L ML – L 1 2. Mit P- Bootstrap und ML-Schätzer Θ ML,1 Datenmengen i erzeugen 3. Für alle T x : Schätzen von Θ X für maximale L X,(i) 4. Finde L ML,(i) 5. δ (i) = L ML,(i) - L 1,(i) (Verteilung für δ) 6. Einseitiger Test: δ signifikant?

35 35 SOWH- Test (=Test posPfud) Test Statistik δ wie bei KH und SH-Test Da T ML benutzt Annahme E[δ] =0 nicht möglich Da P- Bootstrap keine Zentrierung Zeit für Maximierung über alle T X Vorschlag 1: RELL-like für (a priori) T 1

36 36 Test posPpud (Schätzung unter H 0 ) 1. Schritte 1 und 2 siehe Test posPfud 2. Für alle T x /{ T 1 } : Schätzen von Θ X für maximale L X,(i) 3. Für T 1 benutze Θ ML,1 Ľ 1,(i) 4. Finde L ML,(i) 5. δ̛ (i) = L ML,(i) – Ľ 1,(i) (Verteilung für δ) 6. Einseitiger Test: δ signifikant?

37 37 Test posPpud (Schätzung unter H 0 ) nicht besonders schneller Test posPnud unvernünftig, da original T ML (Θ ML ) weit entfernt von optimalen Werten der Bootstrap-Daten (mit T 1 und Θ 1 geschätzt) Bekannt: Es gibt über verschiedene Topologien stabile Parameter (Bsp. Basenhäufigkeit)

38 38 Test posPpud (Schätzung unter H A ) Alle Parameterkomponenten, die gleich für alle T X sind, feste Werte (von Θ ML,1 ) zuweisen Unterschied zum vorigen Test: -nur „freie“ Parameterwerte (Astlängen) werden maximiert Wenn beide Tests H 0 nicht verwerfen Wenn beide Tests H 0 verwerfen ?

39 39 Beispiel HIV-1 - DNA Geg: 6 homologe DNA Sequenzen à 2000 bp von gag und pol Gen von HIV (A1, A2, B, D, E1, E2) Alignieren Konventionelle Phylogenie: T 1 = ((A1,A2), (B,D), (E1,E2)) L 1 = -5073,75

40 40 Beispiel HIV-1 - DNA ML Phylogenie: T ML =(A1, (B,D), (A2, (E1,E2))) L ML = -5069,9 SH-Test: M enthält alle 105 möglichen T x Für ML-Berechnungen: Zeitreversibles Modell mit Γ- Verteilung unter den Sites zur Ratenheterogenitätsmodellierung

41 41 Gamma (Γ) - Verteilung Kontinuierliche, reproduktive Wahrscheinlichkeitsverteilung über positive reelle Zahlen Wahrscheinlichkeitsdichte gegeben durch E(X)= α/β V(X)= α/β²

42 42 Gamma (Γ) - Verteilung

43 43 Beispiel HIV-1 - DNA Θ X : Astlängen, Basenhäufigkeiten, relative Substitutionsrate zwischenNukleotidpaaren, α (Parameter für Γ- Verteilung) 1000 Bootstrap-Datenmengen erzeugt Für alle Test: Teststatistik δ= L ML -L 1 = 3,90 α = 0,05 Da T ML posteriori gewählt wurde KH- Test FALSCH!! (nur zum Vergleich)

44 44 Beispiel HIV-1 - DNA

45 45 Beispiel HIV-1 - DNA Mögliche Erklärungen für Unterschied in SH- und SOWH- Testergebnis: -unterschiedliche H 0 - Hypothesen (- parametrische (SOWH-) Tests sind mächtiger als nichtparametrische (SH-)) -parametrische Tests vom zugrunde gelegten Modell abhängig

46 46 Beispiel HIV-1 - DNA

47 47 Beispiel Säugetiere - aa Geg: -6 mt Proteinsequenzen à 3414 Aminosäuren (aa): Mensch(H), Seehund(S), Kuh(C), Hase(R), Maus(M), Opossum(O) -(S, C) 15 mögliche T X SH- Test: 15 T X gleichzeitig verglichen 7 T X nicht verworfen

48 48 Beispiel Säugetiere - aa SOWH- Test: - T 1 = ((H, ((S, C), R)), M, O) (a priori) -T ML = (((H, (S, C)), R), M, O) Mit „model of mammalian mt aa replacement + F + Γ “ (Yang et al. 1998): L 1 = ,26 L ML = ,60 Teststatistik δ= L ML -L 1 = 2,66

49 49 Beispiel Säugetiere - aa

50 50 Zusammenfassung/ Ausblick Veröffentlichte KH- Test Ergebnisse mit Vorsicht behandeln!! Alle zukünftigen Tests mit SH- oder SOWH- Tests ausführen Untersuchung von Ergebnissen mit kombinierten Tests Untersuchung der Unterschiede zwischen SH- und SOWH- Testergebnissen


Herunterladen ppt "Statistische Tests in der Phylogenie Likelihood-Based Tests of Topologies in Phylogenetics Nick Goldman, Jon P. Anderson, Allen G. Rodrigo -Lisha Naduvilezhath."

Ähnliche Präsentationen


Google-Anzeigen