Title
Developing and testing statistical methods for experimental evolution
Description (de)
Dissertation - Veterinärmedizinische Universität Wien - 2021
Aus rechtlichen Gründen sind nicht alle Teile dieser Arbeit frei zugänglich. Der Zugriff auf den elektronischen Volltext ist auf Angehörige der Veterinärmedizinischen Universität Wien beschränkt. Bitte einloggen!
Description (en)
Dissertation - University of Veterinary Medicine Vienna - 2021
The full text is only available to university members. Please log in!
Description (en)
The aim of this thesis is to develop and test new methods for experimental evolution. This thesis is divided into three chapters, each corresponding to a research project and a published paper. The first chapter presents an improved version of the commonly used χ2 and Cochran-Mantel- Haenszel tests adapted to overdispersion. Indeed, these tests are commonly used in population genetics to test for selection looking at allele frequency time series data. However, the variance in the considered data is higher than the one accounted for by the test statistic. Thus, in this project we modified the test statistic and adapted it to general variance. Additionally, we calculated the variance estimators for the relevant population genetics sources of variance: i.e. we integrated estimators for the variances due to drift and pool sequencing. Lastly, we evaluated the performance of these tests under a wide range of scenarios using extensive simulations. In the second project, a comparison between many tests aimed at detecting selection from allele frequency changes is carried on. The power of the different tests when looking for targets of selection is shown using simulations under different selection regimes: selective sweeps, truncating selection, and stabilizing selection. We show that the most powerful tests are LRT-1, CLEAR and the CMH test. We also compare the estimated selection coefficients from the different methods, showing that CLEAR provides the best results. Lastly, in the third project we develop a method able to reconstruct the haplotype information using multiple samples of allele frequency data. The approach we propose can infer both the haplotype structure and frequency information and provides accuracy estimates for both quantities. Additionally, we show that the allele frequency estimated from our reconstructed haplotypes have even higher accuracy than those obtained by pool sequencing. We show that our method performs well using simulated data and we apply it to real data from HIV, Drosophila simulans and mice experiments.
Description (de)
Das Ziel dieser Arbeit ist die Entwicklung und Erprobung neuer Methoden für die experimentelle Evolution. Diese Arbeit ist in drei Kapitel unterteilt, die jeweils einem Forschungsprojekt und einer veröffentlichten Arbeit entsprechen. Im ersten Kapitel wird eine modifizierte Version der allgemein verwendeten χ2- und Cochran- Mantel-Haenszel-Tests vorgestellt, die an ̈Überdispersion angepasst sind. Diese Tests werden in der Tat häufig in der Populationsgenetik verwendet, um auf Selektion bei Zeitreihendaten der Allelfrequenz zu testen. Die Varianz in den betrachteten Daten ist jedoch höher als die von der Teststatistik erfasste Varianz. Daher haben wir in diesem Projekt die Teststatistik modifiziert und an die allgemeine Varianz angepasst. Darüber hinaus berechneten wir die Varianzschätzer für die relevanten populationsgenetischen Varianzquellen, d. h. wir leiteten Sch ̈atzer für die Varianzen aufgrund von Drift und Poolsequenzierung ab. Schließlich haben wir die Leistung dieser Tests unter einer Vielzahl von Szenarien mit Hilfe umfangreicher Simulationen bewertet. Im zweiten Projekt wird ein Vergleich zwischen verschiedenen Tests durchgeführt, die darauf abzielen, Selektion anhand von Änderungen der Allelfrequenz zu erkennen. Die Aussagekraft der verschiedenen Tests bei der Suche nach Selektionszielen wird anhand von Simulationen unter verschiedenen Selektionsregimen gezeigt. Wir zeigen, dass die leistungsfähigsten Tests LRT-1, CLEAR und der CMH-Test sind. Wir vergleichen auch die geschätzten Selektionskoeffizienten der verschiedenen Methoden und zeigen, dass CLEAR die besten Ergebnisse liefert. Im dritten Projekt schließlich entwickeln wir eine Methode, die in der Lage ist, Haplotyp- Informationen unter Verwendung mehrerer Stichproben von Allelhäufigkeitsdaten zu rekonstruieren. Der von uns vorgeschlagene Ansatz kann sowohl die Haplotypstruktur als auch die Häufigkeitsinformationen ableiten und liefert Genauigkeitsschätzungen für beide Größe. Darüber hinaus zeigen wir, dass die aus unseren rekonstruierten Haplotypen geschätzten Allelhäufigkeiten sogar eine höhere Genauigkeit aufweisen als die durch Pool-Sequenzierung erhaltenen. Wir zeigen, dass unsere Methode mit simulierten Daten gut funktioniert und wenden sie auf reale Daten aus HIV-, Drosophila simulans und Mäuseexperimenten an