Title
Towards unraveling the dynamics of transposable elements
Description (en)
PhD thesis - University of Veterinary Medicine Vienna - 2021
Description (de)
PhD Arbeit - Veterinärmedizinische Universität Wien - 2021
Description (en)
A significant portion of the genome of many organisms is comprised of Transposable Elements (TEs). TEs are complex interspersed repetitive genomic elements that selfishly proliferate in a host genome. Recent studies have shown that TE dynamics can play important roles in the adaptive evolution of organisms. However, many details about the dynamics of TEs in natural populations still remain elusive, including their degree of polymorphism as well as the underlying causes for observed differences in abundance and activity. In this thesis, I aim to contribute to the unraveling of TE dynamics in natural populations. Additionally, I aim to establish approaches and methodologies that equip future researchers with the tools to properly describe these dynamics. In the first section, I develop and apply novel methodologies to assess the representation quality of TEs and repetitive regions in genomic assemblies. These methodologies aim to overcome the technological limitations the repetitive nature of TEs poses towards genomic characterization and correct representation of TEs and repetitive regions. Specifically, I aim to allow the study of functionally important genomic arrays of TE insertions involved in the piRNA defense pathway against uncontrolled transposition activity. These regions, termed ’piRNA clusters’, are particularly difficult to study in genomic assemblies due to the repetitive nature of the inserted TEs. Additionally, currently available metrics to evaluate the quality of genome assemblies are largely not representative for the quality of TEs and repetitive regions. I address this problem by establishing various quality metrics indicative of the assembly quality of TEs and repetitive regions, mainly focusing on piRNA cluster sequences. I apply these quality metrics to create genome assemblies with high quality regarding their TEs and piRNA cluster. Additionally, I demonstrate how these metrics can be extended for broader applications in other genomic regions or organisms. Lastly, I envision how future studies could utilize this methodology to empirically describe the dynamics of piRNA clusters. In the second section of my thesis I describe the recent, stealthy invasion of the LTR retrotransposon Tirant in Drosophila melanogaster within the last century. For this purpose, I combine the extensive catalogue of D. melanogaster laboratory strains collected worldwide with high-quality genome assemblies (including those created in Chapter 1) and extensive sequencing efforts (DNA, RNA and small-RNA sequencing) to describe the dynamics of the Tirant invasion in detail unprecedented by similar studies. I find that Tirant has invaded D. melanogaster in the early 20th century, and quickly spread through the entire species range. I also demonstrate that Tirant was previously active in D. melanogaster, but active copies were lost previously to the recent invasion. Existing residual piRNAs were seemingly unable to prevent the novel invasion. Additionally, I reconstruct the activity patterns of previously described recent TE invasions in D. melanogaster, confirming the accuracy and power of my workflow. D. melanogaster is one of the most well-studied organisms in terms of its TE landscape and activity and the existence of Tirant in D. melanogaster was previously well known. However, the fact that Tirant has only recently invaded natural populations has eluded detection thus far. This remarkable discovery illustrates that the application of a similar workflow has the potential to unravel previously cryptic dynamics of TE activity in a variety of organisms. Thus, it could finally be possible to exhaustively describe the activity of the various existing TE families and allow to quantitatively and qualitatively describe the dynamics of TE activity in natural populations. In summary, this thesis provides novel biological insight into peculiarities of TE dynamics and establishes novel methodological approaches that will allow to further describe TE dynamics in natural population. I thus lay the groundwork for future research, particularly within the framework of describing the dynamics of piRNA cluster dynamics and TE invasions.
Description (de)
Ein erheblicher Anteil des Genoms vieler Organismen beinhaltet Transposons (abk. TEs). TEs sind komplexe, breit verteilte repetitive genomische Teilelemente welche sich innerhalb eines Wirtsgenoms egoistisch vermehren. Kürzlich veröffentlichte Studien haben gezeigt, dass die Dynamiken von TEs eine wichtige Rolle in der adaptiver Evolution von Organismen spielen können. Jedoch verbleiben viele Details über die Dynamiken von TEs in natürlichen Populationen weiterhin unklar, einschließlich ihres Grades an Polymorphie sowie welche Faktoren den beobachteten Unterschieden in Häufigkeit und Vielfalt zugrunde liegen. In dieser Arbeit beabsichtige ich zu der Entschlüsselung der Dynamiken von TEs in natürlichen Populationen beizutragen. Zusätzlich beabsichtige ich neue Herangehensweisen und Methoden zu entwickeln, welche Wissenschaftler mit den nötigen Werkzeugen ausstatten um diese Dynamiken genau zu beschreiben. Im ersten Abschnitt entwickle ich neue Methodiken um die Qualität der Vertretung von TEs und repetitiven Regionen in konstruierten Genomen (genannt ’Assemblies’) zu beurteilen. Diese Methodiken zielen darauf ab, technologische Limitierungen bezüglich der genomischen Charakterisierung und der korrekten Repräsentation von TEs und repetitiven Regionen zu überwinden, welche durch den repetitiven Charakter von TEs verursacht werden. Hierbei beabsichtige ich besonders, die Untersuchung von funktionell relevanten genomischen Anordnungen von TE Insertionen zu ermöglichen, welche in das piRNA-Verteidigungssystem gegen unkontrollierte Transpositionsaktivität eingebunden sind. Diese Regionen werden ’piRNA cluster’ genannt und sind in genomischen Assemblies aufgrund ihrer repetitiven Eigenschaften besonders kompliziert zu untersuchen. Zusätzlich sind bereits existierende Metriken zur Evaluierung von genomischen Assemblies größtenteils nicht aussagekräftig bezüglich der Qualität der Representation von TEs und repetitiven Regionen. Ich gehe dieses Problem an indem ich mehrere Metriken etabliere, welche die Qualität einer Assembly in Bezug auf die Repräsentation von TEs und repetitiven Regionen wiedergeben. Hierbei konzentriere ich mich speziell auf piRNA cluster. Ich wende diese Metriken an um neue genomische Assemblies mit einer hohen Qualität bezüglich TEs und piRNA clustern zu konstruieren. Zusätzlich zeige ich wie diese Metriken für eine breitere Anwendung in anderen genomischen Regionen oder Organismen erweitert werden können. Zuletzt zeige ich auf, wie zukünftige Studien diese Methodik zur empirischen Beschreibung der Dynamiken von piRNA clustern benutzen könnten. Im zweiten Abschnitt meiner Arbeit beschreibe ich die kürzlich und verstohlen erfolgte Invasion des LTR retrotransposons Tirant in Drosophila melanogaster. Zu diesem Zweck kombiniere ich den umfangreichen Katalog von weltweit gesammelten D. melanogaster Laborstämmen mit qualitativ hochwertigen genomischen Assemblies (inklusive derjenigen welche in Ab- schnitt 1 etabliert wurden) und ausgiebigem genomischen Sequenzieren (DNA, RNA und small-RNA Sequenzierung), um die Dynamiken der Invasion von Tirant in einem Detailreichtum zu beschreiben, welches beispiellos für ähnliche Studien ist. Ich entdecke dass die Invasion von Tirant in D. melanogaster im frühen 20. Jahrhundert stattgefunden hat und sich inner- halb kurzer Zeit in den gesamten Vorkommensbereich der Spezies ausgebreitet hat. Ich zeige zusätzlich, dass Tirant bereits zuvor in D. melanogaster aktiv war, aber alle aktiven Kopien vor der neuen Invasion verloren wurden. Existierende Überbleibsel von piRNAs waren scheinbar nicht dazu in der Lage die neue Invasion von Tirant zu verhindern. Ich rekonstruiere ebenfalls die Muster bereits bekannter kürzlich erfolgter Invasionen von TEs in D. melanogaster, wodurch ich die Genauigkeit und Stärke meines Arbeitsprozesses bestätige. D. melanogaster ist einer der bestuntersuchten Organismen bezüglich seiner TE-Landschaft und die Existenz von Tirant in D. melanogaster ist bereits länger bekannt. Trotzdem blieb der Fakt das Tirant erst kürzlich in natürliche Populationen von D. melanogaster eindrang bisher unentdeckt. Diese bemerkenswerte Entdeckung zeigt auf dass die Anwendung eines ähnlichen Arbeitsprozesses die Möglichkeit der Entschlüsselung der bisher kryptischen Dynamiken von TE-Aktivität in verschiedensten Organismen bietet. Hierdurch könnte schlussendlich die umfangreiche Beschreibung der Aktivität verschiedenster TE-Familien sowie die quantitative Beschreibung der Dynamiken von TEs in natürlichen Populationen ermöglicht werden. Zusammengenommen liefert diese Arbeit einen neuen Einblick in die biologischen Besonderheiten von TE Dynamiken und etabliert zeitgleich neue Methodiken welche zukünftige weiterführende Beschreibungen von TE Dynamiken in natürlichen Populationen ermöglichen. Hiermit lege ich den Grundstein für zukünftige Forschungsbemühungen, speziell im Rahmen der Beschreibung der Dynamiken von piRNA clustern und TE Invasionen.