RNA病毒基因组的复杂多样还体现在基因的获得和丢失。由于RNA病毒序列短、进化快,导致病毒基因的获得或丢失很难发现。分析新发现的病毒基因组发现,这些事件在RNA病毒的进化进程中频繁发生。这表现在复杂的RNA病毒含有大量的辅助基因,最简单的病毒则仅由一个RNA聚合酶(RdRp)基因组成,这也同时提出了什么是病毒的问题。更值得注意的是,RNA病毒也经常从细胞生物中获取基因,包括RNA解旋酶、甲基转移酶、核酸酶外切酶、蛋白酶、ADP-ribose 结合蛋白和双链RNA结合蛋白基因,甚至大肠杆菌群集运动蛋白(NANAR结构域)基因等等。这些基因在病毒进化史上出现的时间很不连贯,在基因组所处的位置也具有很大的灵活性,表明这些基因经历了多次独立的基因获得和缺失事件。
现有的研究认为,在病毒基因开放阅读框的数目与排列、结构和非结构蛋白基因的顺序、以及病毒基因组分节段的频率和节段的数量等特征是保守的。然而,本研究发现在一些正链RNA病毒进化过程中出现高频率的分节段或去分节段化(即重新成为不分节段基因组)。负链RNA也有多种分节段的组织形式,如布尼亚类病毒的基因组不仅具有原来认为的3基因节段,而且现在发现一些病毒由1-7个不等的基因节段组成。这都显示出现有知识体系和分类体系的严重缺陷。
总的来说,本研究结果呈现出一个比目前的分类系统所描绘的亲缘进化关系更复杂的、基因组进化更灵活多样的病毒圈,从而为研究病毒甚至生物的遗传与进化提供了新的理论基础。该研究建立的病毒检测体系、发现未知病毒的方法,为实现在新发突发传染病的防控上做到早识别、早预警、精准防控奠定了基础。