惊人发现:人工智能揭示 16 万种全新 RNA 病毒
人工智能算法帮助科学家从全球环境样本中识别出大量病毒。没有一种可能是有害的。使用专门的人工智能(AI)程序,科学家已经识别出超过 16 万种以前未知的病毒。
这项同类研究中规模最大的研究凸显了病毒圈的巨大规模,即存在于地球上众多环境中的病毒。
研究人员使用了一个名为 LucaProt 的人工智能程序,该程序识别出了先前未被识别、存储在源自世界各地生态系统的遗传物质数据库中的 RNA 病毒。
RNA 病毒——包括冠状病毒——其遗传物质由单链核糖核酸(RNA)组成,而不像疱疹病毒等 DNA 病毒那样由双链 DNA 组成。
澳大利亚悉尼大学的病毒学家埃迪·霍姆斯(Eddie Holmes)是此项研究的共同负责人,他表示,这项研究表明,对于“期望识别蛋白质结构和发现不同病毒”的科学家而言,人工智能已变得何等“具有变革性”。
在本研究中所使用的 LucaProt 人工智能算法的工作方式,与今年获诺贝尔化学奖认可的 AlphaFold 系统类似。人工智能方面的工作在诺贝尔物理学奖中也获得了认可。
人工智能助力科学家以前所未有的态势走红网络
霍姆斯及其合作者把卢卡蛋白系统描述成突破了遗传物质中的“暗物质”
他们从遗传物质的“宏基因组”样本入手——这一堆信息来自植物、动物、真菌、细菌以及像病毒这类的“非生命”物质
在已知的 DNA 片段中存在着未知代码的序列:“这是与我们数据库中已知的任何东西都不匹配的东西,”霍姆斯说道
研究人员把它称作“暗物质”
这项研究训练了一种叫做 LucaProt 的算法,用于预测暗物质中的哪些遗传信息源自病毒 RNA 物种。
霍姆斯称,在从悉尼南部的一个农业站采集的单个 50 克宏基因组样本里,发现了 1600 多种新病毒。
总的来讲,该团队分析了超过 10000 个类似的宏基因组样本,这致使发现了 161979 种潜在的 RNA 病毒物种以及 180 个 RNA 病毒超群。
然而,160000 种病毒在尚未被发现的病毒海洋中不过是沧海一粟——或许还不到 0.1%。作者称,这暗示了世界病毒圈的真实规模。
英国埃克塞特大学的进化生物学家本·朗顿(Ben Longdon)表示,LucaProt 是用于识别病毒的一个极为有用的工具,并且他已经在使用该工具助力自己开展有关新兴病毒性疾病的研究。
朗贡说,LucaProt 展示了人工智能如何帮助发现关于病毒的“大量情况”,甚至“超过了我们对它们进行分类和命名的能力”。
出现了数千种新病毒,但人类可能是安全的
这项研究是否揭示了人类面临的任何新的病毒威胁?霍姆斯说,可能没有,因为他们研究中发现的病毒可能无法感染人类。
“在 16 万个新病毒中,没有一个与哺乳动物病毒相近,我认为这些病毒都不会感染人类,”霍姆斯说。
即使它们能够感染人类,也没有迹象显示它们是危险或能致病的病毒。与细菌一样,“好”或“友好”的病毒也可能对健康有益。
朗顿说,尽管这些病毒是无害的,但了解它们的存在极其重要。
“如果我们想了解新出现的传染病,我们需要了解存在哪些病毒,它们是如何传播的,以及哪些因素决定了它们在宿主物种之间传播的能力,”朗顿说。
朗顿补充说,这些发现是朝着了解病毒多样性以及它们如何进化得更具传染性或更不具传染性迈出的一步。