人工智能如何在开始之前阻止下一次重大流感

发布时间: 2020-02-15 08:37:54 来源:

随着毁灭性流感季节的到来,全球的免疫系统在今年冬天一直在加班工作。疾病预防控制中心(CDC)的数据显示,近几个月来,已有180,000多名美国人住院治疗,另有10,000多人死亡,而冠状病毒(现已正式命名为COVID-19)在全球范围内的传播速度惊人。对世界范围内日益严重的流感爆发的担忧甚至促使MWC 2020的预防性取消-距预定在巴塞罗那开幕的前一周不到。但是在不久的将来,以人工智能为基础的药物开发可以帮助生产出足够快的疫苗和治疗方法,从而在致命病毒变异为全球大流行之前阻止其传播。

药物和疫苗开发的常规方法效率极低。通过密集的试验和错误技术,研究人员可以花将近十年的时间艰苦地审查候选分子。根据塔夫茨药物研发研究中心2019年的研究,开发单一药物治疗的平均费用为26亿美元-是2003年费用的两倍多-只有大约12%的临床开发获得了FDA的批准。

佐治亚大学药物与生物医学科学助理教授Eva-Maria Strauch博士对Engadget表示:“您始终拥有FDA。”FDA批准药物的确需要五到十年的时间。

但是,借助机器学习系统,生物医学研究人员可以从本质上颠覆“试错法”。研究人员可以使用AI对庞大的候选化合物数据库进行分类,并推荐最可能有效的化合物,而无需人工系统地尝试每种潜在的治疗方法。华盛顿大学计算生物学家S. Joshua Swamidass表示:“药物研发团队真正面临的许多问题已不再是人们认为可以通过对大脑中的数据进行排序而解决的问题。”《2019年科学家》杂志。“必须有一种系统的方法来查看大量数据……以回答问题并深入了解如何做事。”

例如,特比萘芬是一种口服抗真菌药物,于1996年以拉米非(Lamifil)的形式出售,是一种鹅口疮治疗剂。然而,在三年之内,有多人报告了服用该药物的不良影响,到2008年,三人死于肝毒性,另有70人患病。医生发现特比萘芬(TBF-A)的代谢产物是肝损害的原因,但当时无法弄清它是如何在体内产生的。

直到2018年,这种代谢途径一直是医学界的一个谜,直到2018年华盛顿大学研究生Na Le Dang训练了关于代谢途径的AI并让机器确定了肝脏将特比萘芬分解为TBF-A的潜在途径。事实证明,创建有毒代谢物是一个分为两个步骤的过程,该过程很难通过实验识别,但足够简单,以使AI具备强大的模式识别功能。

实际上,在过去的50年中,已经有450多种药物退出市场,其中许多药物会像拉米菲一样引起肝脏毒性。足以让FDA启动Tox21.gov网站,该网站是分子及其对各种重要人类蛋白质的相对毒性的在线数据库。通过在此数据集上训练AI,研究人员希望能够更快地确定潜在的治疗方法是否会引起严重的副作用。

Engadget告诉Engadget:“过去,我们在本质上一直面临挑战,'您能预先预测这些化合物的毒性吗?'。”“这与我们进行药物小分子筛查的方法完全相反。我们不想受到打击,我们要说'嘿,这种[化合物有可能有毒”。”

当认可机构不忙于揭示已有十年历史的医学奥秘时,它们正在帮助设计更好的流感疫苗。在2019年,澳大利亚弗林德斯大学的研究人员使用AI对普通流感疫苗进行“涡轮增压”处理,从而使人体在暴露于该疫苗时会产生更高浓度的抗体。嗯,从技术上讲,研究人员并没有完全使用AI,而是完全自行设计疫苗,因此没有像使用AI那样开门而走。

由弗林德斯大学医学教授尼古拉·彼得罗夫斯基(Nikolai Petrovsky)领导的团队首先构建了AI Sam(配体搜索算法)。为什么他们不称其为Sal既不在这里也不在那里。

Sam受过训练,可以区分对流感有效的分子和对流感无效的分子。然后,该团队训练了第二个程序,以生成数万亿个潜在的化学化合物结构,并将其反馈给Sam,该程序着手确定它们是否有效。然后,团队选拔了最优秀的候选人,并对其进行了物理综合。随后的动物试验证实,增强疫苗比未改良的前作更有效。最初的人体试验于今年年初在美国开始,预计持续约12个月。如果批准程序顺利进行,则涡轮增压疫苗可能会在几年内公开发售。对于只用了两年(而不是正常的5-10)开发的疫苗来说,还不错。

虽然机器学习系统可以筛查庞大的数据集,其速度远远超过生物学研究人员,并且可以通过更加脆弱的联系进行准确的知情估计,但在可预见的未来,人类仍将停留在药物开发领域。一方面,还有谁会生成,整理,索引,组织和标记所有向AI传授所需训练的培训数据?

即使机器学习系统变得越来越称职,就像其他所有AI一样,当使用有缺陷或有偏差的数据时,它们仍然容易产生次优的结果。Unlearn.AI的创始人兼首席执行官查尔斯·费舍尔(Charles Fisher)博士在11月写道:“许多用于医学的数据集都来自白人,北美和欧洲人口。”“如果研究人员将机器学习应用于这些数据集之一,并发现生物标记物以预测对治疗的反应,则不能保证该生物标记物在所有人群中都能很好地发挥作用。”为了应对数据偏差带来的偏斜影响,费舍尔倡导“更大的数据集,更复杂的软件和更强大的计算机”。

正如Kebotix首席执行官Jill Becker博士向Engadget解释的那样,另一个重要组成部分将是干净的数据。Kebotix是一家2018年的创业公司,采用AI与机器人技术相结合来设计和开发外来材料和化学物质。

她解释说:“我们有三个数据源。”“我们有能力生成我们自己的数据……考虑半经验计算。我们也有自己的综合实验室来生成数据,然后……使用外部数据。”这些外部数据可以来自公开期刊或订阅期刊,也可以来自专利和公司的研究合作伙伴。但是无论来源如何,贝克尔都指出:“我们花费了大量时间对其进行清理。”

Michael补充说:“确保数据具有与这些模型相关的适当的元数据是绝对关键的。而且,这不仅仅是发生,还必须付出实际的努力。这很困难,因为它昂贵且耗时。 。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。
Top