之间网

差异在于数据药物发现的人工智能革命

生活
导读 十年前,在攻读博士学位期间,凯瑟琳·埃里森(KathleenElison)会骑着她的紫色Huffy巡洋舰自行车从她位于希望之城花楼的实验室前往邻近的显...

十年前,在攻读博士学位期间,凯瑟琳·埃里森(KathleenElison)会骑着她的紫色Huffy巡洋舰自行车从她位于希望之城花楼的实验室前往邻近的显微镜设施。Elison与她的导师、分子医学系副教授JacobBerlin博士一起开发一种超密集微阵列,用于测量小分子相互作用,目的是为药物发现等治疗应用提供信息。为筛选实验准备的关键步骤包括使用显微镜收集组合文库的测序信息,这一过程称为“解码”。

“这次行程单程一英里,我每天要走三次来对我们的进行成像,”埃利森回忆道。

那时,手动解码最多五个视野需要四到五天的时间。在该小组获得了自己的显微镜的资金后,朝着提高吞吐量迈出了一大步。借助用于自动图像处理和数据提取的新管道,规模扩大从那里开始滚雪球。

如今,Elison是TerrayTherapeutics的高级科学家,这是一家位于加利福尼亚州蒙罗维亚(洛杉矶)的生物技术公司,而Berlin是创始首席执行官。该公司的核心技术将Elison的超小型(大约镍币大小)与用于药物发现的人工智能(AI)工具相结合。最初是在几天内对单个上的五个视场进行手动成像,现在已升级为使用Terray的自动化平台在24小时内对整个进行成像和解码。

“这是在五分之一的时间内将空间增加了7,000倍的天文数字,”埃利森在最近访问Terray总部时告诉我。

Elison的于2018年底被引入公司。2022年2月,Terray宣布进行6000万美元的A轮融资,此前此前未宣布进行过2000万美元的种子轮融资。自那时起,该公司已发展成为拥有100名员工的团队和占地52,000平方英尺的工厂,毗邻加利福尼亚州杜阿尔特市希望之城园区。在现场参观期间,我发现了一些毛绒动物长鼻浣熊,它是浣熊家族的成员,向该公司的化学空间基础模型、加速治疗推理的对比优化(COATI)致敬。

Terray还建立了一些有前景的合作伙伴关系。2022年10月,该公司宣布与CalicoLifeSciences合作,发现与年龄相关疾病的小分子疗法。2023年12月宣布与百时美施贵宝开展多目标合作。

2023年11月,Terray宣布获得NVIDIA风险投资部门NVentures的股权投资。在此次合作中,Terray利用NVIDIADGXCloud开发小分子的综合化学基础模型,其中一些模型将在NVIDIABioNeMo云服务上提供,用于药物发现中的生成AI。

Berlin将公司的时间表描述为一个多阶段的旅程,从硬件革命(扩大制造规模)到数据革命(快速、精确地收集高质量数据),再到计算革命(构建药物发现平台)。由于数据不足或不明确是人工智能药物发现方法的最大瓶颈之一,Terray的超小型旨在通过以前所未有的规模生成高质量的化学数据来解决这一差距。在过去18个月中,Terray测量了超过26亿个小分子/靶标相互作用,以推动其生成式AI药物设计。

最终,柏林强调,人工智能和数据缺一不可。“没有人会查看26亿个数据点并用它们做任何真正令人兴奋的事情。您还必须具备计算能力。区别在于数据,但价值在于从第一天开始就采用的对半交织的方法,即计算和数据始终结合在一起,”Berlin告诉GEN。

Terray是目前在药物发现领域掀起“人工智能革命”的数十家生物技术公司之一。Exscientia和RecursionPharmaceuticals这两家分别成立于2012年和2013年的上市公司等大型企业紧随其后,在未来十年中利用人工智能的新药研发初创企业将呈爆炸式增长。但这个人工智能黑匣子到底意味着什么呢?

从广义上讲,药物发现中的人工智能的特点是新的数据密集型平台,可以提高速度并降低失败率。这些平台结合了机器学习(ML)等人工智能工具,从数据中学习生物模式,做出预测以指导下一步实验步骤,并在湿实验室中测试这些预测。

在《自然生物技术》最近发表的一篇文章中,总部位于香港和纽约市的药物发现公司InsilicoMedicine的科学家们使用人工智能驱动的方法来确定一种用于致命肺部疾病特发性肺纤维化的小分子抑制剂。从靶点发现到临床前候选药物提名,这项工作大约用了18个月的时间完成。

BiocomCalifornia的全球生命科学合作和投资者会议于2月份在加利福尼亚州拉霍亚著名的TorreyPines高尔夫球场举行,TimeBioVentures的普通合伙人兼联合创始人DAWallach主持了题为“人工智能和药物发现:在哪里”的讨论。牛肉?”探索人工智能工具在药物发现管道中的作用和优势(图3)。

“‘牛肉在哪里?’这是一个很难回答的问题,部分原因是它均匀分布在各处。业界还没有看到这样的标题:‘这是通过临床测试的商业人工智能分子,现在是世界上最畅销的药物之一’,”Dimension创始人兼管理合伙人李南表示。

事实上,当今药物发现公司中的人工智能并不标榜“点击按钮,获取分子”的完全集成产品。相反,人工智能工具为传统上缓慢的药物发现流程提供了更高的效率,而计算机工具在前往潮湿实验室之前提供了高效的首要搜索场所。

强生公司全球治疗发现主管艾玛·帕米(EmmaParmee)表示,效率不仅仅由速度来定义,还包括能够实现5-10年前无法药物治疗的靶点,并确定在临床上失败率较低的候选药物。在这方面,数据驱动的方法已被证明能够有效指导下一步的研究步骤,以促进成功药物的发展。

“从一个起点开始,我们使用生成工具[输出]数以万计的分子,然后对这些分子进行分类,供我们的化学家进行评估,”帕尔米说。“其中一个生成的分子实际上激发了化学家进行另一种[分子变化],这对该项目确实产生了影响。”

她还强调,人类知识,例如药物化学专业知识和对合成可及性的理解,对于这些管道仍然至关重要,因为人工智能模型仍然具有预测性。

GenesisTherapeutics的首席技术官兼联合创始人BenSklaroff将计算化学家描述为人工智能的“战略控制者”。化学家们没有手工设计单个分子,而是“将探照灯指向特定方向”。然后,人工智能可以在该化学空间区域内生成一组分子。该探照灯可以包括识别分子修饰区域或定义吸收、分布、代谢和排泄(ADME)参数以协助药理学。

Genesis于2019年在斯坦福大学成立,由VijayPande实验室衍生而来,VijayPande是AndreesenHorowitz(a16z)生物+健康基金的创始普通合伙人。该公司专注于使用其深度学习平台(称为GenesisExplorationofMolecularSpace(GEMS))进行小分子药物发现的生成和预测人工智能,Genesis已与Genentech和EliLilly建立了合作伙伴关系,并于2023年8月获得了2亿美元的风险投资,由a16z共同领导。

尽管科学家的使命是理解生物学,但Wallach提出了批评,认为ML模型往往是“大规模回归发现者”和“大型相关推理机”,可能无法为生物学机制提供答案。这应该成为科学家们关心的问题吗?

“除了少数例外,我们几乎不知道任何药物实际上是如何起作用的!”insitro首席战略官PhilipTagari感叹道。“如果目的是改善人类健康并确保患者掌握有效的治疗方法,那么在不完全了解生物学的情况下开发治疗方法是理所当然的。如果是黑匣子,我就拥抱黑匣子!”塔加里继续说道。

总而言之,将人工智能应用于药物发现仍然是一项多方面的壮举。我最近在GEN的每周播客《TouchingBase》中采访了Dimension研究总监、ARKInvest生命科学研究前总监SimonBarnett,Barnett将药物发现描述为一个单一的大问题,不会随着时间的推移而打开闸门。人工智能或机器学习工具,而是一系列小问题和决策,它们组合在一起,整体上形成了一个难题。

“药物不是‘用人工智能设计的’。[相反],机器学习工具多年来持续渗透到药物开发过程中,”Barnett说。“你可以围绕正确的数据和应用于正确问题的正确架构建立一家伟大的公司。如果你把所有这些事情排列起来,我认为会产生非常有趣的结果。”

小分子的大力量

回到Terray,“正确”的数据、架构和问题以高通量平台为特色,以解决药物发现中小分子数据的历史缺乏问题。

从基因组学、蛋白质组学、siRNA、CRISPR敲除和患者数据库(例如英国生物银行),生物学已经看到数据流的爆炸式增长,这为治疗学提供了数据驱动的计算机会。尽管抗体和蛋白质等生物制品的数据流具有利用天然工厂或细胞的优势,可以生成大型候选物库,但小分子传统上是由合成化学家制造的,平均每周生产几个分子。这些方法既缓慢又昂贵。作为一种解决方案,Terray的提供“海量、高质量、快速迭代”的数据。

Terray首席科学官VanessaTaylor表示,尽管该与靶标和疾病无关,但Terray仍将治疗重点放在免疫学上。鉴于免疫学领域的许多生物制剂依赖于患者注射,因此对小分子口服药物的需求尚未得到满足。

“患者不一定想每六周去诊所注射一次药物。另外,由于这些药物的半衰期较长,因此它们不会很快消失。如果患者的免疫系统受到严重抑制,他们可能会被困六周,”泰勒告诉GEN。

她还指出,Terray对小分子的追求通常遵循药物已获批准的途径。“我们知道,如果我们能够通过不同的机制来靶向该途径,即进入细胞并击中该途径中的某些物质的小分子,就会产生治疗效果,”泰勒说。

“人们并不完全知道在这些途径中的何处进行干预。这非常适合[Terray的方法],在这种方法中,你可以并行处理多个目标,然后找到正确的干预点。”Berlin表示同意。

绘制化学空间中的山脉

传统的药物发现遵循线性方法,其中单个靶点最初由人类根据已知的生物学选择。相比之下,今天的人工智能工具提供了一种反向方法,可以对大型化学空间进行采样,以告知值得考虑的广泛目标选择。

“一开始没有人知道化学发现和生物学的正确交叉点将在哪里带来最大的成功可能性,”柏林说。“好消息是空间如此之大,几乎所有问题的答案都在某个地方。但反之亦然。空间如此之大,定义这些答案真的很难。”

Terray的技术可评估目标蛋白质与微阵列上数百万种化合物的结合亲和力。泰勒指出,鉴于该平台不知道蛋白质如何结合,该屏幕的定位是识别新的结合位点。“它基本上是一个具有迭代潜力的大型高通量亲和力平台。我们专注于我们看到结合的区域,然后研究改变分子结构如何改变结合亲和力,”泰勒告诉GEN。

Terray的管道具有三个主要步骤:多样性库筛选、重点库筛选和生成药物设计。在多样性库筛选过程中,数以千万计的化合物被添加到集合中,重点是增加化学空间的覆盖范围,从而首先勾勒出山脉的轮廓来构建地图。

多样性筛选精确定位了感兴趣的化学领域。然后,重点进行库筛选,以提高这些区域周围的化学分辨率。“你可以想象一下,当你从化学空间中的一个点转到整个山脉测绘卡通时,所增加的分辨率。然后你可以让那个空间周围的分子告诉你,“这里的甲基真的很重要!”或者‘不,你必须在这里安装另一个铃声系统,’”柏林说。

最后,将来自多样性和重点库筛选的数据与ADME数据集等补充资源相结合,以协助药物化学家进行生成药物设计。

十年后,埃莉森每天骑自行车去显微镜设施,跨学科团队推动特雷的研究向前发展,这让她感到震惊。

“[计算机数据科学家]非常熟悉湿实验室中发生的各个方面,因为他们对从中产生的数据非常熟悉,”埃利森说。“我们一些最好的湿实验室想法来自计算机科学家!”

标签: