9月27日消息,抗病毒药物具有时间长、病毒变异快等特点,世界范围内多家药物研发公司正引用机器学习、深度学习等AI技术来筛选、检测现有药物或全新的类药物分子,用以研发可以阻断病毒并能批量生产的抗病毒药物。
其中,位于巴黎的Iktos和位于美国的SRI Biosciences研发并合成了第一轮针对新冠肺炎的抗病毒药物试验品,并已进入测试阶段。
AI工具进军制药行业,意缩短研发周期至六个月
在去年的一次会议上,亚恩·加斯顿·马修(YannGaston-Mathé)和内森·柯林斯(Nathan Collins)一见如故。马修是位于巴黎的AI公司Iktos首席执行官兼联合创始人,Iktos的主要业务是通过深度学习模型设计虚拟的新型分子,柯林斯则是硅谷非营利组织SRI International子公司SRI Biosciences的首席战略官,领导的自动合成化学平台为制造分子提供方法。
“SRI Biosciences恰好能将我们设计出的新药制造出来,这样两家公司的业务正好互补了。”提起后面的合作,马特回忆说。
所以在2019年末,他们共同发起了一个项目,计划设计一款阻断流感蛋白质的抗病毒药物。随后新冠肺炎爆发,加斯顿·马特和柯林斯了解到病毒的罪魁祸首SARS-CoV-2所依赖的蛋白质与他们所想要阻断的流感蛋白质相似度达到了97%,因此,双方加快了研发进度。
治疗新冠肺炎的第一批抗病毒药物可能来自对现有药物的筛选。例如,Remdesivir最初用于治疗埃博拉病毒,现已被证明可以加快新冠肺炎患者的康复速度。但针对某病毒制造的药物在用于治疗另一病毒时,通常效力有限且可能产生副作用。如果研究人员生产出针对SARS-CoV-2的抗病毒药物,那么该药物可能比Remdesivir更安全有效。
除此之外还有一个致命问题:传统的药物研发速度太慢,无法应对突发疫情。从头开始设计药物通常需要三到五年的时间,而这还未算上之后临床试验的时间。“我们的目标是将AI和自动化相结合,将时间缩短到六个月或更短,” 柯林斯说, “让药物研发快一点,再快一点。”
小型生物技术公司和大型制药公司都认同这种观点,其中许多公司现在正在不断发展以超级计算能力为后盾的自动化技术,以前所未有的速度和范围对新冠疫情以及下一次大型传染病进行预测、设计和测试新的抗病毒药物。
“整个行业都在使用这些工具,”国际抗病毒研究协会会长,汉堡一家药物研发公司Evotec的执行副总裁Kara Carter说。“我们不仅需要新抗病毒药物来治疗人群中可能存在的SARS-CoV-2感染,还需要它们来治疗未来会到达的病原体。”
抗病毒药物的研发困境,面临三大难点
抗病毒药物与疫苗有着根本的不同,疫苗可以帮助免疫系统防御病毒入侵,产生的抗体可以增强人体的免疫反应。而相比之下,抗病毒药物是一种化合物,通过与特定蛋白质结合、阻止其功能,从而使病毒无法自我复制,阻断其传播。
SARS-CoV-2病毒预计有25到29种蛋白质,但并非所有蛋白质都是合适的药物靶标。正在研究阶段的药物靶标有:外部刺突蛋白,该蛋白可以直接与人细胞的受体结合,两种称为蛋白酶剪刀状酶,可将长条病毒蛋白切成细胞内的功能片段,以及聚合酶复合物等。
但是仅仅是选出附着于靶蛋白的药物也是不够的,化学家们还需要考虑该药物与靶标结合的紧密程度,是否也与其他物质结合,在体内代谢的速度等。候选药物大概需要达到10到20个这样的条件。
“但这些条件常常看起来相互之间是不相关的或矛盾的。”马特说。
制造抗病毒药物很难,主要有以下三个原因。
首先,病毒是病原体世界中的“斯巴达人”:它们高效、野蛮,是逃避人类免疫系统的专家。病毒直径约20到250纳米,仅有几个简单的组成部分,靠劫持宿主细胞进行繁殖,并经常在离开时破坏这些细胞。他们有无数技巧来掩饰自己的存在,包括防止感染的细胞发出分子遇险信号等。加拿大皇后大学(Queen’s University)病毒学家Colpitts说:“因为病毒真的很小,组成部分也不多,所可以被用作药物靶标的蛋白质其实并没有多少。”
其次,病毒可以快速复制,通常数小时或数天即可翻倍。这种遗传物质的不断复制使病毒能够迅速进化,产生能够避开药物作用的突变。所以当只使用单一一种药物治疗时,艾滋病病毒很快就会产生抗药性。这就是为什么治疗HIV感染需要使用抗病毒药混合物。
最后,与在人类细胞外部独立存在的细菌不同,病毒会入侵人类细胞进行繁殖,因此,任何用于消除病毒的药物都需要杀死宿主细胞。如果药物无法区分病毒和细胞,则将会引起严重的副作用。从事抗病毒药物研发已有三十多年的Carter说“这两者确实很难区分。”
除了病毒本身特点带来的研发困难,资金问题也是阻碍防病毒药物研发很重要的一部分,因为研发抗病毒药很少能盈利。伦敦经济学院的健康政策研究人员估计,开发一种新药的平均成本为10亿美元,而癌症和其他特殊药物的平均成本高达28亿美元。Carter表示,由于抗病毒药通常仅在疾病流行期间服用,因此公司很少能收回开发药物所花费的资金,更不用说获得利润了。
多家制药公司联合开发新药,药物研发技术亟待突破
位于德国海德堡的独立研究机构BioMed X的董事总经理Christian Tidona说:“如果想要改变现状,逐步改进方法是没有用的, 药物研发需要突破性的新技术。”
Iktos的AI平台是由药物化学家和人工智能专家创建的。为了应对SARS-CoV-2,该公司使用了生成模型( generative models,即生成新数据的深度学习算法)来“想象”分子结构。
Iktos首席执行官兼联合创始人马修说,根据新药物所需达到的条件,Iktos的AI平台可以提出并检测约100万种化合物。这是一个反复的过程:每个阶段,系统都会生成100种虚拟化合物,并使用预测模型对它们进行测试,以了解它们距离目标条件的接近程度。然后将测试结果用于设计下一批化合物。
他说:“就像我们有一位非常快的化学家一样,他正在设计化合物,测试化合物,根据得到的数据再设计另一批化合物。”
尽管这台计算机不如人类化学家聪明,但它的速度要快得多,它可以探索科学家所称的“化学空间”(chemical space),即所有可能的有机化合物。未开发的化学空间是巨大的:生物化学家估计,至少存在1063种可能的类药物分子,但其中有99.9%从未合成过。
尽管需要大量的测试和计算,设计化合物并不是新药研发最困难的部分。设计好药物模型后,必须对其进行合成,而且合成新化学物质的过程在200年中并没有发生太大的改变,依旧依靠人工操作。合成过程可能需要几天的时间,接下来可能需要数月至数年的时间对其进行优化以便于量化生产。
这就是马修渴望将Iktos的AI生成的分子结构发送给SRI Biosciences的Collins团队的原因。在获得国防部高级研究计划局(Defense Advanced Research Projects Agency)的1380万美元资助后,SRI Biosciences在过去四年中已能实现合成过程自动化。柯林斯说,该公司的名为“SynFini”的三种自动化套件可以在数小时或数天内生产出新的化合物。
在化合物合成过程中,机器学习软件会先提出制造所需分子的可能途径,接下来,使用少量的混合化学成分将化合物打印出来以观察它们如何反应来测试机器学习所提出的路径。如果生产出正确的化合物,则平台将对其继续进行测试。最终,一台台式化工厂就合成了目标化合物。
在Iktos和SRI Biosciences宣布合作后不到四个月,他们已经设计并合成了第一轮SARS-CoV-2的抗病毒药物试验品。现在,他们正在测试这些试验品在实际环境中的表现如何。
他们并不是唯一将人工智能和自动化应用于药物研发的合作项目。3月下旬,总部位于香港的Insilico Medicine首席执行官Alex Zhavoronkov在YouTube上偶然看到一个视频,该视频展示了在虚拟现实的场景中,三名研究人员将彩色棒状片段放在球形蓝色蛋白质的侧面。这三名研究人员正在使用VR探索化合物如何与SARS-CoV-2酶结合。Zhavoronkov联系了发布视频的初创公司,即位于圣地亚哥的Nanome,并邀请其通过虚拟现实中检查Insilico AI生成的分子。
Insilico运行一个AI平台,该平台使用生物数据训练深度学习算法来识别具有类药物特征,可能会与蛋白质靶标结合的分子。该平台在1月下旬为期四天的训练中产生了100个分子,似乎都可以与SARS-CoV-2蛋白酶结合,所以近期会合成其中一些分子以用于实验室测试。
Nanome的VR软件允许研究人员导入一个分子结构,然后以单个原子为单位对其进行查看和操作。Nanome首席执行官史蒂夫·麦克洛斯基(Steve McCloskey)表示,就像人类象棋棋手通过电脑程序模拟下棋步骤一样,化学家可以通过VR来找到让分子更像药物的合成方式。他说:“人机接口越紧密,双向传递的信息越多。”
Zhavoronkov将有关Insilico几种化合物的数据发送给Nanome,后者在VR中重新创建它们。Nanome的化学家展示出如何通过调整改善化合物的合成方式。Zhavoronkov说:“这是一次非常愉快的合作。”
同时,三月,日本武田制药公司邀请开发化学模拟软件的纽约公司Schrödinger加入抗病毒药物联盟,后者的AI专注于蛋白质、小分子以及彼此之间如何相互作用。
Schrödinger的首席生物医学科学家和研究开发负责人Karen Akinsanya说,该软件每周会筛选数十亿个分子以测试化合物的性质,并同时针对所需的性质进行优化。她说:“我们迫切地需要有效的,同时也可以被人体很好地吸收的分子。”她补充说,药物开发人员正在寻求可以广泛使用且易于给药的化合物,例如口服药物而不是静脉注射药物。
Schrödinger评估了四个蛋白质类化合物,并对其中两个通过虚拟模拟进行筛选,而这个过程需要大量算力。6月,Google Cloud捐赠了相当于1600万小时的Nvidia GPU时间用于该公司的计算,接下来,抗病毒药物联盟的制药公司将合成和测试以确定的最有可能生产为抗病毒药物的化合物。
包括Amazon Web Services、IBM和Intel在内的其他公司以及美国的一些国家实验室也在向Covid-19高性能计算联盟捐赠时间和资源。Covid-19高性能计算联盟正在支持87个项目,这些项目现在可以访问680万个CPU内核,50,000个GPU和600 petaflops的计算资源。
结语:药物研发需要多方助力
尽管先进技术可以加快早期的药物发现,但是任何新药物的生产都必须先进行动物实现,大批量生产后再进行临床试验,接下来是一系列抗病毒药物的试验,这些试验平均需要7年左右的时间。
5月,德国的BioMed X研究所启动了一个为期五年的项目,以建立快速的抗病毒反应平台,这将加速从制造到临床试验整个过程中的药物研发。这个耗资约4000万欧元(4700万美元)由制药公司投资的项目也将支持为年轻科学家的研究提供资金和所需设备。
“我们将致力于在不到六个月的时间内,完成从鉴定新病毒到研发一万支新药投入测试。”负责该项目的BioMed X的Tidona说。
而SRI Biosciences的首席战略官柯林斯也提出:“我们必须走出舒适区,开始重新思考如何对这些威胁做出更快的反应。”
尽管疫苗研发所需的时间可能比特制的抗病毒药短得多,但专家们希望COVID-19高性能计算联盟能够继续支持开发具有直接作用的抗病毒药物。创建更多研发抗病毒药物的工具,不仅能帮我们应对这次的新冠疫情,还能为下一次大型流行病做好准备。