


百图生科公开的5款免疫机器人。虎嗅拍摄
而百图生科之所以能够这么快做出成果,也得益于百度长期对生物制药的关注。 据刘维介绍,百度的风险投资已经投了多家AI药物设计公司、做生物传感器的公司,以及其他多种前沿生物技术。“做百图生科很大的原因,也是希望能有机会把这些单点技术充分整合在一起,再跟AI技术、具体的药物研发等问题形成闭环。” 整个体系的驱动力量,就是“AI大模型驱动的高通量干湿闭环生物计算引擎”。它囊括了万亿关系的多组学免疫图谱、千亿参数的蛋白质/免疫计算大模型、亿级数据生产量的高通量免疫模拟实验系统等关键技术,以及由此形成的高效的干湿闭环。 其中,大模型xTrimo免疫大脑是全世界最大的生物预训练模型;刚刚启动的北京中心实验室是全球首创的大规模类免疫系统。 背靠这个巨大引擎,免疫机器人只是算是一个“中期报告”,他们有更大的野心——解码复杂免疫系统。 “最终我们要人造免疫系统。”刘维说。 这个野心是不是太大了?

百图生科的“大模型”。虎嗅拍摄 中国创新药弯道超车的机会来了? 医疗和医药都是相对保守的行业,在模式创新上,很少有振奋人心的好故事。上一个好故事就是百图生科要对标的基因泰克——它开创了Biotech的时代,是新药研发领域的一个传奇。 1976年创办的基因泰克,采用当时全新的基因工程技术研发新药。原本科学家们认为,基因工程技术能够服务制药行业至少还需要很多年,大型制药公司也并没有认真对待这一新技术。 而基因泰克凭借这一技术先后研发成功了生长激素、重组胰岛素等具有开创意义的新药。 从成立到1980年IPO上市之时,该公司的价值也实现了指数级的增长——从最初不到200万美元,激增到了7亿美元以上。 基因泰克的成功带动了Biotech的兴起。结合新药研发难度加大,投入增加、成功率降低等新的特点,更加灵活、机动的Biotech公司,也逐渐取代传统的制药巨头成立为研发的主力军。 根据IQVIA数据,到2018年,全球在研产品管线中已有72%来自Biotech。在中国这个比例更是高达83%。 百图生科如此类比,实际上也是想在医药领域开创一个新的时代。 “这不是一个零和竞争。”刘维指出,基因泰克用的不是上一代的主流技术,是靠基因工程驱动发展的,是引擎级的变革。但是主流药企并没有因此失去市场,化学药、小分子药也在发展演进。 同样的,百图生科的新技术,也并不会替代或颠覆已有的技术路径。 “大量的疾病等在那里。医药行业组团打免疫疾病,都还远远打不过。”刘维认为,在这个共识之下,无论是创新药企、主流药企,还是像百图生科“下一代复杂蛋白质药物”等“造药新势力”的加盟,也都应该是合作的关系。 百图生科也希望他们的类免疫系统,不仅服务于自身的模型训练,还可以为“很多药物研发伙伴提供有益的帮助”。

百图生科CEO刘维。百图生科提供 AI技术杀入创新药研发似乎终于到了一个水到渠成的节点。 近年来,随着低垂的果实采摘殆尽,创新药研发越来越难,烧钱动辄十几亿美元、几十亿美元,最终的销售额却越来越不尽如人意。全球制药业迫切寻找重磅药,都快成了老生常谈。 同期,AI技术经过几十年的迭代发展,也达到了新的巅峰,可以胜任非常复杂的生物计算。 到2020年底,生命科学的围城终于被打开了一个缺口。英国公司DeepMind的蛋白质结构预测工具AlphaFold成功破解了蛋白质折叠问题,实现了对蛋白质结构的预测,破解了困扰生物学界半个世纪之久的难题。 今年7月,AlphaFold预测蛋白质结构总量达到2.14亿个,几乎覆盖了科学界已知的所有蛋白质。 另据机器之心的报道,百图生科和Colossal-AI团队联合开发的xTrimoMultimer模型,还把推理蛋白质结构的速度进一步提高了11倍。 这些数据库都是开源的。 也就是说,现在科研人员想要预测蛋白质结构,就像搜索信息一样简单。每个蛋白质结构,至少可以省几万到几十万美元的成本,时间成本就更不用说了。 这个突破也被誉为“科学界的里程碑”,顺便还给AI+大分子药物研发业务添了一把火。但是它对新药研发的作用又有多大呢? 一般来说,新药研发过程中,最烧钱的部分是临床试验,最难的还是找到靶点。蛋白质结构预测反而没有那么重要的地位。 “根据序列预测结构解决的更多的是学术问题,解决工业问题要反过来,根据所希望得到的结构设计序列。这方面的难度大得多。”结构生化专家王年爽博士告诉虎嗅。AI在药物研发中的应用还在起步阶段。 而与此前技术不同,百图生科的免疫机器人、类免疫系统,很可能是一次大的飞跃。因为,理论上,这套驱动引擎,不仅有助于快速找到靶点,还有助于验证靶点、提高临床阶段的转换。针对的都是研发中的难点、痛点问题。 “这是一个弯道超车的机会,我们中国企业也可以推出世界领先的药物,做出真正的Firstinclass,乃至Onlyinclass的药物。”刘维兴奋地指出,甚至可以促进那些原来科学上认为可行,但是工程上难以实现的研究成果转化落地。 即便本次尝试不成功,按照百图生科首席AI科学家宋乐的预言,诞生在生物计算领域的AI大模型,还是非常有可能成为“彻底改写药物研发技术能力”的新势力。 成功路上的三座大山 科技公司与创新药研发的逻辑差异如此悬殊—— 一个在讲快速迭代的“摩尔定律”,一个讲的是“每9年研发成本翻一番”的“反摩尔定律”。 一个在百图生科看起来信心满满的宏大蓝图,对于习惯细工慢做的医药人来说,简直就是吃下去的“大饼”。 …… 双方的“惯性”拉扯之下,未来,百图生科至少有三座大山需要跨越。 第一座大山,就是资金挑战。 人类希望用计算机来辅助药物研发的历史可以追溯到1980年代。为了挑战蛋白质折叠问题,从2004年IBM推出超级电脑“蓝色基因”到成功,至少用了16年时间。 在这个过程中,除了时间、人力、物力,资金投入也是可观的。 可以看到,1999年筹建之初,IBM透露的“蓝色基因”投资规模就已经达到了1亿美元。 DeepMind在2013年被收购前已经欠下11亿英镑的债务。另据谷歌的财报,2014年到2019年的6年间,他们就亏掉了14.35亿英镑。到2020年以后好不容易扭亏,但是赚的相比烧掉的钱连零头都不到。虽然这些钱并不是都花在解锁蛋白质结构上,但是背后的艰辛也可见一斑。 据医药魔方统计,2017年至2021年全球AI+制药领域融资规模从1亿美元激增至59亿美元。 百图生科的烧钱势头可能还要超出很多创业公司。 在过去一年多时间里,其规模也从最初的20到30人迅速增员到近300人,都是学历高、有药企经历的人才。 刚刚揭幕的北京中心实验室面积达到5000平方米,加上此前已经投入使用的苏州实验室,总规模超过1万平方米。而且引进的设备很多都是顶级的。 “看起来就很贵。”有行业人士向虎嗅感叹。 新药研发是一场马拉松,赢在起点不意味着能够赢到最后。 前面提到,按照李彦宏最初的计划,百图生科要在3年内融资20亿美元。但是现在1年多过去了,目前已知的只有A轮融资的“上亿美元”。 如果百图生科想要做新药研发而非平台,加上又有新药进入临床,那么在接下来的几年甚至十几年里,就需要有持续的资金投入其中。在百度也面临营收压力的情况下,资金挑战还是不容小觑。 除了钱的问题,临床研究成功率低和免疫系统研究不足,也都是拦路的“大山”。 事实上,多靶点药物在人体中作用机制比普通单靶点药物更复杂,出现毒性的风险更大,也更容易失败。目前走得比较快的联合用药,以及偶联药物,包括ADC药物等领域,都有很多惜败的案例。包括罗氏、默沙东等经验丰富的跨国药企。 当然,如果“类免疫系统”成功上线,这个问题或许不难解决。但是,因为基础研究的缺失,特别是免疫系统研究的不到位,类免疫系统本身也面临挑战。 著名分子肿瘤学家、中国工程院院士、百图生科科学顾问委员会主席詹启敏院士表示,目前科学界对免疫体系的了解也不够,无论是细胞免疫还是体液免疫,乃至对免疫微环境的形成都有很多疑问,而且很多问题已经不是单纯的分子生物学能够解决的了。 上海交大医学院上海市免疫学研究所所长苏冰教授向虎嗅表示,人体免疫系统非常复杂,如果要模拟,可能需要很长时间的数据积累,以及对免疫系统更加仔细、详细的了解。 这里面有引入人工智能、大数据的必要性,但不是一蹴而就的。 第三座大山,就是数据挑战。 浙江工业大学智能制药研究院院长段宏亮在同写意(“同写意”是一个以创新药为核心的,汇集研发精英的交流与价值分享平台)组织的一次行业论坛上曾公开悉数过AI制药面临的数据困境, 包括:数据格式不统一,以及由此产生的数据量不足;因具有巨大商业价值,制药企业不肯分享数据而形成信息孤岛的问题等。 中国新药研发的一抹亮光 2015年以来,中国创新药一度成为投资的热门。不过,在临床使用中,原创新药还是主要来自进口,据统计,占到了临床开出专利药的95%以上。大部分中国新药都是me-too类新药(也就是,药效与同类原创新药相当的新药)。 一方面是因为,中国科研基础仍然薄弱,且与产业联系不够紧密,靶点发现的能力几乎没有;另一方面,中国主流药企长期不重视研发,投入少,没有研发基因也是重要原因。 而从投资与回报的角度看,原创新药开发投入高、难度大、风险高,尽管一旦成功回报往往可观,但是成功率太低,有“九死一生”之称。因此,大多数投资人和研发者都更倾向于投入到收益有限,而更加稳妥的me-too类新药中。特别是这几年容易的靶点都已经开发殆尽了。 这也导致中国的新药研发同质化高、内卷严重,投资回报率更低,而临床却还是常有依赖进口或无药可用的情况。 中国在健康领域面临的第一大挑战就是重大疾病。 其中,仅恶性肿瘤,中国每年新发病例就有450万例,300多万人死于肿瘤,很多在中国发病率高的肿瘤,如肝癌、胃癌、食管癌等,还缺少有效药物。“这些药在中国有极大的市场,但是没人研究。” 从这个角度看,百图生科等“造药新势力”的加入,也确实会给中国新药研发提供新的思路。