蛋白质是构成生命的基本元件,破解它们的功能是揭开各种生命现象的金钥匙。然而再复杂的蛋白质也仅由20多种氨基酸以不同长度排列组合组成,在几微秒至几毫秒内迅速地折叠成一个特殊的三维结构,不同的结构决定了蛋白质之间迥异的功能。

在生命科学领域,蛋白质结构预测是个令人着迷的话题,吸引了众多科学家的攻坚,却也一直面临着难度大、成本高、进展缓慢的局面,直到迎来了人工智能的加入,单个蛋白质折叠这一世纪难题才得到基本解决。这一革命性的进展令AI在基础科学领域掀起了巨大波澜,此后全球进入了生命科学技术爆发期。

在新冠肺炎疫情大流行的背景下,AI +合成生物学厚积薄发,而AI蛋白质设计正异军突起。近日,人工智能企业天壤,基于自主研发的AI主导的蛋白质设计平台TRDesign,从头设计了新冠病毒刺突蛋白(S蛋白)结合剂,可以阻止刺突蛋白和人体细胞 ACE2 受体的结合。

ACE2 即血管紧张素转换酶2,是新冠病毒(SARS-CoV-2)进入人体细胞所需的受体,在 SARS-CoV-2 入侵细胞的过程中起着至关重要的作用。相较于传统次突蛋白接合剂开发常采取制备抗体或改造天然 ACE2 的办法,天壤的设计方法具有迷你蛋白分子量小、热稳定性高且成本低的优势,且计算方法更高效,折叠空间更丰富,能有效覆盖 ACE2 与新冠病毒刺突蛋白结合的整个界面以应对病毒的各类潜在突变,这在国内尚属首家。

天壤新冠刺突蛋白结合剂设计流程

从全球范围来看,以AI为核心的蛋白质设计已经从技术概念过渡到价值验证阶段,已经有多款以AI为主导研发的生物酶、医药蛋白进入临床试验阶段。国内企业的强势入局,加速了这一领域的技术富集,为强化合成生物技术战略科技力量打下了坚实基础。相信在未来几年内,将有大量的机构和企业涌入该类技术创新的浪潮中。

合成生物学的春天

合成生物学日益成为催生生物经济的颠覆性力量,逐渐从理论研究转变为未来的制造范式。理论上,合成生物学是指通过构建生物功能元件、装置和系统,对细胞或生命体进行遗传学设计、改造,使其拥有满足人类需求的生物功能,甚至创造新的生物系统。微生物可以制造许多目前工业制造产品,因此合成生物学提供了生产香料、纺织品到食物和燃料等几乎所有人类所需产品的新方法。

合成生物学的发展,有望使供应链不再受到原材料供应的限制。企业可以从头开始,利用细胞设计和制造无限量的产品。例如,0.5克牛肌肉细胞就可产生多达44亿磅牛肉,比墨西哥一年的牛肉消费量还多。合成生物学催生了以科学为基础的初创企业,这些企业正试图改变传统的产品和工艺。

美国对合成生物学的布局比较早,近年来更是连续发布了多份科技路线图,在《2021美国创新与竞争法案》中,合成生物学位列关键竞争技术之一。

与此同时,中国正进入合成生物学竞争快车道。5月10日,国家发展改革委印发《“十四五”生物经济发展规划》。在这份文件中,合成生物学多次受到提及,覆盖医疗健康、食品消费两大领域,其中明确要加快推动合成生物学、人造蛋白等产业的发展,促进生物技术与信息技术深度融合。

全球合成生物学市场大爆发,初创企业蓬勃发展。2020年全球合成生物学领域的相关企业获投融资78亿美元,是2019年的2.5倍。2021年第三季度,合成生物学初创企业的投融资为61亿美元,增幅达33%。其中,健康和医药领域的投融资增长远超其他领域。

波士顿咨询集团在2022年2月发文指出,预计到本世纪末,合成生物将广泛应用在占全球产出1/3以上的制造业,创造30万亿美元的价值。由于实时数据收集、自动化和人工智能的发展,一些行业可能更容易受到影响。未来五年,健康与美容、医疗器械和电子等行业将面临合成生物领域竞争对手的挑战,正如制药和食品行业已经面临的挑战。

近年来,基于深度学习的AI算法快速发展,其在海量数据的持续学习和对未知空间的智能探索方面的突出能力有效契合了当前合成生物学工程化试错平台的需求,在复杂生物特征的高纬关联信息挖掘与生命系统的设计方面呈现出巨大潜力。

以AI为主导的从头设计应用于合成生物学,可以有目的地设计具有特定功能的标准生物元件,代替部分需要在实验中获得有效表达和测试的环节,跨越下游实验优化的时间和成本,数以百万计的潜在有价值的蛋白质无法通过生化方式获得,现在可以直接通过设计研究,并用于生物医学和化学、工业、农业、食品、材料学、环境保护等众多领域,加速应用于合成生物学的工程化落地。

自2020年资本市场和技术实现重大突破后,全球已有10多家公司成功上市,超过30多款AI技术参与的候选化合物进入临床阶段。近年来,中国以AI为核心的药物设计产业态势迅猛,主要集中在分子生成、活性预测、虚拟筛选等领域,大多以提高药物研发效率为目标,而少数以AI为主导的从头设计公司,将从技术的更底层突破,有望改变药物根本的研发方式,发展潜力巨大。

蛋白设计开启新阀门

生命系统极其复杂,包含大量不同的基因和调控元件,而元件之间又以海量不同的组合形成模块、网络,难以精确描述和预测。仅在人体中,就有数以万亿级的细胞相互作用并形成反馈。与之相比,获取细胞及其相互作用的过程却十分低效,其中包括大量试验和纠错的过程,这给高效设计合成生物系统提出了挑战。

蛋白设计是一种全新的生命科学技术。蛋白质结构的实验解析方法存在“实验技术要求高、实验仪器造价高、实验耗时成本高”的问题,使得结构信息的获取十分困难,大大阻碍了蛋白质工程中对于序列-结构-功能的分析和研发。而运用AI技术将使高通量、准确的蛋白质结构信息的获取成为现实,大幅加速蛋白质工程设计。

当前蛋白质药物开发依赖于人类已知功能的天然蛋白质,是庞大的蛋白质空间的极微小子集。通过蛋白设计的方式,能够为以前无药可医的疾病快速创造全新的蛋白质候选药物,减少药物研发的偶然性,从根本上改变药物研发方式。

蛋白质结构的预测和设计均是瞄准蛋白质折叠这一核心问题的研究,两者常被作为互逆向命题。国外由生命科学顶级风投Flagship Pioneering孵化的Generate Biomedicines,基于机器学习驱动的Generative Biology平台,研究了百万量级的蛋白质,学习蛋白质功能密码,从而快速设计、生成执行目标功能的新型蛋白质疗法。并在2022年1月拿到来自Amgen的5个订单,预付款约5千万美元,潜在合约价值超19亿美元。

此前,国内专注于通用智能研究的创新企业天壤自主研发了快速、准确度媲美AlphaFold2的蛋白质结构预测平台TRFold,构建了具有端到端从头进行蛋白质设计、检测并进行稳定性、亲和力优化的蛋白质设计平台TRDesign。以AI技术为驱动,突破蛋白质设计方法计算复杂粗糙,且需要主侧链反复迭代更新的难题。将蛋白质折叠中学到的序列-结构-功能关联反向映射,根据目标功能快速生成氨基酸序列,实现更加高效、成功率更高的蛋白质设计,使“规模化生物制造”的目标成为可能。

除了天壤,目前国内已经涌现出了一些在该领域攻关的企业,比如智峪生科和分子之心。通过纯AI计算和设计方法,智峪生科可以在短时间内将医药中间体的酶从天然底物出发进行了改造和设计。数据显示,改造后的酶催化活性大约提高了5-7倍,热稳定性也提高了近30度。

据《Nature》报道,新药研发的平均成本约为26亿美元,大约耗费10年时间。它包括了漫长的小分子化合物研发阶段、三期临床试验、以及注册审批的过程。然而,能够通过这重重考验并成功上市的药物,仅有不到10%。

天壤创始人兼CEO薛贵荣告诉动点科技:“以 AI 为主导的蛋白质设计方式与传统 AIDD 截然不同。我们已经基于 AI 构建了高效的蛋白质设计平台。后续,天壤还将建设智能湿实验室,以AI 为内核、依靠实验数据的反馈来建立自我强化学习的实验体系,真正超越传统化学和生物学方法;未来,以规模化的方式加快探索更具有价值的蛋白质和人类疾病的潜在疗法。我们相信 AI 有巨大的潜力能够站在一个更高的视野理解生命、设计生命、拓宽生命的广度。”

百度风投CEO高雪也曾表示,蛋白质药物设计是生物制药皇冠上的明珠。AI在蛋白质结构预测方面的卓越表现,使得基于AI的蛋白质药物从头设计成为可能。

而分子之心团队针对AI蛋白质预测与设计开展科研攻关和工业应用,并已经打造了一个拥有自主知识产权的AI大分子优化与设计平台“MoleculeOS”,运用数据驱动的深度学习方法,帮助生物技术专家快速识别和产生最合适的蛋白质,快速将实验室研究成果规模化投射到工业级应用。

红杉中国合伙人杨云霞表示,利用预测蛋白结构的AI算法,根据靶点结构即可实现从头设计结合特定位点的全新蛋白,这一突破有望对药物发现产生颠覆性影响。

随着新冠病毒变异的不断升级,重组蛋白药物也将迎来发展热潮。未来如果AI的从头设计这种源头创新能力能够和AIDD(AI辅助药物研发)以及传统药物开发流程有机融合,针对不同特定需求组合应用和优化,推进实现规模化生产更多高价值功能的蛋白质药物和落地转化,那么AI与合成生物学擦出的美妙火花,将预示着一个高效且低成本的蛋白质研发时代的到来。