分子之心公布达尔文大模型新进展

2023-09-22 11:08    来源:每日看点快看

本文转自:新华网

9月20日,由工业和信息化部、国务院国资委、中国工程院、安徽省人民政府等共同主办的2023世界制造业大会在合肥召开,清华大学智能产业研究院(AIR)卓越访问教授许锦波携自主研发的AI蛋白质生成大模型NewOrigin(中文名“达尔文”)亮相。会上,汇聚各界人工智能领域高端人才、旨在推进多领域融合和协同创新的“AI百人会”成立,许锦波受聘任副会长。

许锦波介绍,NewOrigin大模型拥有百万级参数,学习了万亿级高质量、多层次、多模态的大数据,融合自然语言与蛋白语言,力图高精度、低门槛、高通用性地满足创新药设计、合成生物学等真实产业应用需求,大幅提升蛋白质设计的效率和成功率。NewOrigin大模型基于条件生成机制,联合使用AI、分子动力学、量子计算、湿实验等多维反馈机制,可高精度生成蛋白质序列、蛋白质功能、蛋白质知识表示等多种模态蛋白质内容,完成亲和力、稳定性、活性、表达量等多维度任务,满足真实的产业应用所需。而融合自然语言的交互方式,将极大降低使用门槛,让不具备AI算法能力的生物学家也可以快速上手。

融合自然语言的AI蛋白质生成大模型NewOrigin(达尔文)

会上,许锦波展示了NewOrigin大模型在药物设计领域的应用效果。

提升蛋白疫苗稳定性是提升蛋白质疫苗效果的重要途径之一。传统实验室方法通常使用饱和突变形成数千种、甚至数万种变体,从中筛选出符合需求的目标蛋白质,该过程耗费数月甚至数年,需要数百万成本。使用能量优化等传统计算方法受限于对能量变化的单一维度评估,精准度低,且耗时长、算力成本高。

“分子之心正与合作药企联合攻关,基于NewOrigin大模型解决蛋白疫苗稳定性难题。”许锦波透露。NewOrigin大模型可帮助药物研发团队快速分析,将提升蛋白疫苗效果的难题定位、拆解为可基于AI方法解决的子问题,如用AI设计突变提升蛋白疫苗的稳定性。而后,NewOrigin将对野生型蛋白进行突变设计,并自动调用语言模型、进化模型、结构模型、能量模型等一系列方法提取蛋白特征,预测蛋白疫苗突变体的各项性质,得到最理想的蛋白分子。仅需3天,NewOrigin就可设计出数十个理想的候选蛋白。

除了蛋白疫苗的稳定性优化,NewOrigin大模型也在亲和力优化、特异性优化、酶活性优化等多种传统方法难以突破的复杂问题上取得了重要进展。

这些蛋白质生成任务是当下通用大模型无法解决的难题。对大模型的测试结果显示,它在蛋白质生成场景下无法生成符合需求的内容。

原因在于,蛋白质序列形成的结构比自然语言的结构复杂得多,蛋白质生成的应用场景多样且与自然语言交互的通用场景相差甚远,每一个需求的满足都需要“AI专家”与“生物专家”联合解决。另外,训练AI蛋白质生成大模型需要融合蛋白质数据、基因组数据、宏基因组数据、进化与环境数据、生物医学文献数据等多模态数据,这些数据的专业性、逻辑复杂性极高,且存在数据质控、数据冲突等难题,导致数据标注壁垒比通用NLP领域高数十倍。

AI蛋白质生成大模型的高专业门槛和以应用为目标的特点,要求其研发团队除了必备的算法、算力、数据等基础能力外,还需具备融合计算机、生物、物理等多学科,熟识AI、分子动力学、量子计算等多种方法的跨领域复合背景,以及真实的产业需求与验证能力。分子之心瞄准这一目标,搭建了一支融合AI生物交叉背景与深厚产业背景的复合型团队。这支超配团队正在基于万亿级海量数据持续生产高质量标注样本,开发泛化能力强的监督模型,通过主动学习算法持续迭代数据与专业知识,并通过多阶段预训练及基于相关性的多任务微调,驱动大模型不断学习迭代,提升蛋白质生成效果,满足药物设计、新材料设计、工业、农业、环保等不同领域的差异化蛋白质生成需求。

生物是一个高度复杂但又高度数字化的系统,具备可解读、可编程的特性,与AI大模型的特质高度匹配。许锦波表示:“AI蛋白质生成大模型等生物大模型具有广阔的产业应用前景,分子之心希望通过NewOrigin大模型变革生物医药与合成生物学的未来,帮助人们平等地获取可负担的高品质生物药及绿色生物产品。”



孵化AI创新思维 首届人工智能应用大会在京举办
科技

孵化AI创新思维 首届人工智能应用大会在京举办

本文转自:人民网 人民网北京1月22日电 (焦磊)随着技术不断取得突破,人工智能的应用和发展备受业界关注。日前,首届人工智能应用大会暨中国技术经济学会人工智能应用专业委员会揭牌典礼在北京举行。多位相关领域的专家、学者、企业家以及技术开发者围绕AI技术的未来发展及深度应用进行分享和讨论。 会上,参会者 [详情]

蚂蚁集团发布2023年消保年报:普惠金融教育行动已覆盖1亿人次
科技

蚂蚁集团发布2023年消保年报:普惠金融教育行动已覆盖1亿人次

1月22日,蚂蚁集团官网发布了《2023年消费者权益保护年报》(下简称“年报”)。《年报》显示,2023年蚂蚁集团继续通过“蚂蚁315”消费者权益保护专项行动,持续优化、升级相关产品和服务体验。 2023年,蚂蚁集团通过恶意营销专项治理行动优化消费环境,保护5300万用户免受恶意营销行为干扰。同时, [详情]

大族半导体第1000台LED芯片分选机正式交付
科技

大族半导体第1000台LED芯片分选机正式交付

2024年1月16日,大族激光旗下全资子公司大族半导体在南沙平谦国际工业园举行了第1000台分选机的“千台交付仪式”。作为MiniLED分选机项目历史上的重要里程碑,项目团队成员共同见证了这意义深远的重要时刻。 大族半导体分选机自2022年5月交付第一台量产机到2024年1月实现了产销“千台”的突破 [详情]

车旺科技全链路数字化增值服务 获评中物联货运物流行业创新实践优秀案例
科技

车旺科技全链路数字化增值服务 获评中物联货运物流行业创新实践优秀案例

为寻找优秀企业、推广先进做法、塑造创新品牌、引领行业发展方向,中物联公路货运分会面向行业进行了“2023年度公路货运行业创新实践案例”评选。车旺科技凭借为公路货运行业提供全链路数字化增值服务的科技创新能力,获评创新实践优秀案例。 这一荣誉不仅肯定了车旺科技在提高物流企业运营效率和降低成本方面的努力, [详情]