“AI for Science”——自鄂维南院士率先在国际上提出这一概念后,AI 与科学领域的有机结合,给传统的科学研究领域带来了很多发展的新机会,大力推动了 AI 在数学、物理、化学和生物学等领域的发展。

AI for 生命科学的时代

蛋白质在分子生物学的中心法则中具有十分重要的地位,在各种生命过程中不可或缺。快速、准确的预测蛋白质结构不仅可以在学术研究领域帮助科学家快速获得、验证关键蛋白结构,促进研究人员对重要生命过程中分子机理的理解,在医疗健康和生物工程领域也能作为有力的工具,对新药研发、蛋白质设计有着至关重要的作用。

蛋白质结构预测是获得蛋白质功能结构和构象的过程。然而,蛋白质构象数量巨大,计算过程又很复杂,获取蛋白质空间结构的方法仍然以冷冻电镜、X-ray等实验技术为主。这些传统方法存在计算精度不足、单个蛋白质的观测成本高昂等缺陷。近半个世纪以来,这个问题一直被誉为“21世纪的生物物理学”最重要的研究课题之一。

随着 AI 在科学领域发挥越来越多的能力,生命科学研究也在尝试通过 AI 模型来辅助药物分子的设计、表征和优化,来减少资源成本,缩短研发周期,从而帮助企业达到“降本增效”。而蛋白质结构预测也成为了“AI for 生命科学”的关键成果之一,对生物学领域研究意义重大。

AI 成为必不可少又好用的“生产工具”

深度学习的本质旨在解决高维的数学问题,深度神经网络对高维函数提供了有效的逼近方法,这也为“AI for Science”奠定了基础。

2020 年年末,DeepMind 发布了蛋白质结构预测模型 AlphaFold2,凭借其接近实验精度的成绩取得 CASP14 蛋白质空间结构预测比赛的榜首,让蛋白质结构预测研究迎来了新的曙光。半年后,DeepMind 宣布开源 AlphaFold2,将长达六十多页的代码解析及数据集对外公开,同时把覆盖人类 98.5% 的蛋白质预测结果对外公开,其中 58%达到了可信水平,35.7%达到了高置信度,这一成绩超越了科学家此前几十年通过实验观测手段取得的成果!

AlphaFold2 的出现,被Nature 誉为“前所未有的进步”,成为生物研究领域的标杆成果,一块重要的里程碑,这一突破也展现出 AI 在科学领域解决问题的巨大潜力。随着数据的爆炸式增长、模型、算法和算力不断取得突破,毋庸置疑,AI 已成为科学研究中一个必不可少又好用的“生产工具”。

新一代 AI 框架昇思MindSpore

昇思MindSpore 是新一代覆盖端边云全场景的开源AI框架,旨在开创全新的 AI 编程范式,降低开发者门槛,为开发者打造开发友好、运行高效、部署灵活的 AI 框架,推动人工智能生态繁荣发展。昇思MindSpore 是最亲和昇腾的AI框架,同时支持面向端边云多种场景的主流硬件,目前已经应用在医疗、金融、智造等多个领域广泛应用。

从2020年3月28日开源至今,MindSpore 社区已经开源 320 多个模型,下载量达 166万 ,社区贡献者 4500 人,服务 5000 企业,与 120 多家科研院所展开合作,成为国内第一热度的 AI 开源社区。

此次昇思 MindSpore 对蛋白质结构预测训练推理的支持正是填补了国产 AI 软硬件的空白。未来,昇思MindSpore 仍将携手学术科研界等更多伙伴,共同探索、持续突破,助力国内相关基础研究。

助力生物医药发展之路

AlphaFold2 模型内存需求大,数据处理繁琐,控制编译复杂,对基础 AI 框架存在着巨大挑战。2021年11月,昇思MindsporeSPONGE 团队与昌平实验室、北京大学生物医学前沿创新中心(BIOPIC)和化学与分子工程学院、深圳湾实验室高毅勤教授课题组第一时间对开源后的 AlphaFold2 进行了复现及优化,推出了基于 AlphaFold2 算法的蛋白质结构预测推理工具,推理效率同比提升 2-3倍;并依托鹏城云脑II、昇腾 AI Atlas 集群,基于全场景 AI 框架昇思,在 2022 年 2 月实现训练的全流程打通,同时,参加CAMEO比赛拿到月榜第一的出色成绩。

这也意味着国产 AI 框架也具备了强大的“AI for Science”底层软件能力,同时也为科研工作者提供了新的选择。目前,相关代码已经开源,感兴趣的研究者和开发者可以前往代码仓 get 源码:https://gitee.com/mindspore/mindscience/tree/master/MindSPONGE

开源开放的精神和昇思MindSpore 一起深耕科学计算

将“开源文化”融入到科学研究以及生产生活中,是当下国内研究者和技术工作者共同奋斗的方向。近日,第三届中国开源科学软件创意大赛吹响了号角,华为昇思MindSpore赛道也全面开放!希望通过本次大赛吸引众多优秀国产开源软件开发者参与,将中国最核心、最活跃的科研人才链接在一起,共同探索开源科学软件的未来,打破国外商务软件技术垄断现象,发展我国科学开源与科学软件生态。

华为发布昇思mindspore1.6版本(AIx科学计算)(1)

本次大赛聚焦生物计算和流体力学两大研究领域设置了两大赛题。

分子对接技术是分子模拟的重要方法之一,其本质是两个或多个分子之间的识别过程,涉及分子之间的空间匹配和能量匹配。在生物制药中,针对一个致病蛋白,选择一个亲和性高的化合物小分子与其在靶点处对接从而使蛋白质失活,这种方法十分普遍。

基于分子模拟研究,大赛设置了【赛题一】小分子与蛋白质结合亲和性。参赛者可根据主办提供的蛋白质-化合物对接复合物数据库,训练 AI 分子对接打分模型,预测小分子与蛋白质结合时的亲和性。赛题使用数据来自于 PDBBind 2020,大赛官网同步对外开放,供大家下载。

华为发布昇思mindspore1.6版本(AIx科学计算)(2)

在流体力学研究领域,大赛设置了【赛题二】机翼外形气动仿真。参赛者根据主办方提供的翼型绕流的流场数据集,训练 AI 气动仿真模型,预测给定翼型在目标马赫数及攻角条件下的流场物理量分布。赛题使用数据也已在大赛官网同步对外开放,供大家下载。

华为发布昇思mindspore1.6版本(AIx科学计算)(3)

大赛共有三大阶段,目前是大赛【报名及提交作品】阶段,经过【初审】后进入【决赛】,每个赛题的 Top3 队伍可共获得十万奖金。更多大赛详细信息,大家可以前往大赛官网了解!

华为发布昇思mindspore1.6版本(AIx科学计算)(4)

心动不如行动,立即报名吧!期待与大家大赛相见~

链接:https://marketing.csdn.net/p/bbd0c9a89ca6c171e3a10725715baa60

,