回顾三次产业革命,会发现一个规律:基础科学的突破,抬高技术的天花板,推动大量先进技术成果的涌现,并向产业界转化,最终实现社会经济的指数级增长。
在物理、数学、工程学等的推动下,才有了蒸汽革命;电气革命,源于电磁学、化学等学科的进步;量子物理、信息论等科学成果,则为半导体、计算机等信息产业打下坚实的基础。
今天,基础科学整体已经发展到了一定高度,低处易摘的果实已经被摘走,科学家们向上攀爬的难度远高于以往。
越来越多的科学领域,进入“第五范式”的新篇章,即由人工智能驱动的研究方式。而AI在处理多维、多模态的海量数据上有显著优势,因此,人工智能驱动的科学智能(AI for Science,AI4S)新范式,有望推动科学研究从“马拉松”到“加速跑”。
在今年的WAIC 2023上,科学智能的突破性进展,就备受产学研各界关注。
学术方面,中国科学技术信息研究所发布了AI4S科研创新地图;应用方面,中国商飞上海飞机设计研究院基于昇思MindSpore打造的三维流体仿真大模型“东方.翼风”,展示了流体力学等领域与AI的融合实践。
可以看到,科学智能目前还是一些头部科研院所,以及头部行业、龙头企业在践行的新潮流。更广大的科研群体和科学场景,距离AI技术依然遥远。
有没有一种可能,让AI化作更多科学家手中的实用工具,加速科学智能的进程?这是昇思MindSpore一直在努力实现的命题,也在近期抵达了新的里程碑节点。
近日,在物理方法、生物、流体力学等基础科学领域,国内多个研究团队基于昇思MindSpore Science科学智能套件的助力,取得重大突破。
在这些成功践行的科学智能探索背后,我们可以进一步读懂,科学家们对AI有哪些具体而迫切的需求,智能工具和平台又是如何与科学场景紧密嵌合的,科学与智能的紧耦合又会为科学探索带来哪些可能性。
找钥匙,铸钥匙:科学与AI的无缝嵌合
一场科学革命的发生,往往是以范式转换作为先导的,而科学智能的新范式,要让科学与智能加速融合,以最高效率为科学乃至社会带来价值,还要解决一系列挑战:
首先,科学和AI的语言难以对齐。
科学的本质是探索和改造客观世界,科学智能则意味着数字世界、物理世界、生物世界,正在前所未有的融合。不同世界的语言、规则等跨度很大,比如,要将电磁、力学、气象等物理规律(方程式)投射到数字世界中,需要转化为AI可以理解的数学语言(函数);生物世界的DNA、氨基酸、蛋白质、神经元等,大量生命科学的奥秘还未完全揭开,直接用机器学习的算法,可能是无法运行的,或者效果不够好。
接下来,还会遭遇AI技术本身的复杂性。
AI技术体系复杂,落地科学计算,包括建立数据库、数据清洗、模型选型、系统运维等一项项细节工程……对很多科研院所、高校师生、产业研究院来说,AI是新生事物,缺乏相关经验,导致AI+科学计算模型的开发难度大、周期长,进一步限制了科学智能的落地效率。
此外,在探索科学智能的过程中,计算工具平台不能成为掣肘。
为了推动AI+科学计算,学术界探索出了三种计算模式,分别是物理驱动、数据驱动以及物理+数据融合驱动。
以流体力学为例,物理驱动(PINNs)将物理方程引入到神经网络的损失函数中,使学习结果满足物理规律,但PINNs不依赖于传统数值方法生成标签数据,计算精度和收敛缺乏理论保证,导致训练困难,一旦物理约束变化,就需要重新训练,泛化性不足。而数据驱动的流体力学,则有着庞大的数据维度,数据规模大、处理耗时长、整体成本高昂。物理+数据融合驱动的流体力学,通过仿真软件获得输入和输出的真实数据,比传统数值仿真性能提升40~80倍,并且具有很强的泛化性,目前实现场景较为聚焦,有效性也在持续验证中。
这些计算模式要取得比较理想的效果,需要基础硬件平台、核心AI框架、编译器、应用工具套件等一整套端到端的软硬件解决方案,离不开平台化的支撑。目前,只有华为、谷歌等极少数科技公司,在科学智能领域有较为全面的软硬件布局。
可以看到,科学智能的探索过程中,科研人员和开发者所期待的,是直接简单地使用AI平台工具和能力进行开发,这就需要平台将复杂的硬件、算力服务、AI框架、编译器、模型、应用、环境等,像IT领域的“交钥匙工程”一样,整合成适配科学计算任务的方案,让研究人员可以专注于AI科学计算的应用创造,进行更高效的研发探索。
昇思MindSpore原生支持科学智能,打造了昇思MindSpore Science科学智能套件,包含了业界领先的开源基础模型、预置高精度模型和前后处理工具,支持物理驱动/数据驱动/物理数据融合驱动等多种AI+科学计算范式的全场景AI框架。
AI与科学计算的融合刚刚开始,有大量场景等待探索。昇思MindSpore面向生物、流体、电磁、量子计算等领域,推出了相应的行业套件,以加速应用开发和探索发现。
开锁行动:AI for Science的价值自证
近日,中国科学家及其团队,借助昇思MindSpore SPONGE、MindSpore Flow等科学智能套件,分别取得了多个突破性进展。从中,我们可以看到,AI在科学场景中所能发挥的关键作用:
作用一,以AI方法加速助力物理学的理论突破。
20世纪是物理学的世纪,我们今天仍在享受着上一次科技革命的遗泽,留给当代研究者的都是高处难摘的果实。比如,在流行病学、气象科学、流体力学和生物学等领域中,很多的底层PDE方程仍未被完全发掘出来。
昇思技术团队与中国人民大学高瓴人工智能学院孙浩教授团队合作,基于昇思MindSpore AI框架,提出了物理编码递归卷积神经网络(Physics-encoded Recurrent Convolutional Neural Network,PeRCNN),实现了对非线性PDE的精确逼近。近日,该成果已在《Nature》子刊《Nature Machine Intelligence》上发表。
从中可以看到,AI的两个特点正在为基础研究的突破带来可能。
一是计算效率。相较于物理信息神经网络、ConvLSTM、PDE-NET等方法,PeRCN模型的泛化性和抗噪性明显提升,长期推理精度提升了10倍以上,可以突破传统计算瓶颈,推动偏微分方程的求解。
(PeRCNN在预测和外推的性能上也优于ConvLSTM/ResNet/PDE-Net/DHPM等方法)
二是暗知识。AI能够发现隐藏在海量数据中的相关性,是人类无法感受又无法描述和表达的“暗知识”。PeRCN模型的可解释性,可以从学习到的模型中进一步提取底层的基础物理学表达式,有望准确可靠地发现潜在的物理规律,让我们对物理世界的认识取得新突破。
作用二,首次实现AI+蛋白质动态结构折叠,加速生命科学研究进程。
生物医药领域有著名的“双十定律”,即研发一款新药需要花费至少十年时间、十亿美元,90%的临床药物研发都将以失败告终。加速药物研发的进程,对于提高人类的生命健康、生存质量,有非常重要的意义。
(FAAST核磁共振数据解析流程)
而生物医学领域的AI计算,具有数据量庞大、数据结构复杂多样、有效算法稀缺的种种特性,尤其需要预测准确、简单易用、高效协作的工具平台。昇思MindSpore的计算生物领域套件MindSpore SPONGE,支持分子动力学、蛋白质折叠等常用功能,在大规模计算任务中快速完成计算,辅助研发人员高效研发。
近日,昇思技术团队与高毅勤教授团队(昌平实验室、北京大学化学与分子工程学院和生物医学前沿创新中心(BIOPIC))、田长麟教授团队(中国科技大学、中科院强磁场科学中心)、王申林教授(华东理工大学生物反应器工程国家重点实验室)合作,基于昇思MindSpore+昇腾AI基础软硬件平台,开发了NMR数据自动解析方法FAAST,将通过核磁共振试验获得的蛋白质动态结构,解析速度提高了十倍,解析时间从数月,缩短到数小时,全流程无需专家投入,大大减轻了研究人员的重复劳动,加速生命科学研究和药物研发流程。
作用三,AI+流体力学指数级提升大飞机研发效率、降低研发成本。
历史告诉我们,每一次工业革命,都需要将科研成果转化为产业可用、可接受的技术,很多产业也对科学智能投入了大量研发资源与期待。以流体力学为例,大型客机的流体问题,就是一个非常具有挑战性的科学难题,也是非常典型和高价值的力学场景。
传统飞机设计,仿真过程复杂,需要进行物理建模、网格划分、数值离散、迭代求解等步骤,经过千万亿次的模拟仿真,计算周期长。
在WAIC2023上发布的“东方.翼风”大模型,同样是基于昇思MindSpore开发,实现了三维超临界机翼流体仿真,可以对飞机全场景飞行状况进行快速且高精度的模拟,助力飞机研发,该成果荣获WAIC最高奖项 SAIL奖。
具体来说,“东方.翼风”利用昇思 MindSpore Flow流体仿真套件,结合流体领域专家经验、数据,实现对飞机翼型全场景飞行工况模拟,在三维机翼几何变化的情况下,全流场误差达到了万分之一,三维翼型仿真模拟时间降低为原来的千分之一,加速了飞机设计的效率,减少风洞重复试验的次数和成本。
这些科学智能的成功探索,用实打实的创新证明了,科学场景与AI技术,可以借助精细而易用的工具平台,高效快速地完成对齐、紧密嵌合,发挥AI的技术价值,解锁更多的科学奥秘,满足大众、产业和社会对科技进步的殷切期待。
解锁无尽前沿:昇思MindSpore铸就“全能”钥匙
如果说,这三次科学探索的成功,是一个明晰的信号和方向,说明科学智能蕴藏了无比巨大的期待和潜力。那么下一个问题就是:这些成功,究竟是案例式的炫技,还是可持续、可复制、可信赖的新科研路径?
换句话说,昇思MindSpore构筑的工具平台,也适用于其他未解的科学难题吗?
目前来看,昇思MindSpore的“全能型”特点,也使其成为一把“全能钥匙”,能够从多个维度,支撑科学智能的持续探索,具体来说:
1.深度。结合自研硬件、融合架构到编译软件,AI框架能力,技术底座的全栈布局,可以满足科研人员和开发者在科学计算中从算力到应用的全流程需求,消除后顾之忧。
2.巧度。简单易用的MindSpore Elec、MindSpore SPONGE、MindSpore Flow等行业套件,免去了众多开发流程与运维成本,有效提升科研项目的开发效率,降低了科学计算和AI的开发成本,分子属性、蛋白质结构、高空湍流等预测准确,切实提升了科学探索的成功率。
3.广度。昇思打造了南北向生态和开源社区,汇聚新模型、新技术、课程、专家和落地场景等丰富生态资源,在生态内推动产学研用一体化的协同创新,拓展科学边界,将科研价值进一步打开。
4.长度。科研不是一蹴而就的,有时要有坐冷板凳的耐心。因此,科学智能的计算领域伙伴也要有长期扎根科研领域的长期战略耐心和布局,持续升级基础设施和技术、迭代模型和产品。这一点上,昇思MindSpore作为产业智能化的基座,在通往无尽前沿的探索之路上,陪科研人员走得更远。
四个维度,把科学与智能相融合的每一个环节、每一个阻碍,都一一解决掉,只留给研究人员和开发者最简单易用的开发体验,这就是MindSpore Science如同“交钥匙工程”一样高效的使能模式。
陈寅恪先生说过:“一时代之学术,必有其新材料与新问题。取用此材料,以研求问题,则为此时代学术之新潮流。治学之士,得预于此潮流者,谓之预流。”
AI就是这个时代的预流,昇思MindSpore正在推动更多治学之士与AI加速拥抱,融入科学智能的时代洪流。
更多科学领域和智能技术无缝嵌合,成功的“开锁行动”不断涌现,我们就距离科学的无尽前沿,更近了一步。