超神经HyperAI · 11月28日 · 河北

对话上海交大洪亮:跑通 AI for Science 的落地更有成就感

微信图片_20241128115608.png
近年来,伴随新基建引领的新一代信息技术在千行百业展开落地探索,「产学研用协同」频繁出现在政策文件、行业发展规划中,今年的政府工作报告更是明确提出要「深化产学研用结合」。笔者认为,「产学研用」其实可以划分为学研与产用两个领域。学研指的是教育与科研,即人才培养与科研攻坚;产用指的是在生产环节与实际应用场景中落地创新技术。

在过去的很长一段时间里,学研与产用隔水相望,学术界聚焦高精尖的技术突破,产业界囿于实际痛点「求医无门」。随后,科技成果转化的重要性日益凸显,产研之间逐步构建了沟通交流的桥梁。如今,AI 牵引的新一轮浪潮汹涌而来,不仅是产业界提质增效的得力助手,同时还在逐步重构科研范式,在此背景下,学术与产业的「双向奔赴」成为大势所趋。

一方面,产业 AI 应用更多地着眼于业务流程、生产方式的智能化转型,完全自主可控的 AI 工具或解决方案相对稀缺;另一方面,AI for Science 的发展加速了科研进程,同时也催生了大批颇具突破性、创新性的成果,亟需更多真实数据或应用场景来验证其可行性。

正如上海交通大学自然科学研究 & 物理与天文学院 & 药学院特聘教授洪亮所言:「如今的发展环境下,科研人员愈发意识到发表论文不再是唯一目标,聚焦解决实际工程问题更加重要」。

在这里插入图片描述

洪亮教授在暑期学校进行深度分享

洪亮教授对于产研结合的开放心态也体现在其牵头组织的暑期学校活动中,不同于大部分学校的课程设置完全围绕学术成果展示分享,上海交通大学 AI for Bioengineering 暑期学校关注蛋白质工程领域,不仅邀请到了上海交大、厦门大学、复旦大学、中山大学及上海人工智能实验室的专家,分享了最新研究进展,还联合金赛药业、蔚蓝生物、中元汇吉,从应用的角度介绍了 AI 生物工程领域在产业端的发展进程。

值得一提的是,本次暑期学校的参会者除了国内多所高校的专家学者外,还有来自近 30 家企业的研发人员,其中不乏团队带头人、甚至是大企业的董事长,他们与在场的学生一起,全程听完 3 天的课程,这种在学校/科研院所举办的前沿技术讨论会中都难得一见的现象,却出现在了大学的暑期学校活动中,充分说明业界对于 AI、尤其是「能落地的 AI」充满热情。

在暑期学校期间,HyperAI超神经有幸与洪亮教授进行了一次深度对谈,见微知著,他从 AI 在蛋白质工程领域的发展为起点,全面地梳理了 AI for Science (AI4S) 的落地挑战与途径,以及 AI 与 Science 如何有机结合。

果断转型,在 B 站拿下 AI 学位

诚然,AI for Science 在近两年实现了飞跃式发展。最初,一些课题组在小范围内进行了 AI 工具的探索体验,试图提升数据处理效率。如今,在很多科研领域,AI 已经成为了突破研究梗阻的密钥,甚至在很多工程任务上的表现已经超越了人类专家的能力。随之而来的是 AI 从业者涌入科研领域,研究人员开始自学 AI。毫无疑问,AI 与 Science 之间的藩篱破除催生了大批令人眼前一亮的科研成果,但真正走出实验室的寥寥可数。

对此,洪亮教授表示,「做 AI4S 切忌编织皇帝的新衣,因为迟早会被捅破,还是应该思考落地」。他坦言,「跑通 AI4S 的落地会更有成就感」。

洪亮教授以自身经验为例进一步剖析了 AI4S 落地的魅力所在。他最初也是从事基础科研的,「只能在发表的文章上畅想科研如何应用于实际」。但是,当他的团队将蛋白质工程通用人工智能跑通,并实实在在地走进 20 余家企业,帮助他们进行蛋白质产品的研发,当他看到自己电脑上设计的分子在 5,000L 发酵罐中被生产出来,并用于实际生活中,「那一刻,对于曾经做基础科研的科学工作者而言,幸福感是爆棚的」。

值得一提的是,目前,其团队基于自主研发的蛋白质工程 Pro 系列大模型,直接面向功能需求设计蛋白序列,已经实现了全球第一款及第二款大模型设计并产业化落地的高难度蛋白质产品。

谈及率先在蛋白质工程研究领域实现产业化落地,洪亮教授认为,平台、个人学术背景、研究方向等等都至关重要。

在平台方面,他所在的上海交通大学是一所以工科专业见长的院校,「非常感谢学校支持课题组进行产学研结合」。上海交大的整体学术氛围对于产学研都是开放、包容的,学校会在课题组推进成果落地的过程中予以极大的物质和精神鼓励。

此外,洪亮教授的学术背景,以及其对 AI 发展趋势的深刻洞察,都是促使他走向产研落地的基石。

他本科就读于中国科学技术大学物理系,研究生就读于香港中文大学,研究方向为纳米材料的合成/表征,博士就读于美国阿克伦大学,主要研究方向为高分子/蛋白质的理化性质、动力学以及相变。

2010 年,他继续深造,加入美国橡树岭国家实验室攻读博士后,重点研究计算生物学领域的蛋白质结构、动力学以及功能。或许正是在美国的这段经历,奠定了其日后的主攻方向——蛋白质功能。2015 年,他作为独立 PI 加入上海交通大学从事分子生物物理研究。

2016 年,AlphaGo 击败韩国围棋冠军李在石,名声大噪的同时,令世界看到了 AI 的能力。2018 年,AlphaFold 横空出世,为生物领域带来了巨大震撼,也令洪亮教授开始思考,自己的研究方向如何与 AI 结合。

真正的转折点出现在 2019 年底,正逢新冠疫情肆虐,居家的时间里,他通过台湾大学李宏毅教授发布在哔哩哔哩上的 AI 课程,真正走进了这个看似神秘的新兴技术。虽然自嘲「在 B 站拿了 AI 学位」,但这整整 80 个课时,令他对 AI 有了更加清晰的认知,随后果断选择了 AI for Science。

「当行业技术发生变迁时,是不以个人意志为转移的」,面对势不可挡的 AI 变革,洪亮教授于 2020 年便开始将 AI、计算、湿实验结合起来进行蛋白质设计研究。从物理转入化学,再从化学转向生物,落脚于蛋白质功能与设计的研究,最后又从湿实验走到计算和人工智能。可以说,他踏着技术跃迁的节拍,每一步脚踏实地,最终才能带领团队、带着实验成果,走出实验室。

笔者认为这便是「事预则立」的真实写照,但洪亮教授笑言,「我的运气挺好的」。

作为 Science 领域的研究学者,主动拥抱 AI 并从通识学起、了解其机理,是他为其 AI4S 的探索之路铺就的地基,而运气更多的是体现在研究方向的选择上。「决定做 AI for 蛋白质工程后,我在结构预测、动力学和功能这 3 个方向中,选择了功能」,他坦言,「有功能才有产品」

但这个选择其实也是十分大胆且充满不确定性的,「即便打磨出产品也不一定能够落地产业化」,但当时的洪亮教授恰值 39 岁,身处而立与不惑之年的交点,仍然保持着敢拼敢闯的热情,以及重头再来的勇气。

「我当年 39 岁,还能折腾,如果失败了浪费几年重新选择一个方向爬起来再来。所幸运气好,我们最终跑通了」。从技术的角度来看,「Science 领域的数据结构与数据量能够与 AI 的技术进步 match 又何尝不是一种运气呢」。

虽然他将产业化的成功归因到运气加成上,但其中不乏对于 AI4S 发展趋势的分析。例如,当他看到 AlphaFold 已经在蛋白质结构预测领域实现如斯成就,背后还有 Google 这样的商业巨鳄提供支持,划时代的科学成就让他内心十分激动,但冷静思考后,综合考量自身团队基础与实力,判断无法在蛋白质结构预测赛道存活后,他毅然放弃了这个研究方向。

最终,洪亮教授结合自身优势选择了蛋白质工程通用人工智能领域。该领域的一个显著特点是蛋白质功能数据无法标准化,这对于仅专注于计算机科学的研究者来说,是一个难以一次性突破的挑战。只有在相关领域有深厚背景的专家,通过不断的实验室「湿实验」迭代,才有可能取得进展。

幸运的是,洪亮教授课题组凭借在计算机科学与蛋白质领域交叉学科的多年积累,成功在这一领域「闯关成功」,成为第一个吃到螃蟹肉的人。

AI4S:AI 要尊重科学,Science 要自学 AI

毫无疑问,AlphaFold 的成功对于 AI4S 的发展有极大的推动与启发性,更是一举完成了 AI 与 Science 的破冰。但是,目前的 AI4S 发展其实仍处于起步阶段,双方并没有探索出普适的合作模式,业界也一直在思考——AI for Science,究竟是 AI 引领,还是 Science 引领?

虽然业界一直在呼唤 AI+ 传统科研的交叉学科研究人才,但其成长周期可想而知,可以说是可遇而不可求。AI 领域的研究人员在模型构建、框架优化等方面的效率与设计思路创新往往是科研人员难以快速追赶的,而科研人员对于垂直领域科学问题的精准定位与剖析又是 AI 难以速成的。

两相对比,洪亮教授认为,AI for Science 的核心在于 Science,要先定义科学或者工程问题,才能提出 AI 解决方案。

洪亮教授以 DeepMind 的团队模式为例,其专家团队涵盖了传统科研领域及数据科学、计算机科学,完成了从科学问题定位到 AI 方法构建的闭环。而他的课题组团队建设也与此类似,「2020 年时,召集了几个 CS 的学生和我们一起做 AI for 蛋白质工程,最后跑通落地之后,他们自己也对 AI4S 有了新的认知,很有成就感」,洪亮课题组目前也是吸纳了 CS 与蛋白质工程领域的人才,协同开展研究。

在实践中,团队核心成员周冰心博士介绍道,CS 领域的同学也会提出想法,想要尝试利用 AI 优化某一传统科研方法,此时便是由 CS 牵头进行可行性讨论;同样地,蛋白质工程学科的同学也会将他们发现的科学问题明确地描述出来,寻求来自 AI 的解决方案,此时便是 Science 牵头共同寻找创新方法。

从洪亮教授个人到其团队的建设都很好地诠释了「Science 领域的包容性」,同时,他也建议传统领域的研究人员自学 AI,尤其是课题组负责人,「团队负责人就像企业老板一样,从传统科研转型向 AI4S 就像是企业内部的战略转型,是需要立项的,如果负责人对于新产品、技术毫无概念是很危险的」。

但他也直言,并不是所有研究方向在现阶段都能够借助 AI 实现突破,但是目前国家政策层面鼓励 AI「冲击」各个科研领域,「希望 Science 领域的老师,尤其是年轻老师,要大胆尝试,如果能很幸运地找到可以冲过去的研究方向,方法学一旦突破,对该领域将是巨大的贡献」。

但值得注意的是,冲击成功也并不代表就能够实现产业落地。

例如,目前 AI 在新药研发领域的应用如火如荼,从科研机构到企业,从研究到临床试验,都投入了高昂的人力、财力,甚至有不少初创企业没有熬到黎明的曙光而夭折解散。足以见得,「AI 药物设计的闭环时间太长」,洪亮教授解释道,「计算生物学(物理计算 + AI)往往主要帮助研究人员确定体外(分子或细胞)实验指标,但这些体外实验与动物实验的结果相关性可能很低,而即便动物实验结果好,也不代表临床试验能够良好反馈」。

在这里插入图片描述

这也是为何,他的团队更加关注酶功能的研究方向,「分子实验就是最终结果,可以快速闭环验证。而优秀的酶产品研发能为食品饮料、美容护肤、洗涤纺织、生物医药等多个领域带来重大利好,直接贡献到国民经济主战场」。

其实,除了像洪亮教授这样主动转型 AI4S 的科研团队外,AI 领域的研究团队也希望能够在 AI4S 领域大展拳脚,但其所遇到的技术壁垒可想而知。对此,洪亮教授的建议是「要找对研究方向,不要一味炫技,将大模型生搬硬套」。

具体而言,他认为「AI 领域的人做 AI4S,首先要找到输入输出数据能够标准化、结构化的研究领域,而不是空想科学问题」。与之对应的也恰恰是 Science 人的优势,即「涉及功能的研究中,其数据是很难标准化的,需要实验迭代,如果能够通过 AI 降低实验成本,加之对科学问题的深刻理解,将为行业发展带来巨大贡献」。

结语

在与洪亮教授访谈交流的过程中,他不止一次的提到「运气」,在笔者看来,「时也,运也,命也,非吾之所能也」,但真正能够把握机遇的人,势必要拥有前瞻性的洞察、高效的执行力以及试错的勇气,而这些也都体现在洪亮教授的每一次选择中,最终落脚于 AI for 蛋白质工程,期待他及团队能够带来更多可落地的成果。

推荐阅读
关注数
666
内容数
225
链接人工智能新场景
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息