在现代药物研发中,核心挑战在于从近乎无限的化学空间中精准定位具有治疗潜力的分子。传统研发常陷入「双重困境」:化学空间极其庞大,仅 10 个原子可能构成的分子数就高达 10⁶⁰ 种,筛选难度堪比大海捞针;同时候选分子还需满足活性、毒性、溶解性等多重要求,导致研发周期常超过 10 年、成本达数十亿美元,最终成功率不足 10%。
分子生成模型一度为此带来希望。该技术通过算法模拟分子结构生成,有望大幅缩短发现周期甚至实现「按需设计」。但实际应用中发现,模型生成的分子往往难以在实验室中合成,这种「纸上谈兵」的局限严重制约了其实际价值。
为突破此瓶颈,学界曾尝试两种策略:一种是将「可合成性」作为优化目标,通过评分引导生成易合成分子,但因结构-可合成性关系复杂、评分难以覆盖实验变量,效果有限;另一种是限制模型只在已知可合成分子中探索,虽提升可控性,却牺牲了结构创新性。「可合成投影」策略因此受到关注,其核心是将不可合成分子「修正」为结构相似且具备明确合成路径的类似物, 以兼顾创新与可行。该策略能灵活嵌入多种生成方法,支持活性物拓展、先导物优化等任务。
在此背景下,由英伟达研究团队推出的融合推理能力的高效可合成分子投影框架 ReaSyn, 采用反应链(Chain-of-Reaction, CoR)表示法,将合成路径视为 LLM 的思维链(Chain-of-Thought, CoT)推理路径,为破解分子合成的现实难题开辟了新路径。
在可合成分子重建中,ReaSyn 实现了最高的重建率和路径多样性; 在可合成的目标导向分子优化中,也达到了最佳的优化性能;并在可合成的 hit 扩展任务中显著优于以往的方法。
相关研究成果以「Rethinking Molecule Synthesizability with Chain-of-Reaction」为题,发表于 arXiv。
研究亮点:
- 该研究提出 ReaSyn 框架及反应链(CoR)表示法,将合成路径转化为可解释的思维链进行推理。
- 定制化的 RL 微调与计算扩展方案,大幅提升了模型的探索效率与优化性能。
- 通过多任务实验,证实了该框架在可合成分子生成与优化方面的有效性和多功能性。
论文地址:
https://arxiv.org/abs/2509.16084
关注公众号,后台回复「ReaSyn」获取完整 PDF
更多 AI 前沿论文:
贴近真实药物研发的数据集构建
该研究首先构建了一个贴近真实药物研发场景的实验框架,采用包含 115 种常见反应类型的反应集,并结合从 Enamine 美国库存目录获取的 21.2 万个可购买构建块(building blocks),共同界定出规模超过 10⁶⁰ 分子的可合成化学空间。 实验聚焦于「可合成分子重构」任务,旨在通过为给定分子生成可行合成路径,检验模型对庞大化学空间的覆盖能力。
在测试集设计上,研究团队采用了多组具有不同挑战性的分子集合。 除从 Enamine REAL 多样性数据集和 ChEMBL 数据库中随机选取 1 千个分子作为基础测试集外,为模拟药物研发中「构建块库存更新」的实际情境,还专门构建了一个扩展测试集:从 ZINC250k 库中筛选出 3.7 万余个重原子数少于 18 的分子作为新增构建块,并利用这些扩展库存生成 1 千个测试分子。实验同时纳入了 Luo 等人提出的 ChEMBL 测试集,以确保与已有研究的可比性。
ReaSyn 框架:从分子表示到推理增强的递进式技术路线
ReaSyn 框架旨在解决可合成分子投影中的关键推理瓶颈,其技术路线遵循从分子表示创新到推理能力增强的递进逻辑。
如下图所示,研究首先对可合成化学空间进行了明确定义:该空间由构建块集合与反应规则集合共同确定,其中每个反应通过 SMARTS 语言描述从反应物到产物的转化关系,而可合成空间则表示从初始构建块出发,经过反应规则迭代应用所能获得的所有产物集合。在此框架下,可合成投影的核心目标是为给定目标分子 𝑥 生成一条合成路径 𝑝,使得路径末端产物与 𝑥 的结构相似度最大化。
ReaSyn 的总体框架
在分子合成路径的表示方法上,如下图所示,ReaSyn 创新性地提出了「反应链(Chain-of-Reaction, CoR)」表示策略, 以克服传统「合成树后缀表示法」的多种限制。虽然传统方法支持自回归生成,但存在反应规则需要隐式学习、分层预测容易导致误差传递、以及构建块指纹表示缺乏双射性等固有缺陷。
反应链表示法在保持通用性的基础上实现了 3 个重要突破:在化学反应层面融入思维链(CoT)、无需分层分类即可实现完整路径预测、消除对分子指纹的依赖。
具体实现时,合成路径被分解为多个功能块,所有块共享统一的词汇表,其中分子块(molecular block)采用带特殊标记的 SMILES 字符串表示,反应块(reaction block)等则用单一 token 表示,最终通过拼接操作形成完整的路径序列。
CoR 表示法
模型训练采用两阶段策略,结合了监督学习(Supervised learning)与强化学习微调(RL finetuning)。
监督学习阶段利用目标分子与合成路径的配对数据,以下一 token 预测为目标训练 Transformer 模型, 并通过设计 token 类型加权损失函数来平衡不同类型 token 的学习强度,同时借助中间产物提供更丰富的监督信号。强化学习微调阶段采用在线强化学习算法, 通过奖励机制引导模型探索更多有效路径,其损失函数既考虑路径奖励的最大化,也注重模型行为的稳定性,有效弥补了监督学习在探索能力上的局限性。
在推理阶段, ReaSyn 通过结合栈(stack)结构与束搜索(beam search)机制实现目标导向测试时计算扩展(goal-directed test-time compute scaling),并根据不同任务需求定制评分策略。栈结构负责动态管理反应物与中间产物,支撑逐步推理过程;束搜索则通过维护多个高分候选路径来保持搜索的多样性。
在分子重构任务中, 评分策略侧重结构相似性与反应可行性,确保准确重现目标分子;而在分子优化与活性扩展任务中,则引入奖励模型对构建块及中间产物的目标性质进行评估,引导搜索朝向具有理想特性的可合成分子,实现可合成空间内的定向探索与优化。
实验结果:多任务性能超 SynNet 等方法,消融实验验证核心组件有效性
实验结果如下表所示,ReaSyn 在多项关键任务中均展现出优于现有 SynNet 和 SynFormer 方法的综合性能。
ReaSyn、SynNet 和 SynFormer 方法的对比
在可合成面向目标分子优化任务中,研究重点考察了 ReaSyn 如何提升传统优化方法的实用性。 该任务以图遗传算法(Graph GA)为基础框架,在其繁殖步骤后引入 ReaSyn 进行可合成投影处理,确保所得分子均处于可合成空间内,该方法被命名为 Graph GA-ReaSyn。
实验分为两部分:一是基于 TDC 预言机函数的通用性质优化,二是针对可溶性环氧化物水解酶(sEH)结合亲和力的靶向优化。
在 TDC 任务中, 如下表所示,Graph GA-ReaSyn 在 15 项优化任务中的 「AUC top-10」 指标上均优于所有基于合成约束的基准方法,且其合成可及性评分(SA score)显著优于原始 Graph GA,说明 ReaSyn 在保持优化性能的同时有效提升了可合成性。在sEH亲和力优化中,ReaSyn在结合亲和力、SA评分和类药性(QED)三项指标上全面优于FragGFN、SynFlowNet 及 SyntheMol 等方法,尤其凸显了其在平衡目标性质与可合成性方面的优势。
TDC 任务中可合成目标定向分子的优化结果
在可合成活性化合物扩展任务中, ReaSyn 通过束搜索为已知活性化合物生成多个结构相似且可合成的类似物,以拓展候选分子库。实验以 JNK3 抑制剂为研究对象,从 ZINC250k 中选取评分前十的分子作为起点,为每个分子生成 100 个类似物。通过「类似物率」「提升率」和「成功率」三项指标评估,ReaSyn 在所有指标上均优于以往方法。
AI 驱动合成路径预测,促进可合成分子设计革新
在 ReaSyn 这类 AI 驱动合成路径预测技术发展的同时,全球学术界与企业界也在这一领域积极探索,从不同路径推动着可合成分子设计的创新。
学术界的研究往往侧重于新方法与底层机制的突破。例如,多伦多大学开发的一款台式机器人系统 Organa,则利用计算机视觉和大语言模型(LLM)的结合, 能够将自然语言指令转换为标准化学描述语言 χDL 代码,自动化处理部分化学实验室任务,从而将科学家的口头指令转化为实验流程。
利物浦大学自主研发的 AI 化学家 Mobile Robotic Chemist, 8 天完成 688 次实验,一周时间研究 1,000 种催化配方,并发现了一种新的催化剂。
企业界的创新则更注重于将先进技术转化为实际生产力,并集成到现有工作流程中。专注于人工智能药物研发的英国企业 BenevolentAI 与默克展开的战略合作极具代表性, 前者依托其端到端 AI 平台的化学设计工具,结合英国剑桥的湿实验室设施,为默克的药物研发管线提供从活性化合物识别到临床前候选分子开发的全链条支持,核心在于利用大语言模型的合成路径推理能力,确保生成的小分子化合物兼具高活性与可合成性,大幅缩短从概念到候选分子的转化周期。
人工智能驱动的生物科技公司 Insilico Medicine 在端到端药物研发中展现出合成可及性设计的实战价值,其利用生成式 AI 设计的特发性肺纤维化候选药物 INS018_055,通过内置的 ReaSyn 类可合成投影模块,在临床前研究中实现 100% 的合成成功率, 且从靶点发现到候选分子确定仅用 18 个月,较行业平均周期缩短 60%。
这些来自学界和业界的多元探索,虽然切入点和技术路径各异,但共同指向一个目标:即通过创新方法提升我们设计和合成有用分子的能力与效率,最终为药物研发、新材料开发等诸多领域注入新的动力。
参考链接:
1.https://mp.weixin.qq.com/s/Mz...
2.https://mp.weixin.qq.com/s/1J...
3.https://mp.weixin.qq.com/s/vh...