超神经HyperAI · 2月17日

入选AAAI 2025!香港理工大学团队基于图Transformer,精准预测有机材料分子光电性能

微信图片_20250217112307.png
1966 年,日本东北大学实验室的一组异常数据改写了能源史。当研究人员将紫罗碱染料结晶薄膜置于阳光下时,电流检测器突然跳动的信号令其震惊——有机材料竟然可以不依赖硅晶体产生光电流! 这项发表于「日本应用物理杂志」的里程碑发现,如同投入深潭的石子,激起了持续半个世纪的科研涟漪。

然而有机太阳能电池 (OSCs) 的征途远比想象坎坷。此后的四十年间,研究者们深陷「效率魔咒」:有机材料中激子扩散距离不足 10 纳米,产生的电子空穴对在抵达电极前就已湮灭。转机出现在 2005 年,加州大学洛杉矶分校杨阳团队从植物光合系统获得灵感——他们模仿叶绿体中光系统 II 与 I 的分工协作,用 P3HT 和 PCBM 两种材料构建出纳米级互穿网络。这种「体异质结」结构将激子分离效率提升至 60%,推动器件效率历史性突破 5% 大关, 相关成果登上 Science 封面文章。

在此之后,有机太阳能电池的效率极限得到了持续突破。但是,在有机太阳能电池逼近 20% 效率极限的今天,传统「试错法」研发模式遭遇瓶颈。每个新型分子背后都暗藏数万亿种结构组合,这催生了计算材料学的强势崛起。

香港理工大学团队近日发表的 RingFormer 框架,正掀起一场分子设计的认知革命。该方法通过构建原子-化学环的层级图 Transformer 架构,结合局部消息传递与全局注意力机制,能精准预测分子光电性能。在来自哈佛大学的清洁能源项目数据库 Clean Energy Project Database (CEPDB) 测试集上,其性能较传统方法提升 22.77%,相当于将新材料研发周期从数年缩短至周级别,标志着有机太阳能电池研究正式进入「计算指导实验」的新纪元。

相关成果以「RingFormer: A Ring-Enhanced Graph Transformer for Organic Solar Cell Property Prediction」为题,入选 AI 领域顶级学术会议 AAAI 2025。

微信图片_20250217112312.png

论文链接:
https://doi.org/10.48550/arXiv.2412.09030

研究所用相关数据集下载地址:

https://hyper.ai/cn/datasets/37721

GNN 改变冗长的传统研发模式

随着全球能源转型对可再生能源需求的不断增长,有机太阳能电池 (OSCs) 因其卓越的光电转换特性而成为研究的热点。这些设备以有机小分子半导体材料为基础,通过共轭结构中的电子供体与受体的相互作用实现光能向电能的转换,其效率与分子结构的复杂性密切相关。然而,传统的研发模式依赖于大量的试错实验和漫长的合成过程,研发周期常常需要 3-5 年, 这严重限制了材料创新的速度。

为了更高效地筛选潜在的 OSCs 分子,研究人员开始采用机器学习方法来预测 OSCs 的性能。目前,基于指纹的方法被广泛应用,这些方法通常使用手工设计的分子指纹(例如 MACCS 和 ECFP)作为分子特征,并将其输入到现有的随机森林和支持向量机等机器学习模型中。然而,这些指纹是对分子结构的简化表示,忽略了复杂的分子信息和相互作用, 尤其是在结构复杂的 OSCs 分子中更为明显。

图神经网络 (GNNs) 曾为这一困境带来希望——将分子抽象为原子节点和化学键边的拓扑图,通过深度学习捕捉结构特征。但现有模型在解析 OSCs 分子时面临双重挑战:一方面, GNNs 的「原子近视症」难以捕捉跨越多个苯环的长程电子耦合效应;另一方面, 缺乏对环系统间连接模式的表征,导致无法区分关键结构差异(例如线性连接与星型拓扑对激子分离的影响)。

针对这些挑战,香港理工大学的研究团队提出了一种创新的框架 RingFormer, 这是首个捕捉 OSCs 分子中环系统的图 Transformer 框架。该框架突破了传统原子级建模的单一视角,构建了一个原子-环双层次特征融合系统。

该方法的核心在于建立动态交互机制:在原子层面保持对化学键、电荷分布等微观特征的敏感度,同时在环层面建立跨环注意力网络,精确解析稠环共享边、非稠环空间排布等宏观结构特征。

通过引入环间连接矩阵和环内原子权重分配算法,模型能够自主识别关键环系统及其相互作用模式。实验结果表明,这种双层次建模策略将功率转换效率 (PCE) 预测精度提升至 92%, 在含五环以上复杂体系的分子中展现出更强的表征能力。这一突破不仅为 OSCs 材料设计提供了新的范式,也为复杂分子系统的机器学习建模开辟了新的道路。

RingFormer:从原子和环两个层面表示 OSCs 分子结构

为了更好地评估该方法,研究人员整理了 5 个 OSCs 分子数据集, 包括基于密度泛函理论 (DFT) 生成的 CEPDB 数据集,以及由不同类型的 OSCs 分子组成的 HOPV、PFD、NFA 和 PD 数据集。这些数据集按照 6:2:2 的比例被划分为训练集、验证集和测试集。

研究所用相关数据集下载地址:

https://hyper.ai/cn/datasets/37721

为了精准捕捉 OSCs 分子中的原子和环级结构特征,该研究提出了 RingFormer 框架,首先构建了一个多层次的 OSC 图,然后通过 RingFormer 层对这一多层次图进行整体编码,以预测其性能。 如下图所示,这个多层次的 OSC 图包括原子级 (Atom-level)、环级 (Ring-level) 和跨级图 (Inter-level)。

微信图片_20250217112314.png

RingFormer 框架

原子级图详细描述了 OSCs 分子的原子键合结构,而环级图则专注于环及其连接,以捕捉复杂的环系统。跨层级图则负责建模环与原子之间的关系,从而完整地表示分子的层次结构。这三个层级的整合,提供了一个全面的 OSCs 分子结构描述,使得性能预测更为精确。

接下来,RingFormer 框架融合了局部消息传递 (Message Passing) 和全局注意力机制, 以捕捉每个层级中的独特结构模式,并学习出富有表现力的图表示。在原子级图上,RingFormer 层利用消息传递 GNNs 将局部结构特征编码到原子节点表示中。

对于环级图,RingFormer 层引入了一种创新的交叉注意力机制,专门用于捕捉环系统中的全局模式,尤其是环之间的连接。此外,RingFormer 层还通过跨层级图上的消息传递,促进了环节点和原子节点之间的交互。在每个 RingFormer 层的结束阶段,实施层次融合策略,确保不同层级的信息能够相互补充。

最终,在多层堆叠之后,RingFormer 将原子和环的节点表示聚合,形成一个全面编码 OSCs 分子结构的图表示,为性能预测提供了坚实的基础。

接下来,为了评估 RingFormer 在 OSCs 性能预测中的有效性,研究人员将其与 11 个基线模型在 5 个 OSCs 分子数据集上进行比较。实验结果表明,RingFormer 始终优于基线模型。 值得注意的是,在大规模 CEPDB 数据集上,RingFormer 相对于最近的竞争对手实现了显著的 22.77% 的相对改进。

如下表所示,在预测功率转换效率 (PCE) 方面,RingFormer 在几乎所有数据集上均表现最佳,仅在 PFD 数据集中排名第二。 特别是在平均环数最多的 NFA 数据集上,RingFormer 的性能超过了基于指纹的方法 ECFP,提升了 4.96%。此外,在处理更大和更复杂的 OSCs 分子时,RingFormer 在这些数据集上仍表现出色,在 4 个数据集中的 3 个里表现最佳。

微信图片_20250217112316.png

微信图片_20250217112319.png

RingFormer 和其他基线模型的预测性能比较

研究人员进一步利用 CEPDB 数据集对 RingFormer 在多任务学习中的表现进行了评估。结果显示,RingFormer 在所有 6 个目标性能指标中均持续领先于其他竞争模型, 并且通常具有显著的优势。此外,由于融合了消息传递和全局注意力机制,GPS 在所有目标性能上也表现出色,仅次于 RingFormer,这进一步证实了在 OSCs 分子中同时捕捉局部和全局结构特征的重要性。

最后,研究人员还评估了 RingFormer 在处理不同环数量的 OSCs 分子时的表现。随着分子中环数量的增加,RingFormer 的性能提升也相应增加,这表明了 RingFormer 的优越性能与环系统的复杂性之间存在明显的正相关关系。

此外,该研究还通过 UMAP 技术对 CEPDB 测试集中的 OSCs 分子的图表示进行了可视化分析。与 GPS 生成的嵌入相比,RingFormer 生成的嵌入能够根据 OSCs 分子中的环数量进行明显区分。 这些观察结果进一步证实了 RingFormer 在捕捉环系统复杂结构方面的卓越能力。

AI 技术重塑产业未来,OSCs 背后的中国力量不容忽视

在全球能源转型的浪潮中,有机太阳能电池 (OSCs) 以其轻质、柔性和低成本的特点,正逐渐从实验室走向产业化的前沿,而中国科学家在有机太阳能电池领域的研究进展引人注目。

2015 年,中科院的侯剑辉团队提出了「聚合物-小分子协同效应」理论,并开发了非富勒烯受体 ITIC,其蝴蝶状的三维构型能够实现分子间的精密咬合。该团队的产品在海拔 4,200 米的青海高原极端气候条件下,仍能保持 82% 的效率,成为全球首个高海拔地区的实证案例。

到了 2025 年,苏州大学的李耀文团队通过「顺序结晶策略」调控活性层分子排列梯度,实现了 20.82% 的认证效率,并突破了厚膜器件产业化的瓶颈,使得 400 纳米厚膜的效率达到了 17.93%, 为卷对卷印刷技术的发展奠定了基础。

同时,宁波材料所的葛子义团队设计了喹喔啉基受体 SMA,通过有序的分子排列,将刚性与柔性 OSCs 的效率分别提升至 20.22% 与 18.42%, 即使经过 2,000 次弯曲后仍能保持 96% 的性能,为可穿戴能源设备树立了新的标准。

而 AI 与有机太阳能电池研究的结合早在 2023 年就已显现。苏州大学功能纳米与软物质研究院的李有勇教授团队与袁建宇教授团队合作,利用机器学习实现了有机太阳能电池的高通量筛选。他们通过 DFT 计算深入挖掘有机分子的电子结构性质,并利用大数据技术构建功能性材料数据库,为机器学习模型的训练提供了坚实的基础。这项研究不仅提高了有机光电材料筛选的效率,降低了计算成本, 也为光电器件的设计和优化提供了有力的支持。

论文题目:

Efficient screening framework for organic solar cells with deep learning and ensemble learning
论文链接:

https://www.nature.com/articles/s41524-023-01155-9

2024 年,伊利诺伊大学和多伦多大学的研究团队提出了一项突破性的「闭环迁移 (CLT)」方法,将 AI 转化为一个可解释的化学知识引擎。该方法结合物理特征选择与监督学习,在五轮闭环实验中筛选出 30 种新型分子,包括光稳定性提升 5 倍的捕光分子, 揭示了高能三重态密度 (TDOS) 与稳定性之间的强关联性,为光降解问题提供了普适性的设计原则。

论文题目:

Closed-loop transfer enables artificial intelligence to yield chemical knowledge
论文链接:

https://doi.org/10.1038/s41586-024-07892-1

同样是2024年,德国赫姆霍兹研究所的 Christoph J. Brabec、武建昌与厦门大学的王露遥、德国卡尔斯鲁厄理工学院的 Pascal Friederich、韩国蔚山国立科学技术院的 Sang Il Seok 共同开发了一种闭环自动化工作流程。这一流程结合了机器学习和实验,能够快速生成针对特定设备需求的分子设计规则, 为有机太阳能电池等下一代高性能光电子器件的发展奠定了基础。

论文题目:

Inverse design workflow discovers hole-transport materials tailored for perovskite solar cells
论文链接:

https://doi.org/10.1126/science.ads0901

由此可见,AI 技术在全球范围内的有机太阳能电池研究中发挥着越来越重要的作用,不仅加速了新材料的发现和性能优化,也为解决长期存在的科学问题提供了新的视角和解决方案。随着技术的不断成熟和产业化进程的加速,中国力量已经成为推动全球有机太阳能电池技术发展的关键引擎,有望为未来的能源革命贡献更多的中国智慧和中国方案。

推荐阅读
关注数
702
文章数
552
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息