在麻省理工学院 4 号楼的地下室,有一个被学生们称为「创新的摇篮」的实验室——4-061 实验室。在这里,Donald Sadoway 教授自 1990 年代后期就开始了他对于固体聚合物电解质 (SPE) 锂金属电池的研究。这个实验室见证了无数个日夜的辛勤工作和无数次的实验失败,但也正是这些挑战,孕育出了改变世界的创新发现。
在过去的三十余年中,麻省理工学院始终未曾放慢对固态聚合物电解质 (SPE) 研究的脚步。随着人工智能技术的迅猛发展,麻省理工学院的科研团队正借助机器学习和数据驱动的策略,开启了一系列的创新研究。他们运用先进的算法和海量数据,旨在突破传统材料的局限,为电池技术的未来开辟新的可能性。
不久前,麻省理工学院与丰田研究所的科研团队携手合作,运用生成式人工智能技术,进行了聚合物电解质的全新设计。他们比较了基于 GPT 的 minGPT 和基于扩散的 1Ddiffusion、diffusion-LM 模型,采用了预训练和微调的方法,成功地创造出了一大批新颖、多样化且具有潜在应用价值的聚合物。这一成果不仅展示了人工智能在材料设计领域的强大潜力,也为固态电解质的发展注入了新的活力。公众号后台回复「电解质」获取该论文原文。
下一代锂电池的希望之星:AI 助力固态聚合物电解质的创新突破
固态聚合物电解质 (SPEs) 被广泛认为是下一代锂离子电池的有力候选材料,相较于液态电解质,它们在安全性、能量密度和制造性能方面展现出显著的优势。然而, SPEs 的离子导电性通常比商业化液态电解质低几个数量级,这一特性严重限制了它们的实际应用。为了应对这一挑战,科研人员已经开展了广泛的实验和计算研究。
一方面,研究人员发现数据挖掘为理解物质结构与性能之间的关系提供了新的解决方案。早在 2021 年,上海交通大学的研究团队在 Nano Energy 期刊上发表了一项题为「Harnessing Artificial Intelligence to Holistic Design and Identification for Solid Electrolytes」的研究,他们结合机器学习模型和有限的 DFT 计算,从超过 29,000 个设计的石榴石 (Garnet Solid State Electrolyte) 结构中,快速筛选出 12 个在室温下具有极低电子电导率的候选物。这种方法在计算上缩短了至少 95 年的筛选周期,为固态电解质的设计和发现开辟了新的思路和方法。
论文链接:
https://www.sciencedirect.com/science/article/pii/S2211285521005929
到了 2023 年,日本东北大学的研究团队在题为「The dynamic database of solid-state electrolyte (DDSE)」的研究中,构建了一个动态的全固态电池电解质数据库,并利用机器学习预测离子电导率,为实验合成的新材料提供了性能参考。
论文链接:
https://www.sciencedirect.com/science/article/pii/S258996512300034X
另一方面,研究人员也致力于通过新材料的挖掘来提升聚合物的离子导电性。目前,尽管高温操作、添加辅助添加剂、共聚物化等常见方法取得了一定的进展,但它们大多依赖于聚乙烯氧化物 (PEO)。受限于材料本身的局限性,PEO 材料已经成为了 SPE 技术发展的一大障碍。但是,现阶段对于非 PEO 聚合物的探索仍然相对有限。为了探索更广阔的非 PEO 聚合物空间,机器学习和数据驱动方法开始被广泛应用于聚合物属性预测和逆向设计。
尽管人工智能可以加速新聚合物的发现,但它也带来了独特的挑战。一般来说,人工智能预测的准确性依赖于丰富、多样、广泛的初始数据集,因此高质量的数据至关重要。此外,设计一套能够生成化学上真实且可合成的聚合物的算法也是一项复杂的任务。因此,在各种机器学习方法中,生成式设计因其能够从数据中学习并创造新的候选物质而显得尤为突出。这种方法不仅有望通过学习现有数据来扩展聚合物数据库,还能帮助定制化设计特定目标的聚合物材料。
然而,目前很少有研究利用这些先进的生成式 AI 技术来进行聚合物的生成。为了研究生成式 AI 技术在非 PEO 材料方面的应用,尤其是在具有高度结构随机性的非晶材料的聚合物电解质领域,麻省理工学院和丰田研究所的研究团队在一项最新研究中深入研究了不同先进生成式模型在聚合物生成中的复杂性,并提出了一种可以持续生成和评估新的基于 GPT 和扩散模型的聚合物电解质的从头设计方法,为实验检验提供了新的候选物。
minGPT 胜过扩散模型:预训练策略提升数据集适应性
在麻省理工学院的最新研究中,为了开发有价值的新型聚合物电解质材料,该研究该研究通过标记 (tokenize)、训练 (Train)、生成 (Generate)、验证 (Evaluate) 四大模块,为聚合物生成设计了一个系统的评估方案。
该研究的工作流程
首先,在标记 (tokenize) 阶段,研究人员首先选择了一个包含 6,024 种不同非晶聚合物电解质的 HTP-MD 数据集。这些聚合物的离子传输属性主要通过分子动力学 (MD) 模拟计算得出。
基于这个数据集,在训练 (Train) 阶段,研究人员比较了几种不同的生成式 AI 模型 (Generative AIs),包括 GPT 模型的一个流行的开源 PyTorch 复现项目——minGPT,以及两种扩散模型:一维去噪扩散概率模型 (1Ddiffusion) 和扩散语言模型 (diffusion-LM),在聚合物生成方面的性能。
通过这些模型的比较,研究人员希望能够找到一种最有效的方法来生成具有理想属性的聚合物电解质。鉴于三个模型具有不同的损失函数,损失值可能无法为化学系统提供全面评估。因此,研究人员提出了一种包含 6 个不同的指标的评估聚合物生成的方法,从而可评估模型在不同超参数组合下的性能。
- 1Ddiffusion 模型是对去噪扩散概率模型 (DDPM) 的改进,最初是为了图像生成而开发的。
- 在 diffusion-LM 模型中,非自回归语言模型架构与连续扩散的概念相结合,可用于生成文本。
- minGPT 项目地址:
https://gitcode.com/gh_mirrors/mi/minGPT - 1Ddiffusion 项目地址:
https://gitcode.com/gh_mirrors/de/denoising-diffusion-pytorch - diffusion-LM 项目地址:
https://gitcode.com/gh_mirrors/di/Diffusion-LM
在这项研究中,研究人员首先研究了无条件 (Unconditional) 生成情况下的模型架构性能,即在没有任何属性约束的情况下,使用 HTP-MD 数据集来训练生成模型,以学习聚合物的「语言」。在无条件生成的过程中,模型可在生成 (Generate) 阶段被训练可随机生成 (Randomly generated) 新颖的、化学上有效的、独特的和可合成的聚合物。
结果如下图所示,minGPT 模型和 diffusion-LM 模型的表现相当,而 1Ddiffusion 模型的表现相对较差。在计算成本方面,minGPT 模型在训练和推理方面比基于扩散的模型更高效。在 Tesla V100 GPU 核心 (16GB RAM) 上,训练最优的 minGPT 模型仅大约需要 3-4 分钟,而最优的 1Ddiffusion 和 diffusion-LM 模型则需要大约 2 小时的训练时间。
无条件生成的不同评价指标下不同模型的性能比较
接下来,该研究进一步引导生成模型创建具有理想属性的聚合物电解质,研究了在条件生成 (Conditional) 情况下的模型架构性能。例如,为了实现高离子导电性,研究人员首先将 HTP-MD 数据集中的聚合物分为高导电性和低导电性两组,然后利用从无条件生成任务的超参数调整中获得的最优模型架构在生成 (Generate) 阶段有条件的生成 (Conditionally generated) 具有高导电性的聚合物电解质。
最后,他们使用图神经网络 (GNN) 模型来预测生成聚合物的离子导电性,在测试的 46 个候选材料中,最终筛选出 17 个具有优越的离子导电性的聚合物。结果还表明,与无条件生成的发现一致,minGPT 模型在条件生成中也超越了 1Ddiffusion 和 diffusion-LM 模型,实现了更优越的平均得分。这表明 minGPT 模型不仅在生成新颖聚合物方面表现出色,还能有效地引导生成具有特定理想属性的聚合物电解质。
条件生成的不同评价指标下不同模型的性能比较
由于 minGPT 模型在无条件和条件生成方面都优于基于扩散的模型。因此,研究人员进一步研究了预训练和微调方法对 minGPT 模型的影响。具体来说,他们比较了两种不同的训练策略:一种是从头开始在 HTP-MD 数据集上直接训练的 minGPT 模型,另一种是先在 PI1M 数据库上进行预训练以进行无条件生成,然后再在 HTP-MD 数据集上进行微调以实现条件生成的 minGPT 模型。
- PI1M 数据库:包含 100 万聚合物单体的基准数据库,但缺乏聚合物的离子导电性信息
研究结果表明,预训练策略显著缩短了微调的训练时间,并提高了条件生成的有效性和独特性得分。此外,预训练还增强了模型捕捉 HTP-MD 数据集中聚合物特性的能力,并在生成过程中产生了更广泛的聚合物多样性。这意味着,先在大规模数据库上进行预训练,模型能够更好地适应特定数据集的需求,从而在生成新型聚合物时表现出更高的效率和准确性。
麻省理工学院携手丰田研究所,推动 AI 在汽车领域的广泛应用
事实上,这项研究并非麻省理工学院与丰田研究所的首次合作,双方的合作历史可追溯到 10 年前,成果也颇为丰硕。
早在 2015 年 9 月,丰田汽车公司就宣布将在未来 5 年内投入 5 千万美元,与麻省理工学院和斯坦福大学合作建立研究中心,共同研发无人驾驶汽车。这一合作为 AI 在汽车研发中的广泛应用奠定了基础。
仅仅一年之后,麻省理工学院的运输与物流中心 AgeLab 就与丰田合作安全研究中心 (CSRC) 共同发布了名为 DriveSeg 的创新性开放数据集。该数据集通过视频捕捉驾驶场景,提供的数据流更接近真实的动态驾驶情况,极大地推动了机器学习、场景理解和行为预测等领域的发展。
到了 2020 年,麻省理工学院、丰田研究所和斯坦福大学的研究团队在 Nature 上发表了一篇论文「Closed-loop optimization offast-sprotocols for batteries withcharginmachine learning」,介绍了一种机器学习模型,该模型将电池充电测试时间从近两年缩短至 16 天,缩短了近 15 倍,并能准确预测电池的使用寿命。这一方法有望加速电池开发的各个环节,帮助制造商更高效地设计和制造电池。
论文链接:
10.1038/s41586-020-1994-5
尽管五年之约已经到期,但多方的合作并未止步。2021 年,麻省理工学院、丰田研究院、斯坦福大学和 SLAC 的研究团队再度在《Nature Materials》上发表了一篇题为 Fictitious phase separation in Li layered oxides driven by electro-autocatalysis 的文章,首次将「科学机器学习」应用于电池循环研究,推翻了关于锂离子电池充电和放电的传统假设,并为设计能够在 10 分钟内完成充电的长寿命电动汽车电池提供了新的规则。
论文链接:
10.1038/s41563-021-00936-1
如今,麻省理工学院与丰田研究所再次携手,开发了一种可以持续生成和评估新的聚合物候选物的方法。这一方法在解决复杂的聚合物设计问题和推动下一代电池材料的搜索方面具有巨大潜力。
锂电池产业的升级与变革:AI 助力关键动力
从电动汽车的广泛应用,到我们日常使用的智能手机、笔记本电脑等消费电子产品,再到智能家居设备,锂电池以其高效的能量存储能力,为这些设备提供了强大的动力支持。
在全球范围内,各国政府均对锂电池的开发给予了极大的关注,例如,为落实《新产业标准化领航工程实施方案 (2023―2035 年)》,工信部等四部门在 2024 年 11 月刚刚印发了《国家锂电池产业标准体系建设指南 (2024 版)》,旨在加强锂电池产业标准工作顶层设计,促进锂电池产业健康有序发展。
美国、欧洲和韩国等国家和地区也在加大锂电池研发的投入,以确保在全球竞争中保持领先地位。例如,2021 年 11 月,由美国能源部、国防部、商务部、国务院四部门联合组建的联邦先进电池联盟 (FCAB) 发布了 2021-2030 年美国锂电池国家蓝图,旨在引导对美国锂电池制造价值链的投资,创造就业机会。这些政策不仅促进了技术创新,也为锂电池的广泛应用提供了坚实的基础。
然而,由于不同设备对性能要求的不断提高,目前锂电池的研发仍然面临着材料创新进展相对缓慢、大量电池数据难以有效处理和分析等持续的挑战和创新需求。
锂电池行业正处于技术革新的浪潮之巅,而 AI 无疑是引领这场技术复兴的核心驱动力。例如,作为全球最大的锂电池制造商,宁德时代 (CATL) 已经利用 AI 技术优化了回收流程,在锂电池回收领域取得了显著进展,将锂回收率提高至 91%。芯动科技通过运用先进的人工智能算法和大数据分析技术,对锂电池生产的各个环节进行了深度优化,不仅提升了锂电池生产的智能化水平,还加速了新型锂电池材料的研发和应用。
未来,锂电池产业仍将经历显著的升级和变革。随着技术的不断进步和市场需求的持续增长,锂电池将在能源转型和可持续发展中扮演越来越重要的角色。在这段旅途中,AI 技术正展现出前所未有的姿态,为产业的进一步升级提供源源不断的关键动能。