我们身处一个真实的物理世界,包含许多复杂的物理过程,一般难以对其进行完整的物理建模。然而纵观整个科学发展史,即使再复杂的物理过程也存在其所对应的简洁控制方程组。甚至针对局部时空的物理状态,有时仅由方程中的某些关键项或参数所构成的平衡决定。因此,在很多情况下,学界和业界可将复杂的物理建模过程化繁为简,只需识别与之最紧密相关的主导平衡模型,从而解决核心问题。本篇与大家分享一篇刊于Nature Communications 论文:Learning dominant physical processes with data-driven balance models。该文提出了一种基于数据驱动的方法策略,能够对复杂物理过程的主导平衡模型进行识别,并且能够在湍流、生物学、非线性光学、燃烧等领域有推广适用。
背景介绍
主导平衡模型(Dominant Balance Models),即将复杂的物理问题用相对简单的关键物理项或关键参数进行表征简化的模型。比如在管道流动状态的判别问题中,我们可以通过雷诺数(即流体粘性力和惯性力的比值)对管道内部的流动状态进行最初的判别(Re<2300为层流状态);但随着科学技术的发展,研究学者又进一步发现管道内部的流动状态不仅与雷诺数相关,还和管道粗糙程度,摩擦因子等关键参数相关。通过获取这些关键参数,我们即使不做实验,也可以对管道内部的流动状态进行精准地判别。由这些关键参数所组成的模型即为主导平衡模型。
在传统的主导平衡模型判别中主要依赖于科研专家对物理现象的经验直觉和物理问题的深度剖析,通过一些近似假设进行严格的量纲分析,最终推演获得,因此适用范围受限。该论文提出一种基于数据驱动的主导平衡模型识别的一般化策略,无需依赖经验公式,通过挖掘数据本身所蕴含的物理规律,对复杂物理过程进行简化,推演主导平衡模型,因此更容易在复杂系统物理建模中推广应用。
如何识别主导平衡?
论文所提的基于数据驱动的主导平衡模型识别,可以分成以下5步(本篇以平板边界层转捩至湍流为例,如图1所示):
1.寻找与物理问题相关的简洁控制方程。如图1b,此处的控制方程即为雷诺时均方程。
3.采用高斯混合模型(_Gaussian mixture models,GMM_)对高维“方程空间”的点云划分团簇。作者团队假定高维方程空间中的点是由有限数量的具有未知参数的高斯分布的混合生成,用高斯混合模型对其进行初步的聚类划分,将其划分成多个团簇,每个团簇的点可以重新投影到原先的物理空间上,进而对物理场进行不同局部区域的划分。但由于高维数据本身规律未必符合高斯分布假设,导致团簇的数量可能多于所需主导平衡模型的数量。
4.采用稀疏主成分分析(_Sparse principal component analysis,SPCA_)对各个团簇进行降维,提取协方差变化最大的主成分,对包含相同主成分的团簇进行合并和重新归类。如图1c所示,经过SPCA重新提取划分后,平板边界层转捩至湍流问题一共可划分5个局部区域,分别为转捩区,层流区,自由来流区,惯性底层和粘性底层区。
5.提取非零主成分构建主导平衡模型。如图1c所示,对提取的主成分重新投影至6个维度特征上,忽略在变化方向上"近零方差"的方程项,即可获取在该局部平衡中的关键项,从而获得主导平衡模型。如图1d所示,在平板边界层转捩湍流中,红色区域为粘性底层区域,以粘性力项和壁面法向的雷诺应力项为主导。该结果与经典量纲分析法所得的结论具有较好的一致性,符合常规的物理认知。
图1 平板边界层转捩至湍流的主导平衡模型识别
复杂系统的应用验证
为了验证所提策略的有效性和鲁棒性,作者团队针对不同的复杂系统进行了应用测试,如图2所示,包含转捩湍流、光脉冲传输、地球洋流运动、生物神经科学、发动机燃烧装置模拟等一系列复杂物理问题。结果表明,采用基于数据驱动的主导平衡模型识别方法与经典物理分析方法(如量纲分析)等所得的结果吻合良好,也符合相应的理论方程规律,在一定程度上验证了该策略的有效性。
图2 不同复杂系统的主导平衡模型识别
思考与总结
•论文提出了一种基于数据驱动以非监督学习的方式识别主导平衡机制,能够在复杂系统物理建模中推广;
•论文提出方程空间的视角,控制方程中的每一项用来描述该空间中的方向,主要的平衡关系可通过对稀疏子空间的限制而获得,即可忽略项在方程空间中的方差显著减小。
•识别主导平衡的方法从控制方程出发,通过高斯混合模型聚类和稀疏主成分分析的相结合的策略,避免了对局部时空物理行为的平衡关系的预先假设;其中,高斯混合模型能够识别划分方程空间中不同方向上的团簇,而稀疏主成分分析能够找到具有最大方差的方向来进一步提取稀疏子空间,从而获得主导平衡模型。
运用主导平衡模型,可以增强我们对复杂物理系统的局部时空行为的理解,从而简化研究的问题。基于此模型可以开发新的控制或设计策略,从而实现流动减阻或混合增强等目的。然而,作者团队也指出目前的策略仍然存在一些局限性。比如:该策略对方程中各项计算的精度十分敏感,尤其是有关梯度的计算部分;控制方程中的数据在真实实验中未必能够直接获得(如全场压力、雷诺应力项等)且真实数据带有噪声,可能需借助数据同化技术进行数据获取;"方程空间"未必呈现正态分布,还可以尝试别的聚类算法来增强策略的鲁棒性等。因此,在目前的研究基础上仍有很多尚待挖掘和尝试的新思路和挑战。
Reference
Callaham J L, Koch J V, Brunton B W, et al. Learning dominant physical processes with data-driven balance models[J]. Nature communications, 2021, 12(1): 1-10.
原文:知乎
作者:于璠
推荐阅读
更多嵌入式AI技术相关内容请关注嵌入式AI专栏。