<img src="https://www.zjujournals.com/eng/images/1008-973X/images/logo.png" class="img-responsive">

图 1 重采样示意图

Fig.1 Schematic diagram of resampling

2.2. 高斯分布采样

静态预采样无法做到精确定位，为此提出采用一般背景分布$ \rho (x) $对损失函数$ {F}_{r} $进行重构：

(10)$ {F}_{r}(u(x))=\frac{1}{{N}_{{\mathrm{t}}}}\sum\limits_{i=1}^{{N}_{{\mathrm{t}}}}\int r_{i}^{2}(x)\rho (x)\text{d}x . $

式中：$ {N}_{{\mathrm{t}}} $为样点数量. 通过设计背景密度函数$ \rho (x) $，实现对高风险学习区域的定向采样强化. 一般情况下，最佳$ \rho $的不同定义会导致不同的自适应采样策略. 基于高斯分布在概率密度建模中的基础性优势^[19-20]，本研究使用${\rho }_{i} $表示每个重采样点附近添加点的分布情况：

(11)$ {\rho }_{i}=\pi_{i}N(x|{\mu }_{i},{\varSigma }_{i}) . $

其中$\pi_{i} $为可调参数，$ N(x|{\mu }_{i},{\varSigma }_{i}) $为具有均值$ {\mu }_{i} $和协方差$ {\varSigma }_{i} $的高斯分布. 以一维情况为例，高斯中出现的均值和方差可以通过求解以下风险最大化问题来确定：

(12)$ {\mu }^{*},{\sigma }^{*}=\arg \underset{\mu ,\sigma }{\max }\int{r}^{2}(x;\theta )N(x|\mu ,\sigma )\text{d}x . $

为了更好地得到$ {\mu }^{*} $和$ {\sigma }^{*} $的显式表达式，引入拉普拉斯近似思想，渐近展开目标函数. 假设$ r(x) $在$ {x}_{0} $处的残差/梯度达到重采样标准，残差写为

(13)$ r(x;\theta )={\text{e}}^{-G(x)} . $

将$ G(x) $在$ {x}_{0} $处进行二阶泰勒展开，得到

(14)$ \begin{split}r(x;\theta )=&{\text{e}}^{-[G({{x}_{0}})+{{G}^{\prime}}({{x}_{0}})(x-{{x}_{0}})+\frac{1}{2}{{G}^{''}}({{x}_{0}}){{(x-{{x}_{0}})}^{2}}]}=\\& C\cdot {\text{e}}^{-\frac{1}{2}{{G}^{''}}({{x}_{0}}){{(x-{{x}_{0}})}^{2}}},\\r(x;\theta )=&{\text{e}}^{-[G({{x}_{0}})+{{G}^{\prime}}({{x}_{0}})(x-{{x}_{0}})+\frac{1}{2}{{G}^{''}}({{x}_{0}}){{(x-{{x}_{0}})}^{2}}]}=\\& C\cdot {\text{e}}^{-\frac{1}{2}{{G}^{''}}({{x}_{0}}){{(x-{{x}_{0}})}^{2}}}.\end{split} $

其中$ C $为常数，由于$ {x}_{0} $为区域内残差极大值，得到$ {G}^{\prime}({x}_{0})=0 $. 对于非线性PDE，若解$ u(x) $在局部邻域内满足$ {H}^{2} $正则性，则根据隐函数定理，残差可以在$ {x}_{0} $附近展开成式(14). 令$ G''(x)=\dfrac{1}{2{a}^{2}} $，将式(14)带入式(12)，得到

(15)$ \begin{split}&{\mu }^{*},{\sigma }^{*}=\arg \underset{\mu ,\sigma }{\max }\frac{{C}^{2}}{\sqrt{\text{2π}}\sigma }\int{\text{e}}^{-\left[{{G}^{''}}({{x}_{0}}){{(x-{{x}_{0}})}^{2}}+\frac{{(x-\mu )}^{2}}{2{\sigma }^{2}}\right]}\text{d}x =\\&\arg \underset{\mu ,\sigma }{\max }\frac{1}{\sigma }\int{\text{e}}^{-\left[\left(\frac{1}{2{\sigma }^{2}}+\frac{1}{2{a}^{2}}\right){{\left(x-\frac{{a}^{2}\mu +{\sigma }^{2}{x}_{0}}{{a}^{2}+{\sigma }^{2}}\right)^{2}}}+\frac{{(\mu -{{x}_{0}})}^{2}}{2{a}^{2}+2{\sigma }^{2}}\right]}\text{d}x =\\& \arg \underset{\mu ,\sigma }{\max }\sqrt{\frac{2}{1+(\sigma /a{)}^{2}}}\cdot {\text{e}}^{-\frac{{(\mu -{{x}_{0}})}^{2}}{2{a}^{2}+2{\sigma }^{2}}}.\\[-6pt]\end{split} $

式(15)只有在$ \sigma $为零时才能得到最优解，这样只是在损失最大的点上叠加新的点，在实践中没有意义. 对协方差矩阵施加参数约束($ \sigma \geqslant a $)，通过扩大高风险的搜索范围，扩展重采样点区域. 相较于单一的高风险重采样点(尤其是当该点近似性较差时)，该点区域内样点集合能够更快速有效地达到缩小损失函数的作用. 最终，均值$ \mu $和协方差$ \sigma $的表达式为

(16)$ \mu ={x}_{0},\quad\sigma =a={[2{{G}^{''}}({{x}_{0}})]}^{-1/2} . $

通过高残差和高梯度2个方向进行理论论证，证明背景密度函数存在合理性，以下为推导过程. 在由残差得到的高风险点、式(13)和$ {r}^{\prime}({x}_{0})=0 $前提下，

(17)$ {G}^{''}({x}_{0})=-\frac{{r}^{''}({x}_{0})}{r({x}_{0})} \approx-\frac{{r}^{\prime}({x}_{0}+\varepsilon )}{\varepsilon \cdot r({x}_{0})}. $

事实上，$ r(x) $的最大点$ {x}_{0} $由有限数据集中获得的残差最大样本点$ {\hat{x}}_{0} $来近似. 在这种情况下，令$ \varepsilon \left| {x}_{0}-{\hat{x}}_{0}\right| = O(\varepsilon ) $，协方差$ \sigma $的计算式为

(18)$ \sigma ={[2{{G}^{''}}({{x}_{0}})]}^{-1/2}=\left|\frac{r({\hat{x}}_{0})}{2}\varepsilon \right|^{1/2}\cdot |{r}^{\prime}({\hat{x}}_{0}){|}^{-1/2} . $

以由梯度得到的高风险点、式（13）和$ \dfrac{1}{{r}^{\prime}({x}_{0})}\approx 0 $的条件为前提，

(19)$ {G}^{''}({x}_{0})=\frac{{r}^{''}(x)}{{r}^{\prime}(x)}-\left[\frac{{r}^{\prime}(x)}{r(x)}\right]^{2}\approx-\left[\frac{{r}^{\prime}(x)}{r(x)}\right]^{2}. $

$ r(x) $的最大点$ {x}_{0} $由有限数据集中获得的梯度最大样本点$ {\hat{x}}_{0} $来近似，令$ \varepsilon \left| {x}_{0}-{\hat{x}}_{0}\right| =O(\varepsilon ) $，协方差

(20)$ \sigma ={[2{{G}^{''}}({{x}_{0}})]}^{-\frac{1}{2}}=\frac{r({\hat{x}}_{0})}{\sqrt{2}{r}^{\prime}({\hat{x}}_{0})} . $

针对高风险区域，当样点处梯度越高，依据高斯分布获得的新采样点越紧凑、高风险点周围重采样点越密集. 在多峰和高维的情况下，通过对$ G(x) $的拉普拉斯近似和对角线简化，可以近似生成作为高斯混合的建议密度$ {\rho }_{\text{add}} $，分别通过残差和梯度确定的高风险样本点的均值和协方差定义如下：

(21)$ {\mu }_{i}={x}_{i},\;\;\varSigma _{i}^{-1}=\lambda \cdot \text{diag}\,(|\nabla r({\mu }_{i})|) $

式中：$ \lambda $为超参数，梯度$ \nabla r({\mu }_{i}) $越大，协方差的值越小，采样点越集中. 依据式(21)得到的均值和协方差，能够在重采样过程中构建多个高斯分布区域，并通过随机采样获得新增内点. 对新增采样点进行损失函数计算，使用更新后的网络进行训练迭代，继续最小化损失函数：

(22)$ {F}_{r}(u(x))=\frac{{a}_{n}}{2{N}_{{\mathrm{t}}}}\sum\limits_{i=1}^{{N}_{{\mathrm{t}}}}\int r_{i}^{2}(x)\text{d}x+\frac{(1-{a}_{n})}{2{N}_{{\mathrm{k}}}}\sum\limits_{j=1}^{{N}_{{\mathrm{k}}}}\int r_{j}^{2}(x)\text{d}x . $

其中$ {N}_{{\mathrm{k}}} $为新增采样点数量，$ {a}_{n}=0.9\times {{\mathrm{e}}}^{-0.05n} $是为了平衡新知识和旧知识的权重比例而引入的超参数，随着网络迭代次数n不断增加，损失函数的权重配比逐渐向新增采样点靠拢，$ {a}_{n} $持续减少，将损失函数的重心逐渐向重采样数据靠拢，以此来加速网络训练的速度并提高高梯度区域的精度. G-PIRBN框架如图2所示，G-PIRBN算法见算法2.

图 2

图 2 基于残差/梯度高斯自适应采样的径向基网络框架图

Fig.2 Framework diagram of radial basis network based on residual/gradient Gaussian adaptive sampling

算法2　基于残差/梯度高斯自适应采样的径向基网络

1. 确定网络结构，包括PIRBN的最大迭代次数$ {N}_{{\mathrm{p}}} $，RBF的类型和个数，输入层空间坐标$ x\in {{\bf{R}}}_{n} $以及输出层$ u(x) $的预测值.

2. 对每个输入点进行RBF激活并加权得到函数的预测值，再通过自动微分$ u(x) $得到的各阶导数构建物理方程残差.

3. 当网络迭代次数为$ m $(判定重采样标志)的倍数时，根据残差和梯度最大的采样点集合($ {x}_{i} $和$ {x}_{k} $)确定自适应重采样区域位置.

4. 计算$ {x}_{i} $和$ {x}_{k} $处均值和协方差，依据高斯分布获得高风险点附近的重采样区域.

5. 从每个高斯区域内随机获得$ {N}_{{{x}_{i}}} $或$ {N}_{{{x}_{k}}} $个新采样点，计算该部分的损失函数记为$ {F}_{k} $.

6. 通过设置超参数$ {a}_{n} $，将获得的新损失函数与原有的损失函数进行加权处理(随着网络迭代次数的增加，权重配比逐渐向新损失函数靠拢)，使用更新后的网络进行训练迭代.

7. 重复步骤2~6直到PIRBN迭代次数达到$ {N}_{{\mathrm{p}}} $.

3. 拟合性能验证实验

通过3个高梯度偏微分方程来展示G-PIRBN的模型拟合性能，设立其他网络作为对照组，比较不同网络的训练速度和精度. 实验在采用Intel(R) Core(TM) i7-9750H CPU @ 2.60GHz的Windows11系统上进行，神经网络基于TensorFlow库建立，选择Adam优化器作为训练算法.

3.1. 非线性弹簧方程

非线性弹簧方程的初始、边界条件式为

(23)$ \begin{split}& \frac{{\text{d}}^{2}}{\text{d}{x}^{2}}u(x)+4u(x)+\sin\; (u(x))=f(x),\quad x\in [0,100];\\[-4pt]&\quad\quad u(0)=0,\;\;\frac{\text{d}}{\text{d}x}u(0)=0.\end{split} $

其中$ f(x) $为自定义函数，随$ u(x) $取值变化而更改，解析解为

(24)$ u(x)=x\sin x . $

由于非线性弹簧方程具有超长计算域、大预测值和高梯度的特征，PINN在拟合这类方程中面临严峻的数值稳定性和收敛性挑战. Bai等^[16]将神经网络的神经元变更为RBF，应用具有1 021个神经元的PIRBN，来解决模型在拟合过程中可能会遇到的高梯度区域拟合精度较低的问题. RBF的复杂性和隐藏层单一导致PIRBN训练速度缓慢，采用残差/梯度高斯分布的自适应采样来解决这个问题，残差和梯度分别获得20个重采样区域，每个高斯区域随机获得25个新采样点.

如图3所示为PINN、PIRBN、EI-Grad和G-PIRBN在相同迭代次数条件下分别求解非线性弹簧方程的结果及逐点绝对误差$\varepsilon _i $. 可以看出，G-PIRBN预测值的误差最小，拟合效果最好，逐点绝对误差平均在$ 8\times {10}^{-3} $；PINN的预测仅在$ x=0 $附近区域的分析结果一致，EI-Grad的预测在高梯度区域的拟合效果不理想；PINN无法对方程进行拟合，PIRBN和EI-Grad的在低梯度区域具有很好的拟合效果，但梯度越高的区域误差越大. 如表1所示为不同网络在不同高斯分布区域内不同重采样点数量$N_{\mathrm{p}} $情况下的均方误差MSE. 可以看出，G-PIRBN拟合结果均方误差最小.

图 3

图 3 不同网络的非线性弹簧方程拟合结果和逐点绝对误差

Fig.3 Fitting results and point-wise absolute errors of different networks for nonlinear spring equation

表 1 不同网络的非线性弹簧方程重采样点数量和均方误差

Tab.1 Number of resampling points and mean square error of different networks for nonlinear spring equation

N_p	MSE
N_p	PIRBN	EI-Grad	G-PIRBN
5×10	8.0×10⁻⁴	2.4×10⁻⁵	9.6×10⁻⁶
5×25	4.5×10⁻⁴	3.2×10⁻⁵	2.3×10⁻⁶
20×10	1.7×10⁻⁴	1.1×10⁻⁵	8.1×10⁻⁶
20×25	3.0×10⁻⁵	7.3×10⁻⁷	1.5×10⁻⁷

3.2. 波动方程

将G-PIRBN的应用扩展到二维问题上，考虑波动方程和相应的边界条件：

(25)$ \begin{split}& \left(\frac{{\partial }^{2}}{\partial {x}^{2}}-4\frac{{\partial }^{2}}{\partial {y}^{2}}\right)u(x,y)=0;\;\;x\in [0,1],y\in [0,1].\\[-4pt]&\quad\quad u(x,0)=u(x,1)=\frac{\partial }{\partial x}u(0,y)=0,\\[-2pt]&\quad\quad u(0,y)=\sin\; ({\text{π}} y)+\frac{1}{2}\sin\; (4{\text{π}} y).\end{split} $

解析解为

(26)$ u(x,y)=\cos\; (2{\text{π}} x)\sin\; ({\text{π}} y)+\frac{1}{2}\cos\; (8{\text{π}} x)\sin\; (4{\text{π}} y). $

利用具有61×61个的神经元的单层G-PIRBN来应对高梯度特征带来的挑战性. 神经元的中心均匀分布在计算域$ x\in [0.1,1.1] $、$ y\in [0.1,1.1] $内，其中初始神经元的间距为0.02，设置初始b=20，通过残差和梯度获得的高斯区域均为20个，每个区域内获得的新采样点$ {N}_{{{x}_{i}}} $或$ {N}_{{{x}_{k}}} $为25. 选择具有相同隐藏层和神经元数目的PINN和PIRBN比较模型拟合精准度. 如图4所示为不同网络的波动方程拟合结果及逐点绝对误差. 可以看出，G-PIRBN的误差最小，能够快速收敛，逐点绝对误差平均在$ 8\times {10}^{-3} $；PINN无法完成波动方程的预测；PIRBN与EI-Grad预测结果在大部分区域贴切解析解，但是在高梯度区域的误差开始不受控，PIRBN与EI-Grad无法在少量迭代次数下在高梯度区域达到收敛条件. 不同网络在不同高斯分布区域内不同重采样数量情况下的均方误差如表2所示. 可以看出，G-PIRBN拟合结果均方误差最小.

图 4

图 4 不同网络的波动方程拟合结果和逐点绝对误差

Fig.4 Fitting results and point-wise absolute errors of different networks for wave equation

表 2 不同网络的波动方程重采样点数量和均方误差

Tab.2 Number of resampling points and mean square error of different networks for wave equation

N_p	MSE
N_p	PIRBN	EI-Grad	G-PIRBN
5×10	1.8×10⁻⁴	1.9×10⁻⁵	2.9×10⁻⁶
5×25	8.8×10⁻⁵	5.2×10⁻⁶	8.2×10⁻⁷
20×10	9.8×10⁻⁶	9.8×10⁻⁷	4.4×10⁻⁷
20×25	7.5×10⁻⁶	2.7×10⁻⁷	1.1×10⁻⁸

3.3. 扩散方程

扩散方程在工程中很常见，例如流体力学^[21]和传热问题^[22]. 考虑扩散方程，初始/边界条件为

(27)$ \begin{split}&\left(\frac{\partial }{\partial t}-0.01\frac{{\partial }^{2}}{\partial {x}^{2}}\right)u(x,t)=g(x,t);\;\;x\in [5,10],\;\;t\in [5,10],\\&\quad\quad u(5,t)={b}_{1}(t),\;\;u(10,t)={b}_{2}(t),\;\;u(x,5)={b}_{3}\left(x\right).\\[-6pt]\end{split} $

其中$ g(x,t) $、$ {b}_{1}(t) $、$ {b}_{2}(t) $和$ {b}_{3}(x) $为自定的函数. 解$ u(x,t) $为

(28)$ \begin{split}u(x,t)=&\left[2\cos \left({\text{π}} x+\frac{{\text{π}} }{5}\right)+\frac{3}{2}\cos \left(2{\text{π}} x-\frac{3{\text{π}} }{5}\right)\right]\times\\& \left[2\cos \left({\text{π}} t+\frac{{\text{π}} }{5}\right)+\frac{3}{2}\cos \left(2{\text{π}} t-\frac{3{\text{π}} }{5}\right)\right].\end{split} $

利用61×61个RBF神经元的单层G-PIRBN来应对高梯度特征带来的挑战性. 中心的神经元均匀分布在域$ x\in [4.5,10.5] $、$ t\in [4.5,10.5] $内，其中神经元的间距为0.05，设置初始b=20，通过残差和梯度获得的高斯区域均为20个，每个区域内获得的新采样点$ {N}_{{{x}_{i}}} $或$ {N}_{{{x}_{k}}} $为25. 选择具有相同隐藏层和神经元数目的PINN和PIRBN比较模型拟合精准度. 如图5所示为不同网络的扩散方程拟合结果及逐点绝对误差. 可以看出，G-PIRBN能够很好地学习解决方案，逐点绝对误差平均在8×10⁻³，PINN、PIRBN和EI-Grad都无法精准地预测波动方程图像. 其中PINN收敛迅速但效果极差；PIRBN和EI-Grad虽然低频区域拟合效果较好，但在高梯度区域出现明显偏差. 不同网络在不同重采样点数量情况下的均方误差如表3所示. 可以看出，G-PIRBN拟合结果均方误差最小.

图 5

图 5 不同网络的扩散方程拟合结果和逐点绝对误差

Fig.5 Fitting results and point-wise absolute errors of different networks for diffusion equation

表 3 不同网络的扩散方程重采样点数量和均方误差

Tab.3 Number of resampling points and mean square error of different networks for diffusion equation

N_p	MSE
N_p	PIRBN	DAS-PIRBN	EI-Grad	G-PIRBN
5×10	5.7×10⁻⁴	5.3×10⁻⁵	1.8×10⁻⁵	2.3×10⁻⁶
5×25	4.3×10⁻⁵	2.4×10⁻⁵	4.8×10⁻⁶	6.2×10⁻⁷
20×10	3.2×10⁻⁵	7.2×10⁻⁶	1.2×10⁻⁶	4.2×10⁻⁷
20×25	6.6×10⁻⁶	8.6×10⁻⁷	7.5×10⁻⁸	9.3×10⁻⁹

神经元数量会影响模型拟合结果，如表4所示为G-PIRBN在不同RBF神经元数量$N_{{\mathrm{RBF}}} $下拟合不同方程的结果. 可以看出，拟合精度与神经元数量相关，RBF数量越多网络拟合精度越高. 经过系统性实验验证，统计不同网络拟合不同方程在固定迭代次数k条件下的训练平均耗时t_t，结果如表5所示. 当训练迭代次数相同时，G-PIRBN不仅比其他2种网络花费的CPU计算时间少，还提升了网络的拟合效率. 对比结果表明，G-PIRBN相对于PINN、PIRBN、DAS-PIRBN和EI-Grad在求解具有高梯度特性的偏微分方程问题上具有更高的精度与效率.

表 4 不同物理信息径向基网络在不同径向基函数神经元数量下的方程拟合均方误差

Tab.4 Equation fitting mean squared errors of physics-informed radial basis networks with varying numbers of radial basis function neurons

N_RBF	MSE
N_RBF	PIRBN	DAS-PIRBN	G-PIRBN
25×30	8.3×10⁻²	8.2×10⁻³	1.6×10⁻³
25×55	6.3×10⁻⁴	2.4×10⁻⁴	3.8×10⁻⁵
50×30	9.2×10⁻⁵	4.6×10⁻⁶	8.8×10⁻⁷
50×55	6.6×10⁻⁶	8.6×10⁻⁷	9.3×10⁻⁹

表 5 固定迭代次数下不同网络的方程求解平均耗时

Tab.5 Average time consumption for solving equations across different networks with fixed number of iterations

方程名称	k	t_t/s
方程名称	k	PINN	PIRBN	EI-Grad	G-PIRBN
非线性弹簧方程	5500	357	514	602	323
波动方程	5000	435	680	703	422
扩展方程	5000	302	464	539	285

4. 结　语

本研究提出基于残差/梯度高斯分布的自适应采样方法，并使用该方法改进物理信息径向基网络，得到可以有效地拟合具有高梯度特性偏微分方程的新型神经网络G-PIRBN. 通过计算样点的残差和梯度绝对值自主找出奇异区域，在区域内进行高斯分布式采样以加速神经网络的收敛速度并提高网络在高梯度区域的拟合精度. 与现有的自适应采样方法相比，所提方法能够根据不同的高残差或高梯度点的特性制定合适的采样密度，用更少的训练数据和计算成本获得更低的误差结果，提高网络拟合效率. 模型拟合实验结果表明，与PINN、PIRBN和EI-Grad相比，G-PIRBN在相同的迭代次数下能够在更少的时间内有效表现出方程的高梯度特征. G-PIRBN在泛化性、采样动态调节能力上还有提升空间，为了更快更好地建立模型，计划引入迁移学习，借助训练好的先验知识，进一步加快模型收敛速度，提升训练稳定性.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

VOULODIMOS A, DOULAMIS N, DOULAMIS A, et al

Deep learning for computer vision: a brief review

[J]. Computational Intelligence and Neuroscience, 2018, 2018 (1): 7068349

DOI:10.1016/bs.host.2023.01.003 [本文引用: 1]

[2]

SUN D, LIANG Y, YANG Y, et al. Research on optimization of natural language processing model based on multimodal deep learning [C]// Proceedings of the IEEE 2nd International Conference on Image Processing and Computer Applications. Shenyang: IEEE, 2024: 1358–1362.

[3]

RICHTMYER R D, MORTON K W. Difference methods for initial-value problems [M]. New York: [s.n.], 1967.

DOI:10.1016/j.ijmecsci.2024.109783 [本文引用: 1]

[4]

WANG X, YIN Z Y, WU W, et al

Neural network-augmented differentiable finite element method for boundary value problems

[J]. International Journal of Mechanical Sciences, 2025, 285: 109783

[5]

YANG C, NIU R, ZHANG P

Numerical analyses of liquid slosh by finite volume and lattice Boltzmann methods

[J]. Aerospace Science and Technology, 2021, 113: 106681

DOI:10.1016/j.ast.2021.106681 [本文引用: 1]

[6]

RAISSI M, PERDIKARIS P, KARNIADAKIS G E

Physics-informed neural networks: a deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations

[J]. Journal of Computational Physics, 2019, 378: 686- 707

DOI:10.1016/j.jcp.2018.10.045 [本文引用: 1]

[7]

MUSTAJAB A H, LYU H, RIZVI Z, et al

Physics-informed neural networks for high-frequency and multi-scale problems using transfer learning

[J]. Applied Sciences, 2024, 14 (8): 3204

DOI:10.3390/app14083204 [本文引用: 1]

[8]

RAMABATHIRAN A A, RAMACHANDRAN P

SPINN: sparse, physics-based, and partially interpretable neural networks for PDEs

[J]. Journal of Computational Physics, 2021, 445: 110600

DOI:10.1016/j.jcp.2021.110600 [本文引用: 1]

[9]

JAGTAP A D, EM KARNIADAKIS G

Extended physics-informed neural networks (XPINNs): a generalized space-time domain decomposition based deep learning framework for nonlinear partial differential equations

[J]. Communications in Computational Physics, 2025, 28 (5): 2002- 2041

DOI:10.4208/cicp.oa-2020-0164 [本文引用: 1]

[10]

DOLEAN V, HEINLEIN A, MISHRA S, et al

Multilevel domain decomposition-based architectures for physics-informed neural networks

[J]. Computer Methods in Applied Mechanics and Engineering, 2024, 429: 117116

DOI:10.1016/j.cma.2024.117116 [本文引用: 1]

[11]

LIU D, WANG Y

A Dual-Dimer method for training physics-constrained neural networks with minimax architecture

[J]. Neural Networks, 2021, 136: 112- 125

DOI:10.1016/j.neunet.2020.12.028 [本文引用: 1]

[12]

TANG K, WAN X, LIAO Q

Deep density estimation via invertible block-triangular mapping

[J]. Theoretical and Applied Mechanics Letters, 2020, 10 (3): 143- 148

DOI:10.1016/j.taml.2020.01.023 [本文引用: 1]

[13]

LIU Y, CHEN L, DING J, et al

An adaptive sampling method based on expected improvement function and residual gradient in PINNs

[J]. IEEE Access, 2024, 12: 92130- 92141

DOI:10.1109/ACCESS.2024.3422224 [本文引用: 1]

[14]

JACOT A, GABRIEL F, HONGLER C. Neural tangent kernel: convergence and generalization in neural networks (invited paper) [C]// Proceedings of the 53rd Annual ACM SIGACT Symposium on Theory of Computing. [S.l.]: ACM, 2021: 6.

[15]

SCABINI L F S, BRUNO O M

Structure and performance of fully connected neural networks: emerging complex network properties

[J]. Physica A: Statistical Mechanics and Its Applications, 2023, 615: 128585

DOI:10.1016/j.physa.2023.128585 [本文引用: 1]

[16]

BAI J, LIU G R, GUPTA A, et al

Physics-informed radial basis network (PIRBN): a local approximating neural network for solving nonlinear partial differential equations

[J]. Computer Methods in Applied Mechanics and Engineering, 2023, 415: 116290

DOI:10.1016/j.cma.2023.116290 [本文引用: 2]

[17]

BROOMHEAD D S, LOWE D

Multivariable functional interpolation and adaptive networks

[J]. Complex System, 1988, 2: 321- 355