2. 66442部队, 山西 阳泉 045233;
3. 军械工程学院 科研部, 河北 石家庄 050003
2. Unit 66442, Yangquan 045233, China;
3. Research Department, Ordnance Engineering College, Shijiazhuang 050003, China
故障注入是测试性验证试验的一项关键技术, 是模拟出装备工作中可能发生的故障信号并加载到指定位置[1-2].相比于自然状态下的统计试验, 基于故障注入可以快速、全面地模拟装备可能发生的故障, 并作为备选试验样本.国内外无论是针对外场机内测试还是内场测试设备, 都非常强调基于故障注入的测试性验证试验[2].
外场可更换模块最初由美军的“宝石台”、“宝石柱”计划发展而来, 是新一代航空电子系统和模块化军用装备电子系统的核心备件[3].LRM本身是基于大规模集成电路和超高速集成电路, 具有完备的封装结构, 在功能上具有相对独立性的通用模块, 具有集成度高、开放性好、全寿命成本低等优点.面对LRM进行基于故障注入的测试性试验时, 一方面, 由于严密的封装和紧凑的设计, 存在故障注入器访问深度不够导致的位置不可访问故障模式和会引起对象系统损坏的故障模式, 无法直接实现注入的问题;另一方面, 由于高度集成的复杂电路中, 各个功能单元之间的传递和耦合关系, 使得故障出现的形式更复杂;这些问题会降低故障注入的数量和有效性, 可能造成试验样本的不足, 难以实现对测试性指标充分的验证[4].基于此, 李天梅等[5-7]对位置不可访问的的故障注入问题和故障模型进行专门的研究, 提出基于故障传递特性的等效注入方法和故障模拟的七元组、五元组模型等.上述研究利用故障行为的等效性, 实现了对可注入样本的扩大和对故障信号的精确描述.但是, 上述研究没有考虑装备层次之间的故障传递特性, 等效注入的手段可以进一步扩展, 故障模型稍显抽象、不易复现.
本文基于层次相关性建模, 进一步分析故障的注入及传播的特性.综合LRM的结构特点和故障传播的模型, 提出适用于LRM体系的故障注入方法和等效注入策略, 并通过实例验证该方法的可行性.
1 基于相关性建模的故障传播分析 1.1 故障注入的有效性判据故障注入的目的是通过故障信号的加载, 模拟装备实际工作时产生的故障.故障注入是否有效主要取决于以下2个因素:1) 是否能够加载到正确的位置, 即采用硬件注入时物理位置上是否能够访问, 采用软件注入时在指定位置是否可读写.2) 正确位置上能否准确注入.所谓准确注入表示能否实现实际工作时故障的行为或装备的状态.李天梅等[5]以状态空间的模型对故障注入的有效性进行描述[5], 如图 1所示.
![]() |
图 1 故障注入的状态空间描述 Fig. 1 State space description of fault injection |
图 1中, 最小完备检测/隔离状态集表示对于某一具体的故障模式, 可以正确地检测/隔离故障发生的最小状态集;若故障注入之后的状态空间可以包含最小完备检测/隔离状态集, 则认为对该故障模式的注入是有效的.为了衡量故障注入的有效性, 李天梅等[5]定义了故障样本注入率(fault sample injection rate, FSIR), 用下式的数学模型[5]表达:
${R_{{\rm{FSI}}}} = {N_{{\rm{IF}}}}/{N_{\rm{F}}} \times 100\% .$ | (1) |
式中:RFSI为故障样本注入率, NIF为有效注入的样本量, NF为试验选取的故障样本量.RFSI=1是最希望得到的理想注入结果.综上所述, 故障注入的有效性取决于加载故障信号之后装备的状态空间.若要得到较高的故障注入率, 则故障注入与状态空间的传播关系分析非常重要.
1.2 基于层次相关性模型的故障行为分析LRM属于模块化、集成化设计的复杂电子设备, 集成化设计增加了测试诊断的难度, 模块化体现了新一代装备设计的层次性以及装备两级维修保障体制中不同维修级别测试性评估指标的特点.比如:在进行换件维修的部队级, 故障检测的层次要深入到故障模式级, 隔离的层次在可更换模块级.需要综合考虑故障注入的有效性和LRM体系下装备两级维修特点.在这两方面, 吕晓明等[8-10]研究层次化的系统测试与诊断策略;梁爽等[11]融合了相关性模型的优势, 对故障传播性质进行了深入的分析.这些研究对故障注入与装备状态空间的关系分析有借鉴意义[8-11].
首先对LRM进行层次相关性建模, 原理如图 2所示.
![]() |
图 2 LRM的层次相关性建模 Fig. 2 Hierarchical correlation modeling of LRM |
模型中的节点可以是故障模式, 也可以是功能电路或者分系统等, 这取决于节点所处的层次及其描述的对象.每一个节点输入输出端可以体现装备的状态, 每个故障模式发生都会造成输出端之后状态的变化, 这些变化可能会被后级的容错机制消除, 也可能会导致后级的新的故障模式或传递到更高的层次.故障注入是为了在确定的层次里面, 模拟出故障发生时出现的这种状态的变化.下面, 根据层次相关性模型对故障行为有关的概念进行定义.
定义1 故障模式集F={F1, F2, …, FM}表示受试对象中所有的故障模式[5].
定义2 待注入故障模式集FI={FI1, FI2, …, FIm}表示经样本选取后待注入的故障样本中包含的故障模式, 一般FI⊆F, m≤M [5].
定义3 状态空间向量VSSa=[VSSa1, VSSa2, …, VSSan]表示装备的第a层存在的n个状态.
定义4 故障-状态相关性矩阵CFS=[cij]m×n.其中, cij=0表示故障模式Fi发生不导致状态参数SSj发生异常, cij=1表示故障模式Fi发生导致状态参数SSj发生异常.Fi可以来自集合F或者集合FI.
定义5 故障行为向量FBi是矩阵CFS的任意一行i中所有元素组成的行向量, 表示了故障Fi发生时造成的状态空间.故障注入需要模拟这样的状态空间.
定义6 状态层次相关性矩阵HCSS=[hij]m×n.高一层次的状态参数可以由低一层次的状态参数线性表示.hij=1表示高层次状态参数SSi发生异常时, 低层次状态参数SSj恰好发生异常;hij=0表示高层次状态参数SSi发生异常时, 低层次状态参数SSj不发生异常.
定义7 状态层次传播向量HCi是矩阵HCSS的任意一行i中所有元素组成的行向量, 也是较低层次中的一组状态空间向量, 表示了故障发生的状态空间在受试对象不同层次间的传递关系.
通过上述定义和分析, 可以实现对故障发生后状态空间及传播特性的量化, 即对故障行为的准确描述.
1.3 基于相关性矩阵的故障等效性分析在基于多信号流图建模的测试性分析中, 经常采用测试-故障依赖矩阵分析隐藏故障、冒充故障以及模糊组等[12-13].测试点测试的信息是受试对象的一部分状态参数, 冒充故障是故障之间在被测试的状态空间上经一定运算后得到了相同的行为向量.依据这种思想, 对故障的等效性进行分析.
定义8 行为等效故障.在确定的层次a上, 若矩阵CFS中的行为向量满足下式所示的关系:
${\mathit{\boldsymbol{F}}_{{{\rm{B}}_i}}} = {\mathit{\boldsymbol{F}}_{{{\rm{B}}_j}}} + \cdots + {\mathit{\boldsymbol{F}}_{{{\rm{B}}_k}}};i、j、k = 1,2, \ldots ,m.$ | (2) |
认为故障Fi与Fj, …, Fk同时发生的行为等效.与故障Fi行为等效的故障称为Fi的行为等效故障集.
对于不同层次之间的等效关系, 可以依据状态层次传播向量进行分析.
定义9 状态-故障等效.在确定层次a上, 一确定的状态空间向量VSSam与行为状态向量之间满足下式所示的关系:
${\mathit{\boldsymbol{V}}_{{\rm{S}}{{\rm{S}}_{am}}}} = {\mathit{\boldsymbol{F}}_{{{\rm{B}}_i}}} + \cdots + {\mathit{\boldsymbol{F}}_{{{\rm{B}}_j}}};i、j = 1,2, \ldots ,m.$ | (3) |
认为该状态VSSa与故障Fi, …, Fj同时发生行为等效, 即{Fi, ∪…∪, Fj}称为VSSa的行为等效故障集.
假设在较高的层次b上故障Fi的行为向量为FBbi, 导致VSSb出现变化, 构建与较低层次a之间的HCSS矩阵.对于VSSb中每个异常变化的状态参数, 找出各自的传播向量HCi, 这些传播向量均为a层中的某一确定的VSSa, 按式(3) 求取的这些状态空间向量的所有行为等效故障集之和与Fi等效.如图 3所示为状态空间中各向量集的关系.
![]() |
图 3 状态空间中各向量集关系 Fig. 3 Relation of vector sets in state space |
通过对装备状态空间中故障行为及其等效性的分析可知, 在指定的层次对装备的状态参数进行测试时, 可以通过状态参数的传播关系和行为等效故障集对一些故障模式实施等效模拟.
2 针对LRM的故障注入 2.1 故障信号的模拟与加载
![]() |
图 4 故障注入基本原理 Fig. 4 Schematic of fault injection |
在进行故障注入时, 根据测试性验证试验方案确定的故障样本, 模拟出这些故障并通过软件或硬件的方式加载到指定位置.成功的故障注入须满足故障模拟准确、加载位置可访问以及注入后状态空间不小于最小完备检测/隔离集3个条件[5-6].
故障信号的模拟首先要建立基本的故障模型, 利用一系列特征参数对模型进行描述, 最后通过软件或硬件实现.信号是建立故障注入系统和测试诊断信息之间相关性模型的基本要素, 对于每个信号, 基本特性信息如图 5所示.
![]() |
图 5 信号的基本特性信息 Fig. 5 Basic characteristic information of signal |
为了实现准确的故障注入, 提出基于信号模型的故障模拟方式.建立基于信号基本特性信息的故障模型, 如下所示:
$F = I[f({S_{\rm{a}}},{S_{\rm{t}}},{S_{\rm{p}}},{S_{\rm{j}}}),L,{\mathit{\boldsymbol{F}}_{\rm{B}}}].$ | (4) |
式中:f(Sa, St, Sp, Sj)表示故障信号的基本特性, 即故障注入器须模拟的信号部分, 其中Sa表示故障信号作用, St表示故障信号类型, Sp表示故障信号参数, Sj表示连接关系, 这些特性按照图 6进行描述;L表示故障注入点;FB为故障行为向量, 用于表征和检验故障模拟的准确性.对一个确定的故障样本实施模拟时, 按照图 6将式(4) 的各数据代入, 可以复现故障信号.
![]() |
图 6 故障信号模拟 Fig. 6 Fault signal simulation |
故障信号的加载方式一般有插拔式、探针式、基于转接板以及基于系统总线4种形式.LRM的电路是小型化、高度集成的, 这种结构特点会导致电路上普遍存在位置不可访问的故障注入点[4, 15-16], 尤其是物理上对插拔式和探针式等方式的限制很大, 因此, 故障信号的加载须以总线注入为主.总线注入有局限, 对于不能通过总线方式注入的, 还需使用其他手段尽可能实施注入.
2.2 位置不可访问的故障等效注入因为普遍存在的位置不可访问注入点, 穷尽注入故障是不现实的.必须考虑位置不可访问点的故障等效注入.假设待注入故障模式集FI={FI1, FI2, …, FIm}中, 有k个样本加载位置可访问, 其他m-k个样本因为封装、干涉或破坏性等因素不可访问, 无法实施直接注入;若只注入上述k个样本, 则会导致受试产品的状态空间小于最小检测/隔离集.在这种情况下, 增加可注入样本的等效注入方法如下.
1) 建立受试产品的层次相关性模型, 确定检测/隔离试验的层次l1.
2) 根据待注入故障模式集FI和模型, 求出故障-状态相关性矩阵CFS, 并找出每个故障样本的故障行为向量FBi.
3) 建立基于信号基本特性的故障模型.
4) 对不能直接注入的故障Fi, 按照式(2) 在l1层中寻找行为等效故障集.
5) 若在l1层没有找到行为等效故障集, 则构建l1层上行为向量FBi中每个取值为1的状态参数与低一级的l2层状态参数之间的HCSS矩阵, 找出各自的传播HCi, 按式(3) 寻找l2层中的行为等效故障集.
6) 若步骤5) 找到的行为等效故障集不可直接注入, 则重复步骤4)、5), 在更低一级寻找.
综上所述, 得到面向LRM的故障注入方法, 流程如图 7所示.
![]() |
图 7 面向LRM的故障注入流程 Fig. 7 Fault injection progress for LRM |
以RS422总线体系下的LRM模块A作为受试对象.模块A是一个控制执行系统的核心, 用以实现与上下级计算机的数据传递和信息交换, 完成整个控制执行过程的逻辑关系处理、状态控制和监测.模块A的功能框图如图 8所示.
![]() |
图 8 模块A的功能框图 Fig. 8 Function block diagram of module A |
电源支持单元将输入的大电压直流电源转换为各功能单元工作所需的+5 V、+12 V和-12 V电源;处理单元有一处理器, 可以实现数据、逻辑关系处理和状态控制;A/D转换功能单元、异步通讯单元和同步通讯单元为模块支持单元, 对处理器和BIT电路的工作提供支持与实现作用.模块A中待注入的故障样本量有53个, 包含33个故障模式.
3.1.2 故障注入设备以基于RS422总线的故障注入设备为主, 其他故障注入设备为辅.总线注入设备作为一个转发装置, 串接进RS422总线中.根据控制指令要求, 对总线发送端发出的正常数据信息注入物理层、电气层或协议层故障, 并将带有故障特征的数据信息发送出去, 以达到RS422总线故障注入的目的.该设备可注入的故障类型如表 1所示.
![]() |
表 1 故障注入设备功能 Table 1 Function of fault injection equipment |
对于总线难以模拟且物理可直接访问的硬件故障等, 采用其他方式实施故障注入.
3.2 受试对象故障传播分析按照图 2建立受试对象的层次相关性模型;按定义4求出待注入故障模式集的故障-状态相关性矩阵;需要向低一层次寻找行为等效故障集时, 按定义6构建状态层次相关性矩阵.相关性矩阵可以根据故障树获取[17-20].以A/D转换单元为例, 层次相关性模型如图 9所示, 故障树如图 10所示.根据层次相关性分析, 可以得到A/D转换单元故障模式层级的CFS矩阵, 如下所示:
![]() |
图 9 受试对象层次相关性模型 Fig. 9 Hierarchical correlation model of subjects |
![]() |
图 10 A/D转换单元故障树 Fig. 10 Fault tree of A/D conversion unit |
$\mathit{\boldsymbol{C}}_{{\rm{FS}}}^{{\rm{AD}}}{\rm{ = }}\left[ {\begin{array}{*{20}{c}} 0 & 1 & 0 & 1\\ 0 & 0 & 1 & 1\\ 1 & 1 & 1 & 1\\ 0 & 0 & 0 & 1\\ 0 & 1 & 1 & 1 \end{array}} \right].$ | (5) |
可以得到每个故障模式的故障行为向量.显然, F5存在行为等效故障集{F1∪F2}, 对于功能单元层级中造成模拟输出与output5之间异常的故障模式, 在A/D转换单元的故障模式层级中存在等效故障模式集的一个子集{F3}.
同理, 可以在功能单元级、LRM级求得故障-状态相关性矩阵以及受试对象的层次相关性矩阵.
3.3 故障注入试验按图 7所示的流程, 对模块A的53个故障样本实施故障注入试验.以A/D转换单元为例, 按式(4) 得到的基于信号基本特性信息的故障模型如表 2所示.
![]() |
表 2 故障模型 Table 2 Failure model |
对模块A进行故障注入, 采用基于层次相关性模型的等效注入方法, 扩展可实现的故障注入样本, 得到如表 3和图 11所示的试验结果.表 3中,()表示采用等效注入手段后成功扩展的样本数量.图 11中, 每个坐标维分别表示各功能单元中成功注入的故障样本数, 用5维图形表征整体的故障成功注入样本数变化情况.
![]() |
表 3 故障注入试验结果 Table 3 Results of fault injection test |
![]() |
图 11 成功注入样本数对比 Fig. 11 Number contrast of samples successfully injected |
1) 由表 2可以看出:采用基于信号模型的故障模拟方法所构建的信号模型不仅可以全面准确地复现故障信号的要素, 而且可以很好地体现故障的行为, 为等效注入提供依据.
2) 由表 3可以看出:由于LRM中电路的复杂性以及高度集成化的设计, 采用总线进行故障注入的故障注入率为84.91%, 故障注入的有效性欠佳, 容易导致故障注入后状态空间小于最小检测/隔离状态集.
3) 综合表 3和图 11可以看出:采用提出的等效注入策略之后, 5维图形全面扩大, 对于每一个存在位置不可访问的功能单元, 都可以通过故障的行为等效扩充可注入的故障样本.模块A中共扩充了7个故障样本, 将故障注入率提高了13.20%, 大大提升了故障注入的有效性.
4 结论(1) 该方法在建模阶段通过基于层次相关性模型的故障传播分析, 可以在进行具体的检测/隔离试验时, 得到层次内、层次间故障行为之间的关系.
(2) 在故障信号模拟阶段, 可以给需要模拟的故障信号提供全面、准确的要素, 并且能够与层次相关性模型很好地契合, 体现故障行为.
(3) 采用该方法可以有效地挖掘现有故障注入手段的潜力, 通过行为等效的注入测量大幅度扩充可注入的故障样本量, 在一定程度上解决了面向LRM进行故障注入试验时故障注入不充分的问题.
若要彻底解决注入不充分的问题, 则需要在故障注入设备的访问深度、故障信号模拟上实现技术突破.
[1] | CLARK J A, PRADHAN D K. Fault injection[J]. Computer, 1995, 28(6): 47–56. DOI:10.1109/2.386985 |
[2] | 石君友. 测试性设计分析与验证[M]. 北京: 国防工业出版社, 2011: 276-289. |
[3] | MIL-STD-1389D. Design requirement for standard electronics modules [S]. Washington. DC: U.S. Government Printing Office, 1989: 1-14. |
[4] |
陈然, 连光耀, 张西山, 等. 外场可更换模块体系下测试性验证试验发展研究[J].
计算机测量与控制, 2016, 24(2): 1–4.
CHEN Ran, LIAN Guang-yao, ZHANG Xi-shan, et al. Research on the developments of the testability verification test[J]. Computer Measurement and Controls, 2016, 24(2): 1–4. |
[5] |
李天梅, 胡昌华, 周鑫. 基于故障传递特性的位置不可访问故障注入方法[J].
航空学报, 2011, 32(12): 2277–2286.
LI Tian-mei, HU Chang-hua, ZHOU Xin. Fault injection method resulting from inaccessible location fault based on fault propagation characteristics[J]. Acta Aeronautica Et Astronautica Sinica, 2011, 32(12): 2277–2286. |
[6] |
李天梅, 邱静, 刘冠军. 测试性模拟故障注入试验中的故障模型研究[J].
中国机械工程, 2009, 20(16): 1923–1927.
LI Tian-mei, QIU Jing, LIU Guan-jun. Research on fault model technology in testability simulation-based fault injection experiment[J]. China Mechanical Engineering, 2009, 20(16): 1923–1927. DOI:10.3321/j.issn:1004-132X.2009.16.008 |
[7] |
李天梅. 装备测试性验证试验优化设计与综合评估方法研究[D]. 长沙: 国防科学技术大学, 2010: 85.
LI Tian-mei. Research on optimization design and integrated evaluation of testability verification test for equipments [D]. Changsha: National University of Defense Technology, 2010: 85. |
[8] |
吕晓明, 黄考利, 连光耀. 基于多信号流图的分层系统测试性建模与分析[J].
北京航空航天大学学报, 2011, 37(9): 1151–1155.
LV Xiao-ming, HUANG Kao-li, LIAN Guang-yao. Modeling and analyzing for testability of hierarchy system based on multi-signal flow graph model[J]. Journal of Beijing University of Aeronautics and Astronautics, 2011, 37(9): 1151–1155. |
[9] |
尹园威, 尚朝轩, 马彦恒, 等. 层次测试性模型的评估方法[J].
北京航空航天大学学报, 2015, 41(1): 90–95.
YIN Yuan-wei, SHANG Chao-xuan, MA Yan-heng, et al. Method of testability evaluation using hierarchical testability model[J]. Journal of Beijing University of Aeronautics and Astronautics, 2015, 41(1): 90–95. |
[10] |
谭晓栋, 罗建禄, 李庆, 等. 机械系统的故障演化测试性建模及预计[J].
浙江大学学报:工学版, 2016, 50(3): 442–448.
TAN Xiao-dong, LUO Jian-lu, LI Qing, et al. Fault evolution testability modeling and prediction for mechanical systems[J]. Journal of Zhejiang University: Engineering Science, 2016, 50(3): 442–448. |
[11] |
梁爽, 于劲松, 唐荻音, 等. 基于多信号流图与分支定界算法的故障诊断[J].
北京航空航天大学学报, 2016(1): 180–186.
LIANG Shuang, YU Jin-song, TANG Di-yin, et al. Research on fault diagnosis based on multi-signal flow graph and branch-and-bound algorithm[J]. Journal of Beijing University of Aeronautics and Astronauticss, 2016(1): 180–186. |
[12] |
王宝龙, 黄考利, 马立元, 等. 基于依赖矩阵的测试性分析[J].
计算机测量与控制, 2011, 19(6): 1260–1262.
WANG Bao-long, HUANG Kao-li, MA Li-yuan, et al. Dependency matrix based testability analysis[J]. Computer Measurement and Control, 2011, 19(6): 1260–1262. |
[13] | NASIRUZZAMAN A B M, POTA H R. Bus dependency matrix of electrical power systems[J]. International Journal of Electrical Power and Energy Systems, 2014, 56(56): 33–41. |
[14] |
徐萍, 康锐. 测试性试验验证中的故障注入系统框架研究[J].
测控技术, 2004, 23(8): 12–14.
XU Ping, KANG Rui. Research of fault injection system framework in testability experimental validation[J]. Measurement and Control Technology, 2004, 23(8): 12–14. |
[15] | PITCHAMMAL R, SARALA S. A blue print for the future electronic warfare suite development[J]. Defence Science Journal, 2013, 63(2): 192–197. DOI:10.14429/dsj |
[16] | GESS J, BHAVANI S, JOHNSON R W. Thermalresistance and PIV characterization of a line-replaceable compact liquid-cooled server module for high performance computing platforms[J]. Circulation Research, 2014, 49(4): 912–922. |
[17] |
闫鹏程, 黄鑫, 连光耀, 等. 基于相关矩阵的动力传动系统故障诊断多类传感器优化布置方法研究[J].
计算机测量与控制, 2012, 20(7): 1753–1756.
YAN Peng-cheng, HUANG Xin, LIAN Guang-yao, et al. Research on multi-class sensor placement optimization method for fault diagnosis of mechanical power and transmission system based on fault-sensor dependence matrix[J]. Computer Measurement and Control, 2012, 20(7): 1753–1756. |
[18] | 邱静. 装备测试性建模与设计技术[M]. 北京: 科学出版社, 2012: 139-149. |
[19] |
常庆, 陈建辉, 邱鹏. FTA在故障注入系统中的应用研究[J].
仪表技术, 2007(12): 51–53.
CHANG Qing, CHEN Jian-hui, QIU Peng. Application of FTA in fault injection system[J]. Instrumentation Technology, 2007(12): 51–53. DOI:10.3969/j.issn.1006-2394.2007.12.020 |
[20] | HONG J S, KOO H Y, LIE C H. Computation of joint reliability importance of two gate events in a fault tree[J]. Reliability Engineering and System Safety, 2000, 68(1): 1–5. DOI:10.1016/S0951-8320(99)00079-4 |