电子产品的健康监测、诊断和预测
by Michael Pecht
July 1, 2008
预测和健康管理(PHM)是允许产品或系统在其实际应用条件下对其可靠性作评估的一种方法。估计与预计正常运行条件(即健康)的偏移或退化程度并估计(预测)电子产品的剩余寿命,这个评估可以用来看是否符合几个关键目标。这些包括:
1,对失效的高级警告; 2,通过及时维修来减少计划外的维护和维护周期长的情况。 3,通过减少检验成本、停工期和存货来减少设备寿命周期的成本; 4,改善质量符合性,并辅助现有的和未来产品的设计和逻辑支持。见注1。
随着电子产品功能复杂性增加,对产品健康的评估、缺点诊断和预测的需求逐渐增加。这对软缺点和间歇失效有特别的重要性,这在当今的电子产品中是最常见的一些失效模式。一个间歇性失效,是在短期内功能的损失且随后得到恢复的情况,可以造成“不可复现(CND)”、“重新测试合格(RTOK)”、“探测不到缺点(NFI)”、“未发现缺点(NFF)”和“未发现问题(CND)”的诊断结论。这个缺点可能不容易被预测到,而且它并不全部能复现。但是,一个间歇性失效可以是,也经常是周期性的。这也很重要,因为传统的电子产品(Mil-HDBK-217、217-PLUS、Telcordia、PRISM 和 FIDES)可靠性预测方法应永远不被使用,因为他们对预测实际寿命失效的情况不准确--他们误导性很高,并能导致质量差的设计。
PHM技术结合了传感、记录、环境的理解、操作和与性能相关的参数,来评估产品健康及健康趋势(经常是在剩余寿命的条件下)。产品健康的监测可以通过使用各种方法来实施,这些技术来感应并解释性能退化的指示性参数,如预计外数值的运行参数偏移和趋势;物理或电气退化的变化,如材料开裂、腐蚀、界面分层、电气电阻或门限电压;和寿命周期环境中的变更,如使用时间和频率、室温和湿度、振动和冲击。
进行健康监测、诊断和预测的方法
一个电子PHM的框架如图1所示。第一步涉及到实际寿命评估,其中在可靠性设计产品中使用到的设计数据、预计寿命周期条件、失效模式、机制、效力分析(FMMEA)和失效原因(PoF)模式是输入,得到的是可靠性(实际寿命)评估。根据实际寿命评估,由可能优先选择关键的失效模式和失效机制。现有的传感数据、总线监控其数据和任何的(包修内的和维修的)维护记录可以用来识别潜在的弱点,和潜在的异常条件及参数。根据这一信息,这些PHM的监控参数和传感位置可以确定。
这个缺点探测(诊断)和预测的输入是产品运行和环境条件的实时传感数据。运行条件数据可以包括保险电路(保险网络)的输出,同时也包括软性变量,如产品负载和其他性能模量。
根据传感和其他输入数据,又三种方法,包括几种方法的组合,来预测电子产品是否可以使用:1,熔断丝和保险设施的使用;2,失效前体的监测和原因;3,环境监测和损坏铸模的使用负载。然后可以进入产品寿命周期使用档案、健康并进行失效预测。
健康监测和反常情况的排除
管理程序用一种防患未然和先发制人的方式来预测失效。电子产品的健康状态通过把失效从实时数据中排除而达到,这考虑到了各种组成健康产品的操作(参数)范围和趋势。
一般来讲,一个健康的产品可从训练模式中确定出来。训练模式抓住了已知健康产品数据和提取的使用特征,来建立可接收的健康条件。然后使用这些条件来确定被监测产品是否可定性为健康。 特征提取数据可同时投入缺点算法,生成非健康或失效状态的分类和可行性,并确定适合的失效探测的标度(即,一些失效可以在纳秒时间表上探测出,而另一些退化机制可以有余产品寿命等同的失效时间表)。一个异常情况可以用趋势分析的统计方法,通过分析其失效算法进一步确定。当失效算法显示出积极的趋势或者符合失效分类,下一步就是执行失效或失败预测。
参数和缺点分离
缺点预测算法的目标是得到失效(分离参数和失效),然后再合理的时间内预测失效并预防误报和不报警。不报警可以通过失效预测算法预防,这种算法是获取健康监测数据并分析从健康状态到失效状态的转变可行性独立得出的。对这一转换可行性的评估,和失效分类,被用来识别潜在的失效前体。一个NFF时间可能不能很好地被识别“定义”为失效,但是,它仍然能通过对数据驱动方法中其状态的可行性转变作改变,因此可以被捕捉到。因此,通过结合数据驱动失效隔离和PoF,这个失效可以被分离出,并识别出造成失效的根源。
可以在PoF模式中计算出损失,以获得剩余寿命。然后PHM的信息可以被使用来维持预测和决定,这些可以最小化地减少寿命周期成本、最大化可利用性或一些其他使用功能。
分析的可靠性要求
电子行业中认为在诊断、预测技术和算法实施很重要的三个关键要求是:1,强化在线数据融合和状态的确定,排除与实际缺点不同的瞬变和假警报;2,数据分析算出来找出软缺点和其他相关时间的相互关系(如产品模式的改变);3,预测算出来跟踪电子产品的退化和预计剩余使用寿命。关于这些算法特征的条件、独立性要求在以下几段中能够有讨论。
章节关于--强化在线数据融合和与实际失效区分的瞬变和假警报状态的确定
在电子产品中的失效被分离并识别出来可能非常困难。一个在使用中发现失效的电子产品经常在随后的诊断情况中功能正常。结果是,一些功能正常的部件经常被更换掉,这造成了成本管理效力低,更糟的是,可以成为一种安全危害。 各种术语,如软缺点,CND、RTOK、NFI、NFF被用来形容这种状况。这也被定义为软缺点。造成软缺点的原因包括由于微粒辐射造成的瞬间失效、电源供应波动,因为连接松动引起的间歇性缺点,部分瑕疵、或元件退化和硬件设计差。一个软缺点同时也可以由于实验室环境不能完全复现实际使用负载情况造成,也可以由测试中焊点裂缝的自我愈合失败造成。在一些情况下,软缺点的出现说明了使用了不合适的诊断程序、或整体缺点图大于缺点覆盖面。 在原处诊断是捕捉软缺点的必要手段。在线数据融合表明了在实际运作中所有实际测量标度的可变性能分析的算法能力。同时,诊断和预测算法必须能够区分由失效引起的请款和通常非常规模式运行工艺的差别。例如,非常规的数据可以是由于工艺中外界改变或简单的由噪音、仪器和人为错误造成的自然改变表现的。 一种方法是对数据中心正常化,排除标度中的不同。必要时对这个方法作变形,使能够对标度定制并减少测量度规形成的噪音。减少和过滤技术(使用主要成分分析、连续贝叶斯过滤和回归移动平均数来精炼投射)是把数据中的噪音和极端分离的方法。 PHM的状态确定为算法能做出关于产品健康趋势的能力。数据趋势方法可以用来探测潜在的异常,并在一些情况下,排除与实际失效区分的瞬变和假警报,但是这些方法仅对与已经确定的正常(健康)状态不同的变化作识别。除非有失效数据的历史记录(产品退化和最终失效的退化图),数据趋势不足以来预测失效。在这些情况下,异常情况与趋势和失效机制/失效模式间的关系,要求用PoF方法。
章节关于—数据分析算法必须把软缺点和其他相关事件关联起来
为了把软缺点和其他相关事强关联起来,特别是瞬变失效和假错误,最好使用一个产品参数与相关产品性能特征的关联图。但关键的目标是,选择揭示各个事件利益关系的标准(如,产品性能变化)。再次强调,这需要对失效模式和机制有理解,这是性能的关连。失效机制是导致失效的物理、化学、热动力或其他工艺等。失效机制可以分两类,要么是应力过大,要么是机械使用过多(见图2)。过应力失效是由于单个的负载(应力)状况造成的,应力超出了基材强度。过分使用形成的失效时由于施加负载过多过量地使用从而累计损失造成的。在先进技术中,只能对过分使用失效机制作预测。一个方法是使用FMMEA来辅助分析。 FMME建立在理解产品要求、产品物理性能(生产工艺中的变化)、产品材料在负载下的反应(应用条件下的应力)、和在使用条件下产品对失效的感应度的基础上。FMMEA结合了寿命周期环境和运行条件、计划时间和活跃应力和潜在失效机制。FMMEA同时根据失效的表面和严重性来对失效机制进行重点分类,提供导则来确定主要运行应力和环境及运行参数,这些参数在设计中一定占用到或控制到。寿命周期图用来评估失效的可接受性。如果一定的环境和运行条件不存在、或产生很小的应力,完全取决于这些环境和运行条件的失效机制出现的几率较低。
章节关于—预测算法必须跟踪退化和预计剩余可用寿命
预测算法用到非定常德数据历史记录、提取趋势并估计在未来一定时间内功能上的值。对预估来说,时间数列、神经网络、支持传染媒介机器、马尔可夫链和参量估计是一些常用的技术。但是,PoF预估大多数情况下被要求设定失效标准并对剩余使用寿命作判断。Mathew和其他人使用基于PoF的PHM技术来对航天飞机固体火箭推助器(SRB)中的电路卡作剩余寿命评估预测。从起飞前到降落后SRB上记录的振动时间记录被和物理模式一起用来评估损失。使用SRB整个寿命周期的负载图,电路卡上的元件和结构的剩余寿命可以得到预估。确定出在未来的40次任务重不会出现一次电气失效。 Mathew et al9是根据其寿命周期内的负载对航空电子内可替换的部件作了预测。这项研究是国防部建立的项目中的一部分,用来建立美国军方的互交式供应链系统。目标是通过一扇网络的门,达成预测、无线沟通和数据库,使能够进行成本有效管理和更换电子产品。研究表明以预测为基础的维护图可以在军用电子系统中得到使用。这一方法包括LRU上埋入传感器的集成、数据传输的无线沟通、用来简化数据和损失估计的PoF算法、和把这一信息上传到网络上的方法。所示表面军方电子系统中预测的使用可以避免造成失效、可用性高、减少寿命周期成本。
预测
产品参数变化趋势的识别可以提供性能变化和/或退化的信息。时序分析技术是捕捉这种趋势的有效工具。另外一种被电子行业考虑的方法包括自回归移动平均数,自回归外生输入、自回归移动平均数与外生输入和自回归联合移动平均数。尽管时序方法在参数退化预测中表现得很好,他们在失效预测中并不适用,失效预测要求预估算法(通常为PoF)能够处理突发数据和量子化数据。
制成传播媒介机器也被使用来预估产品健康,通过使用核函数和结构风险最低化原则,SVM把 SVMs通过对核函数和结构风险低估原则的用途在时间数列预测比传统神经网络使概念化错误的一个最高界面减到最小,和通常完成更高的概念化表现。把概念化错误的上限最低化,并在时序预估中达到比传统神经网络更高的概念性能。但是,他们同时也会由于不使用PoF模式而预估失效情况面临困难。 失效前体是会帮助进行产品健康预估的性能特征。但是,在这个步骤中达到这个前体的度规非常关键。例如,针对间歇故障做的试验,显示出趋向预断方法的数据没有提供价值。但是,通过把PoF的关系嵌入到直接修改测量标度中,可作出很多观察和随后 的预测。
结论
电子行业已经开始应用基于PoF的失效情况探测技术,做出成功的诊断。这包括提取循环范围、舷梯率、停留时间和住入装载的算法,并随后把所有这些负载参数与PoF模式相关联,使能够把失效分离并诊断出来。在某些情况下,统计投射追求、特征提取和模式识别算法也被用于查出和分离出失效参量,但是主要还是实验性研究(产品放置加速老化条件下)。在这种情况下,使用PCA技术来建立投射模量、多维分布的数据集群分析技术用来作为反常现象侦查,基于MSET、SPRT和PoF的多种方法被用于进行预测。 The next steps for the prognostics community are to extend these studies and provide:诊断行业的下一步骤是进一步这些研究并提供:
- 有效的、成本有效的根源评估工具(软件),这伴随着PoF和时序PHM一起把与实际失效区分开的假警报。
- 快速的识别和诊断(软件),如结合SVM和STSA与特征提取、图形识别和PoF分析的工具来预测产品退化、故障和关键电子产品的剩余使用寿命
- 有效的诊断工具(算法)来探测并预估退化情况、故障和失效,包括瞬变失效、软缺点和偶尔的假警报时间。
- 确定能回收投资的方法和算法。
参考文献
1. Vichare, N., and Pecht, M., “Prognostics and Health Management of Electronics,” IEEE Transactions on Components and Packaging Technologies, Vol. 29, No. 1, pp. 222-229, March 2006.
2. Telcordia SR332, “Reliability Prediction Procedure (RPP) for Electronic Equipment,” 2001.
3. Wong, K. L., “What Is Wrong With the Existing Reliability Prediction Methods?,” Quality and Reliability Engineering International, Vol. 6, pp. 251-258, 1990.
4. Pecht, M., and Nash, F., “Predicting the Reliability of Electronic Equipment,” Proceedings of the IEEE, Vol. 82, No. 7, pp. 992-1004, July 1994.
5. Pecht, M., and Ramappan, V., “Are Components Still the Major Problem: A Review of Electronic System and Device Field Failure Returns,” IEEE Trans. Components, Hybrids, Manufacturing Technology, CHMT-15, pp. 1160-1164, 1992.
6. Pecht, M., Dube, M., Natishan, M., and Knowles, I., “An Evaluation of Built-In Test,” IEEE Transactions on Aerospace and Electronic Systems, Vol. 37, No. 1, pp. 266-272, January 2001.
7. Pecht, M., and Dasgupta, A., “Physics-of-Failure: An Approach to Reliable Product Development,” Journal of the Institute of Environmental Sciences, Vol. 38, pp. 30-34, 1995.
8. Mathew, S., Das, D., Osterman, M., Pecht, M., and Ferebee, R., “Prognostic Assessment of Aluminum Support Structure on a Printed Circuit Board,” International Journal of Performability Engineering, Vol. 2, No. 4, pp. 383-395, October 2006.
9. Mathew, S., Das, D., Osterman, M., Pecht, M., Ferebee, R., and Clayton, J., “Virtual Remaining Life Assessment of Electronic Hardware Subjected to Shock and Random Vibration Lifecycle Loads,” Journal of the IEST, Vol. 50, No. 1, pp 86-97, April 2007.
10. Suykens, J. A. K., Gestel, T. V., Brabanter, J. D., Moor, B. D., and Vandewalle, J., “Least Squares Support Vector Machines,” World Scientific Publishing, New Jersey, London, Singapore, 2002.
11. Muller, K. R., Smola, A. J., Ratsch, G., Scholkopf, B., and Kohlmorgen, J., “Using Support Vector Machines for Time Series Prediction.” In: B. Scholkopf, C. J. C. Burges and A. J. Smola, Eds., Advances in Kernel Methods—Support Vector Learning, MIT Press, Cambridge, Mass., pp. 243–254, 1999.
12. Vichare, N., and Pecht, M., “Prognostics and Health Management of Electronics,” IEEE Transactions on Components and Packaging Technologies, Vol. 29, No. 1, pp. 222-229, March 2006.
|