PHM建模方法论之「数据特征提取」

SAIJIN 2022-12-11 发布于北京

展开全文

PHM建模方法论包括6大步骤，分别是数据采集、数据预处理、特征提取、模型建立、预测与诊断以及可视化。

数据特征提取步骤是整个过程的第3步，目的是通过采用合适的数据分析方法，从原始数据中提取与建模相关的有效特征来建立模型。

一、特征提取

常用的特征提取方法，包括时域特征提取，频域特征提取，以及时频域特征提取。

时域特征提取通常包括的参数较多，比如有RMS（有效值）、峰峰值、峭度、裕度、歪度、均值、均方根、脉冲因数、波形因数、波峰因数等等。

上图展示了4种不同健康条件下轴承的振动信号。从这4个图里边我们可以看出，轴承的健康程度不同，振动信号波形的幅值也不相同，并且波形的特征也不相同。通常来讲，当轴承出现磨损以后，振动信号的峰峰值幅值有效值，以及峭度值都会增大。

上图展示了柴油机4种不同健康状态下，振动信号的特征参数。从这4张图里边我们也可以看出来，不同状态下所对应的特征参数也是存在一定的差异。

频域特征提取主要包括频带能量提取和特征频率提取。

所谓频带能量提取是指，在频谱内指定的频段内提取所对应的能量。特征频率提取是指在特定的频率点提取该点锁定的幅值。频带能量提取通常会在FFT频谱或功率谱里边来进行。以FFT频谱为例，当要提取某一个频段内所对应的能量时，可以把该频段内所有的幅值进行相加，来作为该频段内所对应的能量。

以滚动轴承为例，当轴承出现磨损时，通常会在频谱中出现共振频带频率簇，并且在包络谱中出现轴承故障特征频率。如上图所示，磨损的轴承会在4000-8000Hz频段内出现一个共振频带，因此，可以将该频段所对应的能量作为区分发电机轴承磨损和正常的一个特征参数。

另外，对共振频带进行解调后可以得到包络谱，通过包络谱可以清晰地看到，轴承对应的故障特征频率。因此，可以把特征频率作为特征参数，然后提取特征频率所对应的幅值。

常用的时频域分析提取方法包括短时傅里叶变换（STFT）和小波分析。时频域分析特别适用于分析非平稳信号，然后针对非平稳信号的特征提取可以考虑时频域分析。

时频域分析的主要优点是可以在时间、频率以及幅值三个维度来观察信号的特征。

上图是某个典型非平稳信号的STFT结果。从图中我们可以清晰地看到，在E1、E2、E3、E4这4个位置出现了能量比较集中的区域，而且对应的频率以及时刻均不相同。因此，可以把这4个区域所对应的能量作为该信号的一个特征，用于后续分析，而4个区域的能量则可以通过幅值相加进行对应。

另外，小波分析也是时频域分析的一种常用方法。不同于短时傅里叶变换，小波分析所采用的基函数是一种幅值衰减、可伸缩、可平移的小波基，而短时傅里叶变换是基于FFT来进行的，而FFT基数函数是一种无限长的正弦函数。所以说通常情况下，小波分析要优于短时傅里叶变换，但小波分析也有自身的一些缺点。

上方左、右两图分别采用Cmor3-3小波和Db8小波对齿轮箱高速端进行振动分析，对比两图可以发现，采用不同的小波，对最后的分析结果会产生较大的影响。

那么，在实际中应如何去选择小波基呢？一个是可以通过经验的方法；另外也可以多尝试几种小波，选择分析效果最好的一种。

二、特征选择

特征选择的目的是提升模型输入与建模目标的相关性并降低冗余度，避免“维度灾难”，同时为后续数据处理提供更好的理解。特征选择还有助于减少传感器的安装数量，比如，当评估轴承的健康状态时，若振动特征更能够体现轴承状态，可以只增加振动传感器，而不选择温度或其他类型的传感器。此外，通过特征选择还可以提高算法的计算效率。

特征选择的常用方法：