分享

高阶统计量在EEG信号处理中的应用

 思影科技 2021-04-05
       脑电图(Electroencephalography, EEG)是一种非侵入性的电生理监测技术,它使用电极从头皮记录大脑的电活动。EEG不仅是诊断影响大脑的疾病和障碍的重要工具,而且有助于我们更好地了解大脑的活动和结构。EEG记录是包含各种噪声和伪迹的微弱、非线性和非平稳信号因此,为了分析它们,需要先进的信号处理技术。二阶统计特征通常足以分析大多数基本信号。然而,高阶统计特征具有在二阶中缺失的特征是对分析更复杂的信号(EEG)非常有益的特征。本文的主要目的是全面介绍高阶统计量或谱(higher order statistics /spectra, HOS)EEG信号处理中的应用。因此,我们首先总结了EEG分析的以往研究,然后对HOS进行了简要的数学描述。然后介绍了高阶统计量的相关特征及其在EEG分析中的应用。然后将这些应用分为三类,每一类都用先前研究的例子进行了深入探讨。最后,我们在文献调查的基础上提出了一些具体的建议,并讨论了该领域未来可能的发展方向。本文发表在IEEE REVIEWS IN BIOMEDICAL ENGINEERING杂志。(可添加微信号siyingyxf18983979082获取原文及补充材料)。

关键词EEG、高阶统计量/(HOS)、峰度(Kurtosis)、双谱(Bispectrum)、小波变换、独立成分分析( Independent Component AnalysisICA)
 
1. 介绍
EEG数据是非线性、非高斯和非平稳的。每个头皮电极对应于大脑的一个特定区域。目前,没有电极位置的标准;最接近它的是国际10-20系统,如图1所示。

1 国际10-20电极位置系统

然而,由于信号的来源是大脑的特定部分,放置在头皮上的电极只是对真实来源的观察。因此,需要几个预处理步骤,如独立成分分析(independent component analysis, ICA)来找到实际的源,并减少噪声和伪迹。EEG信号通常根据其波型分为六大类:delta, theta, alpha, beta, gamma mu 波。信号振幅约为10-100μV,频率约在1-100Hz的范围内,采样频率通常大于200Hz,以满足奈奎斯特采样标准。
基于EEG信号处理领域的研究工作可以根据应用和方法分为两个主要领域。第一个领域的重点是使用EEG信号进行诊断;在这一领域,目标是确定患者是否有特定的神经疾病、神奇紊乱或损伤。这一领域的第一部分通常涉及从背景和正常的EEG信号中提取特征,以根据现有的数据集将病人归类为真正的阳性或真正的阴性。该领域的下一部分试图在病人被归类为真正阳性后发现疾病的进展。EEG信号分析背景如图2所示。图3显示了从BCI数据集III15个通道获取的20EEG信号。

2 EEG信号分类一般流程

3 多通道EEG信号实例

第二个领域的目标是EEG信号的每个通道中提取一个成分(它是不同神经成分、伪迹和噪声的混合),对应于特定的身体、心理或运动事件;这些单一成分称为事件相关电位(event-related potentials, ERP)。然而,必须考虑到,这一领域的许多工作可能不属于两个领域或者同时属于两个领域,比如伪迹去除或使用患者的ERP特征,而不是EEG进行分类。ERP的重点是检测和提取由特定事件引起的单一成分,而EEG信号分析或处理的重点是提取可靠的特征。本研究所探讨的方法来自第一个领域,即EEG信号分析;在这次调查中,我们将不讨论ERP分析。
该领域最常用的特征之一是在许多信号处理应用中使用的功率谱,但由于EEG信号的非线性和随机性,需要对其他特征进行分析。使用二阶统计的先决条件是系统是最小相位,且噪声是高斯的。然而,在实践中的信号可能并不总是符合这些标准。针对二阶统计量无法求解的问题,提出了HOS方法。HOS(也可简称HOSA)具有分析非高斯过程的能力,并抵抗高斯噪声,还包括在功率谱分析中丢失的相位信息。HOS作为一种信号处理工具已被应用于不同的领域,如等离子体分析、振荡器的研究和纹理表面方向的估计。它还以其在天文学中去除斑点噪声的应用而闻名,并被用于恢复受大气湍流影响的图像。将HOS分析方法应用于低信噪比的弱信号时,取得了较好的效果。高斯信号在高阶域中消失。因此,HOS特征也可以用作非高斯性的度量,并将非高斯源从混合信号中分离。这些特征也可用于非高斯信号的分类。

4 15个通道EEG信号的三维图形
D. SubhaM. R. Lakshmi等提出的调查中,已经解释了不同的EEG信号处理方法。因此,在本文中,我们将重点放在更全面地描述HOS及其在EEG分析和数学中的应用。我们调查的流程包括使用关键字对所有主要数据库进行详尽的文献搜索,然后对累积的参考资料进行过滤,以获得每个涵盖领域中最具开创性或第一次创新的工作。对这些选定的论文进行了审查和引用,而未列入的其他论文则列在书目中。在第二节中,简要讨论了以往在EEG分析和建模方面的工作。在第三节中,提供了HOS的数学描述、以前的工作和算法以及它的不同特征和应用。在第四节中,简要介绍了在EEG分析的不同领域中使用HOS特征进行的先前研究。在第五节中,讨论了这项调查结果的结果,并提出了一些具体的建议,以及在HOSEEG信号分析中的应用中可能的未来方向。最后,第六节给出了结论。
 
2.EEG信号分析
人脑不能作为一个完全确定的系统,因为它能够创造新的东西。它也不是一个完整的随机系统,因为它有能力学习和重复精确的思想和行动序列。这种悖论的存在是由于人脑的非线性性质和确定性混沌。这是分析大脑信号被证明是极其困难的原因之一。图4是图3EEG信号三维图形表示。呈现3D版本信号的原因是观察信道之间的相关性。这种相关性的存在解释了为什么定位是预处理的一个重要组成部分。该EEG信号将作为本文示例中的测试样本。
根据T. K. Rao等提出的脑机接口(brain-computer interfacing, BCI)包括四个主要阶段:信号采集,信号预处理,信号分类和计算机交互。第一阶段或信号采集涉及记录信号的方法,例如EEG,功能性磁共振成像,近红外光谱和脑磁图。对于EEG信号分析,第二阶段或预处理的目标是从第一阶段的原始输出中得到干净的信号。信号预处理也可以说是信号增强可以包括几个步骤,如伪迹去除和降噪。有许多类型的伪迹,如眨眼、眼睛运动、心跳、肌肉运动和电源线干扰。伪迹去除可以使用不同的算法进行,其中最重要的是:ICA、典型相关分析(canonical correlation analysis, CCA)、公共平均参考(common average referencing, CAR)、表面拉普拉斯(surface LaplaCian, LA)、主成分分析(principal component analysis, PCA)、共空间模式(common spatial patterns, CSP)和自适应滤波。在此阶段中将创建干净的数据集。第三阶段是信号分类,其中干净信号根据几种显著特征被分类为不同的类别。特征提取、特征选择、降维和分类是这一阶段的各个步骤。在第四阶段,这些分类信号将被用于所需的应用。
       研究人员已经在许多不同的领域使用了EEG分析。在医学上,它有各种各样的应用,从检测脑损伤和疾病、疼痛程度、麻醉深度测量到健忘和记忆丧失。然而,医学并不是EEG唯一的领域,另一个受益的领域是机器人领域。基于EEG的脑控制移动机器人可用于改善许多残疾人的生活条件。研究人员和公司已经使用这些方法来制造EEG控制的轮椅和假肢。还有一些头带可以收集EEG数据,将它们转换为简单的命令,让人们用他们的思想移动预定的物体,类似于科幻电影中的做法;甚至是游戏行业的一些公司也在研究EEG信号,以便在未来制作大脑控制的虚拟现实(virtual reality, VR)游戏。由于应用的多样性,EEG信号分析近年来得到了许多研究者的研究。
       通常用于其他类型信号的不同分析方法可能不适用于非平稳信号;因此,EEG分析的第一步是信号分割。有些人使用了基于EEG信号平均平稳性的固定大小的段,而另一些人使用了更先进的方法,如谱误差测量(spectral error measurement, SEM)、广义似然比(generalized likelihood ratio, GLR)和非线性能量算子(nonlinear energy operator, NLEO),它们可以自动找到半平稳段的大小。
 
A.线性方法
虽然EEG信号是非线性的,但大多数用于分析的方法都是线性的。线性方法的计算复杂度较低,对EEG非线性的理解有限等,是首选线性方法的一些原因。在此,我们提出了EEG分析中一些最重要和最有利的线性方法。
1)时域分析:
时域测量很容易受到由信号的非平稳性引起的偏差。时域的另一个缺点是它不能区分不同的生物信号。有许多具有匹配的均值和方差的自然信号具有不同的节律,这表明在时域中使用传统的时域统计测量方法从信号中获得的信息并不足以进行EEG分析。
线性判别分析(linear discriminant analysis, LDA)、线性预测(linear prediction, LP)ICACCA都是在时域分析最有益的算法。这些技术被广泛应用于EEG信号的伪迹去除和特征提取。

5 使用LDA分类数据集展示
LDA
LDA是一种用于寻找特征线性组合的方法,使得预定义的类的线性重叠最少。它既可以用作线性分类器,也可以用作与其他分类器相结合的降维步骤。这个方法与PCA类似,但是与LDA不同,在PCA中没有预定义的类。图5中展示了如何在分类信号模式中使用LDA的简单演示。我们可以看到LDA是如何线性转换的,以便这两个类对精确分类的重叠最少。
LP
LP问题假设当前样本的值可以预测为p的线性加权加和。在预测中使用的过去样本的数量指定了LP模型的阶数。因此,线性预测滤波器通过计算FIR滤波器的系数来查找信号的特征。这种估计可以看作是一个优化过程,涉及到计算滤波器系数以达到最小误差。由于线性预测滤波器的系数是可互换的,根据定义,该滤波器可以被归类为自适应滤波器。
如果从x1, x2, x3, ..., xN的数据序列中,我们希望从序列中之前的p个样本中预测xn,那么LP模型为:

式中,为预测值,1≤ip是用最小均方误差确定的预测系数(权重)p是预测阶数。
ICA
盲源分离(blind source separation, BSS)有多种方法,其中一种是ICABSS是一个从混合的观测信号中找到一组源信号的问题,几乎少到没有先验信息。显然,没有任何信息,这个问题可能没有唯一解。因此,这些方法中的每一种都有自己的假设集;在ICA的情况下,假设源是独立的和非高斯的。ICA是一种将混合信号分离为原始分量的强大工具,这意味着也有可能将一些伪影和噪声从所需的源信号中分离出来。原始的BSS问题如下:

或者矩阵的形式

其中X是观测向量,S是源向量,A称为混合矩阵。
ICA方法就是通过最小化它们之间的非高斯性来找到源。非高斯的标准度量是峰度,这是一个高阶统计特征,由下式定义:

       

其中,E(*)是期望,μ是均值,而σ是标准差。ICA有很多算法,但它们可以分为两大类,线性或非线性。还有其他衡量非高斯性的方法。然而,所有这些数据都属于更高阶的统计。Daly等将小波分解与ICA相结合,创建了一种新的所谓FORCe伪迹去除方法。事实上,根据M. M. N. Mannan等人的研究,ICA是伪迹去除研究中最常用的BSS方法。

CCA
另一种解决BSS问题的方法是CCA。目标与ICA相同,它通过使用(2)(3)的多个观测来获取数据源。然而,虽然ICA关注于最小化估计信号的高斯性,CCA试图最大化自相关,同时最小化源之间的互相关。该方法在EEG分析中具有良好的性能,特别是可以去除噪声和伪迹。Clercq等已经将该方法与其他方法结合,如ICA去除EEG信号中的肌肉伪迹进行了比较,其中CCA已经优于其他方法。
1) 频域分析:
对于EEG信号的频率分析,使用了傅立叶变换和小波变换。在频率分析中,EEG信号属于不同的频带,这有助于对它们进行分类。Kiymik等人比较了短时傅里叶变换(short-time Fourier transform, STFT)和连续小波变换(continuous wavelet transform, CWT)的结果,以评估癫痫患者的癫痫发作活动。STFT方法在处理实时信号方面产生了更好的结果,因为它的计算复杂度低,并且可以用于实时诊断,但是STFT的频率分辨率有限。相反,小波方法在多分辨率分析中具有更好的去噪性能,并且由于其高分辨率而更有利于临床解释。然而,必须记住,与时间统计测量相比,频谱分析通常更容易受到噪声和伪迹的影响
Inuso等人将小波变换与ICA相结合,创建了一种新的算法,用于从EEG信号中去除伪影,称为WICA。过去,研究人员在使用ICA之前和之后使用小波变换创建两种类型的组合方法;然而,WICA在某种意义上是不同的,在这个算法中小波变换是分离问题的内部部分。实验表明,该算法比以前的算法具有更好的效果。Bagheriet等人还利用CWTICA共同开发了一种从EEG信号中去除心电图(electrocardiographic, EKG)伪迹的自动化方法;该方法利用EKG的特殊特征来识别EEG信号中的伪迹成分。
在某个时候,研究人员感到需要大脑动态变化的视觉表示,他们使用频率分析技术来进行。这种创建统计变换的EEG信号的视觉表示的方法被称为定量脑电图(quantitative electroencephalography, qEEG)。压缩谱阵列(compressed spectral array, CSA)是最常用的qEEG可视化工具。大脑地形图是由计算机辅助分析产生的,它是一个彩色显示器,代表不同频段的能量,表达大脑的功能。图6显示了由qEEG产生的脑地图的一些例子,以及它们如何被用于诊断某些身体和精神疾病。在这张图中,不同类型精神障碍的脑地图可以与正常脑地形图进行比较。

6 qEEG的结果可以用brainmaps来表示

Haider等人已经证明,qEEG可以合理灵敏地识别成人严重的癫痫发作,还可减少病情审查时间。然而,仍有必要用间歇性EEG信号评估来确认疑似癫痫发作。


3) 时频分析:
由于时间和频率分析都存在较大的问题,提出了几种基于联合时频分析的方法。研究人员使用加窗STFTCWT计算EEG信号的每个窗口的功率谱;他们还使用维格纳维尔分布(Wigner-Ville distribution, WVD)及其改进版本,平滑伪维格纳分布(smoothed pseudo WignerVille distribution, SPWVD)来分析非平稳信号。Fu等提出了一种新的从EEG信号中识别癫痫发作的频谱分析算法。该方法采用希尔伯特边缘谱(Hilbert marginal spectrum, HMS)分析,基于希尔伯特-黄变换(HHT)HHT使用经验模式分解(empirical mode decomposition, EMD),它将信号分解为基本成分,称为内在模式函数(intrinsic mode functions, IMF),而不是正弦分解和小波。EMD在时域上分解信号,在非线性和非平稳信号的情况也很有优势。集合经验模式分解(Ensemble empirical mode decomposition, EEMD)EMD的增强版本;该方法解决了传统EMD的一些问题,如模式混合问题。Kuo等使用从该方法中提取的特征(IFMS)对预期的运动进行分类,它实现了比其他特征更高的精度。Hassan等还采用EEMD方法分解单通道EEG信号,并利用提取的特征对不同睡眠阶段的EEG信号进行分类。2014年,Chen等将EEMD与多组(multiset)CCA结合,并将其用于去除单通道EEG中的肌肉伪迹。J. MinguillonM. K. Islam探索不同的伪迹去除方法。在这两项研究中,采用多目标方法去除伪迹较好;其中一种方法是使用EMD等方法进行源分解。
 
B.非线性方法
      正如之前所提到的,大多数关于EEG信号处理的研究都是线性的,而且很少有人研究过EEG信号的非线性性质。然而,在过去的几年里,这一趋势发生了变化,关注这一课题的研究人员数量也迅速增加。一些研究人员已经试图寻找EEG信号的非线性特征,而另一些人则更关注要应用于这些信号的非线性分析技术。这两种方法都需要一些了解EEG信号的非线性。
   EEG信号非线性分析的早期阶段大致在1985年和1990年左右,主要涉及各种类型EEG信号的低维混沌动力学。到90年代初,研究人员意识到各种非线性时间序列分析算法的一些局限性,早期关于大脑混沌性质的说法大多被排斥。之后EEG分析主要集中在检测、表征、建模等方面以及更适合EEG信号的非线性特征。
1)非线性特征:李雅普诺夫指数(Lyapunov exponents, LE)是用来描述相空间中附近轨迹的收敛速度或散度率的非线性测量。李亚普诺夫指数是对混沌系统动态诊断的最有用的测量方法之一。李亚普诺夫指数的最小值指定了癫痫发作的时刻。Swiderski等利用EEG信号的LE来识别癫痫发作。癫痫是一种神经系统疾病,通常以癫痫发作为特征。这些疾病是由大脑皮层突然放电引起的,这干扰了大脑的正常功能。结果表明,正常和癫痫EEG信号中最大的李亚普诺夫指数(largest Lyapunov exponents, LLE)有显著差异
赫斯特指数(Hurst exponent, H)也被称为依赖指数,基于分形时间序列的无标度范围内的渐近行为来测量该过程的长期记忆,可用于分析时间序列的长期依赖性的存在和程度,也可用于描述EEG信号的非平稳性质。接近0.5H值,表示随机和不相关的信号。在(5)中给出了Hurst指数的方程,

其中σ为标准差,T为采样时间,R为最大离差和最小离差的差值。
近似熵(approximate entropy, ApEn),测量了数据在时域中的可预测性和规律性的变化。一个小的Apen通常是一个可预测的和高度规则的系统的指标。相反,高ApEn表明了数据的不可预测性和随机性。时间序列数据的ApEn是非负的具有较大值的数值,对应于数据的复杂性和随机性。ApEn通常用于短且有噪声的数据。它是一种感知潜在情景行为变化的特征,这种变化不会出现在振幅或峰值事件中。对于N个数据点或样本,与(1)中相同,状态空间为ApEn值由(6)计算:

根据Pincus以前的工作选择mr的值,其中ApEn显示了良好的统计效果,是相关积分,由(7)定义:

相关维数(correlation dimension, CD)证明了信号空间的维数。大于5CD值通常是随机信号

(9)中给出了CD的方程,其中C(r)定义为(8)。轨迹在相位空间中的点由XxXy指定,N表示数据样本数,θHeaviside函数,r表示每个参考点周围的径向距离。
Natarajan等对不同精神状态下EEG信号的非线性参数如HCDLLEApEN等进行了评价。随后,他们对结果应用方差分析检验,并在所有情况下都达到了良好的“p”值。他们发现,在音乐和(按摩脚部的)反射疗法的影响下,alpha波变得更强。同时,CDLLEH会减少。

2) 非线性模型:Hazarika等利用双线性模型开发了一种非线性方法,并将其用于对健康受试者、精神分裂症患者和强迫症患者获得的EEG信号进行预处理。在下一步,他们使用多层感知器对预处理的EEG数据进行分类,形成不同的类。他们观察到,使用双线性模型的分类比使用线性自回归(linear autoregressive, AR)系数获得更好的结果。
Hassani等利用非线性Volterra模型进行了EEG数据的分割。结果表明,使用该模型可以在预处理阶段用贝叶斯方法精确检测突变点。他们还使用贝叶斯方法描述变化点问题的后验分布,并利用马尔可夫链蒙特卡洛(Markov chain Monte Carlo, MCMC)算法估计了该变化点过程的后验分布。
EEG信号的非线性进行了许多研究,研究人员开发了许多算法、模型和特征,但最流行的可能是非线性盲源分离(nonlinear blind source separation, NBSS)ICA作为BSS最有能力的算法之一,也受到了相关研究的显著关注。标准ICA依赖于观测矩阵是独立源的线性混合,换句话说,构成源与观测之间关系的混合矩阵是线性的。这个假设的问题是,许多现实世界的数据没有遵循这一要求;因此,许多人致力于开发模型来避免这个前提假设,从而产生了非线性ICA(nonlinear ICA, NICA)NICA中,观测向量不再是源的线性映射,混合矩阵可以是任何非线性函数。为了解决NICA问题,开发了不同的模型;其中一个模型假设两个连续阶段,一个线性混合,一个非线性。为了解决非线性问题,必须用Q阶的多项式逼近非线性函数。

其中g是上述模型非线性阶段的多项式近似。该近似值的逆解结果如下:

Oveisi等使用NICA模型与线性ICA进行比较,以便对EEG数据进行分类。在特征提取后,采用对角线性判别分析(diagonal linear discrimination analysis, DLDA)对两组特征进行分类。他证明,对于NICA特征,分类算法的精度更高。许多公司和研究小组还开发了EEG分析和可视化的工具,如EEG工具箱和ERP工具箱,Brainstorm软件。

如果您对脑电数据处理感兴趣,欢迎浏览思影科技课程及服务可添加微信号siyingyxf18983979082咨询):


第二届脑电机器学习数据处理班(南京,4.6-11)

第十四届脑电数据处理入门班(南京,5.10-15)

第二十七届脑电数据处理中级班(南京,6.1-6.6)

第二十六届脑电数据处理中级班(重庆,4.9-14)

第十二届近红外脑功能数据处理班(上海,6.15-20)

第十三届脑电数据处理入门班(上海,4.19-24)

第九届眼动数据处理班(上海,4.6-11)

第十一届近红外脑功能数据处理班(上海,4.13-18)

第三届脑电机器学习数据处理班(上海,6.25-30)

第九届脑电信号数据处理提高班(上海,7.8-13)


数据处理业务介绍:


思影科技EEG/ERP数据处理业务

思影科技脑电机器学习数据处理业务

思影科技近红外脑功能数据处理服务

思影数据处理服务六:脑磁图(MEG)数据处理

思影科技眼动数据处理服务

招聘及产品:

招聘:脑影像数据处理工程师(上海)

BIOSEMI脑电系统介绍

目镜式功能磁共振刺激系统介绍
 

3. 高阶统计量

二阶频谱是二阶自相关函数的傅里叶变换;它也被称为功率谱,广泛应用于信号处理。高阶谱是用高阶统计量来描述的,如信号的矩和累积量。例如,三阶和四阶标准化矩为偏度(skewness, S),峰度(kurtosis, K)和三、四阶谱或双谱(bispectrum, B)和三谱(trispectrum, T)是三、四阶自相关函数的傅里叶变换。HOS实际上是高阶(高阶自相关的傅里叶变换)的谱,而熵等特征则是从谱中导出的(因此可以称为HOS特征),而累积量和矩等其他特征则不是;这意味着这些特征实际上应该被称为高阶统计特征,为了简单起见,这里我们将它们都称为HOS特征

双谱在生物医学领域得到了广泛的应用,特别是EEG信号的处理,比如双谱指数或者BISBIS是一种监督方法,作为Guedel分类法的补充,确定麻醉深度以及监控意识水平。在下一节中,我们将详细介绍HOSEEG分析中的应用。双谱保持相位信息的特性,对信号重建和分析信号不同频率下耦合现象产生的非线性二次关系都是非常有益的。该谱是根据信号的自相关函数来定义的。在(12)(13)(14)中分别给出了第三、第四自相关函数的方程。

其中n1n2是样本的索引数,xx的复数共轭。在(15)(16)(17)中分别给出了匹配自相关性的二阶、三阶和四阶谱(对于周期信号)的傅里叶变换。

在这些方程中,Xx的傅里叶变换,在频域而不是样本域进行了细化,因此,变量也从n变化到f这里(15)(16)(17)呈现了二阶、三阶和四阶谱,即功率谱、双谱和三谱。双谱是在双频域中定义的,因此,它是两个频率的函数。同样,三谱是在三频中定义的,是三个频率的函数中得到的双相干和三相干。

要对不同的EEG信号进行分类,需要可以作为特点的特征;比如幅度平均值和相位熵等特征。这些特征的方程式由(20)(21)(22)给出:

      其中,Ω表示图7中的f1f2的区域。φ是相位,而l(*)是指示函数,当相位值在φn(23)指定的范围内时给出1,否则给出0。使用这个区域的原因是,这个部分是双谱的四分之一(幅度和相位),包含实际数据,其余部分是冗余的。这一非冗余区域可以在图7中看到。

7 非冗余区域
(21)中,香农熵被用来测量双谱相位熵。(20)中的平均幅度可以用来区分具有相似二阶谱的数据,但它容易受到振幅变化的影响。这个问题可以通过归一化来解决。
对于随机系统,熵很高,随着它们变得更加周期性和可预测,熵减小;直到一个完整的谐波、周期和可预测过程出现,熵值变到零。
除了双谱相位熵之外,还有其他三个必要的熵。在(23)(25)(27)中分别给出了归一化双谱熵(bispectral entropy, BE1)、归一化双谱平方熵(BE2)和归一化双谱三次熵(BE3)。它们的定义为在(24)(26)(28)给出的归一化双相干和平方归一化双相干的熵。

双谱的相位不像傅里叶相位那样随时间而变化。方程(29)定义了双谱不变量,Pa,它是沿径向线的积分双谱的相位,斜率等于n

其中,

如前所述,对于低信噪比的信号,HOS分析获得了更好的结果。高斯信号的高阶为零,因此,一些高阶特征可以用来测量信号的非高斯性,并从混合信号中提取独立的非高斯源信号。这种高阶统计特征可用于非高斯信号的检测和分类。
1982年,Hinich开发了一种测试平稳时间序列的高斯性和线性的算法。其基本概念是,如果一个过程的三阶累积量为零,那么它的傅里叶变换或双谱也必须是零,因此双相干性为零。如果双相干是非零的,这个过程是非高斯的,如果它是一个非零的常数,这个过程是线性的,非高斯的。该测试采用了在(32)中给出的双相干功率的平均值作为参考。

A. 双谱估计
功率谱密度估计是信号处理的基本工具之一。类似的方法也可以用来估计信号的双谱。双谱估计方法通常分为两个单独的类,传统的(傅里叶类型”)方法和参数方法;这些类中的每一个都包括各种方法。
1)传统的双谱估计:传统的方法包括直接的和间接的方法。直接估计试图计算(33)给出的双谱定义的近似,而(34)是另一种形式。

然而,间接估计方法试图计算基于(35)(13)的双谱的近似值。

这两个估计是不同的,但是如果它们是在不使用窗口的情况下计算的,实际上它们就变成了相同的。结果表明,传统的估计是渐近无偏和一致的。这些方法通常具有较高的方差,这意味着它们需要大量的记录来实现平滑的双谱估计。用直接方法估计的测试EEG信号的双谱如图8所示。
      图8上显示估计的双谱的大小,而底部图显示相位,它们一起表示样本EEG信号的三阶谱或双谱。由于这种估计方法是基于双谱(傅里叶变换)的定义,与参数方法相比,它得到了更精细、更平滑的轮廓。传统方法具有易于实现和具有很长数据记录的良好估计的优点;然而,由于傅里叶变换的不确定性原理,传统方法的能力受到限制。

8 直接法估计样本EEG双谱的幅值和相位

2)参数双谱估计:除了传统的方法外,所有其他的方法都属于参数估计的范畴。因此,术语参数估计涵盖了广泛的方法。Capon的最大似然法及其改进方法、交叉熵法(cross-entropy, CE)和基于自回归移动平均数(autoregressive-moving average, ARMA)模型的方法。谐波分解方法如Pisarenko谐波分解(Pisarenko harmonic decomposition, PHD)Prony分析,多信号分类(multiple signal classifification, MUSIC),奇异值分解(singular value decomposition, SVD)等,也是参数方法的一部分;然而,参数方法通常被称为基于AR、移动平均(moving average, MA)ARMA模型。
9给出了用ARMA方法对样本信号双谱的参数估计。这两种方法都估计双谱,使用相同的数据,由于ARMA方法是迭代的,因此与传统方法相比,它通常会产生许多小分量。我们拟合了直接方法的轮廓,使其更容易发现图89的差异。

9 利用参数ARAM模型估计双谱

B. 二次相位耦合Quadratic Phase Coupling (QPC)
在某些情况下,在研究系统时,信号的谐波之间发生了一些相互作用,这通常是由于系统的二次非线性所致。这些相互作用导致输出信号的某些频率和相位发生一些变化。由于功率谱丢失了相位信息,因此无法检测到这些事件。然而,双谱不是盲相位(phase-blind),这意味着它可以检测和量化这一现象。
W. Kicinski等给出了一个简单的例子,它指出如果我们在(36)中有信号x,通过一个非线性系统,相位该是多少。

这个例子考虑了一个简单的非线性系统,例如                         

在这个系统中,h(t)(即输出)将包括(38)中的成对谐波。

系统的非线性导致谐波的数量增加,因此频率增加;这种现象被称为二次相位耦合。因此,二次相位耦合在信号中的存在强烈地表明了系统是非线性的。
正如我们前面提到的,计算双谱的主要方法有两种,传统方法和参数方法,总的来说,传统方法更适合于QPC,参数方法通常实现更高的分辨。
 

4. 高阶统计量在EEG中的应用

在过去,许多研究使用二阶统计量和谱进行EEG信号分析。然而,经过多年的研究发现,由于二阶统计量中缺乏相位信息,以及EEG信号的低信噪比和高非线性,高阶统计量可能获得更好的分析结果。在此之后,由于生物系统固有的非线性特性的普遍存在,HOS在生物信号分析中的应用变得尤为流行。

三阶统计特征是EEG分析中最常见的HOS特征,其次是四阶统计特征。正如在前一节中提到的,这些特征通常包括矩、累积量、谱和不同的熵。这些特性都可以用来进行不同的分类EEG信号的类型或更好地理解正常和背景EEG信号。

 HOSEEG分类中的应用之一是检测患者的癫痫发作。这一应用在过去十年中一直是研究人员的热门研究课题。

Chua等利用HOS研究了EEG信号中癫痫发作的性质。他们使用双相干模式、熵和其他高阶统计特征来分析健康受试者和癫痫患者的EEG信号。在特征提取后,他们进行了方差分析测试,其中特征给出了极好的p值。

Zhou等提出了一种基于HOS特征的新特征提取方法,从EEG信号中对左/右运动图像进行分类。运动想象是一种动态状态,个体在没有明显运动的情况下,在心理上模拟身体部分的运动。他们还使用LDASVMANN进行分类,并在相同的BCI数据集上取得了比2003年优胜者更好的结果

Hosseini等人使用HOS分析特征和支持向量机(SVM)对价值-唤醒空间的两个主要区域的情绪压力状态进行分类。他们对数据的分析表明,径向基函数核的性能优于其他核。同年,Ghandeharion等人设计了一种自动眼伪迹抑制算法,使用小波系数和峰度来检测独立分量分析的伪迹分量。同时,Acharya等人从睡眠的不同阶段(清醒、快速眼动和四个睡眠阶段)的双谱和双相干中提取了HOS特征。之后,他们在自动识别的分类步骤中将这些特征输入高斯混合模型(GMM)

Javidi等利用峰度来开发盲源提取(blind source extraction, BSE)算法,提取圆形和非圆形复杂信号。BSEBSS的一个子类别,BSE不是将信号划分为不同的源,而是试图找到分量。为了实现这一目标,Javidi使用了潜在源的高阶统计、基于峰度的收缩方法和顺序提取。他们使用该算法实时去除EEG信号中的眼电(electrooculography, EOG)和肌电(electromyography, EMG)伪迹。

Du等试图基于高阶矩对癫痫性EEG信号进行分类,另一个特征是双谱加权中心(weighted center of bispectrum, WCB),并使用PCA进行降维。在(39)(40)中给出了WCB和绝对WCB(absolute WCB, aWCB)的方程。

他们使用的矩相关特征是双谱的对数振幅之和(H1),双谱中对角元素的对数振幅的和(H2),双谱中对角元振幅的一阶谱矩(H3)、双谱中对角元振幅的二阶矩(H4)和双谱中主域振幅的一阶谱矩(H5)

在实验中,他们使用了15HOS特征,为了减少特征之间的冗余,采用了PCA方法。他们采用了8种机器学习算法进行分类,包括多层感知器人工神经网络( multilayer perceptron artificial neural network, MLP-ANN)RBF网络、随机森林(random forest, RaF)、旋转森林(rotation forest, RoF)、逻辑回归(logistic regression, LR)、模型树(model trees, MT)、简单逻辑回归(simple logistic regression, SLR)和装袋算法(bagging, BA)它们能够达到很高的精度,在某些情况下甚至超过98%Lay-Ekuakille等使用HOS特征和抽取信号对角化(decimated signal diagonalization, DSD),它可以处理指数阻尼信号来分类癫痫患者。Shafifiul Alam等还尝试使用HOS特征来开发一种癫痫检测方法。他们使用不同的矩和累积量作为从EMD领域的EEG信号中提取的特征。EMD特别适合分析非平稳和非线性信号,如EEG,并将其与神经网络相结合进行分类。Yuvaraj等比较功率谱和HOS特征,对帕金森氏症患者(Parkinson’s disease, PD)EEG情绪状态进行分类。他们使用k-最近邻(k-nearest neighbor, kNN)SVM算法进行分类。结果表明,当使用HOS特征时,其精度较高。Mahajan等利用改进的多尺度样本熵、峰度、小波分解和ICA开发了一种快速无监督和全自动的算法,从EEG信号中去除EOG伪迹。Wang等用峰度作为非高斯性的度量,比较了一些AD患者和健康人群EEG信号的高斯性。他们发现AD患者EEG信号的平均峰度要比健康人高得多,表明AD患者EEG模式中存在异常动态。继续他们以前的工作,2016Yuvaraj等利用EEG信号的HOS特征开发了一种新的帕金森病诊断指数(Parkinson’s disease diagnosis index, PDDI),用于PD的自动检测。在分析了13个不同的HOS特征之后,他们根据它们的F值对它们进行了排序,并使用前三个高评级特征(H1EB1H2)来开发PDDI。在(46)中给出了它们的数学方程:             

他们使用了九种不同的分类器,决策树(decision tree, DT)kNN、模糊kNN、朴素贝叶斯(naive Bayes, NB)、概率神经网络(probabilistic neural network, PNN)SVM三种核函数、RBF2阶和3阶多项式核函数。他们取得了与Hosseini等人相似的结果。再一次证明,使用RBF核函数(SVM-RBF)SVM分类器具有最佳的性能,在使用高阶特征的同时,平均准确率达到99.62%,灵敏度达到100%,特异性达到99.252018年后Oh等人为同一应用使用相同的数据集发表了另一篇论文;然而,这次他们使用13层卷积神经网(convolutional neural network, CNN)进行分类,平均准确率为88.25%,敏感性为84.71%,特异性为91.77%。可以看出,SVM-RBF结合高阶特征具有更好的性能。Bairy等利用方差、峰度、归一化峰度、偏度和归一化偏度等HOS特征,结合线性预测编码(linear predictive coding, LPC)和接收者操作特征算法,开发了一种计算机辅助诊断(computer-aided diagnosis, CAD)系统,帮助患者诊断抑郁症。

     在他之前的工作之后,Hosseini尝试了一种混合的方法来识别癫痫的不同阶段。他使用HOS特征、遗传算法(genetic algorithm, GA)和最小二乘SVM(least square SVM, LS-SVM)来识别不同的癫痫状态。他使用HOS特征以及遗传算法(GA)和最小二乘支持向量机(LS-SVM)与高斯和多项式RBF核来识别不同的癫痫状态。与此同时, Ikeda等人发表了一篇论文,其中他们使用峰度和eLORETA来估计EEG信号中癫痫活动的源。eLORETA技术是一个三维表示,显示大脑的电活动。他们将该模型与等效电流偶极子(equivalent current dipole, ECD)和合成孔径磁测量(synthetic aperture magnetometry, SAM)进行了比较,并报道了癫痫患者EEG数据的eLORETA峰度分析可能有助于尖峰活动源的定位。

正如在这里可以看到的,许多关于EEG分析的研究直接或间接地使用了HOS特征,虽然HOS不是一个新的发现,但对于那些研究EEG分析领域的人来说,它仍然是一个很好的选择。

5 讨论和展望

在过去的20年里,人们对高阶统计量的兴趣越来越大,但是这个领域的许多应用还没有被发现。 10份报告显示了过去20年中载有高阶统计/高阶谱字样的论文数量。在这项调查中,我们提供了一个综述高阶统计特征在EEG信号分析中的应用。然而,在我们深入研究主要课题之前,我们简要回顾了EEG信号分析中的其他值得注意的研究,以及一些高阶统计特征的数学描述。随后,我们研究了以往利用HOS特征进行EEG信号处理的不同应用的研究。最后,根据这一领域以前的工作,我们根据它们的应用对这些论文进行了分类,分为三类。

1HOSEEG分析中的应用主要涉及伪迹或噪声的识别或去除(预处理阶段)。这些研究的例子如表1所示,以及有关的伪迹及其来源。从这个表中,我们可以注意到小波分析和ICA是两种被广泛应用于伪迹检测和去除的方法。使用高阶特征可以提高检测EEG伪迹的准确率,Ghandeharion等在利用四阶矩的同时,实现97.8%的精度;当不考虑峰度值时,该精度下降到95.2%

1 基于伪迹及其来源的分类1的研究概要

10 近二十年来这一领域的论文数量趋势

在第二类中,HOS特征被用于开发也可以用于EEG分析以及其他领域。由于高阶特征不受高斯噪声的影响,因此它们被用来开发一般的信号处理方法,如特征矩阵的联合近似对角化(joint approximation diagonalization of eigen-matrices, JADE)BSS快速ICA或基于峰度的BSE,这些方法在EEG分析中也被证明是有用的。表2包含其中一些方法及其主要应用。这些方法主要用于BSS和特征选择阶段。该表中提到的许多方法都使用峰度,这意味着非高斯性被经常用于开发算法。考虑到非高斯性在决定独立性方面起着相当大的作用,这一现象并不奇怪。
第三类是HOS特征直接用于分类问题,并得到了研究人员的广泛研究。在这次调查中,我们提到了不同的研究方法包含不同运动功能分类,情绪状态、应激状态,睡眠阶段,PD患者和PD的诊断,癫痫和抑郁症。在表3中,总结了之前在这一类别中进行的研究以及在每一类别中使用的特征和分类器。上述类别几乎完全匹配不同的EEG分析组,这意味着HOS在几乎所有类型的EEG分析中都是有益的。
2 包含使用HOS特征的方法的第2类研究总结

3 EEG分析中高阶统计量第3类应用研究综述

以往利用HOS特征进行EEG分析的研究存在的问题之一,是由于数学和计算的复杂性,对特征本身的关注很少,高阶特征很少被单独研究。对每一个特征的进一步研究将使研究者更好地理解实验结果。他们还应该记住,HOS分析有几个主要缺点;除了数学复杂性,增加谱的阶数会增加维数;这个新维度将帮助我们找到新的特征,但是通过向谱增加一个维数,计算负担将大大增加。因此,在利用高阶统计数据特征之前,有必要对二阶统计数据进行彻底的研究。
计算机科学在机器学习领域的快速发展,加上更创新和稳健的特征选择方法的发展,将增加第1类的研究;这将导致对神经疾病更可靠的诊断。在第1类算法中,最有益的算法之一是WICA。在不同的研究中,它已被用于去除EEG中的各种伪迹。这一类别中的未来发展之一可能是收集这些信息,以创建一个单一的算法,通过修改WICA或其他算法来检测和删除所有类型的EEG伪迹。该算法可以在添加到EEG工具箱供公众使用之前进行优化。
2类文献中现有的研究数量最少,但在这一领域可能影响最大。使用HOS开发的算法并不多。然而,这些算法在信号处理的几乎每个领域都得到了广泛的应用。未来该领域的一个可能方向是为BSS开发更好的非高斯测量或更鲁棒的算法;另一个发展潜力在QPC;这是高阶统计的重要组成部分。在之后,这可能被用来提供更深入的理解EEG信号的非线性。其中的每一类都是非常重要的,并包含了特定的特征。这种分类只针对HOSEEG分析中的应用。然而,这可以扩展到其他信号处理区域。
EEG信号并不是唯一受到HOS分析影响的生物医学信号;心电图、表面肌电图、肺声音、心脏声音、肠声、躯体感觉、不同的医学成像等都经过HOS分析研究。此外,HOS在激光雷达、雷达、激光、等离子体物理、地震数据处理、图像处理、谐波检索、时延估计、自适应滤波、阵列处理、盲均衡等多个领域都有应用。
 
6 结论
在这项调查中,我们试图突出EEG分析中的一些重要研究和一些高阶统计量的数学描述。然后,简要报告了利用HOS特征对EEG分析进行的重要研究,以及它们所使用的特征。然后,我们根据应用将这些研究分为三大类。在第1类中,我们包括了使用HOS特征进行伪迹去除和预处理的研究。第2类包括利用HOS特征的信号处理方法,可用于BSSEEG分析和特征选择。最后,在第3类中,HOS特征被直接用于分类和诊断的目的。非线性、非平稳的性质,加上EEG信号的结构和随机性的变化,使其成为最难以分析的信号之一。最重要的是,有不同的通道对应于大脑的不同区域,每个通道都是不同的成分、伪迹和噪声的组合。这就是为什么大脑信号的某些方面还没有被完全理解。高阶统计学作为一种先进的信号处理工具,可能会使我们探究EEG信号的真正潜力又近了一步。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多