基于深度残差收缩网络的雷达空中目标识别
作者:尹建国, 盛文, 蒋伟
摘 要
雷达空中目标高分辨距离像(high resolution range profile, HRRP) 中往往包含一定的杂波噪声, 利用HRRP开展空中目标识别需要重点考虑噪声的影响。针对上述问题, 提出一种基于深度残差收缩网络(deep residual shrinkage network, DRSN) 的雷达空中目标HRRP识别方法。该网络将深度残差网络、软阈值函数和注意力机制结合起来, 采用跨层恒等连接方式, 不仅可以避免网络层数过深造成梯度消失或梯度爆炸, 从而导致网络学习能力下降的问题, 还可以有效过滤掉识别过程中噪声特征的影响, 使模型专注于目标区域的深度特征识别, 提升强噪声背景下模型的识别能力。实验结果表明, 相对于其他常用的深度学习模型, 所提方法在各个信噪比条件下, 识别效果均有一定的优势, 该模型对噪声具有较强的鲁棒性。
关键词
空中目标识别 ; 高分辨距离像 ; 深度残差收缩网络 ; 噪声鲁棒性
引言
雷达自动目标识别(radar automatic target recognition, RATR) 是现代化信息战争中的重要手段。随着现代雷达技术和信息处理技术的迅猛发展, 基于高分辨距离像(high resolution range profile, HRRP) 的RATR引起了广泛关注, 成为了研究热点之一[1-5]。雷达HRRP是宽带雷达获取目标在视线方向上的一维投影矢量和, 包含丰富的目标结构信息, 比如目标尺寸和散射体分布等, 是识别空/天目标的重要依据。
传统的RATR方法主要由4个部分组成, 即数据获取、数据预处理、特征选择和提取及目标识别, 核心在于目标特征的选择和提取, 需要具备深厚的领域知识来构建目标特征库。特征的选择不仅要考虑到目标回波中的噪声分量和冗余分量的影响, 还要在降低数据维度的同时尽可能保留目标的本质信息, 才能提高识别的准确率和效率。在基于HRRP的RATR中, 传统方法中常用的特征主要包括反映目标物理结构的平移不变特征、反映目标HRRP散射随机性的熵特征及反映目标与标准体散射矩阵和散射能量的相似性特征等[6-8], 通过选择相应特征, 可以在一定程度上提升识别能力和泛化能力。但是, 特征的选择严重依赖于经验知识, 且并不是特征越多越好, 只有选择那些能反映目标深层次特性的特征才能对目标识别做出贡献, 而如何准确地选择这些特征本身就是一个难题, 如果一些隐藏的却反映目标深层次特性的特征无法被有效利用, 则识别性能会受到影响。此外, 传统方法中采用了浅层线性的模型结构, 不利于获得目标的深层分类信息, 也会影响到模型的识别性能。
近年来, 深度神经网络被广泛应用于机器学习任务, 并取得了极其优异的性能表现。相比于传统方法, 深度神经网络方法采用非线性层次化的网络结构, 可以从大量原始数据中自动学习到目标的深层次隐藏特征, 并且能够自适应地调整模型参数, 最终提高识别的效率和准确度。基于此, 基于深度学习的RATR已成为广泛研究的热点之一。
卷积神经网络(convolutional neural networks, CNN) 是深度学习的典型网络, 已广泛应用于雷达目标识别中[9-11]。文献[12]采用CNN自动提取多基地雷达系统目标HRRP的高阶特征, 仿真结果显示该方法在低信噪比的情况下依然表现出了良好的识别性能, 系统具有较强的鲁棒性。文献[13]进一步加深网络层数, 采用深度CNN (deep CNN, DCNN) 对添加了不同信噪比噪声的HRRP进行识别, 取得了相对较好的识别效果, 但在低信噪比(如小于等于5 dB) 情况下该网络模型的识别率仍不足60%。传统的CNN模型没有考虑相邻时间内输入样本间的相关性, 相邻HRRP之间是存在时间依赖性的, 循环神经网络(recurrent neural network, RNN) 可以有效解决这一问题。文献[14]采用RNN中的长短时记忆(long-short time memory, LSTM) 网络对3类目标进行分类, 输入节点为128, 隐藏节点为50, 输出数为3。训练数据每类含175幅HRRP, 对100幅测试数据进行测试, 识别率高于95%。HRRP中包含部分非目标区域, 该区域的信息对于目标识别是无用且不利的。针对这种情况, 文献[15]引入注意力机制模型和CNN相结合构成目标注意力CNN, 可以自适应地为HRRP每个局部特征分配权重, 从而定位于目标区域, 增强模型对有价值目标信息的兴趣。文献[16] 将CNN、双向递归神经网络和注意力机制相结合, 既让模型专注于判别目标区域, 也对数据的时移敏感性有很强的鲁棒性。另外, 文献[17-20]采用自编码器(auto-encoder, AE) 或其改进网络开展基于HRRP的目标识别, 利用AE提取目标的多维隐特征, 使得系统更具稳健性, 均取得了较好的识别效果。文献[21]提出一种堆栈去噪AE (stacked denoising AE, SDAE), 可以对HRRP这种高维散射数据的特征进行更加深层次的压缩和提取, 同时对数据进行降噪处理, 比传统的AE具备更强的噪声鲁棒性和泛化能力。上述研究显示, 相比于传统RATR方法, 基于深度学习的雷达目标识别在性能和准确率上具有独特的优势, 尤其是在低信噪比情况下其性能有大幅提升, 值得开展研究。
近年来, 残差神经网络(residual network, ResNet) 得到了广泛的关注, 在典型深度学习算法多层CNN中, 随着网络层数的加深, 网络模型会出现梯度消失或梯度爆炸、模型退化以及过拟合的问题, 而在ResNet中引入恒等函数和残差函数可以有效地避免上述问题[22]。HRRP中包含有丰富的目标结构信息, 被广泛用于目标识别中, 但同时也包含有大量的噪声和一些冗余信息。本文针对HRRP中存在噪声和非目标区域问题, 引入深度残差收缩网络(deep residual shrinkage network, DRSN)[23], 该网络由深度残差网络、软阈值函数和注意力机制三部分组成。软阈值函数的引入可以有效过滤掉噪声特征的影响, 提高强噪声信号下模型的识别性能, 在噪声信号的识别中有着良好的效果[23]; 注意力机制既可以自动设置阈值, 避免人工设置阈值, 也可以将注意力集中于局部感兴趣区域, 增强有用信息对目标识别的积极作用。因此, 本文所采用的方法在基于HRRP的目标识别中更具有优势, 也具备更强的噪声鲁棒性。
1 DRSN模型设计
典型的DRSN整体结构由卷积层、一定数量的残差收缩模块(residual shrinkage building unit, RSBU)、批标准化(batch normalization, BN)、线性整流函数(rectified linear unit, ReLU)、全局均值池化层(global average pooling, GAP) 和全连接(fully comected, FC) 输出层组成的深度神经网络, 如图 1所示。
图1 DRSN的基本结构
其中, RSBU是该网络的核心结构, 主要由深度残差网络、软阈值函数和注意力机制组成。
1.1 深度残差网络
在深度学习中, 层数的加深可以减少网络参数数量, 提升模型性能。但是, 层数的加深也容易导致梯度消失或梯度爆炸的问题, 尤其是梯度消失会导致误差无法反向传播, 从而导致学习很慢或者根本无法更新参数并学习, 使网络难以有好的结果。另外, 典型CNN算法随着层数加深, 可能出现模型退化的问题, 即随着网络层数的加深, 新增的层可能无法学习到恒等映射。基于上述问题, ResNet被提出, 该网络采用跨层恒等路径的方式, 减轻了参数优化的难度, 可以实现网络层数增加的同时提升模型性能。残差网络最重要的是残差单元模块, 结构如图 2所示, 其中x为输入, F(x)为残差函数。
图2 残差单元模块
深度残差网络即是在网络主体部分堆叠多个残差单元模块, 加深网络层数。在深度残差网络进行基于反向传播的模型训练时, 其损失不仅能够通过卷积层等进行逐层的反向传播, 而且能够通过恒等映射进行更为方便的反向传播, 从而更容易训练得到更优的模型。
1.2 软阈值函数
软阈值化是信号处理中常用的降噪方式, 软阈值函数如下所示:
(1)
式中: din为输入;dout为输出;τ为阈值, 为恒正数。其基本原理是先对输入信号进行分解, 然后通过软阈值函数对分解后的信号进行过滤, 最后重构信号。通过式(1)可以看出, 其将绝对值低于τ的特征置为0, 而将其他的特征也朝着0调整, 即达成“收缩”的效果。
另外, 软阈值函数是一个非线性变换函数, 从式(1)可以看出, 其梯度只有0和1两种, 可以有效避免梯度爆炸和梯度消失的问题。
1.3 注意力机制
软阈值函数中阈值τ的设置非常重要, 其取值对于降噪的结果有直接的影响。DRSN引入注意力机制可以自动设置阈值, 避免人工设置阈值带来的不确定性。
注意力机制可以将注意力集中于局部关键信息, 通过一个小型子网络, 自动学习到一组权值系数, 对各个特征通道进行加权, 从而可以增强有用信息的同时抑制冗余信息。
将注意力机制、软阈值函数和残差单元模块集成在一起组成DRSN的基本RSBU, 其基本结构如图 3所示。
图3 DRSN的基本模块
DRSN通过引入注意力机制, 使每个样本都可以有独特的一组权重, 可以根据样本本身的特点, 进行独特的特征通道权重调整, 保证每个样本都有自己独特的阈值, 有效地消除样本中的噪声信息和重构特征。因此, DRSN适用于输入信号中各个样本噪声含量不同的情况, 有利于含噪信号分类任务性能的提升。
本文提出的DRSN的整体结构如图 4所示, 该结构从输入到输出含由输入层、卷积层、10层堆叠的残差单元模块、BN、ReLU激活函数、GAP和FC组成。
图4 本文提出的DRSN结构图
2 实验结果及对比分析
2.1 实验数据
本文采用的是3类飞机的HRRP数据, 3类飞机分别为中型喷气飞机Z、小型喷气飞机X和中型螺旋桨飞机L。HRRP是宽带雷达获取目标在视线方向上的一维投影矢量和, 包含丰富的目标结构信息, 图 5为飞机目标的HRRP样本生成示意图。
图5 飞机目标HRRP样本示意图
3类飞机的HRRP示例如图 6所示, 每类飞机的采样点为256, HRRP中包含有非目标区域的冗余信息和目标区域的回波信息, 前者如椭圆区域所示, 后者如矩形区域所示。每类样本包含8 500条数据, 按照0.75 ∶0.25的比例划分为训练集和测试集, 即训练集中包含6 375条数据, 测试集中包含2 125条数据。
图6 3类飞机的HRRP示例图
2.2 实验环境与评估指标
实验设备采用Win11系统计算机, 显卡为NVIDIA GeForce RTX 3070 Laptop GPU, 实验语言为Python语言。采用以Tensorflow为后端的TFLearn深度学习库进行程序开发和训练测试, 隐藏层激活函数用ReLU, 使用交叉熵损失函数作为训练时需要优化的代价函数, 采用Adam优化器更新参数, 最后采用Softmax分类器。
使用的评估指标包括准确率、精确率、召回率、网络模型的参数量、训练与测试时长、模型大小等。最佳网络模型保存为h5格式。
2.3 实验结果及对比分析
本文首先给出建立的DRSN模型, 用于HRRP识别时的结果分析; 然后, 对原始HRRP进行加噪处理, 加入不同能量的高斯白噪声, 使得输入信号的信噪比分别为5 dB、10 dB、15 dB、20 dB、25 dB和30 dB, 比较在不同信噪比下建立的DRSN模型的识别性能; 最后, 对上述不同信噪比的信号, 分别采用ResNet、1DCNN、LSTM和SDAE进行识别, 与本文采用的DRSN模型识别结果进行对比。
2.3.1 DRSN对3类目标的识别效果分析
定义每个训练批次为64, 训练50个周期, 学习率为0.001, 模型对原始数据的训练结果如图 7所示。
图7 DRSN训练精度和损失值变化过程曲线
图 7展示了模型的训练精度和损失值的变化过程。由图 7可知, DRSN具有较低的损失值, 反映了DRSN对训练数据具备良好的学习能力。同时, 该模型训练时收敛较快, 这得益于残差模块中的多次跳跃性连接和数据批量化处理。图 8的混淆矩阵显示, 类别1和类别2出现少量的识别错判问题, 类别3全部识别正确, 测试集中3种目标的平均识别精度达到98.1%, 表明该模型对本文所使用的数据集具有很好的识别效果。
图8 DRSN训练时分类的混淆矩阵
2.3.2 信噪比对DRSN模型识别效果的影响
DRSN引入软阈值函数和注意力机制, 可以有效地过滤噪声特征对识别的影响, 提高模型的噪声鲁棒性。本文为验证DRSN对HRRP识别中在不同信噪比条件下的识别性能, 对原始数据添加不同能量的高斯白噪声, 得到信噪比分别为5 dB、10 dB、15 dB、20 dB、25 dB和30 dB的信号, 信噪比SNR的定义如下所示:
(2)
式中: 为HRRP的平均功率; Pnoise为噪声功率。通过本文建立的DRSN模型进行训练后, 平均识别精度如表 1所示。
表1 不同信噪比下DRSN识别准确率比较
由表 1可知, 随着信噪比的降低, 模型的识别精度在下降, 由于引入软阈值函数, 可以自动调整阈值, 从而过滤掉一部分噪声。可以看到, 即使在5 dB信噪比下, DRSN模型仍具备69.8%的识别精度, 表明该网络对噪声具有鲁棒性。
2.3.3 不同信噪比下各网络模型识别效果对比
为进一步验证DRSN对噪声的鲁棒性, 本文对比了DRSN、ResNet、1DCNN、LSTM和SDAE等5种网络模型的识别效果, 输入信号为第2.3.3节中加噪处理得到的6种不同信噪比的信号。5种方法在不同信噪比下的平均识别率如图 9所示。
图9 通过5种不同方法比较信噪比对识别率的影响
从图 9可以看出, 当信噪比为30 dB时, 各个网络的识别效果都比较好, 本文采用的DRSN平均识别率最高, 达到97.3%, 比排名第2的SDAE模型高出2.9%。而随着信噪比的降低, 各个方法的识别性能总体降低, 但是本文使用的方法即使在5 dB和10 dB的信噪比下识别效果依然领先。综上所述, 本文采用的网络模型对噪声具有更强的鲁棒性。
3 结束语
本文提出一种用于雷达空中目标HRRP识别的DRSN。该网络引入深度残差网络、软阈值函数和注意力机制, 可以提高模型在高噪声数据或复杂数据上的特征学习效果, 而雷达回波数据中往往伴随着一些噪声和杂波, 因此DRSN非常适用于雷达回波数据。
本文对3种飞机目标的实测数据进行识别, 在不加入额外噪声的情况下平均识别精度可以达到98.1%, 具备较高的识别性能。而在对原始数据进行加噪处理后, 在不同信噪比条件下该模型依然具备较好的识别精度, 最后通过与其他几种常用于HRRP识别的深度学习模型进行比较, 在各个信噪比条件下, 本文提出的模型都具备一定的优势。结果表明, 本文提出的DRSN模型在空中目标HRRP识别中具备更优的性能。
在实际的雷达应用中, 雷达回波信号中除了噪声信息外, 还包含一定数量的地物杂波和气象杂波, 这部分杂波信号会干扰到正常目标的识别, 除了采用杂波抑制方法滤除杂波以外, 下一步还需要研究更稳健、更具泛化性的雷达目标识别算法以应对杂波干扰。此外, 雷达系统采样率也会对目标回波信号造成影响, 过低采样率可能会导致信号细节丢失或者不准确, 进而影响对目标结构细节的刻画, 不同采样率对雷达目标识别的影响, 也是下一步需要考虑的问题。最后, 在实际应用中, 非合作目标的数据获取往往比较困难, 样本数量较少, 因此下一步也将对非合作目标识别问题展开研究。
声明:公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨,并不意味着支持其观点或证实其内容的真实性。版权归原作者所有,如转载稿涉及版权等问题,请立即联系我们删除。