兵工学报 ›› 2024, Vol. 45 ›› Issue (7): 2128-2143.doi: 10.12382/bgxb.2023.0526
收稿日期:
2023-05-27
上线日期:
2023-08-15
通讯作者:
YANG Huanyu, WANG Jun*(), WU Xiang, BO Yuming, MA Lifeng, LU Jinlei
Received:
2023-05-27
Online:
2023-08-15
摘要:
战场态势瞬息万变,利用可见光图像对敌方用于军事行动的飞机类型进行有效区分,对提供军事作战信息具有重要意义。针对现有军用飞机识别方法存在小目标飞机和环境背景复杂导致的模型特征提取困难、数据样本数量不足导致的模型训练不充分的问题,提出一种坐标通道注意力(ConvNeXt-Coordinate Attention,ConvNeXt-CA)深度学习网络军用飞机目标识别方法。该方法在ConvNeXt网络可以保留小目标飞机特征的基础上,引入CA机制设计CA-Stage模块,提升网络对于背景和前景的区分能力;采用数据增强的方式扩充数据集,以及使用迁移学习的策略提高模型的泛化能力,训练得到具备最优超参数的ConvNeXt-CA网络。实验结果表明,与传统的军用飞机识别方法和其他深度学习模型相比,基于迁移学习的ConvNeXt-CA网络在预测准确率上有明显的提升,且具备较强的泛化能力。
中图分类号:
杨环宇, 王军, 吴祥, 薄煜明, 马立丰, 陆金磊. 一种坐标通道注意力深度学习网络的军用飞机识别方法[J]. 兵工学报, 2024, 45(7): 2128-2143.
YANG Huanyu, WANG Jun, WU Xiang, BO Yuming, MA Lifeng, LU Jinlei. A Method for Military Aircraft Recognition Using a Coordinate Attention-based Deep Learning Network[J]. Acta Armamentarii, 2024, 45(7): 2128-2143.
算法模型 | 预测准确度/% | epoch |
---|---|---|
HOG+SVM | 68.6 | 1 |
ResNet50 | 90.4 | 20 |
ResNet50-CBAM | 89.8 | 20 |
ResNet50-CA | 91.5 | 20 |
Swin-T | 92.0 | 20 |
VAN-B2 | 94.3 | 20 |
ConvNeXt | 93.5 | 20 |
ConvNeXt-CBAM | 94.7 | 20 |
ConvNeXt-CA-a | 94.8 | 20 |
ConvNeXt-CA | 96.0 | 20 |
表1 不同模型的最佳准确率
Table 1 Best accuracies of different models
算法模型 | 预测准确度/% | epoch |
---|---|---|
HOG+SVM | 68.6 | 1 |
ResNet50 | 90.4 | 20 |
ResNet50-CBAM | 89.8 | 20 |
ResNet50-CA | 91.5 | 20 |
Swin-T | 92.0 | 20 |
VAN-B2 | 94.3 | 20 |
ConvNeXt | 93.5 | 20 |
ConvNeXt-CBAM | 94.7 | 20 |
ConvNeXt-CA-a | 94.8 | 20 |
ConvNeXt-CA | 96.0 | 20 |
混淆矩阵 | 真实值 | ||
---|---|---|---|
正样本 | 负样本 | ||
预测值 | 正样本 | TP | FP |
负样本 | FN | TN |
表2 混淆矩阵基础指标关系
Table 2 Confusion matrix underlying index relation
混淆矩阵 | 真实值 | ||
---|---|---|---|
正样本 | 负样本 | ||
预测值 | 正样本 | TP | FP |
负样本 | FN | TN |
算法模型 | 精确率/% | 召回率/% | 特异度/% |
---|---|---|---|
ResNet50 | 91.04 | 90.13 | 99.70 |
ResNet50-CBAM | 90.97 | 89.19 | 99.69 |
ResNet50-CA | 91.87 | 91.01 | 99.73 |
Swin-T | 92.76 | 91.31 | 99.76 |
ConvNeXt | 93.71 | 92.75 | 99.80 |
ConvNeXt-CBAM | 95.73 | 93.86 | 99.83 |
ConvNeXt-CA-a | 95.15 | 94.34 | 99.84 |
ConvNeXt-CA | 96.12 | 95.33 | 99.88 |
表3 不同模型的评价指标数值
Table 3 The evaluation index values of different models
算法模型 | 精确率/% | 召回率/% | 特异度/% |
---|---|---|---|
ResNet50 | 91.04 | 90.13 | 99.70 |
ResNet50-CBAM | 90.97 | 89.19 | 99.69 |
ResNet50-CA | 91.87 | 91.01 | 99.73 |
Swin-T | 92.76 | 91.31 | 99.76 |
ConvNeXt | 93.71 | 92.75 | 99.80 |
ConvNeXt-CBAM | 95.73 | 93.86 | 99.83 |
ConvNeXt-CA-a | 95.15 | 94.34 | 99.84 |
ConvNeXt-CA | 96.12 | 95.33 | 99.88 |
图13 不同模型的热力图(左为不同模型识别F35飞机时的注意力热力图,中为C17,右为EF2000)
Fig.13 Heat maps of different models(left: the attention heatmaps of different models when recognizing F35 aircraft, middle: C17, and right: EF2000)
算法模型 | 准确度/% | 运行时间/s |
---|---|---|
ConvNeXt | 93.5 | 4.60 |
ConvNeXt+CA | 96 | 4.62 |
表4 不同方法的准确率和运行时间
Table 4 Recognition accuraciesandrun times of different methods
算法模型 | 准确度/% | 运行时间/s |
---|---|---|
ConvNeXt | 93.5 | 4.60 |
ConvNeXt+CA | 96 | 4.62 |
算法模型 | 训练准确度/% | epoch |
---|---|---|
ResNet50+迁移学习 | 86.1 | 20 |
ResNet50随机初始化 | 70.4 | 20 |
ConvNeXt+迁移学习 | 94.4 | 20 |
ConvNeXt随机初始化 | 83.1 | 20 |
表5 不同方法的准确率
Table 5 The accuracies of different methods
算法模型 | 训练准确度/% | epoch |
---|---|---|
ResNet50+迁移学习 | 86.1 | 20 |
ResNet50随机初始化 | 70.4 | 20 |
ConvNeXt+迁移学习 | 94.4 | 20 |
ConvNeXt随机初始化 | 83.1 | 20 |
算法模型 | 迁移学习 | CA | Epoch | 预测准确度/% |
---|---|---|---|---|
20 | 82.6 | |||
ConvNeXt | P | 20 | 93.5 | |
P | 20 | 84.2 | ||
P | P | 20 | 96.0 |
表6 不同改进方法对军用飞机图像识别性能的影响
Table 6 Effects of different improved methods on military aircraft image recognition results
算法模型 | 迁移学习 | CA | Epoch | 预测准确度/% |
---|---|---|---|---|
20 | 82.6 | |||
ConvNeXt | P | 20 | 93.5 | |
P | 20 | 84.2 | ||
P | P | 20 | 96.0 |
[1] |
张永梅, 赖裕平, 马健喆, 等. 基于视频的装甲车和飞机检测跟踪及轨迹预测算法[J]. 兵工学报, 2021, 42(3):545-554.
doi: 10.3969/j.issn.1000-1093.2021.03.010 |
doi: 10.3969/j.issn.1000-1093.2021.03.010 |
|
[2] |
|
[3] |
王铁虎, 焦爱泉, 冯连仲, 等. 精确打击作战与装甲装备未来发展[J]. 兵工学报, 2010, 31(增刊2):61-67.
|
|
|
[4] |
李明悦, 何乐生, 雷晨, 等. 基于注意力特征融合的SqueezeNet细粒度图像分类模型[J]. 云南大学学报(自然科学版), 2021, 43(5):868-876.
|
|
|
[5] |
龙怡灿, 雷蓉, 董杨, 等. 基于YOLOv5算法的飞机类型光学遥感识别[J]. 地球信息科学学报, 2022, 24(3):572-582.
doi: 10.12082/dqxxkx.2022.210369 |
|
|
[6] |
王娜, 胡超芳. 基于客观聚类的手写数字识别方法[J]. 复杂系统与复杂性科学, 2019, 16(2):77-84,94.
|
|
|
[7] |
|
[8] |
|
[9] |
|
[10] |
张宪法, 郝矿荣, 陈磊. 免疫多域特征融合的多核学习SVM运动想象脑电信号分类[J]. 自动化学报, 2020, 46(11):2417-2426.
|
|
|
[11] |
|
[12] |
|
[13] |
李泽东, 李志农, 陶俊勇, 等. 基于特征融合的注意力增强卷积神经网络的航空发动机滚动轴承故障诊断方法[J]. 兵工学报, 2022, 43(12):3228-3239.
|
|
|
[14] |
张良安, 陈洋, 谢胜龙, 等. 基于机器视觉与深度学习的飞机防护栅裂纹检测系统[J]. 兵工学报, 2023, 44(2):507-516.
doi: 10.12382/bgxb.2021.0674 |
doi: 10.12382/bgxb.2021.0674 |
|
[15] |
刘秋, 孙晋伟, 张华, 等. 基于卷积神经网络的路面识别及半主动悬架控制[J]. 兵工学报, 2020, 41(8):1483-1493.
doi: 10.3969/j.issn.1000-1093.2020.08.002 |
doi: 10.3969/j.issn.1000-1093.2020.08.002 |
|
[16] |
兰天, 李博, 杨敬宝. 基于小样本多背景下的飞机图像识别研究[J]. 电脑编程技巧与维护, 2020(4):142-144.
|
|
|
[17] |
张文达, 许悦雷, 倪嘉成, 等. 基于多尺度分块卷积神经网络的图像目标识别算法[J]. 计算机应用, 2016, 36(4):1033-1038.
doi: 10.11772/j.issn.1001-9081.2016.04.1033 |
doi: 10.11772/j.issn.1001-9081.2016.04.1033 |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[1] | 季稳, 李春娜, 贾续毅, 王刚, 龚春林. 结合系统辨识和迁移学习的高速旋转弹气动力建模方法[J]. 兵工学报, 2024, 45(7): 2197-2208. |
[2] | 罗皓文, 何绍溟, 亢有为. 一种基于迁移学习的多任务制导算法[J]. 兵工学报, 2024, 45(6): 1787-1798. |
[3] | 刘懿, 任济寰, 吴祥, 薄煜明. 基于集成迁移学习的新装备装甲车辆分类[J]. 兵工学报, 2023, 44(8): 2319-2328. |
[4] | 黄文宽, 钱林方, 尹强, 刘太素. 基于迁移学习的供药装置故障诊断方法[J]. 兵工学报, 2023, 44(10): 2964-2974. |
[5] | 庞伊琼, 许华, 张悦, 朱华丽, 彭翔. 基于迁移元学习的调制识别算法[J]. 兵工学报, 2023, 44(10): 2954-2963. |
[6] | 李泽东, 李志农, 陶俊勇, 毛清华, 张旭辉. 基于特征融合的注意力增强卷积神经网络的航空发动机滚动轴承故障诊断方法[J]. 兵工学报, 2022, 43(12): 3228-3239. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||