兵工学报 ›› 2024, Vol. 45 ›› Issue (3): 934-947.doi: 10.12382/bgxb.2022.0736
宋晓茹1,*(), 刘康1, 高嵩1, 陈超波1,2, 阎坤1
收稿日期:
2022-08-21
上线日期:
2022-12-21
通讯作者:
基金资助:
SONG Xiaoru1,*(), LIU Kang1, GAO Song1, CHEN Chaobo1,2, YAN Kun1
Received:
2022-08-21
Online:
2022-12-21
摘要:
复杂战场环境下军事目标识别技术是提升战场情报获取能力的基础和关键。针对当前军事目标识别技术在复杂战场环境下漏检误检率高、实时性差等问题,提出一种基于改进YOLOv5模型的PB-YOLO军事目标识别算法。将改进的目标识别算法对于陆战场军事单元的识别锚框进行重新聚类,以提升模型对于目标大小适应度,加速模型收敛;采用通道-空间并行注意力机制,增加模型对复杂战场环境下目标特征信息与位置信息关注度;在特征融合网络部分使用BiFPN以提升模型对于特征的融合能力与速度;采用Alpha_IoU损失函数加速模型收敛,解决当真实框与预测框重合时IoU计算退化问题。实验结果表明,在自建军事目标数据集下,改进算法与主流目标识别算法相比,在保证模型空间复杂度的同时,mAP值达到了90.17%。消融实验对比结果表明,改进后网络较原模型精度提升11.57%,具有较好的识别性能,能够为战场情报获取提供有效的技术支撑。
中图分类号:
宋晓茹, 刘康, 高嵩, 陈超波, 阎坤. 复杂战场环境下改进YOLOv5军事目标识别算法研究[J]. 兵工学报, 2024, 45(3): 934-947.
SONG Xiaoru, LIU Kang, GAO Song, CHEN Chaobo, YAN Kun. Research on Improved YOLOv5-based Military Target Recognition Algorithm Used in Complex Battlefield Environment[J]. Acta Armamentarii, 2024, 45(3): 934-947.
参数 | 数值 |
---|---|
lr | 0.01 |
momentum | 0.937 |
weight_decay | 0.0005 |
batch_size | 16 |
image_size | 640×640 |
epoch | 300 |
表1 初始参数设置
Table 1 Initial parameter setting table
参数 | 数值 |
---|---|
lr | 0.01 |
momentum | 0.937 |
weight_decay | 0.0005 |
batch_size | 16 |
image_size | 640×640 |
epoch | 300 |
数量及尺寸 | 坦克 | 士兵 | 装甲车 | 自行火炮 |
---|---|---|---|---|
数量/个 | 1652 | 2497 | 1086 | 1087 |
尺寸/m | 11×3.4×2 | 5.5×2.5×2.3 | 8×3×2.1 |
表2 目标数量及尺寸统计
Table 2 Statistical table of target quantity and size
数量及尺寸 | 坦克 | 士兵 | 装甲车 | 自行火炮 |
---|---|---|---|---|
数量/个 | 1652 | 2497 | 1086 | 1087 |
尺寸/m | 11×3.4×2 | 5.5×2.5×2.3 | 8×3×2.1 |
序号 | 先验框宽高值 |
---|---|
1 | [12.734 28.496] |
2 | [18.768 39.405] |
3 | [52.218 42.258] |
4 | [35.064 83.506] |
5 | [102.03 61.18] |
6 | [153.82 115.14] |
7 | [232.96 306.19] |
8 | [409.64 177.11] |
9 | [526.23 396.53] |
表3 重聚类后先验框宽高值
Table 3 Prior box width and height values after reclustering
序号 | 先验框宽高值 |
---|---|
1 | [12.734 28.496] |
2 | [18.768 39.405] |
3 | [52.218 42.258] |
4 | [35.064 83.506] |
5 | [102.03 61.18] |
6 | [153.82 115.14] |
7 | [232.96 306.19] |
8 | [409.64 177.11] |
9 | [526.23 396.53] |
主流算法 | 模型体积/MB | FPS | mAP/% |
---|---|---|---|
Faster R-CNN | 159.7 | 6.5 | 86.7 |
SSD | 23.1 | 38 | 83.4 |
ShuffleNet | 3.0 | 28 | 73.3 |
MobileNet | 8.0 | 34 | 74.8 |
YOLOv3 | 235.6 | 20 | 82.1 |
YOLOv4 | 244.8 | 48 | 83.1 |
YOLOv5m | 118.3 | 44.3 | 81.5 |
YOLOv5l | 226.7 | 43.2 | 83.4 |
YOLOv5x | 401.0 | 40.9 | 84.0 |
YOLOv5s+SE | 60.0 | 42 | 81.1 |
YOLOv5s+CBAM | 63.0 | 37 | 84.0 |
PB-YOLO(无BiFPN) | 63.3 | 51 | 85.0 |
PB-YOLO | 64.0 | 57 | 90.17 |
表4 主流算法识别结果对比
Table 4 Comparison of recognition results of mainstream algorithms
主流算法 | 模型体积/MB | FPS | mAP/% |
---|---|---|---|
Faster R-CNN | 159.7 | 6.5 | 86.7 |
SSD | 23.1 | 38 | 83.4 |
ShuffleNet | 3.0 | 28 | 73.3 |
MobileNet | 8.0 | 34 | 74.8 |
YOLOv3 | 235.6 | 20 | 82.1 |
YOLOv4 | 244.8 | 48 | 83.1 |
YOLOv5m | 118.3 | 44.3 | 81.5 |
YOLOv5l | 226.7 | 43.2 | 83.4 |
YOLOv5x | 401.0 | 40.9 | 84.0 |
YOLOv5s+SE | 60.0 | 42 | 81.1 |
YOLOv5s+CBAM | 63.0 | 37 | 84.0 |
PB-YOLO(无BiFPN) | 63.3 | 51 | 85.0 |
PB-YOLO | 64.0 | 57 | 90.17 |
模型 | 识别算法及改进 | Parameters/M | GFLOPs | Training time/h | mAP/% |
---|---|---|---|---|---|
A | YOLOv5 | 7.021 | 15.8 | 4.12 | 78.6 |
B | A+通道注意力机制 | 6.932 | 15.5 | 4.5 | 80.4 |
C | A+空间注意力机制 | 6.879 | 15.7 | 4.37 | 81.2 |
D | A+并行注意力机制 | 6.713 | 15.3 | 5.12 | 84.3 |
E | A+Alpha-IoU | 7.021 | 15.8 | 3.495 | 79.3 |
F | B+Alpha-IoU | 6.932 | 15.5 | 4.39 | 80.8 |
G | C+Alpha-IoU | 6.879 | 15.7 | 4.22 | 81.5 |
H | D+Alpha-IoU | 6.713 | 15.3 | 4.75 | 85.0 |
I | A+BiFPN | 7.169 | 16.5 | 2.126 | 83.6 |
J | D+BiFPN | 6.862 | 15.9 | 3.304 | 89.47 |
K | E+BiFPN | 7.169 | 16.5 | 2.061 | 85.5 |
L | H+BiFPN | 6.862 | 15.9 | 3.261 | 90.17 |
表5 PB-YOLO消融实验对比
Table 5 PB-YOLO ablation experiment comparison
模型 | 识别算法及改进 | Parameters/M | GFLOPs | Training time/h | mAP/% |
---|---|---|---|---|---|
A | YOLOv5 | 7.021 | 15.8 | 4.12 | 78.6 |
B | A+通道注意力机制 | 6.932 | 15.5 | 4.5 | 80.4 |
C | A+空间注意力机制 | 6.879 | 15.7 | 4.37 | 81.2 |
D | A+并行注意力机制 | 6.713 | 15.3 | 5.12 | 84.3 |
E | A+Alpha-IoU | 7.021 | 15.8 | 3.495 | 79.3 |
F | B+Alpha-IoU | 6.932 | 15.5 | 4.39 | 80.8 |
G | C+Alpha-IoU | 6.879 | 15.7 | 4.22 | 81.5 |
H | D+Alpha-IoU | 6.713 | 15.3 | 4.75 | 85.0 |
I | A+BiFPN | 7.169 | 16.5 | 2.126 | 83.6 |
J | D+BiFPN | 6.862 | 15.9 | 3.304 | 89.47 |
K | E+BiFPN | 7.169 | 16.5 | 2.061 | 85.5 |
L | H+BiFPN | 6.862 | 15.9 | 3.261 | 90.17 |
[1] |
|
[2] |
于博文, 吕明. 改进的YOLOv3算法及其在军事目标检测中的应用[J]. 兵工学报, 2022, 43(2):345-354.
doi: 10.3969/j.issn.1000-1093.2022.02.012 |
doi: 10.3969/j.issn.1000-1093.2022.02.012 |
|
[3] |
刘俊, 孟伟秀, 余杰, 等. 面向军事目标识别的DRFCN深度网络设计及实现[J]. 光电工程, 2019, 46(4):21-30.
|
|
|
[4] |
|
[5] |
doi: 10.1109/ACCESS.2021.3072211 URL |
[6] |
|
[7] |
doi: 10.1007/s11042-022-12715-4 |
[8] |
doi: 10.1016/j.neucom.2019.05.031 |
[9] |
doi: 10.3390/rs14040874 URL |
[10] |
|
[11] |
孙剑明, 韩生权, 沈子成, 等. 基于双卷积链的双目人体姿态距离定位识别[J/OL]. 兵工学报:1-8[2022-08-23]. DOI: 10.12382/bgxb.2021.0629.
|
|
|
[12] |
|
[13] |
|
[14] |
doi: 10.3233/JCM-226112 URL |
[15] |
doi: 10.1109/TPAMI.34 URL |
[16] |
潘浩. 基于深度学习的军事目标识别[D]. 杭州: 杭州电子科技大学, 2018.
|
|
|
[17] |
|
[18] |
陈龙, 张峰, 蒋升. 小样本条件下基于深度森林学习模型的典型军事目标识别方法[J]. 中国电子科学研究院学报, 2019, 14(3):232-237.
|
|
|
[19] |
林洋, 董宝良, 刘泽平. 一种基于CGAN和GcForest的军事目标识别方法[J]. 信息技术, 2020, 44(3):134-138.
|
|
|
[20] |
杨朝红, 王伟男. 基于优化SSD300的小尺度典型军事目标识别方法研究[J]. 电脑与信息技术, 2020, 28(4):19-22.
|
|
|
[21] |
李鑫, 王晟全, 李昂. 基于非监督网络的军事目标识别算法的研究[J]. 电光与控制, 2021, 28(10): 36-39.
|
|
|
[22] |
|
[23] |
|
[24] |
|
[25] |
doi: 10.3390/s22155903 URL |
[26] |
|
[27] |
|
[28] |
任江涛, 李定主, 屠惠琳. 基于训练网络的目标检测方法及应用[J]. 火力与指挥控制, 2020, 45(4):173-177.
|
|
[1] | 惠康华, 杨卫, 刘浩翰, 张智, 郑锦, 百晓. 基于YOLOv5的增强多尺度目标检测方法[J]. 兵工学报, 2023, 44(9): 2600-2610. |
[2] | 周宇, 曹荣刚, 栗苹, 马啸. 一种用于外场试验图像的引信炸点检测方法[J]. 兵工学报, 2023, 44(8): 2453-2464. |
[3] | 王检, 张邦宁, 张洁, 魏国峰, 郭道省. 基于多域特征融合的通信辐射源个体识别方法[J]. 兵工学报, 2023, 44(4): 949-959. |
[4] | 丁伯圣, 张睿恒, 徐立新, 陈慧敏. 基于灰度补偿和特征融合的沙尘图像修复方法[J]. 兵工学报, 2023, 44(10): 3115-3126. |
[5] | 于博文, 吕明. 改进的YOLOv3算法及其在军事目标检测中的应用[J]. 兵工学报, 2022, 43(2): 345-354. |
[6] | 李泽东, 李志农, 陶俊勇, 毛清华, 张旭辉. 基于特征融合的注意力增强卷积神经网络的航空发动机滚动轴承故障诊断方法[J]. 兵工学报, 2022, 43(12): 3228-3239. |
[7] | 才华, 孙俊, 朱瑞昆, 朱新丽, 赵义武. 基于自适应圆边际的深度人脸识别算法[J]. 兵工学报, 2021, 42(11): 2424-2432. |
[8] | 李响, 苏娟, 杨龙. 基于改进YOLOv3的合成孔径雷达图像中建筑物检测算法[J]. 兵工学报, 2020, 41(7): 1347-1359. |
[9] | 刘昊, 谢鹏, 李玥. 联合火力打击中的多目标组合排序算法[J]. 兵工学报, 2020, 41(12): 2570-2578. |
阅读次数 | ||||||||||||||||||||||||||||||||||||||||||||||||||
全文 1095
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||
摘要 1434
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||