兵工学报 ›› 2024, Vol. 45 ›› Issue (7): 2085-2096.doi: 10.12382/bgxb.2023.0401
收稿日期:
2023-05-08
上线日期:
2023-08-18
通讯作者:
CHANG Tianqing1, ZHANG Jie1,*(), ZHAO Liyang2, HAN Bin1, ZHANG Lei1
Received:
2023-05-08
Online:
2023-08-18
摘要:
针对基于可见光图像的装甲目标检测算法易受地面复杂环境干扰的问题,提出一种基于可见光与红外图像融合的装甲目标检测算法,通过卷积神经网络自适应融合可见光和红外图像特征,提高对地面复杂环境下装甲目标的检测精度。针对装甲目标检测任务,通过实拍方式构建一个在复杂地面环境下的可见光-红外装甲(Visible-Thermal Armored Vehicle,VTAV)目标图像数据集;基于经典的单阶无锚框检测模型,设计前端特征融合结构、中端特征融合结构和后端特征融合结构;在VTAV数据集上对比不同融合结构和不同融合方式间的检测性能差异。实验结果表明,后端特征融合结构性能最佳,与基于可见光图像的装甲目标检测算法相比,mAP@0.5∶0.95提升2.6%,表明基于可见光与红外图像融合的装甲目标检测算法能够有效提升地面复杂环境下装甲目标的检测精度。
中图分类号:
常天庆, 张杰, 赵立阳, 韩斌, 张雷. 基于可见光与红外图像融合的装甲目标检测算法[J]. 兵工学报, 2024, 45(7): 2085-2096.
CHANG Tianqing, ZHANG Jie, ZHAO Liyang, HAN Bin, ZHANG Lei. Research on Armored Vehicle Detection Algorithm Based on Visible and Infrared Image Fusion[J]. Acta Armamentarii, 2024, 45(7): 2085-2096.
数据集名称 | 图像对数量 | 装甲目标数量 |
---|---|---|
VTAV数据集 | 4977 | 10244 |
训练集 | 3000 | 5784 |
验证集 | 977 | 2209 |
测试集 | 1000 | 2251 |
表1 VATV数据集信息
Table 1 Information of VTAV dataset
数据集名称 | 图像对数量 | 装甲目标数量 |
---|---|---|
VTAV数据集 | 4977 | 10244 |
训练集 | 3000 | 5784 |
验证集 | 977 | 2209 |
测试集 | 1000 | 2251 |
融合检测 结构 | 融合 级别 | 卷积核尺寸 | mAP@0.5/ % | mAP@0.5∶ 0.95/% | |
---|---|---|---|---|---|
1×1 | 3×3 | ||||
EFF | 像素级 | √ | 50.4 | 19.8 | |
EFF | 像素级 | √ | 62.2 | 28.6 | |
MFF | 特征级 | √ | 78.9 | 45.2 | |
MFF | 特征级 | √ | 78.9 | 45.8 | |
LFF | 特征级 | √ | 78.8 | 45.2 | |
LFF | 特征级 | √ | 79.3 | 46.1 |
表2 不同卷积核尺寸的融合效果
Table 2 Fusion effects of different convolutional kernel sizes
融合检测 结构 | 融合 级别 | 卷积核尺寸 | mAP@0.5/ % | mAP@0.5∶ 0.95/% | |
---|---|---|---|---|---|
1×1 | 3×3 | ||||
EFF | 像素级 | √ | 50.4 | 19.8 | |
EFF | 像素级 | √ | 62.2 | 28.6 | |
MFF | 特征级 | √ | 78.9 | 45.2 | |
MFF | 特征级 | √ | 78.9 | 45.8 | |
LFF | 特征级 | √ | 78.8 | 45.2 | |
LFF | 特征级 | √ | 79.3 | 46.1 |
融合检测 结构 | 融合 级别 | BN+Relu | mAP@0.5/ % | mAP@0.5∶ 0.95/% |
---|---|---|---|---|
EFF | 像素级 | 78.6 | 43.6 | |
EFF | 像素级 | √ | 62.2 | 28.6 |
MFF | 特征级 | 77.2 | 43.1 | |
MFF | 特征级 | √ | 78.9 | 45.8 |
LFF | 特征级 | 78.1 | 44.1 | |
LFF | 特征级 | √ | 79.3 | 46.1 |
表3 BN层和Relu激活层的融合效果
Table 3 Fusion effects of BN layer and Relu activation layer
融合检测 结构 | 融合 级别 | BN+Relu | mAP@0.5/ % | mAP@0.5∶ 0.95/% |
---|---|---|---|---|
EFF | 像素级 | 78.6 | 43.6 | |
EFF | 像素级 | √ | 62.2 | 28.6 |
MFF | 特征级 | 77.2 | 43.1 | |
MFF | 特征级 | √ | 78.9 | 45.8 |
LFF | 特征级 | 78.1 | 44.1 | |
LFF | 特征级 | √ | 79.3 | 46.1 |
BN+Relu | 预训练权重 | mAP@0.5/% | mAP@0.5∶0.95/% |
---|---|---|---|
67.8 | 31.0 | ||
√ | 68.2 | 31.3 | |
√ | 78.6 | 43.6 | |
√ | √ | 62.2 | 28.6 |
表4 预训练权重对前端融合检测结构的影响
Table 4 The influence of pre-trained weights on the structure of early feature fusion
BN+Relu | 预训练权重 | mAP@0.5/% | mAP@0.5∶0.95/% |
---|---|---|---|
67.8 | 31.0 | ||
√ | 68.2 | 31.3 | |
√ | 78.6 | 43.6 | |
√ | √ | 62.2 | 28.6 |
检测结构 | 融合方式 | mAP@0.5/% | mAP@0.5∶0.95/% | mAP@0.5∶0.95精度差 | FPS/(帧·s) | ||
---|---|---|---|---|---|---|---|
Add | Concatenation | RGBT | |||||
FCOS_T | 61.6 | 24.2 | -19.3 | 29.8 | |||
FCOS_RGB | 78.5 | 43.5 | 0 | 29.8 | |||
EFF | √ | 76.5 | 39.6 | -3.9 | 28.8 | ||
EFF | √ | 78.7 | 43.6 | +0.1 | 28.6 | ||
EFF | √ | 72.0 | 39.6 | -3.9 | 28.7 | ||
MFF | √ | 78.9 | 44.5 | +1 | 19.5 | ||
MFF | √ | 78.9 | 45.8 | +2.3 | 13 | ||
LFF | √ | 79.2 | 45.8 | +2.3 | 18.9 | ||
LFF | √ | 79.3 | 46.1 | +2.6 | 18 |
表5 不同检测模型实验结果
Table 5 Experimental results of different detection models
检测结构 | 融合方式 | mAP@0.5/% | mAP@0.5∶0.95/% | mAP@0.5∶0.95精度差 | FPS/(帧·s) | ||
---|---|---|---|---|---|---|---|
Add | Concatenation | RGBT | |||||
FCOS_T | 61.6 | 24.2 | -19.3 | 29.8 | |||
FCOS_RGB | 78.5 | 43.5 | 0 | 29.8 | |||
EFF | √ | 76.5 | 39.6 | -3.9 | 28.8 | ||
EFF | √ | 78.7 | 43.6 | +0.1 | 28.6 | ||
EFF | √ | 72.0 | 39.6 | -3.9 | 28.7 | ||
MFF | √ | 78.9 | 44.5 | +1 | 19.5 | ||
MFF | √ | 78.9 | 45.8 | +2.3 | 13 | ||
LFF | √ | 79.2 | 45.8 | +2.3 | 18.9 | ||
LFF | √ | 79.3 | 46.1 | +2.6 | 18 |
目标检测算法 | 输入图像 | mAP@0.5/% | mAP@0.5∶0.95/% |
---|---|---|---|
YOLOv5_n | RGB | 75.9 | 44.4 |
YOLOv5_n | RGB+T | 77.2(+1.3) | 45.9(+1.5) |
YOLOv5_s | RGB | 78.4 | 48.6 |
YOLOv5_s | RGB+T | 81.0(+2.6) | 50.5(+1.9) |
YOLOv7_tiny | RGB | 78.5 | 45.7 |
YOLOv7_tiny | RGB+T | 79(+0.5) | 46.5(+0.8) |
YOLOv8_n | RGB | 77.2 | 46.8 |
YOLOv8_n_ | RGB+T | 78.8(+1.6) | 47.7(+0.9) |
表7 拓展实验结果
Table 7 Results of extended experiments
目标检测算法 | 输入图像 | mAP@0.5/% | mAP@0.5∶0.95/% |
---|---|---|---|
YOLOv5_n | RGB | 75.9 | 44.4 |
YOLOv5_n | RGB+T | 77.2(+1.3) | 45.9(+1.5) |
YOLOv5_s | RGB | 78.4 | 48.6 |
YOLOv5_s | RGB+T | 81.0(+2.6) | 50.5(+1.9) |
YOLOv7_tiny | RGB | 78.5 | 45.7 |
YOLOv7_tiny | RGB+T | 79(+0.5) | 46.5(+0.8) |
YOLOv8_n | RGB | 77.2 | 46.8 |
YOLOv8_n_ | RGB+T | 78.8(+1.6) | 47.7(+0.9) |
[1] |
刘科. 认知技术在战场态势感知中的应用[J]. 指挥信息系统与技术, 2021, 12(3):13-18.
|
|
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
doi: 10.1109/TPAMI.2016.2577031 pmid: 27295650 |
[8] |
|
[9] |
王全东, 常天庆, 张雷, 等. 基于深度学习算法的坦克装甲目标自动检测与跟踪系统[J]. 系统工程与电子技术, 2018, 40(9):2143-2156.
|
|
|
[10] |
于博文, 吕明. 改进的YOLOv3算法及其在军事目标检测中的应用[J]. 兵工学报, 2022, 43(2):345-354.
doi: 10.3969/j.issn.1000-1093.2022.02.012 |
|
|
[11] |
宋晓茹, 刘康, 高嵩, 等. 复杂战场环境下改进YOLOv5军事目标识别算法研究[J]. 兵工学报, 2024, 45(3):934-947.
doi: 10.12382/bgxb.2022.0736 |
|
|
[12] |
盛大俊, 张强. 基于边缘感知的深度神经网络红外装甲目标检测[J]. 红外技术, 2021, 43(8):784-791.
|
|
|
[13] |
|
[14] |
|
[15] |
别倩, 王晓, 徐新, 等. 红外—可见光跨模态的行人检测综述[J]. 中国图象图形学报, 2023, 28(5): 1287-1307.
|
|
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[1] | 刘鹏, 熊泽宇, 景文博, 冯萱, 张俊豪, 刘桐伯, 吴雪妮, 夏璇, 万琳琳, 赵海丽. 降质靶标检测算法[J]. 兵工学报, 2024, 45(6): 2065-2075. |
[2] | 武凌霄, 康家银, 姬云翔, 马寒雁. 基于多判别器双流生成对抗网络的红外与可见光图像融合[J]. 兵工学报, 2024, 45(6): 1799-1812. |
[3] | 梁国龙, 罗钧戈, 郝宇, 付进. 一种基于组合子阵协方差矩阵的阵列扩展方法[J]. 兵工学报, 2024, 45(5): 1717-1724. |
[4] | 沈英, 刘贤财, 王舒, 黄峰. 基于偏振编码图像的低空伪装目标实时检测[J]. 兵工学报, 2024, 45(5): 1374-1383. |
[5] | 宋晓茹, 刘康, 高嵩, 陈超波, 阎坤. 复杂战场环境下改进YOLOv5军事目标识别算法研究[J]. 兵工学报, 2024, 45(3): 934-947. |
[6] | 熊光明, 罗震, 孙冬, 陶俊峰, 唐泽月, 吴超. 基于红外相机和毫米波雷达融合的烟雾遮挡无人驾驶车辆目标检测与跟踪[J]. 兵工学报, 2024, 45(3): 893-906. |
[7] | 秦昊林, 许廷发, 李佳男. 基于超像素注意力和孪生结构的半监督高光谱显著性目标检测[J]. 兵工学报, 2023, 44(9): 2639-2649. |
[8] | 惠康华, 杨卫, 刘浩翰, 张智, 郑锦, 百晓. 基于YOLOv5的增强多尺度目标检测方法[J]. 兵工学报, 2023, 44(9): 2600-2610. |
[9] | 彭沛然, 任术波, 李佳男, 周鸿伟, 许廷发. 基于光照感知的多光谱融合行人检测方法[J]. 兵工学报, 2023, 44(9): 2622-2630. |
[10] | 周宇, 曹荣刚, 栗苹, 马啸. 一种用于外场试验图像的引信炸点检测方法[J]. 兵工学报, 2023, 44(8): 2453-2464. |
[11] | 王学敏, 于洪波, 张翔宇, 安舒, 李文海. 基于Hough变换检测前跟踪的水下多目标被动检测方法[J]. 兵工学报, 2023, 44(7): 2114-2121. |
[12] | 柳嵩, 姚直象, 陆代强, 袁骏. 一种基于被动声呐宽带空间谱的自动检测算法[J]. 兵工学报, 2023, 44(6): 1764-1774. |
[13] | 夏琳琳, 张晶晶, 初妍, 张道畅, 宋梓维, 崔家硕, 刘瑞敏. 融合天空偏振光的视觉SLAM研究进展与展望[J]. 兵工学报, 2023, 44(6): 1588-1601. |
[14] | 刘佳, 刘海鸥, 陈慧岩, 毛飞鸿. 基于融合特征的无人履带车辆道路类型识别方法[J]. 兵工学报, 2023, 44(5): 1267-1276. |
[15] | 王检, 张邦宁, 张洁, 魏国峰, 郭道省. 基于多域特征融合的通信辐射源个体识别方法[J]. 兵工学报, 2023, 44(4): 949-959. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||