兵工学报 ›› 2024, Vol. 45 ›› Issue (S1): 219-230.doi: 10.12382/bgxb.2024.0587
刘锟龙1, 王虎1,*(), 刘小强1, 牛帅旭1, 黄奕1, 付琦2, 赵涛3
收稿日期:
2024-07-15
上线日期:
2024-11-06
通讯作者:
LIU Kunlong1, WANG Hu1,*(), LIU Xiaoqiang1, NIU Shuaixu1, HUANG Yi1, FU Qi2, ZHAO Tao3
Received:
2024-07-15
Online:
2024-11-06
摘要:
在智能光电设备中,基于人工智能的可见光-热红外(Red Greed Blue-Thermal, RGB-T)图像语义分割任务可以广泛应用于自动驾驶、无人机航拍、视频监控等。图像的光照信息能在一定程度上反映场景中图像局部区域信息的可靠性,利用光照先验信息有助于进一步提高语义分割的性能。基于此,提出一种基于光照感知和特征增强的RGB-T图像语义分割模型,通过挖掘光照先验信息并结合注意力机制,引导网络在多模态图像特征融合过程中更加关注可靠信息的提取,同时抑制干扰信息的引入。实验在MFNet数据集上与最新的12种方法进行了比较,相比于性能第2的模型,mAcc提高了5.4%,mIoU提高了1.0%。所提网络模型能够获得更准确的分割结果,并通过定性定量实验验证所提模型及各个模块的有效性。
中图分类号:
刘锟龙, 王虎, 刘小强, 牛帅旭, 黄奕, 付琦, 赵涛. 基于光照感知和特征增强的可见光-热红外图像语义分割[J]. 兵工学报, 2024, 45(S1): 219-230.
LIU Kunlong, WANG Hu, LIU Xiaoqiang, NIU Shuaixu, HUANG Yi, FU Qi, ZHAO Tao. Illumination Perception and Feature Enhancement Network for RGB-T Semantic Segmentation[J]. Acta Armamentarii, 2024, 45(S1): 219-230.
阶段 | 输入 | 具体操作 | 输出 |
---|---|---|---|
RGB输入图像 (640×480×3) | Conv(s=1,p=1),ReLU, Maxpool(k=2×2) | 下采样特征图 (320×240×64) | |
S1:特征图下采样 | 下采样特征图 (320×240×64) | Conv(s=1,p=1),ReLU, Maxpool(k=2×2) | 下采样特征图 (160×120×128) |
下采样特征图 (160×120×128) | Conv(s=1,p=1),ReLU, Maxpool(k=2×2) | 下采样特征图 (80×60×256) | |
下采样特征图 (80×60×256) | Conv(s=1,p=1),ReLU, Maxpool(k=2×2) | 下采样特征图 (40×30×256) | |
S2:光照感知特征图生成 | 下采样特征图 (40×30×256) | Conv(s=1,p=1) | 光照感知特征图 (40×30×2) |
S3:分类 | 光照感知特征图 (40×30×2) | 全局平均池化 | 分类特征图 (1×1×2) |
表1 IPNet结构细节
Table 1 Details of illumination perception network construction
阶段 | 输入 | 具体操作 | 输出 |
---|---|---|---|
RGB输入图像 (640×480×3) | Conv(s=1,p=1),ReLU, Maxpool(k=2×2) | 下采样特征图 (320×240×64) | |
S1:特征图下采样 | 下采样特征图 (320×240×64) | Conv(s=1,p=1),ReLU, Maxpool(k=2×2) | 下采样特征图 (160×120×128) |
下采样特征图 (160×120×128) | Conv(s=1,p=1),ReLU, Maxpool(k=2×2) | 下采样特征图 (80×60×256) | |
下采样特征图 (80×60×256) | Conv(s=1,p=1),ReLU, Maxpool(k=2×2) | 下采样特征图 (40×30×256) | |
S2:光照感知特征图生成 | 下采样特征图 (40×30×256) | Conv(s=1,p=1) | 光照感知特征图 (40×30×2) |
S3:分类 | 光照感知特征图 (40×30×2) | 全局平均池化 | 分类特征图 (1×1×2) |
方法 | 无标签 | 车辆 | 人 | 自行车 | 地线 | 车档 | 护栏 | 色锥 | 凸起 | mAcc | mIoU | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Acc | IoU | Acc | IoU | Acc | IoU | Acc | IoU | Acc | IoU | Acc | IoU | Acc | IoU | Acc | IoU | Acc | IoU | |||
DUC[ | 98.8 | 97.7 | 92.4 | 82.5 | 84.1 | 69.4 | 71.3 | 58.9 | 58.4 | 40.1 | 25.5 | 20.9 | 17.3 | 3.4 | 60.0 | 42.1 | 52.2 | 40.9 | 61.2 | 50.7 |
DANet[ | 97.4 | 96.3 | 91.3 | 71.3 | 82.7 | 48.1 | 79.2 | 51.8 | 48.0 | 30.2 | 25.5 | 18.2 | 5.2 | 0.7 | 47.6 | 30.3 | 19.9 | 18.8 | 55.2 | 41.3 |
HRNet[ | 99.4 | 98.0 | 90.8 | 86.9 | 75.1 | 67.3 | 70.2 | 59.2 | 39.1 | 35.3 | 28.0 | 23.1 | 12.1 | 1.7 | 50.4 | 46.6 | 55.8 | 47.3 | 57.9 | 51.7 |
LDFNet[ | 96.2 | 95.3 | 87.0 | 67.9 | 83.9 | 58.2 | 82.7 | 37.2 | 67.4 | 30.4 | 32.9 | 20.1 | 8.2 | 0.8 | 67.4 | 27.1 | 55.6 | 46.0 | 64.6 | 42.5 |
ACNet[ | 97.6 | 96.7 | 93.7 | 79.4 | 86.8 | 64.7 | 77.8 | 52.7 | 57.2 | 32.9 | 51.5 | 28.4 | 7.0 | 0.8 | 57.5 | 16.9 | 49.8 | 44.4 | 64.3 | 46.3 |
SA-Gate[ | 98.2 | 96.8 | 86.0 | 73.8 | 80.8 | 59.2 | 69.4 | 51.3 | 56.7 | 38.4 | 24.7 | 19.3 | 0.0 | 0.0 | 56.9 | 24.5 | 52.1 | 48.8 | 58.3 | 45.8 |
MFNet[ | 98.7 | 96.9 | 77.2 | 65.9 | 67.0 | 58.9 | 53.9 | 42.9 | 36.2 | 29.9 | 12.5 | 9.9 | 0.1 | 0.0 | 30.3 | 25.2 | 30.0 | 27.7 | 45.1 | 39.7 |
RTFNet[ | 99.6 | 98.2 | 91.3 | 86.3 | 78.2 | 67.8 | 71.5 | 58.2 | 59.8 | 43.7 | 32.1 | 24.3 | 13.4 | 3.6 | 40.4 | 26.0 | 73.5 | 57.2 | 62.2 | 54.6 |
PSTNet[ | — | 97.0 | — | 76.8 | — | 52.6 | — | 55.3 | — | 29.6 | — | 25.1 | — | 15.1 | — | 39.4 | — | 45.0 | — | 48.4 |
AFNet[ | — | — | 91.2 | 86.0 | 76.3 | 67.4 | 72.8 | 62.0 | 49.8 | 43.0 | 35.3 | 28.9 | 24.5 | 4.6 | 50.1 | 44.9 | 61.0 | 56.6 | 62.2 | 54.6 |
MMNet[ | — | — | — | 83.9 | — | 69.3 | — | 59.0 | — | 43.2 | — | 24.7 | — | 4.6 | — | 42.2 | — | 50.7 | 62.7 | 52.8 |
MLFNet[ | — | — | — | 82.3 | — | 68.1 | — | 67.3 | — | 27.3 | — | 30.4 | — | 15.7 | — | 55.6 | — | 40.1 | — | 53.8 |
本文算法 | 99.0 | 97.9 | 92.4 | 85.3 | 82.1 | 71.6 | 73.5 | 60.7 | 61.7 | 46.1 | 41.0 | 31.4 | 38.0 | 7.1 | 54.6 | 47.3 | 71.2 | 46.0 | 68.1 | 54.8 |
表3 不同方法的测试结果对比
Table 3 Comparison of test results of different models
方法 | 无标签 | 车辆 | 人 | 自行车 | 地线 | 车档 | 护栏 | 色锥 | 凸起 | mAcc | mIoU | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Acc | IoU | Acc | IoU | Acc | IoU | Acc | IoU | Acc | IoU | Acc | IoU | Acc | IoU | Acc | IoU | Acc | IoU | |||
DUC[ | 98.8 | 97.7 | 92.4 | 82.5 | 84.1 | 69.4 | 71.3 | 58.9 | 58.4 | 40.1 | 25.5 | 20.9 | 17.3 | 3.4 | 60.0 | 42.1 | 52.2 | 40.9 | 61.2 | 50.7 |
DANet[ | 97.4 | 96.3 | 91.3 | 71.3 | 82.7 | 48.1 | 79.2 | 51.8 | 48.0 | 30.2 | 25.5 | 18.2 | 5.2 | 0.7 | 47.6 | 30.3 | 19.9 | 18.8 | 55.2 | 41.3 |
HRNet[ | 99.4 | 98.0 | 90.8 | 86.9 | 75.1 | 67.3 | 70.2 | 59.2 | 39.1 | 35.3 | 28.0 | 23.1 | 12.1 | 1.7 | 50.4 | 46.6 | 55.8 | 47.3 | 57.9 | 51.7 |
LDFNet[ | 96.2 | 95.3 | 87.0 | 67.9 | 83.9 | 58.2 | 82.7 | 37.2 | 67.4 | 30.4 | 32.9 | 20.1 | 8.2 | 0.8 | 67.4 | 27.1 | 55.6 | 46.0 | 64.6 | 42.5 |
ACNet[ | 97.6 | 96.7 | 93.7 | 79.4 | 86.8 | 64.7 | 77.8 | 52.7 | 57.2 | 32.9 | 51.5 | 28.4 | 7.0 | 0.8 | 57.5 | 16.9 | 49.8 | 44.4 | 64.3 | 46.3 |
SA-Gate[ | 98.2 | 96.8 | 86.0 | 73.8 | 80.8 | 59.2 | 69.4 | 51.3 | 56.7 | 38.4 | 24.7 | 19.3 | 0.0 | 0.0 | 56.9 | 24.5 | 52.1 | 48.8 | 58.3 | 45.8 |
MFNet[ | 98.7 | 96.9 | 77.2 | 65.9 | 67.0 | 58.9 | 53.9 | 42.9 | 36.2 | 29.9 | 12.5 | 9.9 | 0.1 | 0.0 | 30.3 | 25.2 | 30.0 | 27.7 | 45.1 | 39.7 |
RTFNet[ | 99.6 | 98.2 | 91.3 | 86.3 | 78.2 | 67.8 | 71.5 | 58.2 | 59.8 | 43.7 | 32.1 | 24.3 | 13.4 | 3.6 | 40.4 | 26.0 | 73.5 | 57.2 | 62.2 | 54.6 |
PSTNet[ | — | 97.0 | — | 76.8 | — | 52.6 | — | 55.3 | — | 29.6 | — | 25.1 | — | 15.1 | — | 39.4 | — | 45.0 | — | 48.4 |
AFNet[ | — | — | 91.2 | 86.0 | 76.3 | 67.4 | 72.8 | 62.0 | 49.8 | 43.0 | 35.3 | 28.9 | 24.5 | 4.6 | 50.1 | 44.9 | 61.0 | 56.6 | 62.2 | 54.6 |
MMNet[ | — | — | — | 83.9 | — | 69.3 | — | 59.0 | — | 43.2 | — | 24.7 | — | 4.6 | — | 42.2 | — | 50.7 | 62.7 | 52.8 |
MLFNet[ | — | — | — | 82.3 | — | 68.1 | — | 67.3 | — | 27.3 | — | 30.4 | — | 15.7 | — | 55.6 | — | 40.1 | — | 53.8 |
本文算法 | 99.0 | 97.9 | 92.4 | 85.3 | 82.1 | 71.6 | 73.5 | 60.7 | 61.7 | 46.1 | 41.0 | 31.4 | 38.0 | 7.1 | 54.6 | 47.3 | 71.2 | 46.0 | 68.1 | 54.8 |
B | I.W. | AIFE | MFIF | mAcc/% | MIoU/% |
---|---|---|---|---|---|
√ | 58.2 | 49.4 | |||
√ | √ | √ | 59.2 | 51.2 | |
√ | √ | 63.2 | 51.1 | ||
√ | √ | √ | 64.3 | 51.9 | |
√ | √ | √ | √ | 68.1 | 54.8 |
表5 不同组件的客观性能比较表
Table 5 Objective performance comparison table for different components
B | I.W. | AIFE | MFIF | mAcc/% | MIoU/% |
---|---|---|---|---|---|
√ | 58.2 | 49.4 | |||
√ | √ | √ | 59.2 | 51.2 | |
√ | √ | 63.2 | 51.1 | ||
√ | √ | √ | 64.3 | 51.9 | |
√ | √ | √ | √ | 68.1 | 54.8 |
方法 | mAcc/% | mIoU/% |
---|---|---|
图像级权重 | 64.9 | 52.2 |
像素级权重 | 68.1 | 54.8 |
表6 不同类型光照权重的客观性能比较表
Table 6 Objective performance comparison table for different illumination weights
方法 | mAcc/% | mIoU/% |
---|---|---|
图像级权重 | 64.9 | 52.2 |
像素级权重 | 68.1 | 54.8 |
[1] |
李良福, 陈卫东, 高强, 等. 基于深度学习的光电系统智能目标识别[J]. 兵工学报, 2022, 43(增刊1):162-168.
|
|
|
[2] |
|
[3] |
|
[4] |
doi: 10.1109/TIP.2003.817242 pmid: 18244710 |
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
宋亮, 谷玉海, 石文天. 基于改进BiSeNet的非结构化道路分割算法研究[J]. 应用光学, 2023, 44(3):556-564.
|
|
|
[14] |
刘致驿, 孙韶媛, 任正云, 等. 基于改进DeepLabv3+的无人车夜间红外图像语义分割[J]. 应用光学, 2020, 41(1):180-185.
doi: 10.5768/JAO202041.0106002 |
|
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[1] | 万张博, 胡建刚, 李俊杰, 陈励, 毛余琨, 叶梦雅. 基于图卷积的陆域智能化无人作战体系效能评估[J]. 兵工学报, 2024, 45(S1): 271-277. |
[2] | 王烨茹, 杨耿, 刘述, 许啸, 陈华杰, 秦飞巍, 徐华杰. 基于图神经网络的车辆目标遮蔽关重部位检测[J]. 兵工学报, 2024, 45(S1): 242-251. |
[3] | 郭爱强, 李天鹏, 朱曦, 管智超, 李门, 董弘玙, 高欣宝. 基于卷积神经网络和时空特征的烟幕视频检测和参数提取[J]. 兵工学报, 2024, 45(8): 2478-2486. |
[4] | 杨环宇, 王军, 吴祥, 薄煜明, 马立丰, 陆金磊. 一种坐标通道注意力深度学习网络的军用飞机识别方法[J]. 兵工学报, 2024, 45(7): 2128-2143. |
[5] | 刘芳, 李士伟, 卢熹, 郭策安. 基于PSO-CNN-XGBoost水下柱形装药峰值超压预测[J]. 兵工学报, 2024, 45(5): 1602-1612. |
[6] | 吕卫民, 孙晨峰, 任立坤, 赵杰, 李永强. 一种基于TCN-LGBM的航空发动机气路故障诊断方法[J]. 兵工学报, 2024, 45(1): 253-263. |
[7] | 周宇, 曹荣刚, 栗苹, 马啸. 一种用于外场试验图像的引信炸点检测方法[J]. 兵工学报, 2023, 44(8): 2453-2464. |
[8] | 吴礼洋, 呙鹏程, 刘超, 李文强. 基于注意力机制增强残差网络的雷达信号调制类型识别[J]. 兵工学报, 2023, 44(8): 2310-2318. |
[9] | 刘懿, 任济寰, 吴祥, 薄煜明. 基于集成迁移学习的新装备装甲车辆分类[J]. 兵工学报, 2023, 44(8): 2319-2328. |
[10] | 何锦成, 韩永成, 张闻文, 何伟基, 陈钱. 基于通道校正卷积的真彩色微光图像增强[J]. 兵工学报, 2023, 44(6): 1643-1654. |
[11] | 刘佳, 刘海鸥, 陈慧岩, 毛飞鸿. 基于融合特征的无人履带车辆道路类型识别方法[J]. 兵工学报, 2023, 44(5): 1267-1276. |
[12] | 王检, 张邦宁, 张洁, 魏国峰, 郭道省. 基于多域特征融合的通信辐射源个体识别方法[J]. 兵工学报, 2023, 44(4): 949-959. |
[13] | 王洋, 冯永新, 宋碧雪, 田秉禾. DP-DRCnet卷积神经网络信号调制识别算法[J]. 兵工学报, 2023, 44(2): 545-555. |
[14] | 张良安, 陈洋, 谢胜龙, 刘同鑫. 基于机器视觉与深度学习的飞机防护栅裂纹检测系统[J]. 兵工学报, 2023, 44(2): 507-516. |
[15] | 郑志伟, 管雪元, 傅健, 马训穷, 尹上. 基于卷积神经网络与长短期记忆神经网络的弹丸轨迹预测[J]. 兵工学报, 2023, 44(10): 2975-2983. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||