兵工学报 ›› 2025, Vol. 46 ›› Issue (1): 231124-.doi: 10.12382/bgxb.2023.1124
收稿日期:
2023-11-22
上线日期:
2025-01-25
通讯作者:
基金资助:
FENG Yingbin, GUO Xiaozun*(), YAN Jiahua
Received:
2023-11-22
Online:
2025-01-25
摘要:
针对无人机航拍图像密集度大、目标尺寸小、背景复杂等难点,提出一种基于多尺度注意力机制的小目标检测(Small target detection of BPAN-EF_C2f YOLOv8s,SBE_ YOLOv8s)算法,通过设计一种基于多尺度注意力机制的特征提取模块(EMA-Faster Block_C2f,EF_C2f),替换YOLOv8网络中的C2f模块,提高网络对小目标特征的提取能力;在特征融合网络中增加P1检测层,并设计一种跨尺度特征融合结构(Bi-Path Aggregation Network,BPAN),融合小目标特征信息;增加一个微小目标检测头,使用SIoU Loss作为边界框损失函数,提升小目标检测精度和网络收敛速度。在公开数据集VisDrone2019上进行实验验证。验证结果表明:与YOLOv8s算法相比,新算法在检测精度上提升了6.9%、mAP50提升了9.1%,模型参数量减少了44.6%,检测速度为28帧/s,新算法在小目标检测领域具有一定的实用性。
中图分类号:
冯迎宾, 郭枭尊, 晏佳华. 基于多尺度注意力机制的无人机小目标检测算法[J]. 兵工学报, 2025, 46(1): 231124-.
FENG Yingbin, GUO Xiaozun, YAN Jiahua. Small UVA Target Detection Algorithm Based on Multi-scale Attention Mechanism[J]. Acta Armamentarii, 2025, 46(1): 231124-.
配置 | 版本 |
---|---|
操作系统 | Windows 10 |
处理器 | Intel Xeon Sliver 4210 CPU @2.20GHz |
显卡 | NVIDIA Quadro RTX 4000 |
框架 | Pytorch 1.13.1 |
开发软件 | Pycharm 2020.3.12 |
开发语言 | Python 3.8.17 |
表1 实验环境配置信息
Table 1 Experimental environment configuration information
配置 | 版本 |
---|---|
操作系统 | Windows 10 |
处理器 | Intel Xeon Sliver 4210 CPU @2.20GHz |
显卡 | NVIDIA Quadro RTX 4000 |
框架 | Pytorch 1.13.1 |
开发软件 | Pycharm 2020.3.12 |
开发语言 | Python 3.8.17 |
编号 | 模型 | P/% | mAP50/% | mAP50-95/% | Par/106 | O/109 |
---|---|---|---|---|---|---|
1 | YOLOv8s | 44.8 | 33.0 | 18.6 | 11.2 | 28.5 |
2 | YOLOv8s+BPAN | 49.4 | 40.2 | 23.1 | 7.7 | 123.4 |
3 | YOLOv8s+BPAN+SIoU Loss | 50.1 | 40.9 | 23.4 | 7.7 | 123.4 |
4 | YOLOv8s+BPAN+EF_C2f | 51.2 | 41.8 | 23.8 | 6.2 | 105.4 |
5 | YOLOv8s+BPAN+SIoU Loss+EF_C2f | 51.7 | 42.1 | 24.3 | 6.2 | 105.4 |
表2 消融实验中各改进方法的性能测试评价指标
Table 2 Performance test evaluation results of each improved method in ablation experiments
编号 | 模型 | P/% | mAP50/% | mAP50-95/% | Par/106 | O/109 |
---|---|---|---|---|---|---|
1 | YOLOv8s | 44.8 | 33.0 | 18.6 | 11.2 | 28.5 |
2 | YOLOv8s+BPAN | 49.4 | 40.2 | 23.1 | 7.7 | 123.4 |
3 | YOLOv8s+BPAN+SIoU Loss | 50.1 | 40.9 | 23.4 | 7.7 | 123.4 |
4 | YOLOv8s+BPAN+EF_C2f | 51.2 | 41.8 | 23.8 | 6.2 | 105.4 |
5 | YOLOv8s+BPAN+SIoU Loss+EF_C2f | 51.7 | 42.1 | 24.3 | 6.2 | 105.4 |
方法 | mAP50/% | mAP50-95/% | FPS |
---|---|---|---|
Faster-RCNN | 21.7 | 15.1 | 15 |
Cascade-RCNN | 31.9 | 16.1 | |
Light-RCNN | 30.8 | 16.5 | |
YOLOv3 | 32.1 | 17.5 | 31 |
YOLOv4 | 30.7 | 15.9 | 32 |
YOLOv5 | 31.5 | 16.8 | 121 |
YOLOv8 | 33.0 | 18.6 | 169 |
Ours | 42.1 | 24.3 | 28 |
表3 对比实验中各模型的性能评价指标
Table 3 Comparison of the performance evaluation results of models in the experiment
方法 | mAP50/% | mAP50-95/% | FPS |
---|---|---|---|
Faster-RCNN | 21.7 | 15.1 | 15 |
Cascade-RCNN | 31.9 | 16.1 | |
Light-RCNN | 30.8 | 16.5 | |
YOLOv3 | 32.1 | 17.5 | 31 |
YOLOv4 | 30.7 | 15.9 | 32 |
YOLOv5 | 31.5 | 16.8 | 121 |
YOLOv8 | 33.0 | 18.6 | 169 |
Ours | 42.1 | 24.3 | 28 |
类别 | P/% | R/% | mAP50/% | mAP50-95/% |
---|---|---|---|---|
Pedestrian | 62.4 | 40.0 | 43.3 | 18.5 |
People | 60.5 | 26.8 | 31.5 | 12.4 |
Bicycle | 38.7 | 19.5 | 18.9 | 8.3 |
Car | 72.8 | 80.9 | 82.7 | 51.9 |
Van | 46.3 | 49.9 | 46.9 | 31.7 |
Truck | 44.7 | 49.5 | 43.1 | 28.8 |
Tricycle | 28.5 | 36.4 | 25.6 | 14.7 |
Awning-tricycle | 42.7 | 25.4 | 23.8 | 15.2 |
Bus | 68.7 | 56.3 | 62.3 | 43.3 |
Motor | 51.7 | 45.5 | 42.5 | 18.5 |
表4 本文算法在VisDrone 2019数据集上的性能评价指标
Table 4 Performance evaluation metrics of the proposed algorithm on VisDrone 2019 dataset
类别 | P/% | R/% | mAP50/% | mAP50-95/% |
---|---|---|---|---|
Pedestrian | 62.4 | 40.0 | 43.3 | 18.5 |
People | 60.5 | 26.8 | 31.5 | 12.4 |
Bicycle | 38.7 | 19.5 | 18.9 | 8.3 |
Car | 72.8 | 80.9 | 82.7 | 51.9 |
Van | 46.3 | 49.9 | 46.9 | 31.7 |
Truck | 44.7 | 49.5 | 43.1 | 28.8 |
Tricycle | 28.5 | 36.4 | 25.6 | 14.7 |
Awning-tricycle | 42.7 | 25.4 | 23.8 | 15.2 |
Bus | 68.7 | 56.3 | 62.3 | 43.3 |
Motor | 51.7 | 45.5 | 42.5 | 18.5 |
类别 | ||||
---|---|---|---|---|
Pedestrian | 13 | 74 | 24 | 42 |
People | 0 | 1 | 1 | 1 |
Bicycle | 0 | 0 | 0 | 1 |
Car | 39 | 44 | 10 | 8 |
Van | 0 | 4 | 0 | 1 |
Truck | 0 | 2 | 0 | 0 |
Tricycle | 2 | 4 | 0 | 0 |
Awning-tricycle | 1 | 1 | 0 | 0 |
Motor | 1 | 5 | 1 | 1 |
表5 YOLOv8s算法与本文算法检测对比
Table 5 Comparison of detected results of YOLOv8s algorithm and the proposed algorithm
类别 | ||||
---|---|---|---|---|
Pedestrian | 13 | 74 | 24 | 42 |
People | 0 | 1 | 1 | 1 |
Bicycle | 0 | 0 | 0 | 1 |
Car | 39 | 44 | 10 | 8 |
Van | 0 | 4 | 0 | 1 |
Truck | 0 | 2 | 0 | 0 |
Tricycle | 2 | 4 | 0 | 0 |
Awning-tricycle | 1 | 1 | 0 | 0 |
Motor | 1 | 5 | 1 | 1 |
[1] |
|
[2] |
|
[3] |
|
[4] |
惠康华, 杨卫, 刘浩翰, 等. 基于YOLOv5的增强多尺度目标检测方法[J]. 兵工学报, 2023, 44(9):2600-2610.
doi: 10.12382/bgxb.2022.1147 |
doi: 10.12382/bgxb.2022.1147 |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
王殿伟, 胡里晨, 房杰, 等. 基于改进Double-Head R-CNN的无人机航拍图像小目标检测算法[J]. 北京航空航天大学学报, 2024, 50(7):2141-2149.
|
|
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
张智, 易华挥, 郑锦. 聚焦小目标的航拍图像目标检测算法[J]. 电子学报, 2023, 51(4):944-955.
doi: 10.12263/DZXB.20220313 |
doi: 10.12263/DZXB.20220313 |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
冒国韬, 邓天民, 于楠晶. 基于多尺度分割注意力的无人机航拍图像目标检测算法[J]. 航空学报, 2023, 44(5):326738.
doi: 10.7527/S1000-6893.2021.26738 |
|
|
[26] |
李校林, 刘大东, 刘鑫满, 等. 改进YOLOv5的无人机航拍图像目标检测算法[J]. 计算机工程与应用, 2024, 60(11):204-214.
doi: 10.3778/j.issn.1002-8331.2307-0171 |
doi: 10.3778/j.issn.1002-8331.2307-0171 |
|
[27] |
|
[28] |
于博文, 吕明. 改进的YOLOv3算法及其在军事目标检测中的应用[J]. 兵工学报, 2022, 43(2):345-354.
doi: 10.3969/j.issn.1000-1093.2022.02.012 |
doi: 10.3969/j.issn.1000-1093.2022.02.012 |
|
[29] |
奉志强, 谢志军, 包正伟, 等. 基于改进YOLOv5的无人机实时密集小目标检测算法[J]. 航空学报, 2023, 44(7):327106.
doi: 10.7527/S1000-6893.2022.27106 |
|
[1] | 邢文松, 龙震海, 黄杰. 基于滞回环数据的42CrMo高强度钢低周扭转疲劳性能分析[J]. 兵工学报, 2025, 46(1): 231163-. |
[2] | 乔新博, 赵永强, 张景程. 基于空间偏振混叠特性的红外偏振视频目标跟踪[J]. 兵工学报, 2024, 45(9): 3274-3287. |
[3] | 查冰婷, 徐光博, 秦建新, 张合. 多发多收周视激光引信时刻鉴别方法[J]. 兵工学报, 2024, 45(11): 4145-4154. |
[4] | 刘懿, 任济寰, 吴祥, 薄煜明. 基于集成迁移学习的新装备装甲车辆分类[J]. 兵工学报, 2023, 44(8): 2319-2328. |
[5] | 章斌, 卢洪义, 刘舜, 桑豆豆, 杨禹成. 发动机部件CT图像特征提取与区域生长算法[J]. 兵工学报, 2023, 44(4): 1171-1180. |
[6] | 王洋, 冯永新, 宋碧雪, 田秉禾. DP-DRCnet卷积神经网络信号调制识别算法[J]. 兵工学报, 2023, 44(2): 545-555. |
[7] | 王亮, 陈建华, 李烨. 一种基于深度学习的无人艇海上目标识别技术[J]. 兵工学报, 2022, 43(S2): 13-19. |
[8] | 李恒, 叶祖坤, 查文彬, 王禹林. 基于多传感器信息决策级融合的刀具磨损在线监测[J]. 兵工学报, 2021, 42(9): 2024-2031. |
[9] | 王成, 吴岩, 杨廷飞. 利用改进单分类支持向量机提升舰船尾流目标的检测准确率[J]. 兵工学报, 2020, 41(9): 1887-1893. |
[10] | 余永维, 彭西, 杜柳青, 陈天皓. 基于深度学习框架的装配机器人零件实时检测方法[J]. 兵工学报, 2020, 41(10): 2122-2130. |
[11] | 仝蕊, 康建设, 孙健, 杨文, 李宝晨. 基于局部特征尺度分解与复合谱分析的齿轮性能退化特征提取[J]. 兵工学报, 2019, 40(5): 1093-1102. |
[12] | 代健, 李泽, 郝新红, 栗苹. 基于目标联合特征提取的脉冲多普勒引信抗干扰方法[J]. 兵工学报, 2019, 40(2): 225-233. |
[13] | 杨大为, 赵永东, 冯辅周, 江鹏程, 丁闯. 基于参数优化变分模态分解和多尺度熵偏均值的行星变速箱故障特征提取[J]. 兵工学报, 2018, 39(9): 1683-1691. |
[14] | 丁闯, 冯辅周, 张兵志, 吴守军. 行星变速箱振动信号的线性量子信息熵特征[J]. 兵工学报, 2018, 39(12): 2306-2312. |
[15] | 李关防, 崔杰, 袁富宇. 基于线谱瞬时频率估计的被动声纳目标运动分析[J]. 兵工学报, 2017, 38(7): 1395-1401. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||