
					兵工学报 ›› 2025, Vol. 46 ›› Issue (1): 231124-.doi: 10.12382/bgxb.2023.1124
收稿日期:2023-11-22
									
				
									
				
									
				
				
											上线日期:2025-01-25
									
			通讯作者:
					
					
							基金资助:
        
               		FENG  Yingbin, GUO  Xiaozun*(
), YAN  Jiahua
			  
			
			
			
                
        
    
Received:2023-11-22
									
				
									
				
									
				
				
											Online:2025-01-25
									
			摘要:
针对无人机航拍图像密集度大、目标尺寸小、背景复杂等难点,提出一种基于多尺度注意力机制的小目标检测(Small target detection of BPAN-EF_C2f YOLOv8s,SBE_ YOLOv8s)算法,通过设计一种基于多尺度注意力机制的特征提取模块(EMA-Faster Block_C2f,EF_C2f),替换YOLOv8网络中的C2f模块,提高网络对小目标特征的提取能力;在特征融合网络中增加P1检测层,并设计一种跨尺度特征融合结构(Bi-Path Aggregation Network,BPAN),融合小目标特征信息;增加一个微小目标检测头,使用SIoU Loss作为边界框损失函数,提升小目标检测精度和网络收敛速度。在公开数据集VisDrone2019上进行实验验证。验证结果表明:与YOLOv8s算法相比,新算法在检测精度上提升了6.9%、mAP50提升了9.1%,模型参数量减少了44.6%,检测速度为28帧/s,新算法在小目标检测领域具有一定的实用性。
中图分类号:
冯迎宾, 郭枭尊, 晏佳华. 基于多尺度注意力机制的无人机小目标检测算法[J]. 兵工学报, 2025, 46(1): 231124-.
FENG Yingbin, GUO Xiaozun, YAN Jiahua. Small UVA Target Detection Algorithm Based on Multi-scale Attention Mechanism[J]. Acta Armamentarii, 2025, 46(1): 231124-.
| 配置 | 版本 | 
|---|---|
| 操作系统 | Windows 10 | 
| 处理器 | Intel Xeon Sliver 4210 CPU @2.20GHz | 
| 显卡 | NVIDIA Quadro RTX 4000 | 
| 框架 | Pytorch 1.13.1 | 
| 开发软件 | Pycharm 2020.3.12 | 
| 开发语言 | Python 3.8.17 | 
表1 实验环境配置信息
Table 1 Experimental environment configuration information
| 配置 | 版本 | 
|---|---|
| 操作系统 | Windows 10 | 
| 处理器 | Intel Xeon Sliver 4210 CPU @2.20GHz | 
| 显卡 | NVIDIA Quadro RTX 4000 | 
| 框架 | Pytorch 1.13.1 | 
| 开发软件 | Pycharm 2020.3.12 | 
| 开发语言 | Python 3.8.17 | 
| 编号 | 模型 | P/% | mAP50/% | mAP50-95/% | Par/106 | O/109 | 
|---|---|---|---|---|---|---|
| 1 | YOLOv8s | 44.8 | 33.0 | 18.6 | 11.2 | 28.5 | 
| 2 | YOLOv8s+BPAN | 49.4 | 40.2 | 23.1 | 7.7 | 123.4 | 
| 3 | YOLOv8s+BPAN+SIoU Loss | 50.1 | 40.9 | 23.4 | 7.7 | 123.4 | 
| 4 | YOLOv8s+BPAN+EF_C2f | 51.2 | 41.8 | 23.8 | 6.2 | 105.4 | 
| 5 | YOLOv8s+BPAN+SIoU Loss+EF_C2f | 51.7 | 42.1 | 24.3 | 6.2 | 105.4 | 
表2 消融实验中各改进方法的性能测试评价指标
Table 2 Performance test evaluation results of each improved method in ablation experiments
| 编号 | 模型 | P/% | mAP50/% | mAP50-95/% | Par/106 | O/109 | 
|---|---|---|---|---|---|---|
| 1 | YOLOv8s | 44.8 | 33.0 | 18.6 | 11.2 | 28.5 | 
| 2 | YOLOv8s+BPAN | 49.4 | 40.2 | 23.1 | 7.7 | 123.4 | 
| 3 | YOLOv8s+BPAN+SIoU Loss | 50.1 | 40.9 | 23.4 | 7.7 | 123.4 | 
| 4 | YOLOv8s+BPAN+EF_C2f | 51.2 | 41.8 | 23.8 | 6.2 | 105.4 | 
| 5 | YOLOv8s+BPAN+SIoU Loss+EF_C2f | 51.7 | 42.1 | 24.3 | 6.2 | 105.4 | 
| 方法 | mAP50/% | mAP50-95/% | FPS | 
|---|---|---|---|
| Faster-RCNN | 21.7 | 15.1 | 15 | 
| Cascade-RCNN | 31.9 | 16.1 | |
| Light-RCNN | 30.8 | 16.5 | |
| YOLOv3 | 32.1 | 17.5 | 31 | 
| YOLOv4 | 30.7 | 15.9 | 32 | 
| YOLOv5 | 31.5 | 16.8 | 121 | 
| YOLOv8 | 33.0 | 18.6 | 169 | 
| Ours | 42.1 | 24.3 | 28 | 
表3 对比实验中各模型的性能评价指标
Table 3 Comparison of the performance evaluation results of models in the experiment
| 方法 | mAP50/% | mAP50-95/% | FPS | 
|---|---|---|---|
| Faster-RCNN | 21.7 | 15.1 | 15 | 
| Cascade-RCNN | 31.9 | 16.1 | |
| Light-RCNN | 30.8 | 16.5 | |
| YOLOv3 | 32.1 | 17.5 | 31 | 
| YOLOv4 | 30.7 | 15.9 | 32 | 
| YOLOv5 | 31.5 | 16.8 | 121 | 
| YOLOv8 | 33.0 | 18.6 | 169 | 
| Ours | 42.1 | 24.3 | 28 | 
| 类别 | P/% | R/% | mAP50/% | mAP50-95/% | 
|---|---|---|---|---|
| Pedestrian | 62.4 | 40.0 | 43.3 | 18.5 | 
| People | 60.5 | 26.8 | 31.5 | 12.4 | 
| Bicycle | 38.7 | 19.5 | 18.9 | 8.3 | 
| Car | 72.8 | 80.9 | 82.7 | 51.9 | 
| Van | 46.3 | 49.9 | 46.9 | 31.7 | 
| Truck | 44.7 | 49.5 | 43.1 | 28.8 | 
| Tricycle | 28.5 | 36.4 | 25.6 | 14.7 | 
| Awning-tricycle | 42.7 | 25.4 | 23.8 | 15.2 | 
| Bus | 68.7 | 56.3 | 62.3 | 43.3 | 
| Motor | 51.7 | 45.5 | 42.5 | 18.5 | 
表4 本文算法在VisDrone 2019数据集上的性能评价指标
Table 4 Performance evaluation metrics of the proposed algorithm on VisDrone 2019 dataset
| 类别 | P/% | R/% | mAP50/% | mAP50-95/% | 
|---|---|---|---|---|
| Pedestrian | 62.4 | 40.0 | 43.3 | 18.5 | 
| People | 60.5 | 26.8 | 31.5 | 12.4 | 
| Bicycle | 38.7 | 19.5 | 18.9 | 8.3 | 
| Car | 72.8 | 80.9 | 82.7 | 51.9 | 
| Van | 46.3 | 49.9 | 46.9 | 31.7 | 
| Truck | 44.7 | 49.5 | 43.1 | 28.8 | 
| Tricycle | 28.5 | 36.4 | 25.6 | 14.7 | 
| Awning-tricycle | 42.7 | 25.4 | 23.8 | 15.2 | 
| Bus | 68.7 | 56.3 | 62.3 | 43.3 | 
| Motor | 51.7 | 45.5 | 42.5 | 18.5 | 
| 类别 | ||||
|---|---|---|---|---|
| Pedestrian | 13 | 74 | 24 | 42 | 
| People | 0 | 1 | 1 | 1 | 
| Bicycle | 0 | 0 | 0 | 1 | 
| Car | 39 | 44 | 10 | 8 | 
| Van | 0 | 4 | 0 | 1 | 
| Truck | 0 | 2 | 0 | 0 | 
| Tricycle | 2 | 4 | 0 | 0 | 
| Awning-tricycle | 1 | 1 | 0 | 0 | 
| Motor | 1 | 5 | 1 | 1 | 
表5 YOLOv8s算法与本文算法检测对比
Table 5 Comparison of detected results of YOLOv8s algorithm and the proposed algorithm
| 类别 | ||||
|---|---|---|---|---|
| Pedestrian | 13 | 74 | 24 | 42 | 
| People | 0 | 1 | 1 | 1 | 
| Bicycle | 0 | 0 | 0 | 1 | 
| Car | 39 | 44 | 10 | 8 | 
| Van | 0 | 4 | 0 | 1 | 
| Truck | 0 | 2 | 0 | 0 | 
| Tricycle | 2 | 4 | 0 | 0 | 
| Awning-tricycle | 1 | 1 | 0 | 0 | 
| Motor | 1 | 5 | 1 | 1 | 
| [1] |  
											  | 
										
| [2] |  
											  | 
										
| [3] |  
											  | 
										
| [4] |  
											  惠康华, 杨卫, 刘浩翰, 等. 基于YOLOv5的增强多尺度目标检测方法[J]. 兵工学报, 2023, 44(9):2600-2610.  
											 												doi: 10.12382/bgxb.2022.1147  | 
										
|  
											  doi: 10.12382/bgxb.2022.1147  | 
										|
| [5] |  
											  | 
										
| [6] |  
											  | 
										
| [7] |  
											  | 
										
| [8] |  
											  | 
										
| [9] |  
											  王殿伟, 胡里晨, 房杰, 等. 基于改进Double-Head R-CNN的无人机航拍图像小目标检测算法[J]. 北京航空航天大学学报, 2024, 50(7):2141-2149. 
											 											 | 
										
|  
											  | 
										|
| [10] |  
											  | 
										
| [11] |  
											  | 
										
| [12] |  
											  | 
										
| [13] |  
											  | 
										
| [14] |  
											  | 
										
| [15] |  
											  | 
										
| [16] |  
											  | 
										
| [17] |  
											  | 
										
| [18] |  
											  | 
										
| [19] |  
											  | 
										
| [20] |  
											  张智, 易华挥, 郑锦. 聚焦小目标的航拍图像目标检测算法[J]. 电子学报, 2023, 51(4):944-955.  
											 												doi: 10.12263/DZXB.20220313  | 
										
|  
											  doi: 10.12263/DZXB.20220313  | 
										|
| [21] |  
											  | 
										
| [22] |  
											  | 
										
| [23] |  
											  | 
										
| [24] |  
											  | 
										
| [25] |  
											  冒国韬, 邓天民, 于楠晶. 基于多尺度分割注意力的无人机航拍图像目标检测算法[J]. 航空学报, 2023, 44(5):326738.  
											 												doi: 10.7527/S1000-6893.2021.26738  | 
										
|  
											  | 
										|
| [26] |  
											  李校林, 刘大东, 刘鑫满, 等. 改进YOLOv5的无人机航拍图像目标检测算法[J]. 计算机工程与应用, 2024, 60(11):204-214.  
											 												doi: 10.3778/j.issn.1002-8331.2307-0171  | 
										
|  
											  doi: 10.3778/j.issn.1002-8331.2307-0171  | 
										|
| [27] |  
											  | 
										
| [28] |  
											  于博文, 吕明. 改进的YOLOv3算法及其在军事目标检测中的应用[J]. 兵工学报, 2022, 43(2):345-354.  
											 												doi: 10.3969/j.issn.1000-1093.2022.02.012  | 
										
|  
											  doi: 10.3969/j.issn.1000-1093.2022.02.012  | 
										|
| [29] |  
											  奉志强, 谢志军, 包正伟, 等. 基于改进YOLOv5的无人机实时密集小目标检测算法[J]. 航空学报, 2023, 44(7):327106.  
											 												doi: 10.7527/S1000-6893.2022.27106  | 
										
|  
											  | 
										
| [1] | 胡据林, 何洪文, 韩雪峰. 基于微运动片段的履带式车辆多路面-三维度工况构建方法[J]. 兵工学报, 2025, 46(9): 240881-. | 
| [2] | 王露, 晏江, 尹鹏, 刘彦, 黄风雷. 融合毁伤特征的火力资源优化分配算法[J]. 兵工学报, 2025, 46(8): 240971-. | 
| [3] | 沈英, 张硕, 王舒, 苏云, 薛芳, 黄峰. 复杂场景伪装小目标机载偏振遥感检测方法[J]. 兵工学报, 2025, 46(7): 240797-. | 
| [4] | 栾永超, 张斌, 李宸凯, 褚文博, 赵冬娥. 强烟雾干扰下的枪口子弹初速测量方法[J]. 兵工学报, 2025, 46(3): 240160-. | 
| [5] | 邢文松, 龙震海, 黄杰. 基于滞回环数据的42CrMo高强度钢低周扭转疲劳性能分析[J]. 兵工学报, 2025, 46(1): 231163-. | 
| [6] | 乔新博, 赵永强, 张景程. 基于空间偏振混叠特性的红外偏振视频目标跟踪[J]. 兵工学报, 2024, 45(9): 3274-3287. | 
| [7] | 查冰婷, 徐光博, 秦建新, 张合. 多发多收周视激光引信时刻鉴别方法[J]. 兵工学报, 2024, 45(11): 4145-4154. | 
| [8] | 刘懿, 任济寰, 吴祥, 薄煜明. 基于集成迁移学习的新装备装甲车辆分类[J]. 兵工学报, 2023, 44(8): 2319-2328. | 
| [9] | 章斌, 卢洪义, 刘舜, 桑豆豆, 杨禹成. 发动机部件CT图像特征提取与区域生长算法[J]. 兵工学报, 2023, 44(4): 1171-1180. | 
| [10] | 王洋, 冯永新, 宋碧雪, 田秉禾. DP-DRCnet卷积神经网络信号调制识别算法[J]. 兵工学报, 2023, 44(2): 545-555. | 
| [11] | 王亮, 陈建华, 李烨. 一种基于深度学习的无人艇海上目标识别技术[J]. 兵工学报, 2022, 43(S2): 13-19. | 
| [12] | 李恒, 叶祖坤, 查文彬, 王禹林. 基于多传感器信息决策级融合的刀具磨损在线监测[J]. 兵工学报, 2021, 42(9): 2024-2031. | 
| [13] | 王成, 吴岩, 杨廷飞. 利用改进单分类支持向量机提升舰船尾流目标的检测准确率[J]. 兵工学报, 2020, 41(9): 1887-1893. | 
| [14] | 余永维, 彭西, 杜柳青, 陈天皓. 基于深度学习框架的装配机器人零件实时检测方法[J]. 兵工学报, 2020, 41(10): 2122-2130. | 
| [15] | 仝蕊, 康建设, 孙健, 杨文, 李宝晨. 基于局部特征尺度分解与复合谱分析的齿轮性能退化特征提取[J]. 兵工学报, 2019, 40(5): 1093-1102. | 
| 阅读次数 | ||||||
| 
												        	全文 | 
											        	
												        	 | 
													|||||
| 
												        	摘要 | 
												        
															 | 
													|||||
 京公网安备11010802024360号    京ICP备05059581号-4