兵工学报 ›› 2025, Vol. 46 ›› Issue (5): 241146-.doi: 10.12382/bgxb.2024.1146
• • 上一篇
周桢林1,2, 龙腾1,2,3,4, 刘大卫5, 孙景亮1,2,3,*(), 钟建鑫1,2, 李俊志1,2
收稿日期:
2024-12-24
上线日期:
2025-05-07
通讯作者:
基金资助:
ZHOU Zhenlin1,2, LONG Teng1,2,3,4, LIU Dawei5, SUN Jingliang1,2,3,*(), ZHONG Jianxin1,2, LI Junzhi1,2
Received:
2024-12-24
Online:
2025-05-07
摘要:
面向大规模无人机集群协同作业场景,针对航迹冲突频繁导致集群航迹规划高耗时的问题,开展基于强化学习冲突消解的大规模无人机集群航迹规划方法研究。构建“顶层冲突消解-底层航迹规划”的双层规划架构,降低航迹冲突的时空维度。在顶层冲突消解层,设计基于Rainbow DQN (Deep Q-Networks algorithm)训练框架的冲突消解策略网络,将每个航迹冲突的消解过程转换为二叉树拓展左、右树节点的动作选择过程,实现不同冲突消解顺序与冲突消解结果的映射,减少树节点的遍历,提高冲突消解效率;在底层航迹规划层,将时间维度引入空间避碰策略,提出基于节点重扩展机制的跳点搜索法(Re-planning Jump Point Search, ReJPS),增加规划可行域,提升航迹冲突的消解能力。仿真结果表明:相比基于CBS (Conflict Based Search)+A*方法与CBS+ReJPS航迹规划方法,新方法在最优性相当的前提下,平均规划耗时分别降低了86.64%和19.65%。
中图分类号:
周桢林, 龙腾, 刘大卫, 孙景亮, 钟建鑫, 李俊志. 基于强化学习冲突消解的大规模无人机集群航迹规划方法[J]. 兵工学报, 2025, 46(5): 241146-.
ZHOU Zhenlin, LONG Teng, LIU Dawei, SUN Jingliang, ZHONG Jianxin, LI Junzhi. Path Planning Method for Large-scale UAV Swarms Based on Reinforcement Learning Conflict Resolution[J]. Acta Armamentarii, 2025, 46(5): 241146-.
算法:基于节点重扩展机制的跳点搜索法 |
---|
Input: , ,Cnow,Con, Open, Close |
Output: ξi={ , ,…, },k∈Z+ |
1 Get positiong , ; |
2 Initialize Cnow,Con, Open, Close; |
3 While Open≠Ø do |
4 Find gxy=min(Open) |
5 Do prune rules:Flag=1 |
6 while gxy expands no jump point‖ jump point in Con |
7 If gxy reach boundary |
8 Flag=0; |
9 Break; |
10 else |
11 gxy=diagonal search gxy |
12 End if |
13 End while |
14 If Flag |
15 gxy from Open to Close, jump point in Open |
16 End if |
17 If gxy == |
18 Return ξi={ , ,…, },k∈Z+ |
19 End if |
20 End while |
表1 算法伪代码
Table 1 Pseudocode of algorithm
算法:基于节点重扩展机制的跳点搜索法 |
---|
Input: , ,Cnow,Con, Open, Close |
Output: ξi={ , ,…, },k∈Z+ |
1 Get positiong , ; |
2 Initialize Cnow,Con, Open, Close; |
3 While Open≠Ø do |
4 Find gxy=min(Open) |
5 Do prune rules:Flag=1 |
6 while gxy expands no jump point‖ jump point in Con |
7 If gxy reach boundary |
8 Flag=0; |
9 Break; |
10 else |
11 gxy=diagonal search gxy |
12 End if |
13 End while |
14 If Flag |
15 gxy from Open to Close, jump point in Open |
16 End if |
17 If gxy == |
18 Return ξi={ , ,…, },k∈Z+ |
19 End if |
20 End while |
航迹冲突坐标 | 无人机到达时间 | |||||||
---|---|---|---|---|---|---|---|---|
(8, 7) | u1 | u2 | ||||||
4.24 | 5.83 | |||||||
(9, 12) | u4 | u5 | ||||||
2.83 | 6.24 | |||||||
(7, 10) | u3 | u5 | ||||||
4.83 | 9.66 | |||||||
(5, 6) | u1 | u2 | u5 | |||||
7.65 | 9.24 | 14.49 | ||||||
(3, 7) | u1 | u2 | u3 | u4 | u5 | |||
10.07 | 12.66 | 11.49 | 14.66 | 16.90 |
表2 航迹冲突检测
Table 2 Conflict detection
航迹冲突坐标 | 无人机到达时间 | |||||||
---|---|---|---|---|---|---|---|---|
(8, 7) | u1 | u2 | ||||||
4.24 | 5.83 | |||||||
(9, 12) | u4 | u5 | ||||||
2.83 | 6.24 | |||||||
(7, 10) | u3 | u5 | ||||||
4.83 | 9.66 | |||||||
(5, 6) | u1 | u2 | u5 | |||||
7.65 | 9.24 | 14.49 | ||||||
(3, 7) | u1 | u2 | u3 | u4 | u5 | |||
10.07 | 12.66 | 11.49 | 14.66 | 16.90 |
对比方法 | 顶层规划方法 | 底层规划方法 |
---|---|---|
1 | CBS | A* |
2 | CBS | MSA* |
3 | CBS | ReJPS |
4 | DRLCBS | ReJPS |
表3 蒙特卡洛仿真对比方法
Table 3 Different methods in Monte Carlo simulation
对比方法 | 顶层规划方法 | 底层规划方法 |
---|---|---|
1 | CBS | A* |
2 | CBS | MSA* |
3 | CBS | ReJPS |
4 | DRLCBS | ReJPS |
[1] |
|
[2] |
|
[3] |
|
[4] |
陈亚萍, 王楠, 洪华杰, 等. 面向多无人平台区域监视任务的信息素正向激励栅格方法[J]. 兵工学报, 2023, 44(9):2859-2870.
doi: 10.12382/bgxb.2022.0537 |
doi: 10.12382/bgxb.2022.0537 |
|
[5] |
|
[6] |
李军, 陈士超. 无人机蜂群关键技术发展综述[J]. 兵工学报, 2023, 44(9):2533-2545.
doi: 10.12382/bgxb.2023.0514 |
doi: 10.12382/bgxb.2023.0514 |
|
[7] |
赵军民, 何浩哲, 王少奇, 等. 复杂环境下多无人机目标跟踪与避障联合航迹规划[J]. 兵工学报, 2023, 44(9):2685-2696.
doi: 10.12382/bgxb.2022.0525 |
doi: 10.12382/bgxb.2022.0525 |
|
[8] |
于连波, 曹品钊, 石亮, 等. 基于改进冲突搜索的多智能体路径规划算法[J]. 航空学报, 2023, 44(增刊1):727648.
|
|
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
徐广通, 王祝, 曹严, 等. 动态优先级解耦的无人机集群轨迹分布式序列凸规划[J]. 航空学报, 2022, 43(2):325059.
doi: 10.7527/S1000-6893.2021.25059 |
doi: 10.7527/S1000-6893.2021.25059 |
|
[14] |
|
[15] |
|
[16] |
王子晗, 童向荣. 基于冲突搜索的多智能体路径规划研究进展[J]. 计算机科学, 2023, 50(6):358-368.
doi: 10.11896/jsjkx.220800151 |
doi: 10.11896/jsjkx.220800151 |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
周熙栋, 张辉, 陈波. 非结构化场景下基于改进JPS算法的移动机器人路径规划[J]. 控制与决策, 2024, 39(2):474-482.
|
|
|
[22] |
|
[23] |
|
[24] |
|
[25] |
pmid: 22392705 |
[26] |
|
[1] | 先苏杰, 王康, 曾鑫, 宋杰, 吴志林. 基于深度强化学习的落角和视场角约束制导律[J]. 兵工学报, 2025, 46(4): 240435-. |
[2] | 曾照洋, 彭文胜, 李云凯, 徐明. 智能无人机集群可靠性技术内涵、发展及挑战[J]. 兵工学报, 2025, 46(3): 240322-. |
[3] | 潘子双, 苏析超, 韩维, 柳文林, 郁大照, 汪节. 基于动态一致性联盟算法的异构无人机集群协同作战联盟组建[J]. 兵工学报, 2024, 45(9): 3177-3190. |
[4] | 孙浩, 黎海青, 梁彦, 马超雄, 吴翰. 基于知识辅助深度强化学习的巡飞弹组动态突防决策[J]. 兵工学报, 2024, 45(9): 3161-3176. |
[5] | 王东振, 张岳, 赵宇, 黄大庆. 基于RRT-Dubins的无人机航迹优化方法[J]. 兵工学报, 2024, 45(8): 2761-2773. |
[6] | 娄抒瀚, 王冲冲, 龚炜, 邓立原, 李莉. 基于MLAT-DRL算法的协同区域信息采集策略[J]. 兵工学报, 2024, 45(12): 4423-4434. |
[7] | 董明泽, 温庄磊, 陈锡爱, 杨炅坤, 曾涛. 安全凸空间与深度强化学习结合的机器人导航方法[J]. 兵工学报, 2024, 45(12): 4372-4382. |
[8] | 傅妍芳, 雷凯麟, 魏佳宁, 曹子建, 杨博, 王炜, 孙泽龙, 李秦洁. 基于演员-评论家框架的层次化多智能体协同决策方法[J]. 兵工学报, 2024, 45(10): 3385-3396. |
[9] | 曹子建, 孙泽龙, 闫国闯, 傅妍芳, 杨博, 李秦洁, 雷凯麟, 高领航. 基于强化学习的无人机集群对抗策略推演仿真[J]. 兵工学报, 2023, 44(S2): 126-134. |
[10] | 郭志明, 娄文忠, 李涛, 张梦宇, 白子龙, 乔虎. 基于改进蝗虫优化算法考虑任务威胁的多无人机协同航迹规划[J]. 兵工学报, 2023, 44(S2): 52-60. |
[11] | 严钰文, 毕文豪, 张安, 张百川. 基于序列生成对抗网络的无人机集群任务分配方法[J]. 兵工学报, 2023, 44(9): 2672-2684. |
[12] | 赵军民, 何浩哲, 王少奇, 聂聪, 焦迎杰. 复杂环境下多无人机目标跟踪与避障联合航迹规划[J]. 兵工学报, 2023, 44(9): 2685-2696. |
[13] | 尹依伊, 王晓芳, 周健. 基于Q学习的多无人机协同航迹规划方法[J]. 兵工学报, 2023, 44(2): 484-495. |
[14] | 张琦, 葛玉雪, 李攀, 康淇钧, 裴扬. 基于ABMS的全光化无人机集群体系贡献率评估方法[J]. 兵工学报, 2023, 44(11): 3422-3435. |
[15] | 傅晋博, 张栋, 王孟阳, 赵军民. 面向目标定位精度提升的无人机航迹规划[J]. 兵工学报, 2023, 44(11): 3394-3406. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||