兵工学报 ›› 2023, Vol. 44 ›› Issue (9): 2672-2684.doi: 10.12382/bgxb.2022.0931
所属专题: 智能系统与装备技术
收稿日期:
2022-03-03
上线日期:
2023-04-08
通讯作者:
基金资助:
YAN Yuwen, BI Wenhao*(), ZHANG An, ZHANG Baichuan
Received:
2022-03-03
Online:
2023-04-08
摘要:
针对现有无人机集群任务分配算法在进行较大规模的任务分配时求解效率降低、求解时间大幅增加的问题,提出一种基于序列生成对抗网络的任务分配方法。通过构建包含战场信息特征提取网络和序列生成网络的序列生成模型,解决战场信息到任务分配序列的生成问题;构建基于多核多层卷积网络的判别模型,提出收益-评价双指导式策略梯度更新对模型进行训练,解决任务分配序列离散的问题,保证任务分配序列的质量。仿真结果表明,新方法在保证分配序列质量的情况下,能够高效地生成与战场信息对应的任务分配序列。
中图分类号:
严钰文, 毕文豪, 张安, 张百川. 基于序列生成对抗网络的无人机集群任务分配方法[J]. 兵工学报, 2023, 44(9): 2672-2684.
YAN Yuwen, BI Wenhao, ZHANG An, ZHANG Baichuan. Task Allocation Method of UAV Clusters Based on Sequence Generative Adversarial Network[J]. Acta Armamentarii, 2023, 44(9): 2672-2684.
操作 | 隐藏层大小 | 核大小 | 步长 | 特征图大小 | 标准化 | 非线性处理 |
---|---|---|---|---|---|---|
Gθ(Z)-3×NU×NT输入 | ||||||
全连接(1) | N/A | N/A | N/A | 256 | × | Leaky ReLU |
全连接(2) | N/A | N/A | N/A | 128 | × | NONE |
GRU | 128 | N/A | N/A | N/A | × | NONE |
全连接 | N/A | N/A | N/A | 1 | × | NONE |
Dϕ(Gθ(Z),R)-3×NT输入 | ||||||
卷积(1,2,…,Nconv) | N/A | (1,2,…,Nconv)×N | 1×1 | 32 | √ | Leaky ReLU |
全连接 | N/A | N/A | N/A | 2 | × | NONE |
优化器 | Adam(α=10-3,β1=0.9,β2=0.999) | |||||
随机失活率(Dropout) | P=0.4 | |||||
批量大小(Batch size) | 16 | |||||
Leaky ReLU slope | 0.2 |
表1 TA-SeqGAN网络结构及相关超参数
Table 1 TA-SeqGAN network structure and related hyperparameters
操作 | 隐藏层大小 | 核大小 | 步长 | 特征图大小 | 标准化 | 非线性处理 |
---|---|---|---|---|---|---|
Gθ(Z)-3×NU×NT输入 | ||||||
全连接(1) | N/A | N/A | N/A | 256 | × | Leaky ReLU |
全连接(2) | N/A | N/A | N/A | 128 | × | NONE |
GRU | 128 | N/A | N/A | N/A | × | NONE |
全连接 | N/A | N/A | N/A | 1 | × | NONE |
Dϕ(Gθ(Z),R)-3×NT输入 | ||||||
卷积(1,2,…,Nconv) | N/A | (1,2,…,Nconv)×N | 1×1 | 32 | √ | Leaky ReLU |
全连接 | N/A | N/A | N/A | 2 | × | NONE |
优化器 | Adam(α=10-3,β1=0.9,β2=0.999) | |||||
随机失活率(Dropout) | P=0.4 | |||||
批量大小(Batch size) | 16 | |||||
Leaky ReLU slope | 0.2 |
编号 | NU | NT |
---|---|---|
1 | 15 | 8 |
2 | 30 | 18 |
3 | 60 | 50 |
4 | 100 | 80 |
表2 任务场景设置
Table 2 Task scene settings
编号 | NU | NT |
---|---|---|
1 | 15 | 8 |
2 | 30 | 18 |
3 | 60 | 50 |
4 | 100 | 80 |
场景 | GA | PSO算法 | TA-SeqGAN |
---|---|---|---|
1 | 3.75 | 0.17 | 0.12 |
2 | 8.14 | 4.57 | 0.13 |
3 | 23.83 | 51.08 | 0.15 |
4 | 47.96 | 102.61 | 0.21 |
表3 不同场景下不同算法运行时间对比
Table 3 Comparison of running time of different algorithms with the different scenes
场景 | GA | PSO算法 | TA-SeqGAN |
---|---|---|---|
1 | 3.75 | 0.17 | 0.12 |
2 | 8.14 | 4.57 | 0.13 |
3 | 23.83 | 51.08 | 0.15 |
4 | 47.96 | 102.61 | 0.21 |
[1] |
贾永楠, 田似营, 李擎. 无人机集群研究进展综述[J]. 航空学报, 2020, 41(增刊1): 4-14.
|
|
|
[2] |
贾高伟, 王建峰. 无人机集群任务规划方法研究综述[J]. 系统工程与电子技术, 2021, 43(1): 99-111.
|
|
|
[3] |
doi: 10.1002/rnc.v30.14 URL |
[4] |
|
[5] |
doi: 10.1109/TSMCB.2012.2210212 pmid: 22949070 |
[6] |
杜永浩, 邢立宁, 姚锋, 等. 航天器任务调度模型、算法与通用求解技术综述[J]. 自动化学报, 2021, 47(12):2715-2741.
|
|
|
[7] |
|
[8] |
沈林成, 陈璟, 王楠. 飞行器任务规划技术综述[J]. 航空学报, 2014, 35(3): 593-606.
doi: 10.7527/S1000-6893.2013.0500 |
doi: 10.7527/S1000-6893.2013.0500 |
|
[9] |
doi: 10.1016/j.eswa.2022.116605 URL |
[10] |
彭鹏菲, 于钱, 李启元. 基于优先排序与粒子群优化的装备保障任务规划方法[J]. 兵工学报, 2016, 37(6): 1082-1088.
doi: 10.3969/j.issn.1000-1093.2016.06.016 |
|
|
[11] |
doi: 10.1109/TSMC.2015.2431643 URL |
[12] |
苏菲, 陈岩, 沈林成. 基于蚁群算法的无人机协同多任务分配[J]. 航空学报, 2008, 29(增刊1): 184-191.
|
|
|
[13] |
范博洋, 赵高鹏, 薄煜明, 等. 多目标空地异构无人系统协同任务分配方法[J]. 兵工学报, 2023, 44(6):1564-1575.
doi: 10.12382/bgxb.2022.0095 |
|
|
[14] |
doi: 10.1109/JIoT.6488907 URL |
[15] |
张祥银, 夏爽, 张天. 基于自适应遗传学习粒子群算法的多无人机协同任务分配[J/OL]. 控制与决策, 2022(2022-07-12)[2022-10-21]. https://doi.org/10.13195/j.kzyjc.2022.0240.
|
|
|
[16] |
彭雅兰, 段海滨, 张岱峰, 等. 仿灰狼合作捕食行为的无人机集群动态任务分配[J]. 控制理论与应用, 2021, 38(11): 1855-1862.
|
|
|
[17] |
龙涛, 沈林成, 朱华勇, 等. 面向协同任务的多UCAV分布式任务分配与协调技术[J]. 自动化学报, 2007, 33(7): 731-737.
|
|
|
[18] |
张梦颖, 王蒙一, 王晓东, 等. 基于改进合同网的无人机群协同实时任务分配问题研究[J]. 航空兵器, 2019, 26(4): 38-46.
|
|
|
[19] |
李鑫滨, 郭力争, 韩松. 一种分布式异构多AUV任务分配鲁棒拍卖算法[J]. 北京航空航天大学学报, 2022, 48(5): 736-746.
|
|
|
[20] |
doi: 10.1561/2000000039 URL |
[21] |
竺殊荣. 动态环境下多无人机协同任务规划方法[D]. 南京: 南京邮电大学, 2019: 28-40.
|
|
|
[22] |
doi: 10.1016/j.dt.2022.04.001 |
[23] |
李凯文, 张涛, 王锐, 等. 基于深度强化学习的组合优化研究进展[J]. 自动化学报, 2021, 47(11): 2521-2537.
|
|
|
[24] |
|
[25] |
|
[26] |
doi: 10.1016/j.neucom.2018.09.013 URL |
[27] |
doi: 10.1109/TVCG.2945 URL |
[28] |
林懿伦, 戴星原, 李力, 等. 人工智能研究的新前线:生成式对抗网络[J]. 自动化学报, 2018, 44(5): 775-792.
|
|
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
孙秋野, 胡旌伟, 杨凌霄, 等. 基于GAN技术的自能源混合建模与参数辨识方法[J]. 自动化学报, 2018, 44(5): 901-914.
|
|
|
[34] |
薛灵芝, 曾向阳, 杨爽. 基于生成对抗网络的水声目标识别算法[J]. 兵工学报, 2021, 42(11): 2444-2452.
doi: 10.3969/j.issn.1000-1093.2021.11.018 |
doi: 10.3969/j.issn.1000-1093.2021.11.018 |
|
[35] |
郑念祖, 丁进良. 基于Regression GAN的原油总氢物性预测方法[J]. 自动化学报, 2018, 44(5): 915-921.
|
|
|
[36] |
殷小静, 胡晓峰, 杨镜宇. 面向作战体系的生成式对抗网络应用研究[J]. 火力与指挥控制, 2019, 44(11): 11-15.
|
|
|
[37] |
doi: 10.1016/j.patcog.2017.10.013 URL |
[38] |
|
[39] |
|
[40] |
|
[41] |
|
[42] |
严飞, 祝小平, 周洲, 等. 考虑同时攻击约束的多异构无人机实时任务分配[J]. 中国科学:信息科学, 2019, 49(5): 555-569.
|
|
[1] | 苏迪, 王少博, 张成, 陈志升, 刘超越. 基于生成对抗网络的弹载图像盲去模糊算法[J]. 兵工学报, 2024, 45(3): 855-863. |
[2] | 马维宁, 胡起伟, 陈静, 贾希胜. 装备群选择性维修决策与任务分配联合优化[J]. 兵工学报, 2024, 45(2): 407-416. |
[3] | 熊佳梅, 王永振, 燕雪峰, 魏明强. 一种基于语义引导和对比学习的战场图像去烟算法[J]. 兵工学报, 2024, 45(2): 671-683. |
[4] | 马潇, 李新祺, 刘镇源, 邸超. 基于背景感知相关滤波跟踪器的目标快速跟踪方法[J]. 兵工学报, 2024, 45(2): 497-503. |
[5] | 曹子建, 孙泽龙, 闫国闯, 傅妍芳, 杨博, 李秦洁, 雷凯麟, 高领航. 基于强化学习的无人机集群对抗策略推演仿真[J]. 兵工学报, 2023, 44(S2): 126-134. |
[6] | 曹严, 龙腾, 孙景亮, 周禹泽. 信息重传与丢包补偿的多无人机分布式任务分配方法[J]. 兵工学报, 2023, 44(9): 2697-2708. |
[7] | 王磊, 徐超, 李淼, 赵慧武. 多飞行器协同任务分配的改进粒子群优化算法[J]. 兵工学报, 2023, 44(8): 2224-2232. |
[8] | 范博洋, 赵高鹏, 薄煜明, 吴祥. 多目标空地异构无人系统协同任务分配方法[J]. 兵工学报, 2023, 44(6): 1564-1575. |
[9] | 杜伟伟, 陈小伟. 陆军战术级作战任务分配及优化方法[J]. 兵工学报, 2023, 44(5): 1431-1442. |
[10] | 毕文豪, 王炤晰, 吴伟, 张安. 基于公共品博弈的无人机集群自主协同机制[J]. 兵工学报, 2023, 44(11): 3407-3421. |
[11] | 张琦, 葛玉雪, 李攀, 康淇钧, 裴扬. 基于ABMS的全光化无人机集群体系贡献率评估方法[J]. 兵工学报, 2023, 44(11): 3422-3435. |
[12] | 李理, 李旭光, 郭凯杰, 史超, 陈昭文. 国产化环境下基于强化学习的地空协同作战仿真[J]. 兵工学报, 2022, 43(S1): 74-81. |
[13] | 李锦青, 刘泽飞, 满振龙. 基于生成对抗网络的密钥生成方法及其在微光图像加密中的应用[J]. 兵工学报, 2022, 43(2): 337-344. |
[14] | 李晓雄, 张淑宁, 赵惠昌, 陈思. 基于1DC-CGAN和小波能量特征的引信小样本地形目标识别[J]. 兵工学报, 2022, 43(10): 2545-2553. |
[15] | 李剑锋, 闫晓鹏, 郝新红, 于洪海. 基于生成对抗网络的伪码调相脉冲多普勒引信引导式干扰方法[J]. 兵工学报, 2022, 43(10): 2534-2544. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||