兵工学报 ›› 2024, Vol. 45 ›› Issue (9): 3147-3160.doi: 10.12382/bgxb.2023.0831
收稿日期:
2023-08-30
上线日期:
2024-01-12
通讯作者:
基金资助:
HU Yanyang, HE Fan, BAI Chengchao*()
Received:
2023-08-30
Online:
2024-01-12
摘要:
针对高超声速飞行器集群编队控制中飞行器飞行速度快、环境参数变化剧烈导致的集群控制困难问题,提出基于强化学习的集中式训练、分布式执行智能集群控制方法。建立高超声速飞行器集群运动学模型,以协同打击、编队保持作为典型目标,将过载、通信、障碍作为约束,设计了观测空间与动作空间。考虑飞行器间、飞行器与目标、飞行器与障碍物相对位置速度关系设计奖励函数,通过不断调整奖励函数权值并对飞行器进行训练,实现飞行器集群的编队控制。为了考核新算法的性能,建立评价指标,开展大量有扰动随机环境下的仿真分析。仿真结果表明,新的智能控制方法在障碍物随机位置增加的测试环境中仍能完成编队控制,为高速复杂飞行环境下的编队控制提供了一种新的解决方法。
中图分类号:
胡砚洋, 何凡, 白成超. 高超声速飞行器末制导段协同避障决策方法[J]. 兵工学报, 2024, 45(9): 3147-3160.
HU Yanyang, HE Fan, BAI Chengchao. Cooperative Obstacle Avoidance Decision Method for the Terminal Guidance Phase of Hypersonic Vehicles[J]. Acta Armamentarii, 2024, 45(9): 3147-3160.
参数 | 数值 | 参数 | 数值 | |
---|---|---|---|---|
γ | 0.99 | ρ | 0.01 | |
α | 0.2 | |B| | 256 |
表1 SAC算法参数
Table 1 SAC algorithm parameters
参数 | 数值 | 参数 | 数值 | |
---|---|---|---|---|
γ | 0.99 | ρ | 0.01 | |
α | 0.2 | |B| | 256 |
参数 | 数值 | 参数 | 数值 | |
---|---|---|---|---|
KR/km | 4 | Kv/(km·s-1) | 2.0 | |
robs/km | 15.0 | Ko/km | 60.0 | |
KTR/km | 200.0 | KTv/(km·s-1) | 2.0 |
表2 观测空间参数
Table 2 Observation space parameters
参数 | 数值 | 参数 | 数值 | |
---|---|---|---|---|
KR/km | 4 | Kv/(km·s-1) | 2.0 | |
robs/km | 15.0 | Ko/km | 60.0 | |
KTR/km | 200.0 | KTv/(km·s-1) | 2.0 |
参数 | 数值 | 参数 | 数值 | |
---|---|---|---|---|
kfKeepV | -0.01 | vfKeepV/(km·s-1) | 2.0 | |
kfKeepP | -0.01 | RfKeepP/km | 4.0 | |
kobsAvoidS | -0.07 | kobsDangerS | -0.7 | |
kobsAvoidG | -0.5 | ktoTgtV | 0.05 | |
ktoTgtDone | 1.0 | dobsSafe/km | 60.0 | |
hsafe/km | 10.0 | drange/km | 10.0 |
表3 奖励函数参数
Table 3 Reward function parameters
参数 | 数值 | 参数 | 数值 | |
---|---|---|---|---|
kfKeepV | -0.01 | vfKeepV/(km·s-1) | 2.0 | |
kfKeepP | -0.01 | RfKeepP/km | 4.0 | |
kobsAvoidS | -0.07 | kobsDangerS | -0.7 | |
kobsAvoidG | -0.5 | ktoTgtV | 0.05 | |
ktoTgtDone | 1.0 | dobsSafe/km | 60.0 | |
hsafe/km | 10.0 | drange/km | 10.0 |
参数 | 数值 | 参数 | 数值 | |
---|---|---|---|---|
高度h/km | 30.0 | 速度v/(km·s-1) | 2.0 | |
通信数量ncom | 4 | 飞行器间距/km | 10 |
表4 仿真参数设置
Table 4 Simulation parameter settings
参数 | 数值 | 参数 | 数值 | |
---|---|---|---|---|
高度h/km | 30.0 | 速度v/(km·s-1) | 2.0 | |
通信数量ncom | 4 | 飞行器间距/km | 10 |
[1] |
|
[2] |
刘薇, 龚海华. 国外高超声速飞行器发展历程综述[J]. 飞航导弹, 2020(3):20-27,59.
|
|
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
doi: S0019-0578(15)00314-6 pmid: 26786907 |
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
李文, 尚腾, 姚寅伟, 等. 速度时变情况下多飞行器时间协同制导方法研究[J]. 兵工学报, 2020, 41(6):1096-1110.
doi: 10.3969/j.issn.1000-1093.2020.06.006 |
doi: 10.3969/j.issn.1000-1093.2020.06.006 |
|
[13] |
|
[14] |
|
[15] |
安凯, 郭振云, 黄伟, 等. 低/高速飞行器系统编队协同控制方法研究进展[J]. 航空兵器, 2022, 29(5):53-65.
|
|
|
[16] |
|
[17] |
|
[18] |
张晚晴, 余文斌, 李静琳, 等. 基于纵程解析解的飞行器智能横程机动再入协同制导[J]. 兵工学报, 2021, 42(7):1400-1411.
|
doi: 10.3969/j.issn.1000-1093.2021.07.007 |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
doi: 10.23919/JSEE.2021.000121 |
[30] |
尹依伊, 王晓芳, 周健. 基于Q学习的多无人机协同航迹规划方法[J]. 兵工学报, 2023, 44(2):484-495.
doi: 10.12382/bgxb.2021.0606 |
doi: 10.12382/bgxb.2021.0606 |
|
[31] |
韩煜, 宋韬, 郑多, 等. 基于冲突触发避碰机制的无人飞行器集群协同制导技术[J]. 兵工学报, 2023, 44(7): 1881-1895.
doi: 10.12382/bgxb.2022.0152 |
doi: 10.12382/bgxb.2022.0152 |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
相晓嘉, 闫超. 基于深度强化学习的固定翼无人机编队协调控制方法[J]. 航空学报, 2020, 42(4):524009.
|
|
|
[36] |
张卫东. 滑翔式高超声速飞行器再入轨迹规划与姿态控制[D]. 哈尔滨: 哈尔滨工业大学, 2017.
|
|
|
[37] |
|
[1] | 孙浩, 黎海青, 梁彦, 马超雄, 吴翰. 基于知识辅助深度强化学习的巡飞弹组动态突防决策[J]. 兵工学报, 2024, 45(9): 3161-3176. |
[2] | 王晓芳, 许家萁. 基于预设性能的欠驱动飞行器横侧向通道控制方法[J]. 兵工学报, 2024, 45(8): 2749-2760. |
[3] | 陈文杰, 崔小红, 王斌锐. 安全最优跟踪控制算法与机械手仿真[J]. 兵工学报, 2024, 45(8): 2688-2697. |
[4] | 王霄龙, 陈洋, 胡棉, 李旭东. 基于改进深度Q网络的机器人持续监测路径规划[J]. 兵工学报, 2024, 45(6): 1813-1823. |
[5] | 丁文俊, 张国宗, 刘海旻, 柴亚军, 王驰宇, 毛昭勇. 面向海流扰动和通信时延的欠驱动AUV编队跟踪控制[J]. 兵工学报, 2024, 45(1): 184-196. |
[6] | 李松, 麻壮壮, 张蕴霖, 邵晋梁. 基于安全强化学习的多智能体覆盖路径规划[J]. 兵工学报, 2023, 44(S2): 101-113. |
[7] | 曹子建, 孙泽龙, 闫国闯, 傅妍芳, 杨博, 李秦洁, 雷凯麟, 高领航. 基于强化学习的无人机集群对抗策略推演仿真[J]. 兵工学报, 2023, 44(S2): 126-134. |
[8] | 李曹妍, 郭振川, 郑冬冬, 魏延岭. 基于分布式模型预测控制的多机器人协同编队[J]. 兵工学报, 2023, 44(S2): 178-190. |
[9] | 杨加秀, 李新凯, 张宏立, 王昊. 基于积分强化学习的四旋翼无人机鲁棒跟踪[J]. 兵工学报, 2023, 44(9): 2802-2813. |
[10] | 高铁锁, 江涛, 傅杨奥骁, 丁明松, 刘庆宗, 董维中, 许勇, 李鹏. 不同尺度飞行器周围等离子体分布及电磁波传输效应[J]. 兵工学报, 2023, 44(6): 1809-1819. |
[11] | 李超, 王瑞星, 黄建忠, 江飞龙, 魏雪梅, 孙延鑫. 稀疏奖励下基于强化学习的无人集群自主决策与智能协同[J]. 兵工学报, 2023, 44(6): 1537-1546. |
[12] | 张建东, 王鼎涵, 杨啟明, 史国庆, 陆屹, 张耀中. 基于分层强化学习的无人机空战多维决策[J]. 兵工学报, 2023, 44(6): 1547-1563. |
[13] | 马悦萌, 王琳玮, 邵春涛, 周荻, 王永海. 襟翼控制的欠驱动飞行器自抗扰/鲁棒控制系统设计[J]. 兵工学报, 2023, 44(5): 1251-1266. |
[14] | 郑泽新, 李伟, 邹鲲, 李艳福. 基于强化学习的对空雷达抗干扰波形设计[J]. 兵工学报, 2023, 44(5): 1422-1430. |
[15] | 董金鲁, 马悦萌, 周荻, 龚晓刚, 张曦, 宋加洪. 临近空间高超声速飞行器的直接力与襟翼复合滑模控制[J]. 兵工学报, 2023, 44(2): 496-506. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||