兵工学报 ›› 2024, Vol. 45 ›› Issue (6): 1787-1798.doi: 10.12382/bgxb.2023.0082
收稿日期:
2023-02-14
上线日期:
2023-06-06
通讯作者:
基金资助:
LUO Haowen1,2, HE Shaoming1,2,*(), KANG Youwei3
Received:
2023-02-14
Online:
2023-06-06
摘要:
针对典型的飞行器制导任务,利用深度学习算法可以有效地拟合导弹飞行状态与制导指令之间的函数关系。然而当制导任务发生变化时,其二者之间的映射关系也会随之改变,从而导致在当前环境下预训练好的模型无法直接作用于新环境,重新训练制导模型需要大量的弹道数据和巨额的时间成本。为解决上述问题,基于迁移学习的思想引入域对抗神经网络,提出基于迁移学习的多任务制导算法。以1个含有大量标签数据的源域任务辅助2个含有极少量标签数据的目标域任务进行迁移学习,从而克服预训练与在线控制之间的环境差异。使用特征提取器和域判别器提取出对任务环境不敏感的关键特征,使神经网络学习到各个任务所共享的底层信息;为提高预测精度,分别设计针对不同任务的偏置加速度预测器。数值仿真结果表明:基于迁移学习的多任务制导算法实现了导弹在不同任务中的加速度指令预测。
中图分类号:
罗皓文, 何绍溟, 亢有为. 一种基于迁移学习的多任务制导算法[J]. 兵工学报, 2024, 45(6): 1787-1798.
LUO Haowen, HE Shaoming, KANG Youwei. A Multitask Guidance Algorithm Based on Transfer Learning[J]. Acta Armamentarii, 2024, 45(6): 1787-1798.
任务 | 约束条件 | 优化目标 | ||
---|---|---|---|---|
源域任务 | 落角约束(-90°) | 最小飞行时间 | ||
目标域任务Ⅰ | 落角约束(-90°) | 最大终端速度 | ||
目标域任务Ⅱ | 攻击时间约束(70s)和落角约束(-90°) | 最大终端速度 |
表1 约束条件和优化目标
Table 1 Constraints and optimization objectives
任务 | 约束条件 | 优化目标 | ||
---|---|---|---|---|
源域任务 | 落角约束(-90°) | 最小飞行时间 | ||
目标域任务Ⅰ | 落角约束(-90°) | 最大终端速度 | ||
目标域任务Ⅱ | 攻击时间约束(70s)和落角约束(-90°) | 最大终端速度 |
参数 | 数值 |
---|---|
导弹x方向初始位x0/m | 0 |
导弹y方向初始位y0/m | 5000 |
目标x方向位置xf/m | [20000,21000] |
目标y方向位置yf/m | 2000 |
导弹初始速度v0/(m·s-1) | 300 |
初始弹道倾角θ0/° | [0,10] |
表2 初始状态
Table 2 Initial state
参数 | 数值 |
---|---|
导弹x方向初始位x0/m | 0 |
导弹y方向初始位y0/m | 5000 |
目标x方向位置xf/m | [20000,21000] |
目标y方向位置yf/m | 2000 |
导弹初始速度v0/(m·s-1) | 300 |
初始弹道倾角θ0/° | [0,10] |
数据集 | 数据大小 | 弹道条数 |
---|---|---|
源域数据 | 121816 | 440 |
目标域Ⅰ数据a | 4642 | 22 |
目标域Ⅰ数据b | 6018 | 33 |
目标域Ⅰ数据c | 7407 | 44 |
目标域Ⅱ数据a | 3554 | 22 |
目标域Ⅱ数据b | 4506 | 33 |
目标域Ⅱ数据c | 5857 | 44 |
表3 数据集大小
Table 3 The data size of data sets
数据集 | 数据大小 | 弹道条数 |
---|---|---|
源域数据 | 121816 | 440 |
目标域Ⅰ数据a | 4642 | 22 |
目标域Ⅰ数据b | 6018 | 33 |
目标域Ⅰ数据c | 7407 | 44 |
目标域Ⅱ数据a | 3554 | 22 |
目标域Ⅱ数据b | 4506 | 33 |
目标域Ⅱ数据c | 5857 | 44 |
训练集 | 数据组成 |
---|---|
Ⅰ | 源域数据+目标域Ⅰ数据a+目标域Ⅱ数据a |
Ⅱ | 源域数据+目标域Ⅰ数据b+目标域Ⅱ数据b |
Ⅲ | 源域数据+目标域Ⅰ数据c+目标域Ⅱ数据c |
表4 不同训练集
Table 4 Different training sets
训练集 | 数据组成 |
---|---|
Ⅰ | 源域数据+目标域Ⅰ数据a+目标域Ⅱ数据a |
Ⅱ | 源域数据+目标域Ⅰ数据b+目标域Ⅱ数据b |
Ⅲ | 源域数据+目标域Ⅰ数据c+目标域Ⅱ数据c |
目标域任务 | 均值 | 最大值 | 中位数 | 标准差 |
---|---|---|---|---|
Ⅰ | 0.18718 | 1.380 | 0.04245 | 0.0846 |
Ⅱ | 0.58169 | 1.501 | 0.13951 | 0.0587 |
表5 TMG偏置加速度的预测误差
Table 5 Bias acceleration prediction error of TMG
目标域任务 | 均值 | 最大值 | 中位数 | 标准差 |
---|---|---|---|---|
Ⅰ | 0.18718 | 1.380 | 0.04245 | 0.0846 |
Ⅱ | 0.58169 | 1.501 | 0.13951 | 0.0587 |
参数 | 均值 | 最大值 | 中位数 | 标准差 |
---|---|---|---|---|
Δx/m | 0.00039 | 0.00172 | 0.000334 | 0.000342 |
Δy/m | 0.564 | 0.996 | 0.5454 | 0.284 |
Δv/(m·s-1) | 0.0369 | 0.1258 | 0.0275 | 0.02983 |
Δθ/(°) | 0.0438 | 0.1515 | 0.0343 | 0.0383 |
Δt/s | 0.0323 | 0.114 | 0.029 | 0.0266 |
表6 目标域任务Ⅰ的误差统计
Table 6 Error statistics of Task Ⅰ in the target domain
参数 | 均值 | 最大值 | 中位数 | 标准差 |
---|---|---|---|---|
Δx/m | 0.00039 | 0.00172 | 0.000334 | 0.000342 |
Δy/m | 0.564 | 0.996 | 0.5454 | 0.284 |
Δv/(m·s-1) | 0.0369 | 0.1258 | 0.0275 | 0.02983 |
Δθ/(°) | 0.0438 | 0.1515 | 0.0343 | 0.0383 |
Δt/s | 0.0323 | 0.114 | 0.029 | 0.0266 |
参数 | 均值 | 最大值 | 中位数 | 标准差 |
---|---|---|---|---|
Δx/m | 0.00244 | 0.00685 | 0.00159 | 0.00208 |
Δy/m | 0.6359 | 0.991 | 0.6515 | 0.190 |
Δv/(m·s-1) | 0.1251 | 0.3829 | 0.07192 | 0.128 |
Δθ/(°) | 0.2221 | 0.4253 | 0.18774 | 0.1441 |
Δt/s | 0.0284 | 0.052 | 0.03 | 0.0172 |
表7 目标域任务Ⅱ的误差统计
Table 7 Error statistics of Task Ⅱ in the target domain
参数 | 均值 | 最大值 | 中位数 | 标准差 |
---|---|---|---|---|
Δx/m | 0.00244 | 0.00685 | 0.00159 | 0.00208 |
Δy/m | 0.6359 | 0.991 | 0.6515 | 0.190 |
Δv/(m·s-1) | 0.1251 | 0.3829 | 0.07192 | 0.128 |
Δθ/(°) | 0.2221 | 0.4253 | 0.18774 | 0.1441 |
Δt/s | 0.0284 | 0.052 | 0.03 | 0.0172 |
[1] |
肖增博, 雷虎民, 滕江川, 等. 多导弹协同制导规律研究现状及展望[J]. 航空兵器, 2011(6):18-22.
|
|
|
[2] |
张春妍, 宋建梅, 侯博, 等. 带落角和时间约束的网络化导弹协同制导律[J]. 兵工学报, 2016, 37(3): 431-438.
doi: 10.3969/j.issn.1000-1093.2016.03.007 |
|
|
[3] |
陈琦, 王中原, 常思江. 带有落角约束的间接Gauss伪谱最优制导律[J]. 兵工学报, 2015, 36(7): 1203-1212.
doi: 10.3969/j.issn.1000-1093.2015.07.008 |
doi: 10.3969/j.issn.1000-1093.2015.07.008 |
|
[4] |
李强, 卢宝刚, 王晓辉, 等. 一种导弹终端侵彻多约束最优制导方法[J]. 兵工学报, 2016, 37(6): 1131-1137.
doi: 10.3969/j.issn.1000-1093.2016.06.023 |
doi: 10.3969/j.issn.1000-1093.2016.06.023 |
|
[5] |
|
[6] |
叶鹏鹏, 张蛟, 李银伢, 等. 带有不同视场约束的多导弹分布式协同制导[J]. 兵工学报, 2019, 40(3): 506-515.
doi: 10.3969/j.issn.1000-1093.2019.03.008 |
doi: 10.3969/j.issn.1000-1093.2019.03.008 |
|
[7] |
张友根, 于德海, 张友安. 基于时间最优的攻击角度控制研究[J]. 飞行力学, 2010, 28(2): 46-50.
|
|
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
余跃, 王宏伦. 基于深度学习的高超声速飞行器再入预测校正容错制导[J]. 兵工学报, 2020, 41(4): 656-669.
doi: 10.3969/j.issn.1000-1093.2020.04.005 |
|
|
[18] |
刘子超, 王江, 何绍溟. 基于深度学习的时间角度控制制导律[J]. 系统工程与电子技术, 2023, 45(11):3579-3587.
doi: 10.12305/j.issn.1001-506X.2023.11.25 |
doi: 10.12305/j.issn.1001-506X.2023.11.25 |
|
[19] |
|
[20] |
|
[21] |
庞伊琼, 许华, 张悦, 等. 基于迁移元学习的调制识别算法[J]. 兵工学报, 2023, 44(10): 2954-2963.
doi: 10.12382/bgxb.2022.0583 |
doi: 10.12382/bgxb.2022.0583 |
|
[22] |
王育鹏, 吕帅帅, 杨宇. 基于域自适应的复合材料结构损伤识别方法[J]. 航空学报, 2022, 43(6): 526752.
|
|
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
吉瑞萍, 张程祎, 梁彦, 王跃东. 基于LSTM的弹道导弹主动段轨迹预报[J]. 系统工程与电子技术, 2022, 44(6): 1968-1976.
doi: 10.12305/j.issn.1001-506X.2022.06.24 |
doi: 10.12305/j.issn.1001-506X.2022.06.24 |
[1] | 栗苹, 周宇, 曹荣刚, 李发栋, 曹宇曦, 李佳武, 张安琪. 基于深度学习和双域融合的红外成像制导系统复杂背景噪声去除方法[J]. 兵工学报, 2024, 45(6): 1747-1760. |
[2] | 沈英, 刘贤财, 王舒, 黄峰. 基于偏振编码图像的低空伪装目标实时检测[J]. 兵工学报, 2024, 45(5): 1374-1383. |
[3] | 田大明, 苗圃. 融合模型求解与深度学习的可见光通信非线性均衡器[J]. 兵工学报, 2024, 45(2): 466-473. |
[4] | 张堃, 杜睿怡, 时昊天, 华帅. 基于Mogrifier-BiGRU的飞行器轨迹预测[J]. 兵工学报, 2024, 45(2): 373-384. |
[5] | 杨家铭, 潘悦, 王强, 曹怀刚, 高荪培. 水下弱目标跟踪的深度学习方法研究[J]. 兵工学报, 2024, 45(2): 385-394. |
[6] | 秦昊林, 许廷发, 李佳男. 基于超像素注意力和孪生结构的半监督高光谱显著性目标检测[J]. 兵工学报, 2023, 44(9): 2639-2649. |
[7] | 彭沛然, 任术波, 李佳男, 周鸿伟, 许廷发. 基于光照感知的多光谱融合行人检测方法[J]. 兵工学报, 2023, 44(9): 2622-2630. |
[8] | 周宇, 曹荣刚, 栗苹, 马啸. 一种用于外场试验图像的引信炸点检测方法[J]. 兵工学报, 2023, 44(8): 2453-2464. |
[9] | 刘懿, 任济寰, 吴祥, 薄煜明. 基于集成迁移学习的新装备装甲车辆分类[J]. 兵工学报, 2023, 44(8): 2319-2328. |
[10] | 王洋, 冯永新, 宋碧雪, 田秉禾. DP-DRCnet卷积神经网络信号调制识别算法[J]. 兵工学报, 2023, 44(2): 545-555. |
[11] | 张良安, 陈洋, 谢胜龙, 刘同鑫. 基于机器视觉与深度学习的飞机防护栅裂纹检测系统[J]. 兵工学报, 2023, 44(2): 507-516. |
[12] | 郑志伟, 管雪元, 傅健, 马训穷, 尹上. 基于卷积神经网络与长短期记忆神经网络的弹丸轨迹预测[J]. 兵工学报, 2023, 44(10): 2975-2983. |
[13] | 庞伊琼, 许华, 张悦, 朱华丽, 彭翔. 基于迁移元学习的调制识别算法[J]. 兵工学报, 2023, 44(10): 2954-2963. |
[14] | 王强, 吴乐天, 李红, 王勇, 王欢, 杨万扣. 基于双支网络协作的红外弱小目标检测[J]. 兵工学报, 2023, 44(10): 3165-3176. |
[15] | 黄文宽, 钱林方, 尹强, 刘太素. 基于迁移学习的供药装置故障诊断方法[J]. 兵工学报, 2023, 44(10): 2964-2974. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||