您当前的位置:
首页 >
文章列表页 >
通过交叉注意力和专家奖励塑形优化空战威胁评估的强化学习方法
更新时间:2025-12-29
    • 通过交叉注意力和专家奖励塑形优化空战威胁评估的强化学习方法

    • A Reinforcement Learning Method for Optimizing Air Combat Threat Assessment via Cross-attention Mechanisms and Expert-guided Reward Shaping

    • 兵工学报   2025年46卷第S1期 页码:337-350
    • DOI:10.12382/bgxb.2025.0606    

      中图分类号:
    • 纸质出版:2025

    移动端阅览

  • 孙康, 薛丁瑞, 范继, 林玉清, 李博, 王柯新, 刘建成, 卫思雯. 通过交叉注意力和专家奖励塑形优化空战威胁评估的强化学习方法[J]. 兵工学报, 2025, 46(S1): 250606-. DOI: 10.12382/bgxb.2025.0606.

    孙康, 薛丁瑞, 范继, et al. A Reinforcement Learning Method for Optimizing Air Combat Threat Assessment via Cross-attention Mechanisms and Expert-guided Reward Shaping[J]. Acta Armamentarii, 2025, 46(S1): 337-350. DOI: 10.12382/bgxb.2025.0606.

  •  
  •  
icon
试读结束,您可以激活您的VIP账号继续阅读。
去激活 >
icon
试读结束,您可以通过登录账户,到个人中心,购买VIP会员阅读全文。
已是VIP会员?
去登录 >

0

浏览量

27

下载量

0

CNKI被引量

文章被引用时,请邮件提醒。
提交
工具集
下载
参考文献导出
分享
收藏
添加至我的专辑

相关文章

基于蚁群优化算法引导深度Q网络的移动机器人路径规划算法
基于DDQN-D3PG的无人机空战分层决策
不确定场景下基于直觉模糊集和灰色关联度的舰船目标威胁评估方法
一种元学习和强化学习结合的多飞行器协同制导律
基于人工势场和改进强化学习的自主式水下潜航器避障和航迹规划

相关作者

杜亚江
宁小刚
李宗刚
李海亮
任田君
李硕
郭中宇
李远鹏

相关机构

西安科为实业发展有限责任公司
沈阳航空航天大学 自动化学院
中国航天科技创新研究院 算法中心
杭州电子科技大学 自动化学院
北京理工大学 空天科学与技术学院
0