兵工学报 ›› 2023, Vol. 44 ›› Issue (11): 3465-3477.doi: 10.12382/bgxb.2022.0815
所属专题: 群体协同与自主技术
收稿日期:
2022-09-07
上线日期:
2023-05-12
通讯作者:
基金资助:
JIANG Yan, DING Yuyan, ZHANG Xinglong, XU Xin*()
Received:
2022-09-07
Online:
2023-05-12
摘要:
针对智能车辆在复杂环境下高机动运动控制的难题,提出一种基于模型预测与策略学习的人机协同控制算法。该算法利用人类驾驶员对环境的理解和综合处理能力在决策规划层面辅助机器进行局部轨迹规划,包括速度调节和动态路径生成,实现决策规划层面的人机协同;面向高机动行驶的车辆在线优化规划与控制存在时效性问题,一方面在局部规划层采用较长采样间隔和简化的动力学模型设计基于模型预测控制的局部轨迹规划方法,以实现高效在线轨迹优化;另一方面在控制层采用基于滚动时域强化学习的学习型预测控制方法在线优化控制策略,以提升在线优化控制的计算效率与适应性。驾驶员在环的山区公路高机动仿真结果表明:新方法能遵从驾驶员的加减速指令和转向指令生成安全、平滑的规划轨迹,而且能够精确控制车辆沿期望轨迹行驶;在人机协同控制模式下,6位驾驶员完成相同驾驶任务的时间比手动驾驶平均缩短了8.3%,转向操作负荷降低了51.1%。
中图分类号:
蒋岩, 丁语嫣, 张兴龙, 徐昕. 基于模型预测与策略学习的智能车辆人机协同控制算法[J]. 兵工学报, 2023, 44(11): 3465-3477.
JIANG Yan, DING Yuyan, ZHANG Xinglong, XU Xin. A Human-machine Collaborative Control Algorithm for Intelligent Vehicles Based on Model Prediction and Policy Learning[J]. Acta Armamentarii, 2023, 44(11): 3465-3477.
图5 局部行驶路线规划撒点采样示意(o1为静态障碍物,o2为动态障碍物,o2,k表示k时刻碰撞处理后的障碍物2多边形包络,s表示沿道路中心线方向)
Fig.5 Schematic diagram of local driving route planning sprinkler sampling (o1 is a static obstacle, o2 is a dynamic obstacle, o2,k represents the polygonal envelope of obstacle 2 after collision processing at time k, and s is the direction of road centreline)
参数 | 数值 | 参数 | 数值 |
---|---|---|---|
m/kg | 1555 | γ | 0.95 |
hCG/m | 0.665 | ns | 15 |
Ix/(kg·m2) | 846.6 | ζ | 1.1 |
Iy/(kg·m2) | 1 816 | nd | 6 |
Iz/(kg·m2) | 1 816 | Np | 30 |
lf/m | 1.85 | Tp/s | 0.2 |
lr/m | 1.80 | qc | 0.01 |
Kϕ/(N·m·rad-1) | 51 600 | ql | 0.1 |
Dϕ/(N·m·s·rad-1) | 5 300 | qω | 5.0 |
Kθ/(N·m·rad-1) | 45 000 | 0.01 | |
Dθ/(N·m·s·rad-1) | 2 600 | 0.5 | |
Ccf/(N·rad-1) | 76 500 | 0.2 | |
Ccr/(N·rad-1) | 76 500 | 1 | |
w/m | 1.7 | Nc | 50 |
ay,max/(m·s-2) | 4 | Tc/s | 0.02 |
ay,min/(m·s-2) | -4 | imax | 5 |
ax,max/(m·s-2) | -4 | /m | 0.2 |
ax,min/(m·s-2) | -6 | 0.2 | |
w1 | 0.5 | 0.2 | |
w2 | 3.0 | 0.1 | |
w3 | 0.5 | 10-9 | |
w4 | 0.5 | 0.05 |
表1 车辆模型参数以及规划器和控制器参数
Table 1 Vehicle model parameters, and planner and controller parameters
参数 | 数值 | 参数 | 数值 |
---|---|---|---|
m/kg | 1555 | γ | 0.95 |
hCG/m | 0.665 | ns | 15 |
Ix/(kg·m2) | 846.6 | ζ | 1.1 |
Iy/(kg·m2) | 1 816 | nd | 6 |
Iz/(kg·m2) | 1 816 | Np | 30 |
lf/m | 1.85 | Tp/s | 0.2 |
lr/m | 1.80 | qc | 0.01 |
Kϕ/(N·m·rad-1) | 51 600 | ql | 0.1 |
Dϕ/(N·m·s·rad-1) | 5 300 | qω | 5.0 |
Kθ/(N·m·rad-1) | 45 000 | 0.01 | |
Dθ/(N·m·s·rad-1) | 2 600 | 0.5 | |
Ccf/(N·rad-1) | 76 500 | 0.2 | |
Ccr/(N·rad-1) | 76 500 | 1 | |
w/m | 1.7 | Nc | 50 |
ay,max/(m·s-2) | 4 | Tc/s | 0.02 |
ay,min/(m·s-2) | -4 | imax | 5 |
ax,max/(m·s-2) | -4 | /m | 0.2 |
ax,min/(m·s-2) | -6 | 0.2 | |
w1 | 0.5 | 0.2 | |
w2 | 3.0 | 0.1 | |
w3 | 0.5 | 10-9 | |
w4 | 0.5 | 0.05 |
符号 | 描述 |
---|---|
ttask | 完成驾驶任务总时长 |
L2c | 车辆在违反安全区域边界情况下的行驶距离 |
转向操作做功,定义为 = ( + )dt |
表2 性能指标
Table 2 Performance indicators
符号 | 描述 |
---|---|
ttask | 完成驾驶任务总时长 |
L2c | 车辆在违反安全区域边界情况下的行驶距离 |
转向操作做功,定义为 = ( + )dt |
方法 | 指标 | 测试人员 | |||||
---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | ||
手动驾驶 | ttask/s | 268.4 | 244.9 | 247.9 | 233.5 | 227.7 | 248.1 |
L2c/m | 190.2 | 6.0 | 29.0 | 56.8 | 96.9 | 173.7 | |
2945 | 2155 | 2089 | 2766 | 2587 | 1037 | ||
对比方法[ | ttask/s | 226.1 | 237.4 | 238.7 | 229.3 | 245.6 | 232.4 |
L2c/m | 2.7 | 8.5 | 3.1 | 5.5 | 0 | 1.8 | |
1557 | 1157 | 1256 | 1564 | 1437 | 975 | ||
本文方法 | ttask/s | 224.6 | 217.9 | 234.8 | 218.9 | 234.5 | 217.4 |
L2c/m | 0 | 0 | 0 | 0 | 0 | 0 | |
1717 | 914 | 1011 | 975 | 1168 | 852 |
表3 山区公路场景下不同控制方法性能指标统计
Table 3 Statistics of performance indicators of different control methods in mountain road scene
方法 | 指标 | 测试人员 | |||||
---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | ||
手动驾驶 | ttask/s | 268.4 | 244.9 | 247.9 | 233.5 | 227.7 | 248.1 |
L2c/m | 190.2 | 6.0 | 29.0 | 56.8 | 96.9 | 173.7 | |
2945 | 2155 | 2089 | 2766 | 2587 | 1037 | ||
对比方法[ | ttask/s | 226.1 | 237.4 | 238.7 | 229.3 | 245.6 | 232.4 |
L2c/m | 2.7 | 8.5 | 3.1 | 5.5 | 0 | 1.8 | |
1557 | 1157 | 1256 | 1564 | 1437 | 975 | ||
本文方法 | ttask/s | 224.6 | 217.9 | 234.8 | 218.9 | 234.5 | 217.4 |
L2c/m | 0 | 0 | 0 | 0 | 0 | 0 | |
1717 | 914 | 1011 | 975 | 1168 | 852 |
[1] |
陈慧岩, 陈舒平, 龚建伟. 智能汽车横向控制方法研究综述[J]. 兵工学报, 2017, 38(6):1203-1214.
doi: 10.3969/j.issn.1000-1093.2017.06.021 |
|
|
[2] |
胡云峰, 曲婷, 刘俊, 等. 智能汽车人机协同控制的研究现状与展望[J]. 自动化学报, 2019, 45(7):1261-1280.
|
|
|
[3] |
doi: 10.1109/TIV.2022.3154426 URL |
[4] |
刘俊. 智能车辆人机协同转向控制策略研究[D]. 长春: 吉林大学, 2020:13-29.
|
|
|
[5] |
doi: 10.1109/TII.2018.2865105 URL |
[6] |
doi: 10.1109/TITS.6979 URL |
[7] |
doi: 10.1016/j.conengprac.2018.04.007 URL |
[8] |
doi: 10.1080/00423114.2016.1256489 URL |
[9] |
doi: 10.1049/itr2.v12.6 URL |
[10] |
doi: 10.1109/TCST.2012.2200826 URL |
[11] |
doi: 10.1109/TVT.2016.2555853 URL |
[12] |
doi: 10.1002/oca.v36.5 URL |
[13] |
doi: 10.1109/TCYB.2015.2478857 URL |
[14] |
doi: 10.1109/TIV.2022.3167271 URL |
[15] |
龚建伟, 姜岩, 徐威. 无人驾驶车辆模型预测控制[M]. 北京: 北京理工大学出版社, 2020.
|
|
|
[16] |
|
[17] |
|
[18] |
doi: 10.1016/j.eswa.2020.114186 URL |
[19] |
doi: 10.1002/oca.v36.5 URL |
[20] |
doi: 10.1016/j.ifacol.2020.12.073 URL |
[21] |
doi: 10.1016/j.aap.2021.106301 URL |
[1] | 刘江涛, 周乐来, 李贻斌. 复杂地形六轮独立驱动与转向机器人轨迹跟踪与避障控制[J]. 兵工学报, 2024, 45(1): 166-183. |
[2] | 许鹏, 邢伯阳, 刘宇飞, 李泳耀, 曾怡, 郑冬冬. 基于扩张状态观测器和模型预测方法的四足机器人抗干扰复合控制[J]. 兵工学报, 2023, 44(S2): 12-21. |
[3] | 郭志明, 娄文忠, 李涛, 张梦宇, 白子龙, 乔虎. 基于改进蝗虫优化算法考虑任务威胁的多无人机协同航迹规划[J]. 兵工学报, 2023, 44(S2): 52-60. |
[4] | 李松, 麻壮壮, 张蕴霖, 邵晋梁. 基于安全强化学习的多智能体覆盖路径规划[J]. 兵工学报, 2023, 44(S2): 101-113. |
[5] | 曹子建, 孙泽龙, 闫国闯, 傅妍芳, 杨博, 李秦洁, 雷凯麟, 高领航. 基于强化学习的无人机集群对抗策略推演仿真[J]. 兵工学报, 2023, 44(S2): 126-134. |
[6] | 李曹妍, 郭振川, 郑冬冬, 魏延岭. 基于分布式模型预测控制的多机器人协同编队[J]. 兵工学报, 2023, 44(S2): 178-190. |
[7] | 杨加秀, 李新凯, 张宏立, 王昊. 基于积分强化学习的四旋翼无人机鲁棒跟踪[J]. 兵工学报, 2023, 44(9): 2802-2813. |
[8] | 李超, 王瑞星, 黄建忠, 江飞龙, 魏雪梅, 孙延鑫. 稀疏奖励下基于强化学习的无人集群自主决策与智能协同[J]. 兵工学报, 2023, 44(6): 1537-1546. |
[9] | 张建东, 王鼎涵, 杨啟明, 史国庆, 陆屹, 张耀中. 基于分层强化学习的无人机空战多维决策[J]. 兵工学报, 2023, 44(6): 1547-1563. |
[10] | 郑泽新, 李伟, 邹鲲, 李艳福. 基于强化学习的对空雷达抗干扰波形设计[J]. 兵工学报, 2023, 44(5): 1422-1430. |
[11] | 赵文飞, 陈健, 王, 滕克难. 基于强化学习的海上要地群协同防空动态火力分配[J]. 兵工学报, 2023, 44(11): 3516-3528. |
[12] | 张渊博, 项昌乐, 王伟达, 陈泳丹. 基于粒子群优化-蚁群融合算法的分布式电驱动车辆模型预测转矩协调控制策略[J]. 兵工学报, 2023, 44(11): 3253-3258. |
[13] | 李佳键, 史彦军, 杨雨, 李波, 赵熙俊. 无人集群作战任务的多智能体强化学习卸载决策[J]. 兵工学报, 2023, 44(11): 3295-3309. |
[14] | 周球, 周悦, 孙洪鸣, 郭威, 吴凯, 兰彦军. 深海着陆车路径规划及跟踪控制方法[J]. 兵工学报, 2023, 44(1): 298-306. |
[15] | 宋佳睿, 陶刚, 李德润, 臧政, 吴绍斌, 龚建伟. 参数自优化的有人与无人车辆编队鲁棒模型预测控制[J]. 兵工学报, 2023, 44(1): 84-97. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||