• • 下一篇
李海亮1,2,李宗刚1,2*,宁小刚1,2,杜亚江1,2
LI Hailiang1,2,LI Zonggang1,2*, NING Xiaogang1,2, DU Yajiang1,2
摘要: 针对移动机器人深度Q网络(Deep Q-Network, DQN)路径规划算法在处理大规模复杂未知环境时收敛速度慢、规划路径差等问题,提出一种结合蚁群算法(Ant Colony Optimization, ACO)与DQN的路径规划算法(Ant Colony Optimization Guide Deep Q-Networks, ACOG-DQN)。首先引入ACO的信息素机制,以有利于到达终点为目标对当前可能路径进行选择,在降低对环境无效探索次数的基础上确定最优路径;对先前路径选择经验利用阈值筛选形成样本集对Q-network进行训练,然后利用Q-network确定当前环境下移动机器人最优路径。以ACO和Q-network分别确定的最优路径、以及随机探索确定的最优路径为候选,设计Q-network最优路径权重随时间增大的路径选择机制进行决策,遴选出当前动作,达到路径最终由Q-network完全决策的目标。3组不同复杂环境下的仿真与实体试验结果均表明,所提ACOG-DQN算法相对于DQN算法,在收敛速度,路径质量和算法稳定性方面表现出更优的性能,表明了所提算法的有效性。
中图分类号: