基于深度强化学习的路径规划方法、装置和车辆
已公开.
摘要
本申请公开了一种基于深度强化学习的路径规划方法、装置和车辆,基于深度强化学习的路径规划方法,通过“看两步,走一步”的动态路径规划原则,有效地填补了相关技术中的研究空缺,提高了车辆的路径规划带来的个体车辆的收益和全局交通的收益,促进了路网内各个道路上车流的均衡性,提高了整个交通系统的效率。
主权项
一种基于深度强化学习的路径规划方法,其特征在于,当车辆到达一路口节点时,包括:获取所述车辆所在所述路口节点到第一路口节点和第二路口节点范围内的交通状态信息;其中,所述第一路口节点为所述车辆所在所述路口节点的下一路口节点,所述第二路口节点为所述车辆所在所述路口节点的下一路口节点的下一路口节点;将获得的所述交通状态信息输入预先训练好的基于深度强化学习的路径规划模型,以选择所述车辆所在所述路口节点到所述第一路口节点范围内的路径并执行。