
自动驾驶中专家引导的运动编码树搜索

Project Description
-
该项目旨在解决自动驾驶任务中的长期规划任务
-
该项目将执行轨迹级别的搜索,而不是单个控制信号层级。这种方法有效地减少了搜索节点的数量,同时提高了搜索过程的效率。
-
该项目利用各种风格的专家数据来辅助训练蒙特卡洛树搜索(MCTS),并确保在每次迭代中搜索策略的多模态性。
-
该方法的有效性已通过仿真实验验证。
-
更多信息请参考 paper 1 and paper2 .
-
该项目仍在不断更新中,欢迎随时回来查看。
Project Analyses

-
目前,AlphaZero和MuZero算法在自动驾驶领域越来越受到欢迎。
-
利用蒙特卡洛树搜索(MCTS)可以实现长期规划,建模不确定性,并提高驾驶任务的可解释性。
-
然而,它们仍然面临一些挑战。如果规划时间过长,树的深度将显著增加,导致搜索节点数量的指数增加。此外,样本效率也是一个需要解决的紧迫问题。我们需要确保算法能够在有限的样本上学习和做出有效的决策,这对于实时应用非常重要。这些挑战正在积极研究和开发中得到解决,以进一步提升系统的能力。
-
为了克服上述挑战,我们提出了两种解决方案。
-
第一种方案是将运动基元方法(motion primitive methods)融入到MCTS中:基于一系列运动(技能级别)在特定时间段内进行搜索,而不是在每个时间点上进行单个动作的搜索。这样可以更好地捕捉长期规划的动态性,并减少搜索的深度和节点数量。
-
专家策略参与搜索:将专家技能保留为备选选项,但不强制性地选择它们。
-
-
这两种解决方案的综合应用有望解决规划时间长、节点数量多和样本效率低的问题,从而提高自动驾驶任务的性能和可靠性。通过引入运动基元方法和专家策略参与搜索,我们可以更有效地进行长期规划,减少搜索的深度和节点数量,并提高样本的利用效率。这将使我们能够更好地应对复杂的驾驶环境和不确定性,从而提升自动驾驶任务的性能和可行性。我们将继续努力推进这些解决方案的研究和实现,以实现更高水平的自动驾驶技术。
Project Method

Demonstration

Long horizon planning demonstration

Trajectory-level MCTS visualization