[比亚迪] EMoE-Planner: 面向复杂城市环境的创新自动驾驶轨迹规划框架

Scene-Adaptive Motion Planning with Explicit Mixture of Experts and Interaction-Oriented Optimization

https://arxiv.org/abs/2505.12311

EMoE-Planner 是由#比亚迪 新技术研究院开发的一种新型#自动驾驶轨迹规划框架,专门针对复杂城市环境中的挑战而设计。该框架通过三种创新方法来提升轨迹规划性能:显式混合专家(Explicit MoE)动态选择专家、场景特定查询提供多模态先验、以及考虑交互的预测模型和损失计算。

这些方法共同作用,使得EMoE-Planner能够更好地适应多样化场景,并显著提升规划性能。在Nuplan数据集上的实验结果表明,该模型在几乎所有测试场景中均优于现有最先进方法,尤其是在多模态规划和交互考虑方面表现出色。

EMoE-Planner 的特点在于其对场景信息的充分利用和交互动态的细致建模。显式混合专家架构通过独立的场景路由器,能够根据场景类型精确匹配相应的专家,简化了专家的学习任务并提高了模型的透明度。此外,场景特定查询引导模型关注与目标动作相关的区域,提升了训练的稳定性和收敛速度。交互导向的损失函数则进一步优化了轨迹规划结果,使得规划的轨迹更加符合实际驾驶场景中的交互需求。这些特性使得EMoE-Planner在复杂城市环境中的轨迹规划表现尤为突出。

技术解读

EMoE-Planner是一种面向复杂城市环境的自动驾驶轨迹规划技术,其总体思路是通过显式混合专家(Explicit MoE)架构、场景特定查询(Scene-specific Query)和交互导向的优化策略,提升轨迹规划的适应性和准确性。该技术通过动态选择专家网络来处理不同场景,利用场景特定查询引导模型关注关键区域,并通过交互导向的损失函数优化轨迹规划,从而在多模态规划和交互考虑方面取得显著进展。

具体而言,EMoE-Planner首先通过独立的场景路由器对输入场景进行分类,并根据分类结果动态选择最适合的专家网络进行处理。这一过程不仅简化了专家的学习任务,还提高了模型的透明度和训练效率。其次,该技术引入场景特定查询,通过聚类算法为每种场景类型生成特定的目标点,作为查询引导模型关注与目标动作相关的区域,从而提升训练的稳定性和收敛速度。最后,EMoE-Planner通过交互导向的损失函数,考虑车辆之间的动态交互影响,优化轨迹规划结果,使得规划的轨迹更加符合实际驾驶场景中的交互需求。这些技术特点使得EMoE-Planner在复杂城市环境中的轨迹规划表现尤为突出,显著优于现有最先进方法。

EMoE-Planner 能够显著提升自动驾驶在复杂城市环境中的轨迹规划性能,减少对基于规则的后处理的依赖,从而提高系统的整体效率和适应性。其前景广阔,有望推动自动驾驶技术在更多复杂场景中的实际应用,为自动驾驶的商业化和普及化提供有力支持。

论文速读

本文介绍了一种名为EMoE-Planner的新型自动驾驶轨迹规划框架,旨在复杂城市环境中提升自动驾驶的轨迹规划性能。

摘要

  • 自动驾驶在复杂城市环境中的轨迹规划面临诸多挑战,如轨迹多模态难以适应、单一专家难以应对多样化场景以及环境交互考虑不足等。本文提出的EMoE-Planner通过三种创新方法解决这些问题:显式混合专家(Explicit MoE)动态选择专家、场景特定查询提供多模态先验、以及考虑交互的预测模型和损失计算,显著提升了规划性能。在Nuplan数据集上的实验结果表明,该模型在几乎所有测试场景中均优于现有最先进方法。

引言

  • 自动驾驶轨迹规划经历了从基于规则的方法到数据驱动方法的演变。基于规则的方法在复杂城市环境中存在局限性,如难以处理动态交互、轨迹生成僵化以及维护成本高昂。数据驱动方法通过模仿学习和强化学习等手段,能够捕捉人类驾驶行为并降低成本,但在多模态规划和交互考虑方面仍面临挑战。本文提出EMoE-Planner,通过显式混合专家模型、场景特定查询和交互导向的损失函数,解决了现有方法的不足。

相关工作

  • 多模态建模:早期方法忽略了驾驶场景的多模态特性,而现有方法通过锚点策略或扩散模型等手段来提升多模态表示能力,但仍存在局限性。本文提出使用场景特定的终点锚点,平衡锚点密度和模态表示。

  • 交互建模:多智能体交互是轨迹规划中的关键挑战,现有方法如预测优先、规划优先和联合优化等各有优缺点。本文采用规划优先范式,并引入交互回归损失,以优化轨迹偏差。

方法论

  • EMoE-Planner框架:该模型接收车辆状态、动态和静态环境信息以及地图信息,通过编码模块处理后,利用场景编码器和EMoE解码器生成轨迹查询,最终输出预测轨迹和规划轨迹。

  • 显式混合专家(EMoE):与传统混合专家模型不同,EMoE通过独立场景路由器基于场景特征选择专家,简化了专家的学习任务,提高了训练效率。

  • 场景特定查询:通过聚类算法为每种场景类型生成特定的目标点,作为查询引导模型关注与目标动作相关的区域,提升训练稳定性和收敛速度。

  • 交互导向的损失和预测:引入时间加权回归损失和交互感知回归损失,以优化轨迹点的重要性,并考虑车辆之间的交互影响,提高轨迹规划的准确性和合理性。

实验

  • 实验设置:使用Nuplan数据集进行训练和评估,包含300万样本,覆盖多种场景类型。采用非反应式(NR)模拟进行评估,使用Val14、Test14和Test14-hard基准。

  • 结果:EMoE-Planner在所有测试场景中均优于现有学习型方法,在val14和test14-hard场景中表现尤为突出,接近专家水平。与Pluto和DiffusionPlanner等基线方法相比,EMoE-Planner在舒适性和进度指标上表现更好,且在交互导向的损失函数作用下,能够有效优化轨迹进度,避免过度保守。

  • 消融实验:验证了EMoE、场景特定查询和交互导向损失对模型性能的贡献,表明这些组件对提升性能至关重要。

结论

EMoE-Planner通过利用场景信息和交互动态,显著提升了城市自动驾驶中的轨迹规划性能。该框架通过场景特定查询和EMoE架构,提高了模型对多样化场景的适应性和透明度,并通过交互导向的损失函数优化了轨迹规划结果。实验结果表明,该方法在多个基准测试中优于现有最先进方法,减少了对基于规则的后处理的依赖。