章节 01
【导读】LLM驱动的多规划器调度框架:自动驾驶开放式指令实现新方案
本文提出一种基于大语言模型(LLM)的指令实现框架,通过调度多个MPC运动规划器,将乘客自然语言指令转化为车辆可执行控制信号,实现语义推理与车辆控制的有效解耦。该框架解决了传统自动驾驶系统处理开放式指令的局限,提升了任务完成率、安全性与决策可解释性。
正文
本文提出了一种基于大语言模型的指令实现框架,通过调度多个MPC运动规划器,将乘客的自然语言指令转化为可执行的车辆控制信号,实现了语义推理与车辆控制的有效解耦。
章节 01
本文提出一种基于大语言模型(LLM)的指令实现框架,通过调度多个MPC运动规划器,将乘客自然语言指令转化为车辆可执行控制信号,实现语义推理与车辆控制的有效解耦。该框架解决了传统自动驾驶系统处理开放式指令的局限,提升了任务完成率、安全性与决策可解释性。
章节 02
自动驾驶技术发展中,现有HMI研究多聚焦驾驶员交互,忽视乘客开放式操控需求(如"开慢一点欣赏风景"等指令),其转化为控制信号的准确性、可解释性是关键挑战。
传统分层架构依赖预定义命令映射,缺乏开放式语言处理灵活性;高层语义直接映射低层控制的紧耦合设计,导致复杂指令处理困难及决策黑盒问题,影响安全性验证。
章节 03
框架采用调度中心化设计,实现语义推理与控制解耦:
章节 04
构建模拟真实场景的闭环评估基准,支持指令理解准确性、任务完成率、安全合规性等多维度评估,解决现有工具缺失问题。
章节 05
证明自然语言作为自动驾驶控制接口的可行性,调度中心化架构可推广至其他机器人语义-控制协同场景。
扩展上下文感知(结合乘客偏好、路况)、探索多模态交互(语音+手势+视觉)、提升实时性与边缘部署能力。
该框架为构建自然、透明、可靠的自动驾驶交互体验迈出重要一步,未来有望让自动驾驶汽车成为理解乘客意图的智能出行伙伴。