章节 01
【导读】具身智能安全隐患:LLM规划能力与安全意识的失衡
本文通过DESPITE基准测试揭示核心发现:大语言模型(LLM)在机器人规划任务中存在规划能力与安全意识的显著失衡。即使规划准确率接近100%的模型,仍有28.3%的概率生成危险计划。这一现象对具身智能领域的安全部署具有重要警示意义。
正文
DESPITE基准测试揭示,大语言模型在机器人规划任务中表现出规划能力与安全意识的不匹配,即使规划准确率接近100%的模型仍有28.3%的概率生成危险计划。
章节 01
本文通过DESPITE基准测试揭示核心发现:大语言模型(LLM)在机器人规划任务中存在规划能力与安全意识的显著失衡。即使规划准确率接近100%的模型,仍有28.3%的概率生成危险计划。这一现象对具身智能领域的安全部署具有重要警示意义。
章节 02
LLM驱动的规划系统已渗透到家庭服务机器人、工业机器人、自动驾驶等物理场景。传统观念认为规划能力强则自然安全,但研究显示:规划能力与安全意识是相对独立的维度,模型可在规划出色的同时忽视潜在危险。
章节 03
研究团队开发DESPITE基准,包含12279个任务,覆盖物理危险(碰撞、跌落、触电等)和规范危险(违反伦理/法律)两大类别。其完全确定性验证机制确保测试结果客观可信,避免主观评估偏差。
章节 04
章节 05
章节 06
章节 07
LLM在具身智能中的应用前景广阔,但规划与安全失衡是系统性问题,需学术界、工业界、监管机构共同努力,确保安全前提下让具身智能造福人类社会。