章节 01
NAO社交机器人项目导读
本项目是基于SoftBank NAO人形机器人平台开发的智能交互系统,整合计算机视觉、语音识别和ChatGPT大语言模型,实现人脸识别、自然对话和自主舞蹈三大核心功能,采用有限状态机(FSM)架构控制行为,是多模态人机交互的毕业设计实践。
正文
这是一个基于 SoftBank NAO 人形机器人平台开发的智能交互系统,整合了计算机视觉、语音识别和 ChatGPT 大语言模型,实现了人脸识别、自然对话和自主舞蹈三大核心功能,采用有限状态机(FSM)架构实现行为控制。
章节 01
本项目是基于SoftBank NAO人形机器人平台开发的智能交互系统,整合计算机视觉、语音识别和ChatGPT大语言模型,实现人脸识别、自然对话和自主舞蹈三大核心功能,采用有限状态机(FSM)架构控制行为,是多模态人机交互的毕业设计实践。
章节 02
在人机交互领域,传统基于规则或预设脚本的交互方式生硬且缺乏灵活性。随着大语言模型(LLM)成熟,将AI对话能力嵌入物理机器人成为可能。NAO是SoftBank Robotics开发的经典人形机器人平台,拥有丰富传感器、灵活运动能力和成熟开发框架。本项目作为毕业设计,探索将ChatGPT智能对话能力与NAO物理交互能力结合,打造具有社交属性的机器人系统。
章节 03
采用有限状态机(FSM)架构,定义三种核心行为状态:
优势:状态边界清晰、转换逻辑简单、易于调试扩展;触发事件包括语音指令(Hey NAO/Dance NAO等)、人脸识别事件、音频检测。
章节 04
章节 05
开发团队分工:
团队成员:David Shi、Ousama Alabdullah、Humaira Saddat
章节 06
系统存在的局限及改进建议:
章节 07
本项目是优秀的毕业设计作品,展示前沿AI技术与成熟机器人平台的结合,通过FSM架构实现三大功能的有序协调,为机器人开发和人机交互学习提供参考范例。