Zing 论坛

正文

Rasa AI Coworker Hackathon 2026:构建持久化智能同事的技术栈与思路

Rasa 在波士顿科技周 2026 举办的黑客松 starter kit,展示如何构建具备语音交互、跨会话记忆、LLM 推理和 ReAct 子代理的"Always-On AI Coworker"。

RasaAI CoworkervoiceSpeechmaticsRimeNebiusLLMmemoryReActMCP
发布时间 2026/05/30 00:43最近活动 2026/05/30 00:50预计阅读 12 分钟
Rasa AI Coworker Hackathon 2026:构建持久化智能同事的技术栈与思路
1

章节 01

导读 / 主楼:Rasa AI Coworker Hackathon 2026:构建持久化智能同事的技术栈与思路

Rasa 在波士顿科技周 2026 举办的黑客松 starter kit,展示如何构建具备语音交互、跨会话记忆、LLM 推理和 ReAct 子代理的"Always-On AI Coworker"。

2

章节 02

原作者与来源

Rasa AI Coworker Hackathon 2026:构建持久化智能同事的技术栈与思路\n\n## 原作者与来源\n- 原作者/维护者: RasaHQ\n- 来源平台: GitHub\n- 原始标题: rasa-bos-hackathon-2026\n- 原始链接: https://github.com/RasaHQ/rasa-bos-hackathon-2026\n- 发布时间: 2026-05-29\n\n## 背景:从 5 分钟演示到持久化 AI 同事\n\n当前 AI 领域充斥着各种"5 分钟演示"——看起来很酷,但缺乏实际生产力价值。Rasa 在波士顿科技周 2026 举办的黑客松提出了一个更具挑战性的目标:构建真正能够融入团队日常工作、具备长期记忆和可靠工作流的 AI 同事。\n\n这不仅是技术展示,更是对现有 AI 应用范式的反思:如何让 AI 代理不只是回答问题的聊天机器人,而是能够处理复杂业务流程、在长时间会话中保持上下文、并在压力下避免幻觉的可靠协作者?\n\n## 项目概述\n\n这个开源仓库是黑客松的 starter kit 和活动中心,提供了一个可直接运行的 Rasa AI 同事模板。它整合了语音交互、大语言模型推理、跨会话记忆和可选的 ReAct 子代理能力,为参赛者提供了一个坚实的技术起点。\n\n### 核心理念\n\n"We're done with the 5-minute AI demo."(我们厌倦了 5 分钟的 AI 演示。)\n\n黑客松的目标是构建能够处理真实工作流的持久化、长期运行的数字同事。这些代理需要:\n- 处理复杂业务流程\n- 在长时间会话中保持记忆\n- 无缝融入团队日常工作\n- 在高压力下保持可靠,避免幻觉\n\n## 技术栈架构\n\n### 1. 对话引擎:Rasa\n\n作为开源对话 AI 平台的领导者,Rasa 提供了可靠的多轮对话管理能力。相比纯 LLM 驱动的聊天机器人,Rasa 的规则引擎和机器学习混合架构能够提供更可控、可预测的行为。\n\n### 2. 语音交互层\n\n项目整合了 Speechmatics 和 Rime 两家语音技术提供商:\n- Speechmatics:提供高精度的语音识别(ASR)\n- Rime:提供自然流畅的语音合成(TTS)\n\n这种组合使 AI 同事具备真正的语音交互能力,而非仅限于文本聊天。\n\n### 3. LLM 推理:Nebius\n\n项目使用 Nebius 提供的 LLM 推理服务。Nebius 作为新兴的 AI 基础设施提供商,为项目提供了可扩展的大模型推理能力。\n\n### 4. 记忆系统:跨会话持久化\n\n这是项目的核心特性之一。AI 同事能够:\n- 记住之前的对话历史\n- 在多次交互间保持上下文连贯\n- 积累关于用户偏好和工作模式的知识\n\n这种长期记忆能力是将"聊天机器人"升级为"数字同事"的关键。\n\n### 5. 可选增强:ReAct 子代理 + MCP\n\n项目还提供了可选的 ReAct(Reasoning + Acting)子代理能力,以及 MCP(Model Context Protocol)集成。这使得 AI 同事能够:\n- 进行多步推理和规划\n- 调用外部工具和 API\n- 在复杂任务中展示类似人类的思考过程\n\n## Starter 项目结构\n\n仓库中的 starter 目录包含了完整的入门模板:\n\n\nstarter/\n├── actions/ # 自定义动作和逻辑\n├── agentic/ # ReAct 子代理相关代码\n├── data/flows/ # 对话流程定义\n├── domain/ # 领域模型定义\n├── scripts/ # 辅助脚本\n├── tests/e2e/ # 端到端测试\n├── voice/ # 语音相关配置和代码\n├── .data/ # 数据存储\n├── Makefile # 构建和运行命令\n└── README.md # 详细文档\n\n\n这种结构体现了 Rasa 项目的最佳实践,同时整合了语音和代理能力。\n\n## 实际应用场景\n\n### 场景一:会议助手\n\nAI 同事可以:\n- 通过语音加入会议\n- 实时记录和总结讨论要点\n- 记住之前的会议内容,提供连续性\n- 主动提醒待办事项和后续行动\n\n### 场景二:项目管理\n\n- 跟踪项目进度和里程碑\n- 记住每个团队成员的工作习惯和偏好\n- 在适当时候主动提供状态更新\n- 协调跨团队沟通\n\n### 场景三:客户支持\n\n- 处理客户咨询,必要时升级给人类同事\n- 记住客户历史交互,提供个性化服务\n- 在语音和文本渠道间无缝切换\n\n## 技术亮点与创新\n\n### 1. 可控与智能的平衡\n\n项目展示了如何在 Rasa 的规则引擎可靠性和 LLM 的灵活性之间找到平衡。关键业务流程由规则保证可靠性,而自然语言理解和生成则利用 LLM 的能力。\n\n### 2. 真正的多模态交互\n\n通过整合 Speechmatics 和 Rime,项目实现了真正的语音到语音交互,而非简单的语音转文本再转语音。这包括:\n- 实时语音识别\n- 流式语音合成\n- 语音打断和双工对话\n\n### 3. 记忆架构设计\n\n跨会话记忆的实现涉及多个层面:\n- 短期工作记忆(当前对话)\n- 长期事实记忆(用户偏好、历史事件)\n- 程序性记忆(学习到的交互模式)\n\n### 4. 工具使用能力\n\n通过 ReAct 模式和 MCP,AI 同事能够:\n- 理解何时需要外部工具\n- 正确选择和调用 API\n- 处理工具返回的结果\n- 在失败时进行恢复和重试\n\n## 对开发者的启示\n\n### 1. 超越聊天机器人\n\n这个项目展示了如何从简单的问答机器人演进为真正的业务助手。关键在于:\n- 明确的业务目标\n- 可靠的核心流程\n- 自然的交互方式\n- 持续的学习能力\n\n### 2. 技术整合的艺术\n\n成功的 AI 应用往往需要整合多种技术:\n- 传统 NLP(Rasa)\n- 大语言模型(Nebius)\n- 语音技术(Speechmatics + Rime)\n- 记忆存储\n- 工具调用\n\n关键在于选择合适的技术解决合适的问题,而非盲目追求最新技术。\n\n### 3. 可靠性的重要性\n\n企业级 AI 应用必须在各种条件下保持可靠。这要求:\n- 明确的错误处理\n- 优雅降级机制\n- 人类接管能力\n- 全面的测试覆盖\n\n## 局限与展望\n\n作为黑客松 starter kit,项目的主要目标是提供概念验证和技术启发。实际生产部署还需要考虑:\n\n- 规模化:支持大量并发用户和长时间运行\n- 安全性:企业级认证、授权和数据保护\n- 可观测性:全面的监控、日志和调试能力\n- 定制化:适配特定行业和业务场景\n\n## 参与与资源\n\n项目提供了丰富的学习资源:\n- Rasa 官方文档:https://rasa.com/docs/\n- 社区支持:https://info.rasa.com/community\n- 在线体验:https://hello.rasa.ai\n\n## 总结\n\nRasa AI Coworker Hackathon 2026 的 starter kit 不仅是一个技术模板,更是对 AI 应用未来发展方向的探索。它展示了如何将大语言模型的能力与可靠的对话系统、语音交互和长期记忆结合,构建真正有用的 AI 同事。\n\n对于希望构建企业级 AI 应用的开发者来说,这个项目提供了一个宝贵的参考实现,展示了多种技术的整合方式和架构设计思路。无论你是参加黑客松还是独立学习,这都是一个值得深入研究的项目。

3

章节 03

补充观点 1

原作者与来源

  • 原作者/维护者:RasaHQ
  • 来源平台:github
  • 原始标题:rasa-bos-hackathon-2026
  • 原始链接:https://github.com/RasaHQ/rasa-bos-hackathon-2026
  • 来源发布时间/更新时间:2026-05-29T16:43:48Z Rasa AI Coworker Hackathon 2026:构建持久化智能同事的技术栈与思路\n\n原作者与来源\n- 原作者/维护者: RasaHQ\n- 来源平台: GitHub\n- 原始标题: rasa-bos-hackathon-2026\n- 原始链接: https://github.com/RasaHQ/rasa-bos-hackathon-2026\n- 发布时间: 2026-05-29\n\n背景:从 5 分钟演示到持久化 AI 同事\n\n当前 AI 领域充斥着各种"5 分钟演示"——看起来很酷,但缺乏实际生产力价值。Rasa 在波士顿科技周 2026 举办的黑客松提出了一个更具挑战性的目标:构建真正能够融入团队日常工作、具备长期记忆和可靠工作流的 AI 同事。\n\n这不仅是技术展示,更是对现有 AI 应用范式的反思:如何让 AI 代理不只是回答问题的聊天机器人,而是能够处理复杂业务流程、在长时间会话中保持上下文、并在压力下避免幻觉的可靠协作者?\n\n项目概述\n\n这个开源仓库是黑客松的 starter kit 和活动中心,提供了一个可直接运行的 Rasa AI 同事模板。它整合了语音交互、大语言模型推理、跨会话记忆和可选的 ReAct 子代理能力,为参赛者提供了一个坚实的技术起点。\n\n核心理念\n\n"We're done with the 5-minute AI demo."(我们厌倦了 5 分钟的 AI 演示。)\n\n黑客松的目标是构建能够处理真实工作流的持久化、长期运行的数字同事。这些代理需要:\n- 处理复杂业务流程\n- 在长时间会话中保持记忆\n- 无缝融入团队日常工作\n- 在高压力下保持可靠,避免幻觉\n\n技术栈架构\n\n1. 对话引擎:Rasa\n\n作为开源对话 AI 平台的领导者,Rasa 提供了可靠的多轮对话管理能力。相比纯 LLM 驱动的聊天机器人,Rasa 的规则引擎和机器学习混合架构能够提供更可控、可预测的行为。\n\n2. 语音交互层\n\n项目整合了 Speechmatics 和 Rime 两家语音技术提供商:\n- Speechmatics:提供高精度的语音识别(ASR)\n- Rime:提供自然流畅的语音合成(TTS)\n\n这种组合使 AI 同事具备真正的语音交互能力,而非仅限于文本聊天。\n\n3. LLM 推理:Nebius\n\n项目使用 Nebius 提供的 LLM 推理服务。Nebius 作为新兴的 AI 基础设施提供商,为项目提供了可扩展的大模型推理能力。\n\n4. 记忆系统:跨会话持久化\n\n这是项目的核心特性之一。AI 同事能够:\n- 记住之前的对话历史\n- 在多次交互间保持上下文连贯\n- 积累关于用户偏好和工作模式的知识\n\n这种长期记忆能力是将"聊天机器人"升级为"数字同事"的关键。\n\n5. 可选增强:ReAct 子代理 + MCP\n\n项目还提供了可选的 ReAct(Reasoning + Acting)子代理能力,以及 MCP(Model Context Protocol)集成。这使得 AI 同事能够:\n- 进行多步推理和规划\n- 调用外部工具和 API\n- 在复杂任务中展示类似人类的思考过程\n\nStarter 项目结构\n\n仓库中的 starter 目录包含了完整的入门模板:\n\n\nstarter/\n├── actions/ 自定义动作和逻辑\n├── agentic/ ReAct 子代理相关代码\n├── data/flows/ 对话流程定义\n├── domain/ 领域模型定义\n├── scripts/ 辅助脚本\n├── tests/e2e/ 端到端测试\n├── voice/ 语音相关配置和代码\n├── .data/ 数据存储\n├── Makefile 构建和运行命令\n└── README.md 详细文档\n\n\n这种结构体现了 Rasa 项目的最佳实践,同时整合了语音和代理能力。\n\n实际应用场景\n\n场景一:会议助手\n\nAI 同事可以:\n- 通过语音加入会议\n- 实时记录和总结讨论要点\n- 记住之前的会议内容,提供连续性\n- 主动提醒待办事项和后续行动\n\n场景二:项目管理\n\n- 跟踪项目进度和里程碑\n- 记住每个团队成员的工作习惯和偏好\n- 在适当时候主动提供状态更新\n- 协调跨团队沟通\n\n场景三:客户支持\n\n- 处理客户咨询,必要时升级给人类同事\n- 记住客户历史交互,提供个性化服务\n- 在语音和文本渠道间无缝切换\n\n技术亮点与创新\n\n1. 可控与智能的平衡\n\n项目展示了如何在 Rasa 的规则引擎可靠性和 LLM 的灵活性之间找到平衡。关键业务流程由规则保证可靠性,而自然语言理解和生成则利用 LLM 的能力。\n\n2. 真正的多模态交互\n\n通过整合 Speechmatics 和 Rime,项目实现了真正的语音到语音交互,而非简单的语音转文本再转语音。这包括:\n- 实时语音识别\n- 流式语音合成\n- 语音打断和双工对话\n\n3. 记忆架构设计\n\n跨会话记忆的实现涉及多个层面:\n- 短期工作记忆(当前对话)\n- 长期事实记忆(用户偏好、历史事件)\n- 程序性记忆(学习到的交互模式)\n\n4. 工具使用能力\n\n通过 ReAct 模式和 MCP,AI 同事能够:\n- 理解何时需要外部工具\n- 正确选择和调用 API\n- 处理工具返回的结果\n- 在失败时进行恢复和重试\n\n对开发者的启示\n\n1. 超越聊天机器人\n\n这个项目展示了如何从简单的问答机器人演进为真正的业务助手。关键在于:\n- 明确的业务目标\n- 可靠的核心流程\n- 自然的交互方式\n- 持续的学习能力\n\n2. 技术整合的艺术\n\n成功的 AI 应用往往需要整合多种技术:\n- 传统 NLP(Rasa)\n- 大语言模型(Nebius)\n- 语音技术(Speechmatics + Rime)\n- 记忆存储\n- 工具调用\n\n关键在于选择合适的技术解决合适的问题,而非盲目追求最新技术。\n\n3. 可靠性的重要性\n\n企业级 AI 应用必须在各种条件下保持可靠。这要求:\n- 明确的错误处理\n- 优雅降级机制\n- 人类接管能力\n- 全面的测试覆盖\n\n局限与展望\n\n作为黑客松 starter kit,项目的主要目标是提供概念验证和技术启发。实际生产部署还需要考虑:\n\n- 规模化:支持大量并发用户和长时间运行\n- 安全性:企业级认证、授权和数据保护\n- 可观测性:全面的监控、日志和调试能力\n- 定制化:适配特定行业和业务场景\n\n参与与资源\n\n项目提供了丰富的学习资源:\n- Rasa 官方文档:https://rasa.com/docs/\n- 社区支持:https://info.rasa.com/community\n- 在线体验:https://hello.rasa.ai\n\n总结\n\nRasa AI Coworker Hackathon 2026 的 starter kit 不仅是一个技术模板,更是对 AI 应用未来发展方向的探索。它展示了如何将大语言模型的能力与可靠的对话系统、语音交互和长期记忆结合,构建真正有用的 AI 同事。\n\n对于希望构建企业级 AI 应用的开发者来说,这个项目提供了一个宝贵的参考实现,展示了多种技术的整合方式和架构设计思路。无论你是参加黑客松还是独立学习,这都是一个值得深入研究的项目。