章节 01
PPT-Agent:多智能体协作的自动化演示文稿生成系统导读
PPT-Agent是基于多智能体LLM工作流的跨平台PPT生成工具,支持Gemini审查、SVG输出和17种预设风格,可在Claude Code、OpenCode等多个宿主平台运行。通过分工明确的智能体协作,实现从需求调研到最终交付的全流程自动化,结合专业设计工作流提升PPT制作效率与专业性。
正文
一个基于多智能体LLM工作流的跨平台PPT生成工具,支持Gemini审查、SVG输出和17种预设风格,可在Claude Code、OpenCode等多个宿主平台运行。
章节 01
PPT-Agent是基于多智能体LLM工作流的跨平台PPT生成工具,支持Gemini审查、SVG输出和17种预设风格,可在Claude Code、OpenCode等多个宿主平台运行。通过分工明确的智能体协作,实现从需求调研到最终交付的全流程自动化,结合专业设计工作流提升PPT制作效率与专业性。
章节 02
传统PPT制作耗时且依赖手动设计,简单AI工具输出粗糙缺乏专业设计感。PPT-Agent应运而生,采用多智能体架构,将LLM能力与专业设计工作流结合,支持Claude Code、OpenCode等多种AI编程宿主环境,实现全流程自动化。
章节 03
1.初始化与参数解析:接收需求,解析风格(17种预设)、品牌色彩等参数;2.需求调研:research-core智能体收集信息,支持用户确认;3.素材收集:并行搜索汇总图片、数据等素材;4.大纲规划:content-core用金字塔原理构建大纲,支持用户审批;5.规划草稿:生成简版SVG布局框架;6.设计稿生成与审查:slide-core生成Bento Grid布局SVG,review-core调用Gemini多维度审查(布局、可读性等),最多2轮修复;7.交付:输出SVG、HTML预览及演讲者备注。
章节 04
1.Bento Grid布局引擎:1280×720 SVG格式,视觉平衡的信息块组织;2.Gemini驱动审查:多维度评分(最低7.0分),不可用时降级为技术校验;3.品牌定制:YAML配置注入品牌色彩体系;4.跨平台兼容:支持OpenCode、Claude Code等平台多种模型;5.断点续传:状态持久化,可从断点恢复执行。
章节 05
实际效果:小米SU7案例中,不同模型/平台输出对比(如GPT-5.4质量分8.53/10,MiMo V2 Pro采用小米品牌橙),工作流保持稳定输出质量。应用场景:企业营销团队生成品牌PPT、咨询顾问制作分析报告、教育工作者转换课件、创业者准备路演BP、研究人员制作会议演讲材料。
章节 06
局限性:仅支持SVG/HTML输出,依赖Gemini可用性,复杂动画能力有限。未来方向:完善MCP Server封装、增强Headless模式支持CI/CD集成、扩展更多输出格式、引入丰富动画生成能力。
章节 07
PPT-Agent通过多智能体协作模拟专业团队工作流程,兼顾输出专业性与可定制性,是频繁制作演示文稿用户值得关注的开源项目,代表AI辅助内容创作的新方向。