Zing 论坛

正文

Slide Maker:基于对话式AI的智能演示文稿构建工具

CUNY AI Lab开源的slide-maker项目展示了如何通过自然语言对话与AI协作创建专业演示文稿,结合实时编辑、多模型支持和丰富的可视化组件

AI演示文稿对话式创作SvelteKitagentic workflow可视化编辑教学工具开源项目
发布时间 2026/04/11 07:11最近活动 2026/04/11 07:18预计阅读 3 分钟
Slide Maker:基于对话式AI的智能演示文稿构建工具
1

章节 01

Slide Maker:基于对话式AI的智能演示文稿构建工具(导读)

Slide Maker:基于对话式AI的智能演示文稿构建工具

CUNY AI Lab开源的slide-maker项目,通过自然语言对话与AI协作创建专业演示文稿,核心特点包括:

  • 对话式创作流程,让用户专注内容而非格式
  • 实时编辑与多模型支持(Anthropic Claude、AWS Bedrock等)
  • 丰富的可视化组件与交互式Artifact
  • 开源项目,支持自定义主题与部署

本帖将分楼层介绍项目背景、技术架构、功能特性及展望。

2

章节 02

项目背景与动机

项目背景与动机

现代工作/学术中,演示文稿是核心信息媒介,但传统工具需大量时间排版设计。CUNY AI Lab开发slide-maker,旨在通过对话式AI重构创作流程:

  • 解决传统工具的繁琐格式调整问题
  • 构建完整agentic工作流系统,理解用户意图并主动提供建议
  • 实现“所问即所得”的体验,代表生产力工具新方向

项目并非简单模板填充,而是深度整合AI的创作助手。

3

章节 03

核心架构与技术栈

核心架构与技术栈

slide-maker采用全栈现代化架构:

  • 前端:SvelteKit + Svelte5 Runes,提供响应式UI与流畅交互
  • 后端:Hono框架(Node.js),数据持久化用SQLite + Drizzle ORM
  • 身份验证:Lucia v3,支持邮箱注册与*.cuny.edu域名限制
  • 代码管理:Turborepo monorepo,包含web应用、API服务、共享类型定义三个包

模块化设计提升复用与协作效率。

4

章节 04

对话式创作与可视化编辑

对话式创作与可视化编辑

对话式创作

  • 自然语言交互描述需求,系统实时解析意图生成幻灯片
  • SSE流式传输,用户可即时看到AI思考与结果
  • 支持多模型切换(Claude、Bedrock、OpenRouter开源模型)

可视化编辑

  • 三面板布局:聊天/大纲、画布编辑、资源管理
  • 多种布局模板(标题页、双栏、网格卡片等)
  • 拖拽调整模块顺序/大小,TipTap富文本编辑,撤销/重做功能

无缝切换对话生成与手动精修。

5

章节 05

内容组件与资源集成

内容组件与资源集成

内容组件

  • 多样化模块:heading、text、card、image、carousel等
  • 14种交互式Artifact:A*寻路、鸟群模拟、洛伦兹吸引子等,可配置参数且自适应尺寸

资源与导出

  • 资源集成:Tavily/Brave搜索、Pexels图库、PDF/DOCX上传(AI解析内容)
  • 导出:自包含ZIP文件,支持浏览器打开、键盘导航、无障碍访问

满足教学/技术演示的可视化需求。

6

章节 06

主题系统与部署运维

主题系统与部署运维

主题系统

  • 9套内置主题(Studio Dark/Light、CUNY系列等),基于CSS自定义属性
  • 支持自定义/派生主题,符合WCAG AA/AAA对比度标准

部署与运维

  • 多环境配置:开发、预发布(tools.cuny.qzz.io/slide-maker)、生产
  • 架构:Cloudflare + Caddy + Nginx + PM2
  • 管理功能:使用统计、Token配额(默认100万/月)、用户角色管理、登录/注册速率限制

确保安全与便捷部署。

7

章节 07

总结与展望

总结与展望

slide-maker代表AI辅助创作工具的新范式:

  • 深度集成AI到创作全流程(意图理解→实时渲染→精细编辑)
  • 降低演示文稿制作门槛,保持专业输出
  • 价值:教育工作者、技术演讲者、内容创作者的高效工具

未来,随着多模态AI发展,此类agentic工具将在更多创作场景发挥作用。