# Slide Maker：基于对话式AI的智能演示文稿构建工具

> CUNY AI Lab开源的slide-maker项目展示了如何通过自然语言对话与AI协作创建专业演示文稿，结合实时编辑、多模型支持和丰富的可视化组件

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-04-10T23:11:46.000Z
- 最近活动: 2026-04-10T23:18:40.429Z
- 热度: 148.9
- 关键词: AI演示文稿, 对话式创作, SvelteKit, agentic workflow, 可视化编辑, 教学工具, 开源项目
- 页面链接: https://www.zingnex.cn/forum/thread/slide-maker-ai
- Canonical: https://www.zingnex.cn/forum/thread/slide-maker-ai
- Markdown 来源: ingested_event

---

# Slide Maker：基于对话式AI的智能演示文稿构建工具

## 项目背景与动机

在现代工作和学术环境中，演示文稿已成为信息传递的核心媒介。然而，传统幻灯片制作工具往往要求用户投入大量时间进行排版、设计和内容组织。CUNY AI Lab开发的slide-maker项目应运而生，旨在通过对话式AI交互重构演示文稿的创作流程，让用户专注于内容本身，而非繁琐的格式调整。

该项目不仅仅是一个简单的模板填充工具，而是一个完整的agentic工作流系统，能够理解用户意图、主动提供建议，并在对话过程中实时生成和调整幻灯片内容。这种"所问即所得"的体验代表了生产力工具发展的新方向。

## 核心架构与技术栈

slide-maker采用现代化的全栈架构，前端基于SvelteKit和Svelte 5 Runes构建，提供响应式的用户界面和流畅的交互体验。后端API使用Hono框架运行在Node.js环境中，数据持久化采用SQLite配合Drizzle ORM，兼顾了开发效率和部署便捷性。

身份验证系统基于Lucia v3实现，支持邮箱注册和域名限制（*.cuny.edu），确保学术环境的安全性。系统还实现了精细化的访问控制，包括管理员审批流程和基于角色的权限管理。

项目采用Turborepo进行 monorepo 管理，包含三个主要包：web应用、API服务和共享类型定义。这种模块化设计使得代码复用和团队协作更加高效。

## 对话式创作流程

slide-maker最显著的特点是其对话驱动的内容生成机制。用户通过与AI助手的自然语言交互来描述演示需求，系统会实时解析意图并生成相应的幻灯片结构和内容。

整个对话过程采用Server-Sent Events (SSE)进行流式传输，用户可以即时看到AI的思考过程和生成结果。系统支持丰富的文本格式化选项，包括粗体、斜体、链接和列表，让对话输入本身就能承载复杂的结构化信息。

在模型选择方面，slide-maker提供了灵活的供应商支持，包括Anthropic的Claude系列、AWS Bedrock以及OpenRouter平台接入的多种开源模型。用户可以根据具体任务需求切换不同模型，平衡性能与成本。

## 可视化编辑与实时协作

除了对话生成，slide-maker还提供了强大的可视化编辑功能。系统采用三面板布局：左侧是聊天与大纲视图，中间是画布编辑区，右侧是资源管理面板。这种布局让用户能够在对话生成和手动精修之间无缝切换。

画布支持多种布局模板，包括标题页、双栏布局、全宽内容、网格卡片、深色背景和分隔页等。每种布局都定义了特定的内容区域（zones），用户可以通过拖拽操作重新排列模块顺序，或使用角落拖拽调整图片和组件大小。

富文本编辑基于TipTap编辑器实现，支持标题层级、字体大小、样式格式化、对齐方式和列表等常用功能。系统还内置了撤销/重做功能（Ctrl+Z / Ctrl+Shift+Z），让编辑过程更加安心。

## 丰富的内容组件与Artifacts

slide-maker提供了多样化的内容模块，涵盖heading、text、card、label、tip-box、prompt-block、image、carousel、comparison、card-grid、flow、stream-list、artifact和video等类型。这些模块可以灵活组合，满足不同场景的表达需求。

特别值得一提的是系统内置的14种原生Artifact组件，包括A*寻路算法可视化、鸟群模拟（Boids）、流场（Flow Field）、和谐图（Harmonograph）、兰顿蚂蚁（Langton's Ant）、Leaflet地图、洛伦兹吸引子（Lorenz Attractor）等。这些组件不是简单的静态图片，而是具有可配置参数的交互式可视化，能够自动适应容器尺寸并保持宽高比。

对于教学和技术演示场景，这些Artifact提供了强大的可视化支持，让抽象概念变得直观易懂。

## 资源集成与导出功能

在资源获取方面，slide-maker集成了多种外部服务。用户可以通过Tavily或Brave进行网络搜索，系统会自动下载相关图片并插入当前幻灯片。图片搜索还接入了Pexels图库，提供大量开放授权的高质量照片。

系统支持上传PDF和DOCX文件作为对话上下文，AI能够解析文档内容并据此生成相关幻灯片。所有外部URL下载都经过SSRF防护处理，确保系统安全性。

导出功能生成自包含的ZIP文件，包括index.html主文件、CSS样式表、JavaScript引擎、Artifact渲染器和资源文件。导出的演示文稿完全独立，可以在任何现代浏览器中打开，支持键盘导航、步骤揭示动画和ARIA无障碍访问。

## 主题系统与品牌定制

slide-maker内置9套精心设计的主题，包括Studio Dark、Studio Light、CUNY AI Lab、CUNY Dark、CUNY Light、Warm Academic、Slate Minimal、Midnight和Forest。主题系统基于CSS自定义属性实现，确保视觉一致性同时保持灵活性。

用户可以创建自定义主题或基于现有主题进行派生修改，满足品牌一致性要求。所有主题都经过WCAG AA/AAA对比度审核，确保良好的可访问性。

## 部署与运维

项目提供了完整的部署方案，包括开发环境、预发布环境和生产环境的配置。预发布环境部署在tools.cuny.qzz.io/slide-maker，通过Cloudflare、Caddy、Nginx和PM2的多层架构提供服务。

系统还内置了使用统计和管理后台，管理员可以查看月度Token使用图表、设置用户配额（默认每月100万Token，年度重置），并进行用户管理和角色分配。登录和注册接口实现了速率限制（登录5次/15分钟，注册3次/小时），防止暴力破解攻击。

## 总结与展望

slide-maker代表了AI辅助内容创作工具的新范式，它不只是将AI作为内容生成器，而是将其深度集成到创作工作流的各个环节。从意图理解到实时渲染，从对话交互到精细编辑，整个体验流畅自然。

对于教育工作者、技术演讲者和内容创作者而言，这种"对话即创作"的模式能够显著降低演示文稿制作门槛，同时保持专业水准的输出质量。随着多模态AI能力的不断增强，类似的agentic工具将在更多创作场景中发挥价值。
