Zing 论坛

正文

Text-to-3D电影生成器:将文字转化为可探索的3D电影场景

一个自动化的文本到3D电影管道,使用LLM和生成式AI将书籍转化为可探索的电影,处理3D网格生成、场景合成和时间轴逻辑

文本到3D生成式AILLM应用GLB模型Three.jsFastAPI电影生成Stable Fast 3D
发布时间 2026/05/29 07:15最近活动 2026/05/29 07:22预计阅读 3 分钟
Text-to-3D电影生成器:将文字转化为可探索的3D电影场景
1

章节 01

导读 / 主楼:Text-to-3D电影生成器:将文字转化为可探索的3D电影场景

一个自动化的文本到3D电影管道,使用LLM和生成式AI将书籍转化为可探索的电影,处理3D网格生成、场景合成和时间轴逻辑

2

章节 02

原作者与来源

3

章节 03

项目概述与愿景

在生成式AI技术飞速发展的今天,我们见证了文本生成图像、图像生成视频的技术突破。然而,将完整的文字内容(如书籍)转化为可交互、可探索的3D电影体验,仍然是一个充满挑战的课题。Hack-a-tons团队开发的movie项目正是朝着这个方向迈出的重要一步。

该项目构建了一个自动化的文本到3D电影管道,利用大型语言模型(LLM)和生成式AI技术,将书籍内容转化为可探索的电影场景。系统处理从3D网格生成(GLB格式)、场景合成到时间轴逻辑的完整流程,最终渲染出可在浏览器中无缝播放的非交互式machinima环境。

4

章节 04

面向消费者的简化流程

项目的默认公开界面是画廊页面(gallery),而创作流程(create)则是一个简洁的iPhone友好界面:

  1. 用户输入一个电影提示词
  2. 服务器检查Prampta许可(检测已注册主题)
  3. 获得可在浏览器中播放的电影/3D场景预览

这种设计让普通用户无需任何技术背景,只需输入一段文字描述,就能生成属于自己的3D电影场景。

5

章节 05

专业级制作工作空间

对于需要更多控制的专业用户,系统提供了详细的制作工作空间(Pro页面)。当前版本支持登录用户输入提示词后,观看分阶段管道自动创建:

  • 场景和分镜拆分: 将故事分解为多个场景
  • 场景/地点圣经: 建立详细的场景设定文档
  • 物体/道具圣经: 记录场景中需要的所有道具
  • 常驻角色圣经: 建立角色档案和外观设定
  • 参考图像提示词: 为3D资产生成准备参考
  • GLB导向的3D模型清单: 包含真实世界尺寸的模型规格
  • 动画轨道: 定义角色和物体的运动轨迹
  • 渲染时间轴和组装清单: 最终的合成指导

管道在后台持续运行,而Web UI实时显示进度。用户可以取消或重新运行项目,但审核不会阻塞生成流程。

6

章节 06

后端API与数据管理

系统基于FastAPI构建项目API,使用JSON文件管理项目状态,存储在MOVIE_DATA_DIR指定的目录下。这种设计选择提供了:

  • 确定性的文本到生产包管道
  • 简单可靠的状态持久化
  • 易于调试和版本控制
7

章节 07

前端界面设计

项目采用了现代化的响应式设计:

  • 暗色主题: 专业的iPhone优先创作/画廊UI
  • 详细的生产工作室: 位于Pro页面的专业级控制界面
  • 默认公开的画廊: 展示社区生成的作品
  • 标签式导航: Gallery、Create、History、Pro四个主要视图,每个都有独立URL
  • 自适应布局: 竖屏底部标签栏,横屏右侧标签栏
8

章节 08

身份验证与权限

系统集成Google/Apple Firebase登录,用于保护创作者视图:

  • Apple登录优先于Google登录显示
  • 登录后可查看历史记录、项目所有权
  • 支持私有/公开切换和删除功能