Zing 论坛

正文

MiniMax Token Plan多模态模型Hermes技能集成方案

该项目提供了MiniMax Token Plan多模态模型的Hermes/Codex技能集成,支持文本转语音、文生图、文生视频、图生视频、音乐生成、搜索和视觉理解等功能。

MiniMax多模态Hermes文生视频文生图文本转语音音乐生成AI技能
发布时间 2026/05/05 16:53最近活动 2026/05/05 17:24预计阅读 1 分钟
MiniMax Token Plan多模态模型Hermes技能集成方案
1

章节 01

导读 / 主楼:MiniMax Token Plan多模态模型Hermes技能集成方案

该项目提供了MiniMax Token Plan多模态模型的Hermes/Codex技能集成,支持文本转语音、文生图、文生视频、图生视频、音乐生成、搜索和视觉理解等功能。

2

章节 02

项目概述

随着多模态大模型技术的快速发展,开发者越来越需要便捷的工具来集成文本、图像、音频、视频等多种模态的AI能力。MiniMax作为国内领先的大模型厂商,推出了Token Plan系列多模态模型,涵盖文本转语音、图像生成、视频生成、音乐创作等多个领域。

本项目是一个开源的Hermes/Codex技能(Skill),为开发者提供了一套完整的MiniMax Token Plan模型集成方案,通过简单的命令行工具即可调用丰富的多模态能力。

3

章节 03

支持的模型与功能

该技能集成了MiniMax Token Plan的多个核心模型:

4

章节 04

文本转语音(TTS)

  • Text to Speech HD:高质量文本转语音
5

章节 05

图像生成

  • image-01:文生图模型
6

章节 06

视频生成

  • Hailuo-2.3-768P 6s:标准质量文生视频
  • Hailuo-2.3-Fast-768P 6s:快速生成版本
7

章节 07

音乐生成

  • music-2.5:音乐生成模型
  • music-2.6:最新版本音乐生成
  • music-cover:音乐翻唱功能
  • lyrics_generation:歌词生成
8

章节 08

其他能力

  • coding-plan-vlm:视觉语言模型
  • coding-plan-search:搜索增强功能