# Nano-Banana MCP v2：基于Gemini多模态API的图像生成与编辑服务器

> 本文介绍了一个增强型MCP服务器项目，支持使用Google Gemini 3.1多模态API进行AI图像生成和编辑，提供动态模型选择、跨平台自动保存等功能。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-06-08T18:15:39.000Z
- 最近活动: 2026-06-08T18:20:23.194Z
- 热度: 0.0
- 关键词: MCP, Model Context Protocol, Gemini, 多模态, 图像生成, 图像编辑, AI, Claude, Google AI, Node.js
- 页面链接: https://www.zingnex.cn/forum/thread/nano-banana-mcp-v2-geminiapi
- Canonical: https://www.zingnex.cn/forum/thread/nano-banana-mcp-v2-geminiapi
- Markdown 来源: ingested_event

---

# Nano-Banana MCP v2：基于Gemini多模态API的图像生成与编辑服务器

随着AI能力的不断扩展，大语言模型正在从纯文本处理向多模态理解演进。Google的Gemini系列模型就是这一趋势的代表，其最新版本已经原生支持图像生成和编辑功能。本文将介绍一个名为"nano-banana-mcpv2"的开源项目，该项目由开发者notfixingit3创建，提供了一个基于Model Context Protocol（MCP）协议的增强型服务器，让AI助手能够无缝调用Gemini的多模态图像能力。

## 原作者与来源

- **原作者/维护者**: notfixingit3
- **来源平台**: GitHub
- **原始标题**: nano-banana-mcpv2
- **原始链接**: <https://github.com/notfixingit3/nano-banana-mcpv2>
- **发布时间**: 2026年6月8日
- **项目性质**: Nano-Banana-MCP的v2分支版本

## MCP协议简介与项目定位

Model Context Protocol（MCP）是由Anthropic提出的一种开放协议，旨在标准化AI助手与外部工具、数据源之间的交互方式。类似于传统软件开发中的插件系统，MCP让AI模型能够通过统一的接口调用各种功能，而无需为每个工具单独适配。

Nano-Banana MCP v2正是基于这一协议构建的图像处理服务器。它充当了AI助手与Google Gemini多模态API之间的桥梁，让支持MCP的AI客户端（如Claude Desktop、Cursor等）能够直接调用图像生成和编辑功能。

## 核心功能特性

该项目提供了丰富的图像处理能力，主要功能包括：

### 图像生成（generate_image）

用户可以通过自然语言描述来生成全新图像。这是Gemini多模态能力的核心应用场景，模型能够根据文本提示创建符合描述的视觉内容。

### 图像编辑（edit_image）

除了从零生成，项目还支持对现有图像进行编辑修改。用户可以指定基础图像文件，并通过文本描述所需的修改内容。此外，还可以提供参考图像用于风格迁移或视觉指导，这种多图像输入能力大大扩展了创作的可能性。

### 连续编辑（continue_editing）

这是项目的一个贴心设计。在会话中，系统会记住最后生成或编辑的图像，用户可以直接在此基础上继续修改，无需重复指定文件路径。这种会话状态管理让迭代创作流程更加顺畅。

### 动态模型选择

项目支持在工具调用时指定使用的Gemini模型版本，也可以通过环境变量设置默认模型。支持的模型包括：

- **gemini-3.1-flash-image**：标准效率模型，针对速度和高吞吐量生成进行优化
- **gemini-3-pro-image**：高保真创意模型，针对高度上下文相关的原生图像创作进行优化

这种动态选择能力让用户能够根据任务需求在速度和质量之间灵活权衡。

### 跨平台自动保存

生成的图像会自动保存到本地文件系统，且支持跨平台的路径适配：

- **Windows**：保存到`%USERPROFILE%\Documents\nano-banana-images/`
- **macOS/Linux**：保存到`./generated_imgs/`或`~/nano-banana-images/`

这种自动保存机制避免了用户手动管理文件的麻烦，同时保证了数据持久化。

## 配置体系详解

项目采用了多层次的配置优先级设计，确保灵活性：

### 配置优先级（从高到低）

1. **工具参数**：在工具调用时显式传递model参数，优先级最高
2. **环境变量**：GEMINI_API_KEY和GEMINI_IMAGE_MODEL
3. **本地配置文件**：.nano-banana-config.json

### 关键配置项

**GEMINI_API_KEY**：这是访问Google Gemini API的凭证，需要从Google AI Studio获取。用户可以通过configure_gemini_token工具在运行时配置，也可以直接设置环境变量。

**GEMINI_IMAGE_MODEL**：设置服务器范围的默认模型。如果不设置，系统会自动回退到gemini-3.1-flash-image。

这种分层配置设计既满足了开发调试的灵活性需求，也支持生产环境的集中管理。

## 安装与集成方式

项目提供了两种安装方式，适应不同的使用场景：

### 本地开发模式

适合需要修改源码或深度定制的用户。将项目克隆到本地后，在MCP客户端配置中指定node命令和本地文件路径。这种方式便于调试和迭代开发。

### GitHub直接安装

对于希望快速上手的用户，项目支持通过npm直接从GitHub安装：

```bash
npm install -g github:notfixingit3/nano-banana-mcpv2#v0.1.0
```

安装完成后，在MCP配置中直接使用命令名即可，无需指定完整路径。这种方式特别适合CI/CD环境或团队共享配置。

## MCP工具接口设计

项目暴露的工具接口设计遵循MCP规范，每个工具都有清晰的参数定义：

### generate_image工具

- **prompt**（必需）：图像生成的文本描述
- **model**（可选）：指定使用的模型版本

### edit_image工具

- **imagePath**（必需）：待编辑图像的完整本地路径
- **prompt**（必需）：修改描述的文本提示
- **referenceImages**（可选）：参考图像路径数组
- **model**（可选）：指定使用的模型版本

### continue_editing工具

- **prompt**（必需）：修改描述的文本提示
- **referenceImages**（可选）：参考图像路径数组
- **model**（可选）：指定使用的模型版本

### get_last_image_info工具

返回会话中最后处理的图像信息，包括文件路径、大小和修改时间。这对于需要确认当前工作状态的场景很有用。

### get_configuration_status工具

检查Gemini token的配置状态和来源，帮助用户诊断连接问题。

### configure_gemini_token工具

用于在运行时配置API密钥，支持将配置持久化到本地JSON文件。

## 技术实现亮点

从项目结构来看，nano-banana-mcpv2采用了Node.js/TypeScript技术栈，这是MCP服务器的常见选择。项目包含了完整的开发配置，如ESLint用于代码质量检查、.npmignore用于发布控制、CHANGELOG.md用于版本记录等。

项目还提供了claude-config.json文件，这是专门为Claude客户端准备的配置模板，体现了对主流AI客户端的深度集成支持。

分支管理策略也值得注意：main分支用于稳定版本发布，dev分支用于活跃开发。这种Git Flow风格的工作流有利于项目的长期维护。

## 应用场景与使用价值

Nano-Banana MCP v2适用于多种创意和生产力场景：

**内容创作**：博主、设计师可以直接在AI对话中生成配图，无需切换工具
**原型设计**：产品经理可以快速生成UI草图或概念图用于沟通
**图像修复**：对现有图片进行风格转换、元素添加或背景替换
**教育演示**：教师可以即时生成教学插图
**个人娱乐**：探索AI图像生成的创意可能性

更重要的是，通过MCP协议，这些能力可以无缝集成到用户日常使用的AI助手工作流中，无需学习新的工具或界面。

## 与原始项目的关系

该项目明确标注为Nano-Banana-MCP的v2分支版本。根据README描述，主要更新包括：

- 支持现代Gemini模型（取代已弃用的gemini-2.5-flash-image-preview）
- 自定义模型配置能力
- 支持直接从GitHub安装

这种分支发展模式在开源社区很常见，既尊重了原始项目的贡献，又允许针对新需求进行迭代改进。

## 使用建议与注意事项

在使用该项目时，有几个要点需要注意：

**API成本**：Gemini API调用会产生费用，建议在使用前了解Google AI Studio的定价策略
**图像版权**：AI生成图像的版权归属因地区而异，商用前需确认当地法规
**内容安全**：虽然Gemini有内置的安全过滤，但用户仍需对生成内容负责
**隐私考虑**：图像会上传到Google服务器处理，敏感内容需谨慎

## 总结

Nano-Banana MCP v2是一个设计精良、功能实用的MCP服务器项目。它将Google Gemini强大的多模态图像能力封装为标准化的MCP工具，让各种支持该协议的AI客户端都能便捷地调用。无论是对于希望扩展AI助手能力的开发者，还是对于寻求高效图像生成方案的内容创作者，这个项目都提供了开箱即用的解决方案。随着多模态AI技术的快速发展，这类桥接工具将在AI应用生态中扮演越来越重要的角色。