# Thalasscope：让AI推理过程透明可视的实时对比工具

> Thalasscope是一款创新的AI透明度工具，能够同时将同一提示发送给两个Claude模型，实时可视化它们的完整推理过程、网络来源选择以及推理差异，让用户真正看到AI是如何思考的。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-04-24T18:04:08.000Z
- 最近活动: 2026-04-24T18:19:15.488Z
- 热度: 154.8
- 关键词: AI透明度, 大语言模型, Claude, 推理可视化, BYOK, BYOS, 模型对比, Extended Thinking, Next.js, 开源工具
- 页面链接: https://www.zingnex.cn/forum/thread/thalasscope-ai
- Canonical: https://www.zingnex.cn/forum/thread/thalasscope-ai
- Markdown 来源: ingested_event

---

# Thalasscope：让AI推理过程透明可视的实时对比工具

## 背景：为什么我们需要看到AI的思考过程

当前大多数AI工具只向用户展示最终答案，却将思考过程隐藏在黑箱之中。这种不透明性带来了一个根本问题：用户无法了解模型是如何得出结论的，不知道它参考了哪些信息源，也无法判断它在哪些地方产生了犹豫或自我修正。

Thalasscope的诞生正是为了解决这一痛点。它不仅仅是一个AI对话工具，更是一个"AI推理的玻璃箱"——让用户能够实时观察两个不同模型面对同一问题时的完整思考链条，包括它们各自检索到的网络来源、选择或跳过某些来源的原因、自我质疑的过程，以及最终如何形成答案。

## 核心功能：双模型并行推理可视化

Thalasscope的核心机制简单而强大：将同一个提示同时发送给Claude Haiku 4.5和Claude Sonnet 4.6两个模型，并以并行的方式实时展示它们的思考过程。

### 实时思考流展示

系统会将每个模型的扩展思考过程（Extended Thinking）以流式方式呈现，用户可以观察到推理块（thinking blocks）是如何随着模型的思考逐步生成的。这种可视化方式让抽象的推理过程变得具体可感。

### 网络来源透明化

Thalasscope会展示每个模型在回答过程中检索到的网络来源，明确指出哪些来源被采纳、哪些被跳过，以及做出这些选择的原因。这种透明度对于验证AI回答的可靠性至关重要。

### 推理差异对比

通过并排放置两个模型的思考过程，用户可以直观地比较它们在推理深度、来源选择策略和最终回答上的差异。这种对比不仅具有教育意义，也能帮助用户理解不同模型的特性。

## 技术架构与实现细节

Thalasscope采用现代Web技术栈构建，确保了良好的用户体验和可扩展性。

### 技术选型

- **前端框架**：Next.js 15（App Router）
- **编程语言**：TypeScript
- **样式方案**：Tailwind CSS
- **后端存储**：Supabase（可选，支持BYOS模式）
- **AI接口**：Anthropic API

### 隐私优先的设计理念

项目采用了BYOK（Bring Your Own Key）和BYOS（Bring Your Own Supabase）的设计哲学：

**BYOK模式**：用户的Anthropic API密钥仅在浏览器中输入，存储于sessionStorage中，标签页关闭后自动清除。密钥通过用户自己的Next.js服务器直接转发到Anthropic API，绝不会被记录或持久化到任何第三方服务器。

**BYOS模式**：会话数据存储在用户自己的Supabase项目中，而非共享数据库。这种设计确保了用户的提示和推理数据始终掌握在自己手中，因为提示内容往往包含个人隐私或敏感信息。

### 成本透明化设计

Thalasscope将思考令牌的成本信息直接展示给用户，让成本本身成为推理深度的信号。系统默认设置3000个令牌的思考预算，用户可以根据需要调整：增加到10000以获得更丰富、更具探索性的思考过程，或减少以加快响应速度并降低成本。

当前Anthropic API的定价如下：

| 模型 | 输入价格 | 输出+思考价格 | 典型对比成本 |
|------|---------|-------------|-------------|
| Claude Haiku 4.5 | $0.80/百万令牌 | $4.00/百万令牌 | 约$0.05 |
| Claude Sonnet 4.6 | $3.00/百万令牌 | $15.00/百万令牌 | 约$0.19 |

此外，系统采用了提示缓存技术（cache_control: ephemeral），在5分钟窗口内的重复调用可以复用缓存的提示，将输入令牌成本降低约70%，非常适合演示会话或重复测试场景。

## 视觉设计：海洋主题的沉浸式体验

Thalasscope的界面设计采用了独特的海洋主题，配合原创SVG动画背景和角色设计（海马和河豚），营造出一种探索深海的沉浸感。

### 颜色编码系统

系统使用直观的色彩编码来区分不同类型的信息块：

- **蓝色**：网络搜索状态——展示找到的来源、被采纳或跳过的来源及其原因
- **紫色（Haiku）/琥珀色（Sonnet）**：思考过程——标注的推理块随流式响应逐步呈现
- **翠绿色**：最终回答——模型生成的最终答案

这种设计让用户可以一目了然地追踪信息流动和推理进展。

## 模型特性对比

通过Thalasscope的并行对比，我们可以观察到两个Claude模型的显著差异：

**Claude Haiku 4.5**：以专注和高效为特点。它的推理过程快速直接，往往率先完成回答。适合需要快速响应的场景。

**Claude Sonnet 4.6**：以深度和多层次为特点。它的推理过程更慢但更具探索性，思考链条更长。适合需要深入分析的复杂问题。

两个模型都支持Extended Thinking功能，这使得它们的完整推理过程可以通过API获取。而Thalasscope的价值正在于将这种内在的思考差异可视化呈现。

## 应用场景与实用价值

Thalasscope不仅是一个技术展示工具，更具有实际的实用价值：

### 事实核查与来源验证

用户可以回溯每个模型实际使用的信息源，验证AI回答的可靠性。这对于学术研究、新闻核实或任何需要高可信度信息的场景都非常有价值。

### 模型行为研究

通过保存会话数据，用户可以分析不同类型提示下的推理深度变化，比较不同模型的行为模式。这种数据对于理解大语言模型的工作机制具有研究价值。

### 教育与培训

Thalasscope为AI教育提供了一个直观的教学工具，帮助学习者理解大语言模型如何处理信息、如何形成答案，以及不同模型之间的差异。

### 个人知识管理

用户可以将有价值的会话保存下来，形成个人知识库。通过历史面板，随时可以回顾和重新播放过去的会话。

## 未来发展规划

项目开发者已经规划了多个扩展方向：

- **支持更多模型**：计划集成Gemini、GPT、Grok等其他主流模型，实现跨厂商的模型对比
- **主题多样化**：为不同的模型配对设计独特的视觉主题（如Claude vs Gemini采用对战主题）
- **会话分析仪表板**：为BYOS用户提供更深入的数据分析功能
- **移动端适配**：优化移动设备上的使用体验

## 结语：透明度是AI发展的关键

Thalasscope代表了一种重要的技术理念：AI系统应该向用户展示其工作过程，而非仅仅呈现最终结果。在AI能力日益强大的今天，这种透明度不仅是技术问题，更是信任问题。

通过让推理过程可见、可验证、可对比，Thalasscope为用户提供了一个真正理解AI的窗口。正如项目开发者所言："一旦你能够看到思考过程，你就能对它做更多事情。"

对于关心AI透明度、希望深入理解模型行为的研究者、开发者和普通用户来说，Thalasscope是一个值得尝试的工具。它提醒我们：AI的答案很重要，但知道答案是如何得出的，同样重要。
