# C-voting：无需能量函数的置信度投票测试时扩展策略

> 本文提出C-voting策略，通过置信度投票机制实现循环神经网络的测试时扩展，无需显式能量函数即可提升推理任务性能。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-04-15T06:10:12.000Z
- 最近活动: 2026-04-16T02:50:57.558Z
- 热度: 126.3
- 关键词: 测试时扩展, 循环神经网络, 置信度投票, 推理模型, 数独求解, 迷宫求解
- 页面链接: https://www.zingnex.cn/forum/thread/c-voting
- Canonical: https://www.zingnex.cn/forum/thread/c-voting
- Markdown 来源: ingested_event

---

## 背景：测试时扩展与循环推理模型

具有潜在循环处理的神经网络模型近年来受到广泛关注。这类模型的特点是：相同的层被递归地应用于潜在状态，使其成为执行推理任务的理想选择。这类模型的一大优势是支持**测试时扩展（Test-Time Scaling）**——即在不进行额外训练的情况下，通过在测试阶段增加计算来提升性能。

典型的代表包括：
- **分层推理模型（HRM）**：通过增加循环步骤实现更深层次的推理
- **人工藏本振荡神经元（AKOrN）**：利用振荡动力学进行推理

这些模型已成功应用于数独、迷宫求解和AGI基准测试等挑战性任务。

## 现有方法的局限：能量函数的束缚

现有的测试时扩展策略，如基于能量的投票（Energy-Based Voting），虽然有效，但存在一个关键限制：**需要模型具备显式的能量函数**。这大大限制了它们的适用范围，因为许多循环模型并不具备这种显式能量函数。

## C-voting：基于置信度的投票策略

研究团队提出了**C-voting（Confidence-Based Voting）**，一种专为具有多个潜在候选轨迹的循环模型设计的测试时扩展策略。

### 核心机制

C-voting的工作流程如下：

1. **多候选初始化**：使用随机变量初始化潜在状态，产生多个候选轨迹
2. **置信度评估**：对每个候选，计算其预测结果的top-1概率平均值
3. **选择最优候选**：选择置信度最高的候选作为最终输出

这种方法直接利用模型自身的预测置信度作为选择标准，无需额外的能量函数。

## 性能表现

实验结果显示了C-voting的显著优势：

### 数独难题
- 在困难数独（Sudoku-hard）上，C-voting比基于能量的投票策略准确率高出**4.9%**

### 极端数独与迷宫
研究团队还提出了一个简单但有效的注意力循环模型**ItrSA++**，结合C-voting后：
- 在极端数独（Sudoku-extreme）上达到**95.2%**准确率，远超HRM的55.0%
- 在迷宫任务上达到**78.6%**准确率，优于HRM的74.5%

## 核心优势：普适性

C-voting最重要的优势在于其**广泛的适用性**。由于不依赖显式能量函数，它可以应用于：

- 各种循环神经网络架构
- 不具备能量函数的模型
- 任何能够输出概率分布的模型

这大大降低了测试时扩展策略的部署门槛。

## 启示与未来方向

C-voting的成功表明，测试时扩展不一定需要复杂的能量函数设计。有时，简单的置信度度量就能达到甚至超越复杂方法的效果。这一发现为测试时扩展策略的设计提供了新的思路：

- 探索其他基于置信度的选择机制
- 研究置信度与推理深度的关系
- 将C-voting扩展到更多类型的推理任务
