章节 01
VERA:让AI拥有可审计思考过程的分层推理架构导读
VERA提出了一种全新的语言模型推理范式,通过双向分层信息流动和预测误差最小化,实现动态计算、真实不确定性量化和完全可审计的推理过程,旨在突破传统语言模型单向固定深度计算的根本局限。
正文
VERA提出了一种全新的语言模型推理范式,通过双向分层信息流动和预测误差最小化,实现动态计算、真实不确定性量化和完全可审计的推理过程。
章节 01
VERA提出了一种全新的语言模型推理范式,通过双向分层信息流动和预测误差最小化,实现动态计算、真实不确定性量化和完全可审计的推理过程,旨在突破传统语言模型单向固定深度计算的根本局限。
章节 02
当前主流语言模型遵循输入token→固定层数前向传播→输出token的单向范式,存在无法反思预测、无法迭代协调不同抽象层次信念、无法表达真实“不确定”的根本性缺陷。VERA正是为突破这一局限而生。
章节 03
VERA基于神经科学中的预测编码理论,构建层次架构:
章节 04
章节 05
VERA采用GPL-3.0开源协议,处于积极开发阶段,里程碑包括:
章节 06
章节 07
VERA代表范式转变:Transformer让AI学会“模式匹配”,VERA试图让AI学会“思考”(多层级表示间建立一致性的迭代过程)。若成功可能带来: