Zing 论坛

正文

TAP:基于Solana状态通道的流式LLM推理按token支付协议

TAP是一个创新的支付协议,通过Solana状态通道实现LLM推理的逐token付费,消费者可在任意输出token边界暂停,仅支付实际接受的输出内容,解决传统API"先付后用"造成的浪费问题。

LLM推理Solana状态通道支付协议x402token计费Agent工作流区块链支付
发布时间 2026/05/10 13:15最近活动 2026/05/10 13:18预计阅读 3 分钟
TAP:基于Solana状态通道的流式LLM推理按token支付协议
1

章节 01

【导读】TAP协议核心概览

TAP(Token-by-token Asymmetric Payments)是基于Solana状态通道的流式LLM推理按token支付协议,通过x402 HTTP支付标准设计。其核心创新在于支持消费者和生产者在任意输出token边界暂停生成,仅对实际接受的token进行链上结算,解决传统LLM API"先付后用"导致的废token浪费问题。该协议是Solana Frontier 2026黑客马拉松参赛作品,提供完整技术白皮书、Python SDK及演示应用。

2

章节 02

背景:LLM推理付费模式的痛点

当前主流LLM API采用"先付后用"计费模式,用户需为所有生成token付费(包括被丢弃内容)。在Agent工作流中,5%的响应被拒绝就可能造成每日10美元浪费(含重试成本)。更严重的是,用户发现输出偏离预期时无法中断计费,这种结构性缺陷催生了TAP协议。

3

章节 03

TAP核心机制:双向暂停与逐token结算

  1. 输入预付费:通道开启时消费者预付输入费用,生产者与消费者本地验证token化结果,锁定金额覆盖预填充成本;2. 输出逐token付费:累计付费=预付输入+(输出token数×输出单价),准确建模输入处理与输出生成的成本差异;3. 双向暂停权:消费者可因输出偏离主题/格式等暂停,生产者可因消费者停止签署承诺暂停;双方中途停止的最大损失限制在小额批次内(几美分)。
4

章节 04

TAP技术架构与实现

链上组件(Anchor程序):状态通道管理(PDA托管USDC)、承诺验证(Ed25519签名)、结算逻辑(正常/争议/关闭)、指令集(open_channel/settle/dispute/close)。Python SDK:模块化设计,含protocol(承诺schema/签名)、chain(PDA/RPC交互)、x402(线格式)、consumer/producer模块、adapters(Gemini等LLM集成)、evaluators(JSON schema/长度等评估)等。演示应用:FastAPI生产者服务、CLI消费者、实时终端仪表板、Vite+React前端。

5

章节 05

TAP应用场景与赛道定位

  • AI赛道:为Agent工作流提供精细化成本控制;- 支付赛道:基于x402构建,兼容v1规范;- DePIN赛道:去中心化推理网络的公平按请求结算;- 消费者应用:聊天界面的有效"停止"按钮(停止生成同时停止计费)。
6

章节 06

未来扩展与本地运行指南

未来扩展:支持音频/视频流(按秒/帧计费)、GPU租赁(按计算时间)、计量API(任意字节流可中断付费)。本地运行:使用Anchor构建部署(anchor build/deploy/test);Python SDK安装(pip install -e '.[anthropic]');演示环境配置需设置GEMINI_API_KEY、Solana密钥对、RPC地址,启动生产者/消费者后端及前端。

7

章节 07

TAP协议总结与价值

TAP通过状态通道和逐token结算,实现LLM推理服务更公平高效的付费模式。消费者获得随时停止并仅付已接受内容的控制权;生产者获得预填充成本保障。该双向保护机制推动LLM API计费从"先付后用"向"按需付费"演进,为Agent经济基础设施奠定基石。