正文

Hermes Local Rig Accounting：本地LLM推理成本的透明化核算工具

一个为Hermes Agent设计的插件，提供本地大语言模型推理的逐token成本核算，综合考虑硬件折旧、电力消耗和性能基准，帮助用户在本地与云端API之间做出明智决策。

LLM推理本地部署成本核算Hermes AgentGPU折旧电力成本性能基准云端API对比AI基础设施

发布时间 2026/04/25 07:11最近活动 2026/04/25 07:26预计阅读 2 分钟

Hermes Local Rig Accounting：本地LLM推理成本的透明化核算工具

章节 01

Hermes Local Rig Accounting：本地LLM推理成本透明化核算工具导读

Hermes Local Rig Accounting是为Hermes Agent设计的插件，旨在解决本地LLM推理成本不透明的问题。它通过逐token核算硬件折旧、电力消耗、性能基准等维度，帮助用户在本地部署与云端API之间做出数据驱动的决策。

章节 02

本地LLM推理的成本迷思与痛点

许多开发者考虑本地部署时仅关注硬件一次性投入，忽略持续运营成本。真实成本包括硬件折旧、电力消耗、维护成本、机会成本、性能差异等隐性成本。该工具的核心理念是将这些隐性成本显性化，助力用户做出明智决策。

章节 03

核心功能与设计理念

插件提供逐Token成本核算、硬件成本建模（配置总成本、使用寿命、功耗等）、电力成本计算（支持自动/手动电价）、性能基准测试（测量TPS）、社区排行榜（提交对比结果）等核心功能。

章节 04

成本模型详解与示例计算

成本模型包括：折旧成本（GPU专用成本/(使用寿命年数×8766小时)×推理小时数）、能源成本（(平均功耗瓦数/1000)×电价×运行小时数）、每百万Token成本（每小时总成本/(TPS×3600)×1e6）。示例：GPU成本1500美元，3年寿命，450瓦功耗，0.12美元/千瓦时，TPS50，计算得每百万Token成本0.62美元，可与云端API对比。

章节 05

安装配置与使用指南

安装方式：通过hermes plugins install命令或手动克隆仓库。配置：修改config.yaml设置硬件成本、寿命、功耗、电价（支持自动查询）。命令行工具包括/rig-benchmark（测TPS）、/rig-summary（设备概览）、/rig-cost（累计成本）、/rig-rates（查电价）、/rig-submit（提交排行榜），支持多设备配置和LLM工具集成。

章节 06