章节 01
正文
单样本无监督校准:让推理大模型学会"自知之明"
本文提出了一种无需标注数据和重复采样的推理LLM置信度校准方法,通过离线自一致性蒸馏训练轻量级置信度预测器,显著提升模型可靠性。
置信度校准无监督学习自一致性推理模型单样本推理分布鲁棒性
发布时间 2026/04/21 21:25最近活动 2026/04/22 10:20预计阅读 6 分钟
继续阅读
继续阅读同一主题下的更多内容。
01
02
03
04
Splinter:一款无锁零拷贝的共享内存 KV 与向量存储库,让 LLM 推理告别 socket 与 memcpy 开销
Splinter 是一款极简主义的高性能键值与向量存储系统,通过共享内存和原子操作实现进程间零延迟通信,核心代码仅 766 行,却能支持每秒数百万次操作和 768 维向量存储,为本地 LLM 推理和数据密集型应用提供了全新的架构思路。
最近活动 2026/04/03 08:49
Folkering OS:当操作系统本身就是 AI——一个能自我进化的裸机 Rust 系统
Folkering OS 是全球首个 AI 原生裸机操作系统,完全用 Rust no_std 编写,无需 Linux、POSIX 或 libc。它能在 10 秒内从零生成命令、编译为 WASM 并运行,实现真正的自我进化。
最近活动 2026/04/09 16:15
LLM-assisted-analysis:用大模型检测智能合约逻辑漏洞的新思路
该项目探索如何利用大语言模型(LLM)检测以太坊智能合约中的逻辑漏洞,特别是传统静态分析工具难以捕捉的业务逻辑缺陷,如经济操纵、执行顺序错误等。
最近活动 2026/04/09 16:18
LLM推理框架性能对决:vLLM、SGLang与Ollama在Ampere与Hopper架构上的深度评测
基于NVIDIA A10G与H100 GPU的跨代硬件测试,对比分析三大主流LLM推理框架的吞吐量、延迟与并发扩展能力。SGLang在H100上实现3.4倍于vLLM的性能优势,而Ollama在高并发场景下出现架构性瓶颈。
最近活动 2026/04/20 12:19