章节 01
inference-research:自动化LLM推理引擎 nightly 追踪与基准测试系统导读
inference-research是受Andrej Karpathy autoresearch启发的自动化工具,专注于LLM推理引擎的 nightly 追踪与基准测试。它解决了推理系统工程师跟踪技术进展、评估新特性影响并转化为可执行实验计划的挑战。核心功能包括:每晚自动抓取vLLM、SGLang等5大主流推理引擎更新,利用Claude Opus智能筛选并生成DGX Spark集群的可执行基准计划。