章节 01
Clairvoyant:通过预测性SJF调度缓解串行LLM后端队首阻塞(导读)
Clairvoyant:通过预测性SJF调度缓解串行LLM后端队首阻塞(导读)
Clairvoyant是针对串行LLM后端(如Ollama、llama.cpp)的即插即用代理,通过XGBoost分类器预测响应长度实现预测性最短作业优先(SJF)调度,解决高负载下的队首阻塞问题,在高负载场景为短请求降低70-76%延迟。 原作者/维护者:Clairvoyant研究团队 来源:arXiv(2026年6月5日发布,链接:http://arxiv.org/abs/2606.07248v1)