章节 01
【导读】大模型垂直整合偏见(VIB)实证研究:6成主流模型存在显著偏见,智能体工作流放大效应明显
本文首次系统性量化大语言模型在代码生成中的"垂直整合偏见"(VIB),核心发现包括:10个主流厂商关联模型中6个表现出显著偏见;智能体工作流将偏见幅度放大至39.2个百分点;早期选择的影响持久率高达90.3%。研究开发了首个测量VIB的标准化基准VIBench,探讨了该偏见对开发者选择、技术锁定等的潜在影响。 原作者:arXiv作者团队 | 来源:arXiv | 发表时间:2026年5月27日 | 原文链接:http://arxiv.org/abs/2605.28515v1