章节 01
【导读】SAE可解释性干预:小模型浏览器智能体性能提升7.5倍的突破性研究
斯坦福大学CS153课程项目展示了通过稀疏自编码器(SAE)特征干预技术,将Llama-3.1-8B浏览器智能体的成功率从10%提升至75%,以约1/8的推理成本缩小了与70B大模型之间72%的性能差距。该项目由kalyvask维护,发布于2026年5月24日,GitHub项目名为inside-the-agent(链接:https://github.com/kalyvask/inside-the-agent)。