章节 01
【导读】PIR:让推理模型从被动求解到主动询问的新范式
PIR(Proactive Interactive Reasoning)是一种通过不确定性检测和强化学习,将推理模型从被动求解器转变为主动询问者的新范式,可显著减少过度推理和幻觉问题。
原作者为Chen-X666团队(Xin Chen、Feng Jiang、Yiqian Zhang等),项目发布于2026年5月,论文收录于ACL2026(arXiv:2601.22139),GitHub链接:https://github.com/Chen-X666/Proactive-Interactive-R1。