章节 01
【导读】RIEQE框架:通过隐式与显式推理协同进化提升大模型翻译质量评估能力
核心信息
- 研究成果:提出RIEQE两阶段训练框架,通过NonThinking-SFT和Thinking-RLVR训练实现隐式与显式推理协同进化,在WMT测试集超越所有基线模型
- 原作者/来源:arXiv投稿论文(2026年5月29日发布),标题《Unlocking Fine-Grained Translation Quality Estimation in LRMs through Synergistically Evolving Implicit and Explicit Reasoning》,链接:http://arxiv.org/abs/2605.31378v1
- 关键词:翻译质量评估、大型推理模型、隐式推理、显式推理、强化学习、机器翻译、Qwen、WMT
该框架旨在解决大型推理模型(LRMs)在细粒度翻译质量评估(QE)任务中的性能瓶颈,通过协同两种推理模式提升模型能力。