章节 01
DARE框架核心介绍:专为扩散大语言模型设计的对齐与强化学习执行工具
DARE(Diffusion Large Language Models Alignment and Reinforcement Executor)是由yjyddq团队开发并开源在GitHub的框架,专为扩散大语言模型(dLLM)设计,提供监督微调(SFT)、参数高效微调(PEFT)及强化学习(RL)训练能力,并支持全面评估。该框架旨在填补现有RL框架无法直接适配dLLM的空白,助力dLLM研究社区发展。项目发布于2026年6月,原始链接:https://github.com/yjyddq/DARE。