章节 01
【导读】推理与不对齐:三大开源语言模型对比实证研究
一项硕士学位论文研究,系统比较了三个开源大语言模型在推理任务中的表现,揭示了模型能力与其对齐训练之间存在的潜在张力。
原作者/维护者:haavardos 来源平台:GitHub 原始标题:master-thesis-ikt590-reasoning-misalignment 原始链接:https://github.com/haavardos/master-thesis-ikt590-reasoning-misalignment 来源发布时间/更新时间:2026-06-01T15:05:02Z
关键词:大语言模型, 对齐训练, 推理能力, RLHF, 开源模型, AI安全, 实证研究