章节 01
导读:常识驱动的Transformer微调提升故事生成连贯性
原作者/维护者: nithin-jella 来源平台: GitHub 原始标题: Commonsense-Driven-Fine-Tuning-of-Transformer-Models-for-Coherent-Story-Generation 原始链接: https://github.com/nithin-jella/Commonsense-Driven-Fine-Tuning-of-Transformer-Models-for-Coherent-Story-Generation 发布时间: 2026-06-12
本项目针对大语言模型生成长篇故事时存在的逻辑断裂、常识违背等问题,提出通过LoRA技术微调3个不同架构的大语言模型,结合常识推理能力,在ROCStories数据集上训练,并采用BLEU、ROUGE、BERTScore和困惑度等指标评估,旨在生成更连贯、合理的短篇故事。