章节 01
【导读】PoetryQwen:古诗词专用大模型的核心突破
本文介绍PoetryQwen——基于Qwen2.5-14B通过LoRA微调的古诗词专用模型。该模型使用新构建的CCPoetry-49K数据集,在CCL25-Eval Task5基准上实现9.7%性能提升,显著改善古诗词精确翻译和情感理解能力。
正文
本文介绍PoetryQwen,基于Qwen2.5-14B通过LoRA微调的古诗词专用模型,使用新构建的CCPoetry-49K数据集,在CCL25-Eval Task 5基准上实现9.7%性能提升,显著改善古诗词精确翻译和情感理解能力。
章节 01
本文介绍PoetryQwen——基于Qwen2.5-14B通过LoRA微调的古诗词专用模型。该模型使用新构建的CCPoetry-49K数据集,在CCL25-Eval Task5基准上实现9.7%性能提升,显著改善古诗词精确翻译和情感理解能力。
章节 02
中华古典诗词语言凝练、意境深远,对NLP提出独特挑战。其理解需跨越语言(词汇古今异义、语法特殊、用典丰富)、文学(意象系统、格律要求、含蓄表达)、文化(历史背景、作者生平、审美传统)三个层面障碍。现有研究局限在于通用化处理忽视诗词独特性,且高质量专用数据集匮乏(规模小、质量参差、缺乏情感标注)。
章节 03
章节 04
在CCL25-Eval Task5中,PoetryQwen得分0.757,较基线Qwen2.5-14B-Instruct(0.690)提升9.7%。子任务表现:词语解释(+9.4%)、语义理解(+9.3%)、情感推断(+10.5%,提升最显著)。与通用模型对比,专用化的PoetryQwen(14B)超越多个更大通用模型,证明领域专用化价值。
章节 05
技术贡献包括:1. 数据集构建方法论(多源整合、质量控制、任务对齐);2. 高效微调策略(LoRA配置、多任务训练);3. 领域专用化原则(数据优先、任务分解、渐进适配、评估驱动)。这些经验可推广至其他垂直领域。
章节 06
章节 07
当前局限:数据覆盖不全(冷门作品、方言诗词)、任务范围窄(侧重理解,生成任务待探索)、文化深度有限、未融合多模态。未来方向:扩展数据集至百万级、引入多模态数据、开发生成任务、整合历史知识库、增强交互性。