Zing 论坛

正文

PoetryQwen:古诗词理解与翻译的专用大模型

本文介绍PoetryQwen,基于Qwen2.5-14B通过LoRA微调的古诗词专用模型,使用新构建的CCPoetry-49K数据集,在CCL25-Eval Task 5基准上实现9.7%性能提升,显著改善古诗词精确翻译和情感理解能力。

古诗词中文NLPLoRA微调领域专用模型情感理解QwenCCL评测文化传承指令微调
发布时间 2026/06/11 01:54最近活动 2026/06/11 11:31预计阅读 2 分钟
PoetryQwen:古诗词理解与翻译的专用大模型
1

章节 01

【导读】PoetryQwen:古诗词专用大模型的核心突破

本文介绍PoetryQwen——基于Qwen2.5-14B通过LoRA微调的古诗词专用模型。该模型使用新构建的CCPoetry-49K数据集,在CCL25-Eval Task5基准上实现9.7%性能提升,显著改善古诗词精确翻译和情感理解能力。

2

章节 02

背景:古诗词AI面临的技术挑战与现有局限

中华古典诗词语言凝练、意境深远,对NLP提出独特挑战。其理解需跨越语言(词汇古今异义、语法特殊、用典丰富)、文学(意象系统、格律要求、含蓄表达)、文化(历史背景、作者生平、审美传统)三个层面障碍。现有研究局限在于通用化处理忽视诗词独特性,且高质量专用数据集匮乏(规模小、质量参差、缺乏情感标注)。

3

章节 03

方法:PoetryQwen的核心技术策略

  1. 领域数据集构建:构建CCPoetry-49K数据集(49404条样本,覆盖词语解释/语义理解/情感推断,多体裁多时代),经多源整合、清洗对齐、人工校验。2. LoRA高效微调:基于Qwen2.5-14B-Instruct,LoRA秩64,学习率2e-4,训练3轮。3. 三任务联合训练:共享底层表示,任务特定输出头,动态权重调整,混合样本训练。
4

章节 04

证据:PoetryQwen在CCL25-Eval的优异表现及对比分析

在CCL25-Eval Task5中,PoetryQwen得分0.757,较基线Qwen2.5-14B-Instruct(0.690)提升9.7%。子任务表现:词语解释(+9.4%)、语义理解(+9.3%)、情感推断(+10.5%,提升最显著)。与通用模型对比,专用化的PoetryQwen(14B)超越多个更大通用模型,证明领域专用化价值。

5

章节 05

结论:PoetryQwen的技术贡献与领域专用化启示

技术贡献包括:1. 数据集构建方法论(多源整合、质量控制、任务对齐);2. 高效微调策略(LoRA配置、多任务训练);3. 领域专用化原则(数据优先、任务分解、渐进适配、评估驱动)。这些经验可推广至其他垂直领域。

6

章节 06

应用场景:PoetryQwen的实用价值与潜在应用

  1. 教育辅助:为学生提供注释翻译、难句解析,帮助教师准备材料;2. 文化传承:支持诗词赏析平台、古籍数字化、知识图谱构建;3. 创意写作:辅助诗词创作、跨媒介改编(现代文、配图描述)。
7

章节 07

局限与展望:PoetryQwen的不足及未来研究方向

当前局限:数据覆盖不全(冷门作品、方言诗词)、任务范围窄(侧重理解,生成任务待探索)、文化深度有限、未融合多模态。未来方向:扩展数据集至百万级、引入多模态数据、开发生成任务、整合历史知识库、增强交互性。