Zing 论坛

正文

AI驱动的梦境分析:大语言模型自动化Hall/Van de Castle编码系统

一个利用Claude大语言模型半自动化进行梦境内容定量分析的开源工具包,在保持人工审核的同时显著降低编码工作负担。

AI梦境分析Hall/Van de Castle大语言模型Claude梦境研究定量分析开源工具睡眠科学
发布时间 2026/04/29 08:39最近活动 2026/04/29 10:22预计阅读 2 分钟
AI驱动的梦境分析:大语言模型自动化Hall/Van de Castle编码系统
1

章节 01

AI驱动的梦境分析工具llm_dream_coder导读

介绍llm_dream_coder——一个利用Claude大语言模型半自动化Hall/Van de Castle(H/VdC)编码的开源工具包,旨在解决梦境研究中人工编码耗时费力的问题,在降低编码负担的同时保留人工审核环节,助力大规模梦境定量分析。

2

章节 02

Hall/Van de Castle系统:黄金标准与人工编码挑战

H/VdC系统是梦境内容定量分析的标准框架,涵盖人物、社交互动、活动等多个维度。传统人工编码需专业培训,可靠性高但labor-intensive,限制了大规模研究应用。

3

章节 03

llm_dream_coder的设计原则与技术流程

llm_dream_coder采用模块化架构,核心原则:通用性(无需定制数据集)、模块化(编码类别独立)、人工审核导向(输出供复核)。技术流程:数据读取→API调用Claude(带编码手册提示)→结果解析→评估对比→保存结果,利用提示缓存降本。

4

章节 04

性能评估结果与关键发现

人物编码模块测试结果:

数据集 类型 样本量 整体F1 非家庭人物F1
b-baseline 系列数据(开发集) 50 0.73 0.74
norms-f 规范数据(测试集) 50 0.68 0.70
emma 系列数据(测试集) 50 0.51 0.54
关键发现:非家庭人物F1为核心指标(家庭编码需传记知识);规范数据集是最适当基准。
5

章节 05

使用方式与成本考量

数据准备:需coded_dreams.csv(含dream_id等)和可选的dreambank_codings.csv。运行模式:默认、指定数量/集合、系列模式等。成本:claude-opus-4-6模型约0.02-0.05美元/梦境,缓存机制可降本。

6

章节 06

工具局限性与注意事项

局限性:家庭编码需传记信息(系列模式缓解);人工编码员传记偏见影响F1;API成本较高,长梦境可能格式错误。

7

章节 07

应用场景与研究价值

适用于大规模分析、跨文化研究、纵向追踪、教学培训,帮助研究者节省编码时间,聚焦分析解释。

8

章节 08

AI辅助人文研究的新范式

llm_dream_coder不取代研究者判断,自动化繁琐编码。未来完善其他模块,为梦境研究带来更大价值。