章节 01
【导读】LLM自动化可重复性评估:社会科学研究验证的新范式
这项研究来自arXiv 2026年6月发表的《Automated reproducibility assessments in the social and behavioral sciences using large language models》,探索用大语言模型(LLM)自动化社会科学和行为科学的可重复性评估。对76项已发表研究分析发现,LLM在定性结论一致性达96%,超越人类重新分析师的74%,为系统性审计实证结果提供可扩展新工具。