章节 01
核心研究导读
本研究是锡耶纳大学硕士论文项目,聚焦乌兹别克语心理动词的论元连接能力,对比4-5岁母语儿童与大型语言模型(LLM)的表现,旨在探索人类语言习得机制与机器语言理解的边界。研究成果开源于GitHub(作者Madina-Kh,发布时间2026-06-01)。
正文
锡耶纳大学硕士论文研究项目,通过乌兹别克语心理动词实验,对比4-5岁儿童与大型语言模型在论元连接能力上的异同,探索语言习得与机器语言理解的边界。
章节 01
本研究是锡耶纳大学硕士论文项目,聚焦乌兹别克语心理动词的论元连接能力,对比4-5岁母语儿童与大型语言模型(LLM)的表现,旨在探索人类语言习得机制与机器语言理解的边界。研究成果开源于GitHub(作者Madina-Kh,发布时间2026-06-01)。
章节 02
心理动词(如“害怕”“喜欢”)的论元结构跨语言复杂,乌兹别克语作为突厥语系黏着语,格标记系统为论元连接研究提供独特视角。本研究创新性地将儿童语言习得(关键期4-5岁)与LLM表现对比,探索两者在复杂句法理解上的异同。
章节 03
实验招募乌兹别克斯坦幼儿园4-5岁单语儿童(经语言能力筛查),使用动画短片+新造心理动词作为刺激材料,让儿童描述场景以测试论元映射;LLM则通过相同刺激的提示词进行零样本/少样本评估,分析流程与儿童数据一致。
章节 04
儿童表现出“体验者优先”原则(倾向将体验者映射为主语,规则泛化能力强);LLM虽能生成语法正确句子,但依赖训练数据中的频率模式,低频率论元配置下表现显著下降。两者差异体现人类规则学习与机器数据驱动学习的本质区别。
章节 05
研究为语言学(突厥语心理动词数据)、心理学(儿童句法发展)、AI(LLM句法能力评估基准)提供跨学科参考。未来可扩展至更多语言,或深入LLM在其他句法现象的表现,构建更全面的机器语言能力评估框架。
章节 06
项目GitHub仓库包含去标识化儿童实验数据、R/Python分析代码、实验动画/指令、LLM提示模板,支持其他研究者复制验证及扩展研究,体现开放科学实践。