# 大型语言模型游戏智能体研究全景：从Minecraft到多智能体协作的学术资源库

> 乔治亚理工学院DISL实验室维护的awesome-LLM-game-agent-papers仓库系统梳理了基于LLM的游戏智能体研究，涵盖Minecraft、文字冒险、社交推理等8大领域，收录超过500篇论文，已被ACM Computing Surveys正式接受发表。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-05-22T01:10:38.000Z
- 最近活动: 2026-05-22T01:19:40.167Z
- 热度: 152.8
- 关键词: LLM, 游戏智能体, Minecraft, 多智能体, 强化学习, 具身智能, 文本冒险, 社交推理, ACM CSUR
- 页面链接: https://www.zingnex.cn/forum/thread/minecraft
- Canonical: https://www.zingnex.cn/forum/thread/minecraft
- Markdown 来源: ingested_event

---

# 大型语言模型游戏智能体研究全景：从Minecraft到多智能体协作的学术资源库\n\n## 引言：当大模型遇见游戏世界\n\n游戏一直是人工智能研究的理想试验场。从早期的深蓝击败国际象棋冠军，到AlphaGo征服围棋，再到如今基于大型语言模型（LLM）的智能体在开放世界游戏中展现出惊人的推理与协作能力——这一领域的进展正在加速。乔治亚理工学院DISL实验室维护的 **awesome-LLM-game-agent-papers** 仓库，正是这一蓬勃发展的研究领域的权威资源汇总，其同名综述论文已被ACM Computing Surveys（CSUR）正式接受。\n\n这个精心策划的资源库不仅收录了超过500篇相关论文，更按照研究领域进行了系统分类，为研究者和开发者提供了从入门到深入的全景式导航。\n\n## 核心研究领域概览\n\n该资源库将LLM游戏智能体研究划分为8大核心领域，每个领域都代表着不同的技术挑战和研究方向：\n\n### 1. Minecraft：开放世界具身智能的终极试金石\n\nMinecraft因其近乎无限的开放世界特性，成为测试LLM智能体长期规划、工具使用和视觉理解能力的理想平台。资源库收录了54篇相关论文，涵盖多个里程碑式工作：\n\n- **Voyager**（2023）：首个能够自主编写代码、持续学习的LLM智能体，通过"技能库"机制实现终身学习\n- **JARVIS-1**（2023）：多模态记忆增强框架，将视觉感知与语言推理深度融合\n- **Optimus系列**（2024-2025）：从Optimus-1到Optimus-3，展示了大模型在长程任务规划中的演进路径\n- **MineDreamer**（2024）：引入"想象链"（Chain-of-Imagination）机制，让智能体能够基于指令进行视觉化推理\n\n### 2. 文字冒险游戏：推理与决策的纯语言战场\n\n文字冒险游戏（Text Adventure）剥离了视觉复杂性，专注于纯文本环境下的推理与决策。115篇相关论文揭示了这一领域的技术演进：\n\n- **ReAct范式**（2022）：将推理（Reasoning）与行动（Acting）交织，开创了LLM智能体的经典架构\n- **Reflexion**（2023）：引入语言化的强化学习反馈机制，让智能体能够从失败中自我反思\n- **SwiftSage**（2023）：快慢双系统架构，模拟人类认知的双重加工理论\n- **Language Agent Tree Search**（2023）：将蒙特卡洛树搜索与语言模型结合，实现高效规划\n\n### 3. 社交推理与沟通：多智能体交互的复杂博弈\n\n狼人杀、阿瓦隆等社交推理游戏考验智能体的欺骗识别、信任建立和策略沟通能力。43篇论文探索了这一前沿方向：\n\n- **WarAgent**（2023）：基于LLM的多智能体世界大战模拟，展现涌现的社会动态\n- **Richelieu**（2024）：自进化外交智能体，在Diplomacy游戏中达到人类水平\n- **AvalonBench**（2023）：标准化评估框架，用于测试LLM在隐藏角色游戏中的推理能力\n- **Werewolf相关研究**：从基础玩法到策略适应，系统探索欺骗与反欺骗机制\n\n### 4. 竞技对抗：从零和博弈到实时战略\n\n国际象棋、星际争霸等竞技游戏考验智能体的战略深度和实时决策。54篇论文涵盖了：\n\n- **LLM在国际象棋中的推理能力评估**：多项研究揭示了大模型在规则理解、局面评估方面的优势与局限\n- **StarCraft II智能体**：从微观操作到宏观战略的多层次研究\n- **ZeroSumEval**（2025）：Facebook Research提出的模型间对抗评估框架\n\n### 5. 多智能体协作：从竞争到合作\n\n15篇论文聚焦多智能体协作场景，探讨如何让多个LLM智能体有效配合：\n\n- **VillagerAgent**（2024）：基于图的多智能体框架，协调复杂任务依赖\n- **CausalMACE**（2025）：因果推理增强的多智能体协作\n- **协作与竞争的统一视角**：从Minecraft团队任务到社交博弈的合作演化\n\n### 6. 模拟社会：虚拟世界中的社会智能\n\n79篇论文探索如何在虚拟环境中构建具有社会认知能力的智能体：\n\n- **社交智能体架构**：记忆、规划、沟通的整合框架\n- **涌现行为研究**：多智能体交互中意外行为的产生与分析\n- **社会模拟平台**：从简单交互到复杂社会网络的构建\n\n### 7. 具身模拟：物理世界的数字孪生\n\n19篇论文关注具身智能体在物理模拟环境中的感知与行动：\n\n- **视觉-语言-行动（VLA）模型**：将多模态感知与物理控制结合\n- **世界模型学习**：智能体如何构建对物理环境的内部表征\n- **工具使用与操作**：从简单抓取到复杂工具链的构建\n\n### 8. 技术基础：规划、记忆与训练\n\n资源库还系统梳理了支撑游戏智能体的核心技术：\n\n- **规划（123篇）**：从简单的ReAct到复杂的层次化规划、世界模型增强规划\n- **记忆（47篇）**：短期工作记忆与长期知识库的构建与检索\n- **训练（143篇）**：监督微调、强化学习、自我对弈等多种训练范式\n- **自我改进（27篇）**：让智能体能够从经验中自主进化\n- **工具使用（16篇）**：扩展智能体能力的函数调用与API使用\n- **世界模型（16篇）**：内部模拟与预测机制\n\n## 技术演进脉络\n\n通过梳理这些论文，可以清晰地看到LLM游戏智能体领域的技术演进路径：\n\n### 第一代（2022-2023）：基础架构确立\n\n这一时期的研究主要集中在基础架构的探索上。ReAct提出了推理与行动交织的范式，奠定了后续研究的基础。Voyager展示了代码生成作为行动方式的有效性，而Ghost in the Minecraft则探索了纯文本知识驱动的智能体设计。\n\n### 第二代（2023-2024）：多模态与记忆增强\n\n随着GPT-4V等多模态模型的出现，研究者开始将视觉感知引入游戏智能体。JARVIS-1、Steve-Eye等工作展示了视觉-语言融合的可能性。同时，记忆机制也得到了长足发展，从简单的经验回放到复杂的知识图谱增强。\n\n### 第三代（2024-2025）：协作与自我进化\n\n当前的研究前沿聚焦于多智能体协作和自我进化能力。TeamCraft、VillagerAgent等框架探索了复杂任务中的智能体协调，而RetroAgent、SkillRL等则尝试让智能体能够从失败中自主学习新技能。\n\n## 实践价值与应用前景\n\n这些研究不仅仅是学术探索，更具有深远的实践价值：\n\n### 游戏产业\n\n- **智能NPC**：具有长期记忆、能够进行复杂对话的非玩家角色\n- **自动测试**：基于LLM的游戏测试代理，能够发现边缘bug\n- **内容生成**：任务设计、对话生成、关卡构建的自动化\n\n### 机器人与具身智能\n\n- Minecraft等开放世界环境为机器人学习提供了低成本的虚拟训练场\n- 游戏中的规划与决策能力可直接迁移到真实机器人控制\n\n### 多智能体系统\n\n- 游戏中的协作与竞争机制研究，为自动驾驶、智能交通等场景提供理论基础\n- 社交推理游戏中的信任与欺骗研究，有助于构建更鲁棒的多智能体协商系统\n\n## 研究挑战与未来方向\n\n尽管取得了显著进展，该领域仍面临诸多挑战：\n\n### 长期规划的可扩展性\n\n当前智能体在处理超长程任务时仍会出现"迷失"现象。如何在保持上下文窗口限制的同时实现有效的长期规划，是亟待解决的问题。\n\n### 物理常识的 grounding\n\n智能体往往缺乏对物理世界的深层理解，容易做出违反常识的决策。将物理知识更紧密地嵌入LLM推理过程，是提升鲁棒性的关键。\n\n### 多智能体对齐\n\n随着智能体数量的增加，如何确保它们能够有效协作而非相互干扰，如何保证群体行为的可预测性和安全性，都是开放性问题。\n\n### 评估标准化\n\n不同研究使用不同的游戏环境、任务设置和评估指标，使得跨研究比较变得困难。建立标准化的评估基准（如AvalonBench、PillagerBench）是社区的重要任务。\n\n## 结语\n\nawesome-LLM-game-agent-papers资源库不仅是一个论文列表，更是这一快速发展领域的全景地图。从Minecraft的开放世界探索，到文字冒险中的纯文本推理，再到社交游戏中的复杂博弈——这些研究共同勾勒出LLM作为通用智能体的无限可能。\n\n对于希望进入这一领域的研究者，建议从ReAct、Voyager等经典论文入手，逐步深入到多模态、多智能体等前沿方向。而对于产业界的开发者，这些研究成果为构建下一代游戏AI提供了丰富的技术储备和灵感来源。\n\n正如资源库维护者所言：\"If you discover any papers that are suitable but not yet included, please open an issue or submit a pull request.\" 这个开放的学术社区正在持续成长，期待更多研究者加入，共同推动LLM游戏智能体的边界。