正文

Awesome-LLM-RAG：检索增强生成技术的全景导航

一份精心整理的RAG技术资源列表，涵盖论文、工具、教程和应用案例，帮助研究者和开发者系统掌握检索增强生成的前沿进展。

ragllmretrieval-augmented-generationawesome-listpaperstoolsmachine-learning

发布时间 2026/05/12 23:43最近活动 2026/05/13 00:01预计阅读 2 分钟

章节 01

导读：Awesome-LLM-RAG——RAG技术的全景导航资源集合

Awesome-LLM-RAG是由约翰霍普金斯大学研究者维护的开源资源集合，旨在为RAG领域的研究者和实践者提供系统、全面的参考资料。该项目采用经典的"Awesome List"格式，涵盖论文、工具、教程和应用案例，帮助用户系统掌握检索增强生成技术的前沿进展。

章节 02

检索增强生成（Retrieval-Augmented Generation，RAG）是大语言模型领域的重要技术突破，通过将外部知识检索与文本生成相结合，解决纯参数化模型在知识时效性、准确性和可溯源性方面的局限。简单来说，RAG让AI在回答问题时能够"查资料"，而非仅依赖训练时记住的知识。

章节 03

项目核心内容分为四大类：

学术论文与研究成果：涵盖检索增强语言模型（如REALM、RAG）、自适应检索策略（如Self-RAG）、长文本与记忆机制、RAG评估与优化（如RGB基准测试）等子领域；
开源工具与框架：包括DSPy（声明式语言模型编程框架）、ChunkTuner（文本分块优化工具）、Bernstein（多智能体编排器）、Agent Shadow Brain（AI编码智能体）等；
教程与学习资源：推荐《Build a Large Language Model (From Scratch)》《Retrieval Augmented Generation, The Seminal Papers》《Enterprise RAG》《Essential GraphRAG》等书籍；
学术会议与研讨会：跟踪CIKM 2023生成式AI研讨会、SIGIR 2023生成式信息检索研讨会、ACL 2023检索式语言模型研讨会等活动。

章节 04

RAG技术发展分为三个阶段：

基础架构阶段（2020-2022）：聚焦检索器与生成器结合、稠密/稀疏检索对比、端到端训练与模块化设计权衡，代表作为Facebook RAG模型和Google REALM；
能力提升阶段（2022-2023）：重点在自适应检索、多跳推理、指令微调，代表作为Self-RAG、Chain-of-Note；
系统优化阶段（2023至今）：转向推测解码（如REST技术）、长上下文处理、多模态扩展、企业级应用等方向。

章节 05