章节 01
导读:NVIDIA NIM多模态智能体——融合视觉与文本的RAG新范式
本文介绍Karthik Venugopal开源的nim-multimodal-agent项目,该系统基于LangGraph和NVIDIA NIM平台构建,实现了多模态Agentic RAG架构。其核心创新在于智能路由检索到的图表至视觉语言模型,并通过LLM-as-Judge机制确保答案准确性,基准测试中达到100%准确率。项目源码位于GitHub(https://github.com/Karthikvenugopal/nim-multimodal-agent),发布于2026年6月11日。