Zing 论坛

正文

岩石薄片智能分析 Agent:多模态大模型驱动的地质矿物识别系统

这是一个基于多模态大语言模型的智能地质分析系统,通过自然语言对话驱动 Agent 自主调用图像分析工具,实现岩石薄片的矿物自动分类、鲕粒智能分割和专业报告生成。系统采用纯前端架构,支持 GitHub Pages 部署,无需后端服务器即可运行。

多模态大模型岩石薄片分析矿物分类地质 AIAgent 架构Function CallingRAG纯前端部署MiMo地质智能化
发布时间 2026/05/07 22:35最近活动 2026/05/07 22:50预计阅读 2 分钟
岩石薄片智能分析 Agent:多模态大模型驱动的地质矿物识别系统
1

章节 01

岩石薄片智能分析Agent:多模态大模型驱动的地质矿物识别系统导读

这是一个基于多模态大语言模型的智能地质分析系统,通过自然语言对话驱动Agent自主调用图像分析工具,实现岩石薄片的矿物自动分类、鲕粒智能分割和专业报告生成。系统采用纯前端架构,支持GitHub Pages部署,无需后端服务器即可运行。

2

章节 02

项目背景与核心问题

岩石薄片分析是地质领域核心工作,传统流程依赖专业经验且效率低。初学者或野外工作者难以快速准确鉴定,有经验人员面对大量样本也感繁重,因此利用AI辅助成为地质信息化重要研究方向。

3

章节 03

系统架构与设计理念

采用Agent架构,核心为MiMo-v2.5大语言模型,通过Function Calling自主调用工具。纯前端架构基于React18.3+TypeScript5.6+Vite5.4,支持GitHub Pages部署,内置Mock服务器可演示所有功能。

4

章节 04

核心功能模块解析

  1. 矿物自动分类:集成深度学习模型,识别矿物类型并给出置信度;2. 鲕粒智能分割:检测沉积岩鲕粒,统计数量、面积占比;3. 知识库检索:含53条专业知识,基于Fuse.js模糊搜索实现客户端RAG;4. 智能报告生成:综合多源信息生成结构化Markdown报告,流式输出。
5

章节 05

技术实现细节

  • Agent编排器:实现Agentic Loop机制,多轮推理循环;- 三级降级策略:Agentic模式(LLM自主调用)、关键词意图兜底、纯模板报告;- 多模态视觉:MiMo-v2.5可分析图像视觉特征;- 记忆模块:对话记忆超20条自动摘要,图像分析结果LRU缓存至localStorage。
6

章节 06

部署与使用方式

部署简便:静态文件可托管至GitHub Pages,GitHub Actions自动部署。使用流程:配置LLM服务(支持OpenAI兼容API)→上传薄片图片→自然语言对话提问(如分析矿物、统计鲕粒含量等)。

7

章节 07

创新点与应用价值

创新点:多模态LLM与地质知识结合,Agent架构实现灵活智能分析。应用价值:帮助学生学习矿物鉴定,辅助野外初步筛查,为地质数据数字化提供新思路。

8

章节 08

局限性与未来展望

局限性:训练数据覆盖不足导致罕见矿物识别不准,纯前端依赖网络环境,知识库需扩展。未来方向:扩展矿物/岩石类型、集成专业数据库、支持地球化学分析、开发离线推理能力。