# Bioinfor-Claw：为生物信息学打造的模块化AI智能体技能库

> 一个包含50个专项技能的生物信息学智能体平台，支持独立运行、OpenClaw和Claude Code集成，涵盖公共数据访问、多组学分析、CRISPR设计、基因分析、蛋白质结构、机器学习、文献检索等10大应用场景。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-04-15T19:16:01.000Z
- 最近活动: 2026-04-15T19:21:25.680Z
- 热度: 165.9
- 关键词: bioinformatics, AI agent, CRISPR, genomics, proteomics, single-cell, TCGA, DepMap, multi-omics, Claude Code, OpenClaw
- 页面链接: https://www.zingnex.cn/forum/thread/bioinfor-claw-ai
- Canonical: https://www.zingnex.cn/forum/thread/bioinfor-claw-ai
- Markdown 来源: ingested_event

---

# Bioinfor-Claw：为生物信息学打造的模块化AI智能体技能库

在生物信息学研究中，研究人员常常需要在多个数据源、分析脚本和可视化工具之间来回切换。一个典型的研究问题——"基因X在这种癌症中是否具有预后价值，其突变谱是否暗示了CRISPR靶点？"——通常涉及公共数据门户查询、本地分析脚本、绘图笔记本、文献检索和结构查看器，往往需要通过手工方式串联起来。

**Bioinfor-Claw** 正是为解决这一碎片化问题而设计的。它将整个分析流程整合到一个对话式界面中，由精心策划、可复现的技能提供支持。用户只需描述需求，智能体就能选择正确的工具、填充参数、运行分析，并返回带有来源信息的图表和表格。

## 双重定位：独立智能体与技能库

Bioinfor-Claw 具有独特的双重属性，这使其能够适应不同的使用场景：

**作为独立生物信息学智能体**：克隆仓库后运行单个命令，即可获得基于浏览器的聊天界面，由能够自主选择工具、运行分析、跨轮次记忆上下文并返回可发表级别图表和表格的自主智能体提供支持。无需外部智能体框架。

**作为模块化技能库**：所有50个分析能力都被打包为自包含的、智能体友好的技能（每个技能都包含 `SKILL.md`、可用的Python实现和明确的输入/输出契约），可以插入 OpenClaw、Claude Code 或任何扫描 `SKILL.md` 文件的自定义智能体。

这种双重特性是刻意设计的。你可以将 Bioinfor-Claw 作为独立的"桌面AI实验科学家"使用，也可以将其嵌入到你已经在运行的更大智能体平台中，或者直接从脚本和管道调用单个技能——相同的技能在所有三种模式下都能工作。

## 核心能力概览

### 自主智能体特性

- **自动路由智能体循环**：读取 `SKILL.md` 文件，从纯英文请求中选择正确的技能，填充必需参数，执行并恢复错误
- **多LLM后端支持**：Anthropic、OpenAI、Google、Mistral、MiniMax，以及支持任何OpenAI兼容端点的自定义选项
- **跨轮次记忆**：追踪讨论的实体（基因、癌症、UniProt ID）、近期分析和用户偏好
- **可配置的步骤预算**：每个请求默认30轮工具调用，检测到模块化/多数据集工作流时自动提升至45轮以上
- **文件处理**：支持拖放CSV/TSV/VCF/FASTA/JSON/BED上传，服务器路径自动接入 `run_script` 调用
- **结果渲染**：内联图表预览、整合下载卡片、可折叠的错误追踪

### 技能库架构

| 特性 | 说明 |
|------|------|
| 50个专项技能 | 涵盖数据访问、多组学、CRISPR、基因列表、基因中心、结构、机器学习、绘图、文献、实验室追踪 |
| 标准化SKILL.md | 每个技能声明用途、输入、输出、执行策略和触发短语 |
| 纯Python实现 | 基于numpy/pandas/matplotlib/scipy/lifelines技术栈，无R依赖 |
| 每个技能独立的requirements.txt | 仅安装所需依赖 |
| 稳定的文件命名和TSV/PNG/SVG输出 | 设计用于下游链式调用 |

## 十大应用场景

Bioinfor-Claw 目前涵盖**10个应用场景，共50个技能**：

### 1. 公共数据集访问与下载（4个技能）
从NCBI GEO、TCGA/GDC、GTEx和DepMap发现、查询、下载、缓存和组织公共生物数据集。

### 2. 多组学数据分析（5个技能）
转录组学、基因组学、表观基因组学、蛋白质组学和单细胞数据分析，包括RNA-seq差异表达、ATAC-seq/ChIP-seq下游分析、DNA甲基化分析、质谱蛋白质组学和单细胞RNA-seq基础分析。

### 3. CRISPR设计与分析（6个技能）
涵盖SpCas9/Cas12 sgRNA设计、碱基编辑器sgRNA设计（CBE/ABE/双编辑器，13种编辑器预设）、先导编辑器pegRNA设计、混合筛选分析（MAGeCK RRA/MLE）、筛选QC和混合文库设计。

### 4. 基因列表分析（7个技能）
GO/KEGG/Reactome富集分析、GSEA、功能注释、AI辅助基因策展、2-6路基因列表重叠分析（Venn/UpSet + Fisher精确检验）、STRING PPI网络和转录因子富集。

### 5. 基因中心分析（8个技能）
DepMap表达/依赖性/CNV分析、GTEx正常组织表达、TCGA泛癌表达和KM生存分析、体细胞突变棒棒糖图、PRISM药物敏感性相关性、共表达网络和Cox比例风险回归。

### 6. 蛋白质结构分析（5个技能）
UniProt结构域注释、PDB/AlphaFold检索、带口袋检测的交互式3D查看器、序列理化分析和基序扫描、结构对齐和RMSD、3D结构上的变异映射。

### 7. 机器学习与深度学习（3个技能）
组学分类（RF/LR/SVM/XGBoost + ROC/SHAP）、PCA/UMAP/t-SNE降维和k-means/层次/DBSCAN/共识聚类。

### 8. 生物信息学绘图生成器（5个技能）
发表级别的火山图、热图、箱线图/小提琴图/雨云图、散点图/条形图/MA图/相关矩阵/气泡图和Kaplan-Meier生存曲线。

### 9. 论文检索与摘要（4个技能）
每周高影响力论文监测、单篇论文结构化摘要、带引用计数和趋势图的PubMed检索、bioRxiv/medRxiv预印本追踪。

### 10. 实验室检索与追踪（3个技能）
按领域搜索领先实验室、PI出版物追踪和按主题重叠发现合作者。

## 典型工作流示例

### 完整基因表征
从DepMap数据下载到药物敏感性分析，从TCGA表达和突变分析到生存分析，从GTEx正常组织表达到蛋白质结构可视化和序列分析——Bioinfor-Claw 可以在一次对话中完成对一个基因的全方位表征。

### RNA-seq → 通路 → 网络 → 生存
从RNA-seq差异表达分析开始，生成发表级别的火山图，进行GO/KEGG/Reactome富集分析，识别驱动变化的转录因子，构建PPI网络，分析顶级命中基因的生存影响——整个流程可以无缝串联。

### CRISPR筛选 → 命中验证 → 文库设计
从筛选QC和MAGeCK RRA命中调用，到DepMap必需性验证和通路富集，再到针对前50个命中基因的重点后续文库设计——为功能基因组学研究提供完整支持。

## 安装与集成

Bioinfor-Claw 提供四种安装路径，所有路径都使用相同的底层技能库：

**内置智能体 + Web UI（推荐首次用户）**：
```bash
git clone https://github.com/MDhewei/bioinfor-claw.git
cd bioinfor-claw
bash setup.sh --all
source .venv/bin/activate
python3 run_bioinfor_claw.py
```

**OpenClaw集成**：通过 `extraDirs` 注册自动发现所有50个技能。

**Claude Code集成**：从仓库根目录启动Claude Code即可自动扫描所有 `SKILL.md`。

**直接CLI/管道调用**：每个技能都是独立的Python脚本，可从任何shell、Makefile、Snakemake规则或Nextflow流程调用。

## 设计原则

Bioinfor-Claw 围绕五个核心原则构建：

**模块化**：每个技能解决一个定义明确的问题，易于理解、调用、复用、扩展和替换。

**智能体友好**：技能文档格式使智能体能够从用户意图中识别正确的技能，确定所需输入，使用正确参数执行，解释输出并决定下一步操作。

**实用性**：真实研究任务而非玩具演示，涵盖基因表达和依赖性分析、突变和CNV分析、CRISPR设计和筛选解释、文献摘要、结构感知变异解释、可复现图表生成。

**可扩展性**：新技能、新数据集和新图表类型可以在不改变架构的情况下添加。

**可复用性**：输出易于传递到下游——TSV/CSV、JSON清单、PNG/PDF/SVG、结构化摘要、缓存查询结果。

## 项目状态与路线图

Bioinfor-Claw 目前涵盖**10个应用场景的全部50个技能**，以及生产就绪的内置智能体和Web UI。每个技能都有包含明确输入、输出、执行策略和智能体触发示例的 `SKILL.md`、可用的Python实现和 `requirements.txt`。

近期规划包括ENCODE ChIP-seq/ATAC-seq数据集成、端到端工作流模板、服务器端LLM代理等。中长期规划涵盖药物敏感性预测、ClinicalTrials.gov集成、单细胞轨迹分析等更深度功能。

## 总结

Bioinfor-Claw 正在成长为一个完整的AI原生生物信息学平台：一个能够访问生物数据、跨数据集推理、协助实验设计、支持文献综述、生成发表级别图表并协助日常研究任务的自主智能体——模块化、可复用、透明、可扩展且科学实用。

内置智能体是这一愿景的第一个实现；技能库是其基础；与OpenClaw和Claude Code的集成使相同的基础可以移植到团队已经在使用的任何平台。
