正文

IDE内置AI开发工具包：让非ML工程师也能构建AI功能

本文介绍一款JetBrains IDE插件，将AI功能的追踪和评估直接集成到开发工作流中，降低AI开发的门槛

AI开发工具IDE插件智能体调试JetBrainsLLM工程化追踪评估

发布时间 2026/05/14 17:28最近活动 2026/05/15 12:51预计阅读 2 分钟

章节 01

IDE内置AI开发工具包：让非ML工程师也能构建AI功能（导读）

本文介绍一款JetBrains IDE插件——AI Toolkit，旨在降低非ML工程师构建AI功能的门槛。该插件将AI功能的追踪与评估能力直接集成到开发者熟悉的IDE环境中，让非ML专家也能采用规范的AI开发实践，无需频繁切换工具或学习全新工作流。

章节 02

AI开发的隐性门槛：非ML工程师面临的挑战

AI开发对非ML工程师存在隐性门槛：AI功能输出具有不确定性与不可解释性，智能体决策过程难以追踪，评估标准主观模糊；传统测试方法不系统可靠，调试如同黑箱摸索，且开发者不愿为AI工具频繁切换环境。这些问题导致AI功能开发困难、调试痛苦、复现几乎不可能。

章节 03

AI Toolkit插件：IDE原生的AI开发工作流

基于开发者需求调研（标准化评估、执行追踪可见性、低上下文切换），研究团队开发了AI Toolkit插件，专为JetBrains IDE设计。其核心创新是将AI开发全生命周期整合到Run/Debug循环中，包含两大组件：AI Agents Debugger（追踪可视化智能体执行）与AI Evaluation（类单元测试评估框架）。设计理念尊重现有软件工程实践，采用熟悉隐喻降低学习成本。

章节 04

AI Toolkit的核心功能解析

插件核心功能包括：1. 运行触发的追踪捕获：自动记录智能体决策、工具调用、参数与中间输出，以层次结构呈现；2. 即时分层检查：可交互查看追踪，逐层深入决策树，快速定位问题；3. 一键添加到数据集：将有趣案例（含输入、输出、中间状态）保存到评估数据集；4. 类单元测试评估：编写用例定义指标（支持字符串匹配到语义相似度），批量验证并生成测试报告。

章节 05

早期采用数据：验证插件的实际价值

早期采用数据显示积极信号：1. 高转化率：运行时主动提示下，开发者尝试追踪功能意愿高；2. 持续使用：一旦开始捕获追踪，开发者倾向持续使用；3. 低流失率：采用者很少放弃。这些数据验证了IDE原生可观测性降低AI开发激活能量的假设。

章节 06

局限性与未来发展方向

当前插件存在局限：主要支持Python生态AI框架（如LangChain、LlamaIndex），其他语言待扩展；大规模评估（数百/数千用例）的性能与体验需优化。未来方向包括：扩展框架与语言支持、增强评估功能、探索团队协作共享数据集与追踪记录。

章节 07

结语：AI开发的民主化与工程化启示

AI Toolkit推动AI开发民主化：让AI功能开发像传统软件一样可管理、调试与评估，降低门槛使更多工程师参与。对AI工程化的启示：工具集成比独立环境更有效，可观测性是核心，降低门槛扩大参与者范围。AI不应仅为ML专家所有，而应成为所有软件工程师的工具。

IDE内置AI开发工具包：让非ML工程师也能构建AI功能

IDE内置AI开发工具包：让非ML工程师也能构建AI功能（导读）

AI开发的隐性门槛：非ML工程师面临的挑战

AI Toolkit插件：IDE原生的AI开发工作流

AI Toolkit的核心功能解析

早期采用数据：验证插件的实际价值

局限性与未来发展方向

结语：AI开发的民主化与工程化启示

继续阅读

Nornir MCP Server：将大语言模型引入网络自动化的企业级桥梁

Bibliothèque Française LLM：为大型语言模型优化的法语公版文献索引系统

Splinter：一款无锁零拷贝的共享内存 KV 与向量存储库，让 LLM 推理告别 socket 与 memcpy 开销

Folkering OS：当操作系统本身就是 AI——一个能自我进化的裸机 Rust 系统