Zing 论坛

正文

IDE内置AI开发工具包:让非ML工程师也能构建AI功能

本文介绍一款JetBrains IDE插件,将AI功能的追踪和评估直接集成到开发工作流中,降低AI开发的门槛

AI开发工具IDE插件智能体调试JetBrainsLLM工程化追踪评估
发布时间 2026/05/14 17:28最近活动 2026/05/15 12:51预计阅读 2 分钟
IDE内置AI开发工具包:让非ML工程师也能构建AI功能
1

章节 01

IDE内置AI开发工具包:让非ML工程师也能构建AI功能(导读)

本文介绍一款JetBrains IDE插件——AI Toolkit,旨在降低非ML工程师构建AI功能的门槛。该插件将AI功能的追踪与评估能力直接集成到开发者熟悉的IDE环境中,让非ML专家也能采用规范的AI开发实践,无需频繁切换工具或学习全新工作流。

2

章节 02

AI开发的隐性门槛:非ML工程师面临的挑战

AI开发对非ML工程师存在隐性门槛:AI功能输出具有不确定性与不可解释性,智能体决策过程难以追踪,评估标准主观模糊;传统测试方法不系统可靠,调试如同黑箱摸索,且开发者不愿为AI工具频繁切换环境。这些问题导致AI功能开发困难、调试痛苦、复现几乎不可能。

3

章节 03

AI Toolkit插件:IDE原生的AI开发工作流

基于开发者需求调研(标准化评估、执行追踪可见性、低上下文切换),研究团队开发了AI Toolkit插件,专为JetBrains IDE设计。其核心创新是将AI开发全生命周期整合到Run/Debug循环中,包含两大组件:AI Agents Debugger(追踪可视化智能体执行)与AI Evaluation(类单元测试评估框架)。设计理念尊重现有软件工程实践,采用熟悉隐喻降低学习成本。

4

章节 04

AI Toolkit的核心功能解析

插件核心功能包括:1. 运行触发的追踪捕获:自动记录智能体决策、工具调用、参数与中间输出,以层次结构呈现;2. 即时分层检查:可交互查看追踪,逐层深入决策树,快速定位问题;3. 一键添加到数据集:将有趣案例(含输入、输出、中间状态)保存到评估数据集;4. 类单元测试评估:编写用例定义指标(支持字符串匹配到语义相似度),批量验证并生成测试报告。

5

章节 05

早期采用数据:验证插件的实际价值

早期采用数据显示积极信号:1. 高转化率:运行时主动提示下,开发者尝试追踪功能意愿高;2. 持续使用:一旦开始捕获追踪,开发者倾向持续使用;3. 低流失率:采用者很少放弃。这些数据验证了IDE原生可观测性降低AI开发激活能量的假设。

6

章节 06

局限性与未来发展方向

当前插件存在局限:主要支持Python生态AI框架(如LangChain、LlamaIndex),其他语言待扩展;大规模评估(数百/数千用例)的性能与体验需优化。未来方向包括:扩展框架与语言支持、增强评估功能、探索团队协作共享数据集与追踪记录。

7

章节 07

结语:AI开发的民主化与工程化启示

AI Toolkit推动AI开发民主化:让AI功能开发像传统软件一样可管理、调试与评估,降低门槛使更多工程师参与。对AI工程化的启示:工具集成比独立环境更有效,可观测性是核心,降低门槛扩大参与者范围。AI不应仅为ML专家所有,而应成为所有软件工程师的工具。