正文

Second Brain：面向SFT、RLHF与RAG的LLM实验平台

一个专为AI工程师和研究人员设计的LLM实验环境，支持监督微调、人类反馈强化学习和检索增强生成的全流程实验，具备并行推理、盲测评估和数据集生成功能。

LLMSFTRLHFRAGFastAPIpgvector模型评估数据集生成盲测领域驱动设计

发布时间 2026/04/21 00:43最近活动 2026/04/21 00:50预计阅读 2 分钟

章节 01

【导读】Second Brain：面向SFT、RLHF与RAG的LLM实验平台

Second Brain是专为AI工程师和研究者设计的开源LLM实验环境，整合监督微调（SFT）、人类反馈强化学习（RLHF）、检索增强生成（RAG）全流程实验。它解决传统碎片化工作流的效率问题，提供并行推理、盲测评估、数据集生成等核心功能，助力系统性模型实验与优化。

章节 02

背景：传统LLM实验的痛点与平台设计理念

传统LLM实验需在多工具间切换（脚本调用API、表格记录评估、文本编辑器整理数据），效率低且易引入人为错误。Second Brain以“从测试控制台到科学实验室”为理念，将实验全流程封装在统一Web应用中。平台采用领域驱动设计（DDD）架构，后端基于FastAPI，数据层用PostgreSQL+pgvector支持向量搜索，前端实现数学公式渲染。

章节 03

核心功能：并行推理、盲测评估与数据闭环

确定性并行推理：同时对两个模型/提示词发起请求，确保参数与RAG上下文一致，消除时间噪声，提升A/B测试科学性；
盲测评估机制：隐藏模型真实身份，仅显示“模型A/B”，避免品牌偏见，让评估更客观；
语义级文本对比：基于jsdiff高亮输出差异，便于发现幻觉、遗漏等细节；
金标准数据集导出：自动将评估结果导出为JSONL格式，兼容主流训练框架，缩短实验-训练闭环时间；
高级RAG Pipeline：支持元数据预过滤（文档章节、日期等）+向量精排，确定性排序保障实验可复现。

章节 04

技术架构：DDD分层设计与可扩展性

平台采用DDD分层架构，代码分为5层：

api/：FastAPI路由层处理HTTP请求；
core/：配置与环境变量管理；
repositories/：数据库交互层，封装pgvector语义搜索；
schemas/：Pydantic模型负责数据验证与序列化；
services/：业务逻辑核心（LLM编排器、RAG Pipeline）。 LLM编排层采用抽象接口，默认支持Ollama本地模型，预留扩展其他提供商接口，便于维护与扩展。

章节 05