章节 01
临床LLM安全与准确率遵循不同缩放规律(导读)
该研究提出SaFE-Scale框架和RadSaFE-200基准,系统评估34个临床LLM在六种部署条件下的安全性表现。核心发现:准确率提升并不自动带来安全性提升,高质量证据对安全性的改善最为显著,而标准RAG和智能体RAG未能复制这一安全特性。医疗领域中,AI安全的核心在于极端风险控制与避免自信错误,而非平均准确率。
正文
该研究提出了SaFE-Scale框架和RadSaFE-200基准,系统评估了34个临床LLM在六种部署条件下的安全性表现。关键发现:准确率提升并不自动带来安全性提升,高质量证据对安全性的改善最为显著,而标准RAG和智能体RAG未能复制这一安全特性。
章节 01
该研究提出SaFE-Scale框架和RadSaFE-200基准,系统评估34个临床LLM在六种部署条件下的安全性表现。核心发现:准确率提升并不自动带来安全性提升,高质量证据对安全性的改善最为显著,而标准RAG和智能体RAG未能复制这一安全特性。医疗领域中,AI安全的核心在于极端风险控制与避免自信错误,而非平均准确率。
章节 02
医疗AI部署中默认假设:模型规模扩大、上下文增长等会使准确率提升带来安全性提高。但该假设存在缺陷:医疗安全关注极端风险(如高风险场景错误),而非平均表现;错误具有不对称性——自信满满的错误比不确定的错误更危险,可能导致医生不加质疑接受,引发严重后果。
章节 03
章节 04
章节 05
章节 06
章节 07
临床LLM的安全性是主动设计的部署属性,而非规模化的被动结果。传统AI开发范式(更大模型=更安全)在医疗领域危险,需明确定义、测量和优化安全。
关键信息:不要假设更大模型更安全,应投资证据基础设施、设计安全工作流、关注最坏情况。