Zing 论坛

正文

RealMythos:开源重建 Claude Mythos 的网络安全推理能力栈

RealMythos 是一个分阶段的开源项目,旨在公开重建 Anthropic Claude Mythos 的网络安全推理能力。项目从真实漏洞数据出发,逐步构建高质量推理数据集、训练开源模型、搭建可复现的漏洞环境,并最终实现多智能体追踪收集基础设施。

Claude Mythos网络安全开源 AI安全推理漏洞分析数据集大语言模型CVE
发布时间 2026/05/17 12:12最近活动 2026/05/17 12:22预计阅读 2 分钟
RealMythos:开源重建 Claude Mythos 的网络安全推理能力栈
1

章节 01

RealMythos项目导读:开源重建Claude Mythos网络安全推理能力栈

RealMythos是分阶段开源项目,旨在公开重建Anthropic Claude Mythos的网络安全推理能力。项目从真实漏洞数据出发,逐步构建高质量推理数据集、训练开源模型、搭建可复现漏洞环境,最终实现多智能体追踪收集基础设施。目前已完成第一阶段核心交付,发布关联CVE的安全推理数据集,推动AI安全工具民主化与开放协作。

2

章节 02

项目背景:打破AI安全推理能力的封闭性

人工智能安全领域中,Claude Mythos等领先安全推理系统的技术细节与训练数据未公开,引发工具可及性担忧。RealMythos应运而生,核心理念是让先进安全推理工具向研究人员、防御者、教育工作者和开发者自由开放,支持使用、审查、复现和改进。

3

章节 03

技术架构:分层递进的能力栈设计

RealMythos将Claude Mythos视为完整能力栈,分解为五个关联层次:

第一层:真实漏洞数据——基于团队ASE 2023发表的Reef框架收集真实漏洞和修复数据; 第二层:推理数据集——第一阶段已发布6159条CVE关联的C/C++安全推理记录,用于监督微调; 第三层:开源安全推理模型——基于高质量数据集训练开源大语言模型(路线图中); 第四层:可复现软件环境——构建标准化漏洞环境与测试基础设施; 第五层:多智能体追踪收集——建立协作追踪验证基础设施,实现可执行、可审查系统。

4

章节 04

第一阶段成果:安全推理数据集发布

RealMythos第一阶段发布6000+条与真实CVE关联的安全推理记录,特点包括:

  • PoC感知响应:含概念验证代码分析;
  • 质量信号标注:每条记录附质量评估指标;
  • 负责任使用文档:配套使用指南与责任声明;
  • 完整数据管道:从Reef原始数据到训练数据流程开源。

数据集发布于Hugging Face(huggingface.co/datasets/RealMythos/RealMythosReasoning),并提供Google Drive镜像。

5

章节 05

学术基础:基于前期研究的传承与延伸

RealMythos基于团队两项前期研究:

  1. Reef框架:收集真实漏洞和修复数据,发表于ASE 2023;
  2. API引导的数据集合成方法:用于微调大型代码模型,成果将发表于OOPSLA 2025。

这些工作提供方法论基础与数据基础设施,延伸至安全推理数据构建与模型训练,形成完整闭环。

6

章节 06

开放协作:分阶段开源与社区参与

RealMythos采用分阶段开源策略,每一层完成内部审查后发布。目前已建立GitHub仓库、技术报告草案和Hugging Face数据集页面。路线图:第二阶段开发开源安全推理模型,第三阶段构建可复现环境,第四阶段实现多智能体追踪基础设施,透明进度支持社区参与。

7

章节 07

项目意义:推动AI安全生态民主化

RealMythos提供开源替代方案,建立分层开放重建封闭能力栈的新范式,可被其他领域借鉴。对研究社区提供高质量数据资源;对防御者助力应对威胁;对教育工作者提供教学资源,培养安全AI人才。

8

章节 08

结语:迈向开放透明的网络安全推理生态

RealMythos挑战AI能力垄断,证明先进AI安全能力可通过开放协作民主化。后续阶段推进将助力形成更开放、透明、可审查的网络安全推理生态系统。