# RealMythos：开源重建 Claude Mythos 的网络安全推理能力栈

> RealMythos 是一个分阶段的开源项目，旨在公开重建 Anthropic Claude Mythos 的网络安全推理能力。项目从真实漏洞数据出发，逐步构建高质量推理数据集、训练开源模型、搭建可复现的漏洞环境，并最终实现多智能体追踪收集基础设施。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-05-17T04:12:01.000Z
- 最近活动: 2026-05-17T04:22:13.609Z
- 热度: 159.8
- 关键词: Claude Mythos, 网络安全, 开源 AI, 安全推理, 漏洞分析, 数据集, 大语言模型, CVE
- 页面链接: https://www.zingnex.cn/forum/thread/realmythos-claude-mythos
- Canonical: https://www.zingnex.cn/forum/thread/realmythos-claude-mythos
- Markdown 来源: ingested_event

---

## 项目背景与核心理念

在人工智能安全领域，强大的网络安全推理能力长期以来被封闭在少数公司的围墙之内。Anthropic 的 Claude Mythos 作为业界领先的安全推理系统，其技术细节和训练数据并未向公众开放。这种封闭性引发了学术界和开源社区对于 AI 安全工具可及性的担忧——如果最先进的网络安全推理能力只能由少数机构掌控，那么全球的安全研究者和防御者将难以获得平等的工具支持。

RealMythos 项目正是在这样的背景下应运而生。这是一个雄心勃勃的开源计划，目标是将 Claude Mythos 的能力栈进行公开重建。项目的核心理念非常明确：先进的安全推理工具不应该被封闭在受控的访问门后，而应该让研究人员、防御者、教育工作者和开发者能够自由地使用、审查、复现和改进这些工具。

## 技术架构与分层设计

RealMythos 将 Claude Mythos 视为一个完整的能力栈而非单一的模型检查点。项目采用分层递进的设计思路，将整个系统分解为五个相互关联的层次：

**第一层：真实漏洞数据**——项目基于 Reef 框架收集的真实世界漏洞和修复数据作为起点。Reef 是该项目团队在 ASE 2023 上发表的漏洞收集框架，为 RealMythos 提供了高质量的原始数据基础。

**第二层：推理数据集**——从原始漏洞数据中提取并构建结构化的安全推理数据集。第一阶段已经发布了包含 6,159 条 CVE 关联的 C/C++ 安全推理记录，这些数据可直接用于监督微调（SFT）。

**第三层：开源安全推理模型**——基于高质量数据集训练专门面向安全推理的开源大语言模型。这一阶段目前仍在开发中，但已经纳入项目的四阶段路线图。

**第四层：可复现软件环境**——构建可复现的漏洞环境和测试基础设施，使得安全推理能力的评估和验证可以在标准化的环境中进行。

**第五层：多智能体追踪收集**——建立多智能体协作的追踪收集和验证基础设施，实现可执行、可审查、可由社区验证的安全推理系统。

## 第一阶段成果：安全推理数据集

目前 RealMythos 已经完成第一阶段的核心交付。发布的数据集包含超过 6,000 条经过精心整理的安全推理记录，每条记录都与真实的 CVE 漏洞相关联。数据集的特点包括：

- **PoC 感知响应**：数据集中的推理示例包含对概念验证代码的理解和分析
- **质量信号标注**：每条记录都附带质量评估指标，便于筛选和优先级排序
- **负责任使用文档**：项目团队深知安全数据的双重用途特性，因此配套发布了详细的使用指南和责任声明
- **完整的数据管道**：从 Reef 原始数据到最终训练数据的完整处理流程已开源，确保研究的可复现性

数据集已在 Hugging Face 平台发布，地址为 huggingface.co/datasets/RealMythos/RealMythosReasoning，同时项目也提供了 Google Drive 镜像供研究者下载。

## 学术基础与研究传承

RealMythos 并非凭空而起，它建立在项目团队此前两项重要研究工作的基础之上。第一项是 Reef 框架，这是一个用于收集真实世界漏洞和修复数据的系统，已在 ASE 2023 发表。第二项是 API 引导的数据集合成方法，用于微调大型代码模型，相关成果发表在 OOPSLA 2025。

这些前期工作为 RealMythos 提供了方法论基础和数据基础设施。项目团队将此前在代码模型训练领域积累的经验，延伸应用到安全推理数据的构建和模型训练中，形成了从数据到模型再到评估环境的完整闭环。

## 开放协作与社区参与

RealMythos 采用分阶段开源的策略，每一层都在完成内部审查后向公众发布。这种渐进式的开放方式既保证了质量，又最大化了社区的参与机会。目前项目已建立 GitHub 仓库、技术报告草案和 Hugging Face 数据集页面，形成了多渠道的协作入口。

项目的路线图清晰展示了从数据到模型再到完整基础设施的发展路径。第二阶段的开源安全推理模型、第三阶段的可复现环境、以及第四阶段的多智能体追踪基础设施都在按计划推进。这种透明化的进度追踪让社区成员能够清楚地了解项目状态，并在合适的时机参与进来。

## 对 AI 安全生态的意义

RealMythos 的出现对于整个 AI 安全生态系统具有深远意义。它不仅提供了一个开源的网络安全推理能力替代方案，更重要的是建立了一种新的范式——即通过分层开放的方式重建原本封闭的能力栈。这种模式可以被其他领域的研究者借鉴，用于解决类似的开放获取问题。

对于安全研究社区而言，RealMythos 意味着更多的研究者将能够接触到高质量的安全推理数据，训练自己的模型，并在可复现的环境中验证想法。对于防御者而言，开源的安全推理工具将帮助他们更好地理解和应对不断演变的网络威胁。对于教育工作者而言，这是一个绝佳的教学资源，可以用来培养下一代安全 AI 人才。

## 结语

RealMythos 代表了开源社区对 AI 能力垄断的一次重要挑战。通过系统性地重建 Claude Mythos 的能力栈，项目团队正在证明：最先进的 AI 安全能力可以通过开放协作的方式实现民主化。随着后续阶段的逐步完成，我们有理由期待一个更加开放、透明、可审查的网络安全推理生态系统的形成。
