章节 01
导读 / 主楼:MACyber:面向网络安全的多源对齐基准测试与专用大语言模型
MACyber项目提供了MACyber-INT多源对齐网络安全基准测试集和MACyber-12B专用大语言模型,涵盖网络流量、IoT、系统日志、DNS、Web安全、漏洞情报和威胁情报七大领域,为网络安全领域的AI模型评估提供了标准化工具集。
正文
MACyber项目提供了MACyber-INT多源对齐网络安全基准测试集和MACyber-12B专用大语言模型,涵盖网络流量、IoT、系统日志、DNS、Web安全、漏洞情报和威胁情报七大领域,为网络安全领域的AI模型评估提供了标准化工具集。
章节 01
MACyber项目提供了MACyber-INT多源对齐网络安全基准测试集和MACyber-12B专用大语言模型,涵盖网络流量、IoT、系统日志、DNS、Web安全、漏洞情报和威胁情报七大领域,为网络安全领域的AI模型评估提供了标准化工具集。
章节 02
章节 03
MACyber是一个专注于网络安全领域的综合性开源项目,由两部分核心组件构成:MACyber-INT基准测试集和MACyber-12B大语言模型。该项目旨在解决网络安全领域AI模型缺乏标准化评估工具的问题,为研究人员和从业者提供结构化的安全情报数据评估框架。
在当今数字化时代,网络安全威胁日益复杂,传统的基于规则的安全系统难以应对新型攻击手段。大语言模型在网络安全领域的应用潜力巨大,但缺乏针对性的基准测试来评估其真实能力。MACyber项目填补了这一空白,通过多源数据对齐的方式,构建了一个覆盖七个关键安全领域的综合评估体系。
章节 04
MACyber-INT基准测试集包含31个数据集,按照七个高层级安全领域进行组织:
章节 05
网络流量安全(Network Traffic Security) 涵盖网络通信层面的威胁检测,包括异常流量识别、入侵检测等场景。
物联网安全(IoT Security) 针对物联网设备的特殊安全需求,评估模型在IoT威胁识别方面的能力。
系统日志安全(System Log Security) 通过分析系统日志发现潜在的安全事件和异常行为。
DNS安全威胁(DNS Security Threat) 专注于DNS层面的攻击检测,包括DNS隧道、DDoS攻击等。
Web安全威胁(Web Security Threat) 覆盖Web应用层面的各类攻击,如SQL注入、XSS、CSRF等。
漏洞情报(Vulnerability Intelligence) 评估模型对已知漏洞的理解和新型漏洞的识别能力。
威胁情报(Threat Intelligence) 综合性的威胁信息分析,包括攻击者画像、攻击手法识别等。
章节 06
MACyber采用了结构化的JSON数据模式,每个样本包含以下关键字段:
这种设计不仅提供了标准的输入输出格式,更重要的是包含了可解释的推理过程,使得模型评估不仅关注结果准确性,还关注推理逻辑的合理性。
章节 07
项目还提供了MACyber-12B大语言模型,这是一个专门为网络安全领域训练的模型。该模型包含两个重要组件:
章节 08
针对网络安全任务优化的低秩适配器,通过在基础大模型上注入网络安全领域的专业知识,提升模型在安全相关任务上的表现。