Zing 论坛

正文

OmniBehavior: 面向真实世界用户行为模拟的大规模多场景行为轨迹基准数据集

中科院计算所发布OmniBehavior数据集,涵盖快手平台90天跨场景用户行为轨迹,用于评估大语言模型在长期、跨域、异构行为模拟任务上的能力。

用户行为模拟大语言模型行为轨迹推荐系统中科院快手数据集长期兴趣建模
发布时间 2026/04/09 18:31最近活动 2026/04/09 18:48预计阅读 2 分钟
OmniBehavior: 面向真实世界用户行为模拟的大规模多场景行为轨迹基准数据集
1

章节 01

【导读】OmniBehavior:真实世界用户行为模拟的大规模基准数据集发布

中科院计算技术研究所联合快手发布OmniBehavior数据集,涵盖快手平台90天跨场景用户行为轨迹,旨在评估大语言模型在长期、跨域、异构行为模拟任务上的能力,为研究社区提供重要资源。

2

章节 02

研究背景:现有行为数据集的局限与OmniBehavior的诞生

随着大语言模型能力提升,其在用户行为建模的潜力受到关注,但现有基准存在局限:时间跨度有限(难以评估长期兴趣演变)、场景单一(缺乏跨场景关联)、行为类型同质化(无法反映真实复杂性)。OmniBehavior基于快手真实数据,填补这些空白。

3

章节 03

数据集核心特点:长期、多场景与结构化设计

  • 长期观察窗口:覆盖2025年9月1日至11月30日共90天,支持追踪兴趣演变、识别行为模式变化等。
  • 多场景覆盖:整合短视频浏览、直播互动、电商购物、广告互动、客服对话、搜索行为六大核心场景。
  • 数据结构:以用户为中心,包含用户画像(基本特征)和行为历史(时序动作序列,含场景标识、时间戳、上下文等)。
4

章节 04

研究价值:长期兴趣建模与跨域行为分析的新工具

  • 长期兴趣建模:探索兴趣形成/转变、外部事件影响、长期动态兴趣模型构建。
  • 跨域行为分析:研究不同场景关联(如视频观看与购物行为关系、直播互动与电商转化率相关性)。
  • 用户行为模拟:提供真实轨迹作为ground truth,支持训练评估模拟Agent、测试模型预测表现等。
5

章节 05

技术细节与获取:开源情况及数据发布计划

OmniBehavior已在GitHub开源,提供演示数据集demo.json(单用户部分数据)。完整数据集预计2026年5月发布,正在进行隐私合规审计,仅限学术研究使用。相关论文于2026年4月发布,阐述构建方法、评估指标及基准实验结果。

6

章节 06

社区意义:推动用户行为建模研究进入新阶段

OmniBehavior定义了“真实世界行为模拟”研究范式,为LLM研究提出新挑战(把握长期模式、跨场景关联、意图演变),推动其在用户建模领域发展;同时为推荐系统提供长期效果评估依据,解决离线与在线效果不一致问题。

7

章节 07

未来展望:期待行为建模领域的突破性进展

随着完整数据集发布,有望看到:更强大的行为预测模型、更逼真的虚拟用户模拟系统、跨场景统一推荐框架、隐私保护的行为建模技术。OmniBehavior或将成为该领域标准基准,推动学术与工业界突破。