正文

OmniBehavior: 面向真实世界用户行为模拟的大规模多场景行为轨迹基准数据集

中科院计算所发布OmniBehavior数据集，涵盖快手平台90天跨场景用户行为轨迹，用于评估大语言模型在长期、跨域、异构行为模拟任务上的能力。

用户行为模拟大语言模型行为轨迹推荐系统中科院快手数据集长期兴趣建模

发布时间 2026/04/09 18:31最近活动 2026/04/09 18:48预计阅读 2 分钟

章节 01

【导读】OmniBehavior：真实世界用户行为模拟的大规模基准数据集发布

中科院计算技术研究所联合快手发布OmniBehavior数据集，涵盖快手平台90天跨场景用户行为轨迹，旨在评估大语言模型在长期、跨域、异构行为模拟任务上的能力，为研究社区提供重要资源。

章节 02

随着大语言模型能力提升，其在用户行为建模的潜力受到关注，但现有基准存在局限：时间跨度有限（难以评估长期兴趣演变）、场景单一（缺乏跨场景关联）、行为类型同质化（无法反映真实复杂性）。OmniBehavior基于快手真实数据，填补这些空白。

章节 03

章节 04

章节 05

OmniBehavior已在GitHub开源，提供演示数据集demo.json（单用户部分数据）。完整数据集预计2026年5月发布，正在进行隐私合规审计，仅限学术研究使用。相关论文于2026年4月发布，阐述构建方法、评估指标及基准实验结果。

章节 06

OmniBehavior定义了“真实世界行为模拟”研究范式，为LLM研究提出新挑战（把握长期模式、跨场景关联、意图演变），推动其在用户建模领域发展；同时为推荐系统提供长期效果评估依据，解决离线与在线效果不一致问题。

章节 07

随着完整数据集发布，有望看到：更强大的行为预测模型、更逼真的虚拟用户模拟系统、跨场景统一推荐框架、隐私保护的行为建模技术。OmniBehavior或将成为该领域标准基准，推动学术与工业界突破。