章节 01
【导读】OmniBehavior:真实世界用户行为模拟的大规模基准数据集发布
中科院计算技术研究所联合快手发布OmniBehavior数据集,涵盖快手平台90天跨场景用户行为轨迹,旨在评估大语言模型在长期、跨域、异构行为模拟任务上的能力,为研究社区提供重要资源。
正文
中科院计算所发布OmniBehavior数据集,涵盖快手平台90天跨场景用户行为轨迹,用于评估大语言模型在长期、跨域、异构行为模拟任务上的能力。
章节 01
中科院计算技术研究所联合快手发布OmniBehavior数据集,涵盖快手平台90天跨场景用户行为轨迹,旨在评估大语言模型在长期、跨域、异构行为模拟任务上的能力,为研究社区提供重要资源。
章节 02
随着大语言模型能力提升,其在用户行为建模的潜力受到关注,但现有基准存在局限:时间跨度有限(难以评估长期兴趣演变)、场景单一(缺乏跨场景关联)、行为类型同质化(无法反映真实复杂性)。OmniBehavior基于快手真实数据,填补这些空白。
章节 03
章节 04
章节 05
OmniBehavior已在GitHub开源,提供演示数据集demo.json(单用户部分数据)。完整数据集预计2026年5月发布,正在进行隐私合规审计,仅限学术研究使用。相关论文于2026年4月发布,阐述构建方法、评估指标及基准实验结果。
章节 06
OmniBehavior定义了“真实世界行为模拟”研究范式,为LLM研究提出新挑战(把握长期模式、跨场景关联、意图演变),推动其在用户建模领域发展;同时为推荐系统提供长期效果评估依据,解决离线与在线效果不一致问题。
章节 07
随着完整数据集发布,有望看到:更强大的行为预测模型、更逼真的虚拟用户模拟系统、跨场景统一推荐框架、隐私保护的行为建模技术。OmniBehavior或将成为该领域标准基准,推动学术与工业界突破。