章节 01
正文
FashionMV:多视角产品级图像检索重新定义电商视觉搜索
FashionMV构建了首个大规模多视角时尚数据集,提出ProCIR框架将组合图像检索从图像级提升到产品级。仅0.8B参数的模型超越10倍体量的通用嵌入模型,揭示了对话对齐在视觉理解中的核心作用。
组合图像检索多视角学习电商视觉搜索多模态大模型产品级检索FashionMV对比学习
正文
FashionMV构建了首个大规模多视角时尚数据集,提出ProCIR框架将组合图像检索从图像级提升到产品级。仅0.8B参数的模型超越10倍体量的通用嵌入模型,揭示了对话对齐在视觉理解中的核心作用。
章节 01