章节 01
【导读】UniEditBench:图像视频编辑统一基准与低成本评估方案
本文提出UniEditBench统一基准测试平台,支持图像和视频的重建与指令驱动编辑评估。其核心创新在于:1)建立统一评估协议,解决现有评估碎片化问题;2)通过知识蒸馏将235B参数多模态大模型(MLLM)转化为4B/8B轻量评估器,实现低成本高质量评估,对齐人类偏好。
正文
本文提出UniEditBench统一基准,支持图像和视频的重建与指令驱动编辑评估,通过将235B参数MLLM蒸馏为4B/8B轻量评估器,实现低成本高质量评估。
章节 01
本文提出UniEditBench统一基准测试平台,支持图像和视频的重建与指令驱动编辑评估。其核心创新在于:1)建立统一评估协议,解决现有评估碎片化问题;2)通过知识蒸馏将235B参数多模态大模型(MLLM)转化为4B/8B轻量评估器,实现低成本高质量评估,对齐人类偏好。
章节 02
视觉编辑技术快速发展,但评估方法滞后且碎片化:
章节 03
UniEditBench设计统一评估协议,支持多种编辑范式:
章节 04
通过知识蒸馏构建轻量评估器:
章节 05
实验结果表明:
章节 06
该平台的应用场景包括:
章节 07
当前局限及改进方向: