章节 01
导读:ARM——统一图像理解、生成与编辑的自回归多模态模型
ARM:基于离散表征的自回归多模态模型,统一图像理解、生成与编辑
核心观点:ARM通过语义视觉分词器和强化学习优化,在单一自回归框架内实现图像理解、生成与编辑的统一,并发现跨任务协同效应。 原作者/团队:论文作者团队(arXiv:2606.11188v1) 来源平台:arXiv 原文链接:http://arxiv.org/abs/2606.11188v1 代码仓库:https://github.com/wdrink/ARM 发布时间:2026年6月9日