本文由第三方AI基于17173文章http://news.17173.com/content/04182025/234201486.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
图像生成技术新突破:小米大模型团队提出对角蛇形自回归图像生成方式,超越此前所有自回归方法
2025-04-18 23:42:01
神评论
小米大模型团队与北大信科提出了一种具有方向感知的对角蛇形扫描自回归图像生成框架(DAR,diagonal snake-likeorder),有效地确保相邻索引的 token 在空间上紧密相邻。
相对于传统的逐行生成方式,它可以沿着图像的对角线、像蛇一样灵活地生成每个像素,比传统方法更自然,也更接近人类绘画时的直觉。
小米大模型团队表示,DAR 在 256×256 的 ImageNet 基准测试中取得了 1.37 的 FID 分数,刷新了当前同类技术的最好成绩(SoTA)。
小米官方表示将进一步支持更灵活的多种分辨率图像生成。鉴于本方法与 LLM 的训练和推理方式高度兼容,小米大模型团队还将持续探索更加统一的多模态理解与生成技术方案。
【来源:IT之家】


