17173 > 游戏资讯 > 科技新闻 > 正文

图像生成技术新突破:小米大模型团队提出对角蛇形自回归图像生成方式,超越此前所有自回归方法

2025-04-18 23:42:01 神评论

小米大模型团队与北大信科提出了一种具有方向感知的对角蛇形扫描自回归图像生成框架(DAR,diagonal snake-likeorder),有效地确保相邻索引的 token 在空间上紧密相邻。

相对于传统的逐行生成方式,它可以沿着图像的对角线、像蛇一样灵活地生成每个像素,比传统方法更自然,也更接近人类绘画时的直觉。

小米大模型团队表示,DAR 在 256×256 的 ImageNet 基准测试中取得了 1.37 的 FID 分数,刷新了当前同类技术的最好成绩(SoTA)。

小米官方表示将进一步支持更灵活的多种分辨率图像生成。鉴于本方法与 LLM 的训练和推理方式高度兼容,小米大模型团队还将持续探索更加统一的多模态理解与生成技术方案。

【来源:IT之家】
关于,图像生成,小米大模型,自回归方法的新闻
亲爱的 17173 玩家们~我们正在打磨平台的找游戏功能,想听听你平时是怎么筛选、导航找游戏的?你的真实习惯和偏好,能让后续找游戏更顺手哦!立即点击填写问卷 参与问卷