17173 > 游戏资讯 > 科技新闻 > 正文

字节图像生成模型 Seedream 5.0 上线,对标 Nano Banana Pro

2026-02-10 14:04:01 神评论
17173 新闻导语

字节图像生成模型Seedream 5.0正式上线!支持2K/4K分辨率,对标Nano Banana Pro,限时免费体验。实测智能水平提升,理解抽象提示词,生成细节更精准。立即点击了解新功能对比!

感谢网友 Domado、斯文当不了饭吃、kkkkkkkkkayd 的线索投递!

今日,字节图像生成模型 Seedream 5.0 在视频编辑应用剪映、剪映海外版 Capcut、字节 AI 创作平台小云雀均已上线,在即梦 AI 平台开启灰度测试,图片生成可限时免费体验。

▲ Capcut 官宣截图(左)、小云雀主页模型选择(右)

Seedream 5.0 的图像支持 2K 和 4K 分辨率输出,2K 为图片生成直出,4K 为 AI 增强后的分辨率。根据 Capcut 官网,新模型 5.0 的升级点为首次支持检索生图,对提示词的理解准确性增强、支持更细节、精致纹理的图像生成,还允许用户精确调整图像。Seedream 4.5 于 2025 年 12 月 4 日上线。

智东西实际体验并对比了 Seedream 5.0 与 Nano Banana Pro、Seedream 4.5,发现新模型可以理解“静谧科技感”等抽象提示词,但最后的生成效果相比 Seedream 4.5 很难说有跨越式提升,其联网搜索能力尚不稳定、生成效果升级点体现在更美观、多样化上。

Capcut 的官宣推文里提到,Seedream 5.0 可与 Nano Banana Pro 对标,且更便宜,目前所有用户可免费使用 20 次,美国地区之后上线。有网友对比了 Nano Banana Pro、ChatGPT、Seedream 5.0、Grok Imagine Image 的生成效果,其提示词为:生成一张高质量的信息图,解释在特拉普修道院制作啤酒的过程,并配有丰富的插图。

▲ 第一排从左至右为 Nano Banana Pro、ChatGPT 生成,第二排从左至右为 Seedream 5.0、Grok Imagine Image 生成

相比于其他几个,Seedream 5.0 的步骤解释最为详细,每步都有详细的文字说明,但艺术设计感相比 Nano Banana Pro 稍弱。

从社交平台 X 上的网友评论来看,此次 Seedream 5.0 预览版的升级优先考虑的是智能水平而非美观,可以应对复杂的知识驱动型任务。

有网友认为,Seedream 5.0 的智能水平、中文能力有提升,但都比不上 Nano Banana Pro。

还有网友调侃,新模型的进步程度仅 0.09,仅相当于加了网络搜索的 Seedream 4.5。

01. 三大能力增强,主攻实用性需求

根据 Capcut 官网,此次 Seedream 5.0 的重要升级点包括准确性与智能水平增强、更快更具表现力的图像创建、支持联网知识整合。

首先在智能水平方面,Seedream 5.0 能深入理解提示词,生成与用户意图相匹配、细节精准、布局清晰、文本渲染效果更佳的图像。

第二点是增强风格化效果,其图像到图像功能增强了风格化效果,模型可以提供更清晰的细节、精致的纹理和平衡的照明。该模型还新增了编辑功能,用户可以控制笔刷精准选择并调整相应元素。

最后是智能推理能力,其官网提到,新模型的多步逻辑、空间理解及特定领域知识增强。

02. 相较 Seedream 4.5 提升小,能理解抽象需求

智东西体验了 Seedream 5.0 的图片生成能力。

第一个提示词是“为《静夜思》生成古诗插图”,可以看到生成的结果中人物“举头望明月”这一关键元素都没有缺失,还附上了人物在月光下的影子等,但原诗中的“床前”等没有在图片中涉及到。

为了考验 Seedream 5.0 的联网搜索能力,智东西输入了提示词“最近有很多家机器人都要参加 2026 春晚,生成一张已官宣参加春晚的机器人海报”。

Seedream 5.0 生成的视觉元素准确,在大段文字生成中也未出现乱码,表现稳定。但其并没有理解“已官宣参加春晚的机器人”,而是仅生成了机器人上春晚的海报。

还有抽象的提示词,智东西输入“生成一个静谧科技感且带有落日余晖氛围的闹钟图片”,新模型生成的图片中,从闹钟的设计到背景将落日、科技感融合在了一起。

关于更为细致的图像输出,提示词为“特写电影感肖像,一位有雀斑、深色卷发的年轻女性,被鲜艳的野花和藤蔓环绕,头上戴着花冠。在黄金时段拍摄,温暖的逆光在她的头发和皮肤上形成光晕,浅景深,前景花朵柔焦,照片级真实感”。

可以看到,输出的图片中的逆光效果非常到位,发丝边缘的光晕、皮肤的光泽以及前景花朵的柔焦虚化,都营造出了自然的氛围感。

当智东西的提示词为“最新奥斯卡获奖者红毯风格”时,Seedream 5.0 可以直接生成有红毯、背景板、摄影师的完整图像,背景板还有不少奥斯卡的小金人。

根据参考图生成图片方面,智东西上传了最近热度超高的《闪灵》男主杰克,并让 Seedream 5.0“生成这个人的拜年图片,主人公要身有年味的服装,手拿灯笼和对联”。

生成的效果中,主人公的面部与参考图一致,手拿灯笼、对联的元素也都具备。

智东西还比较了 Seedream 5.0 与 Nano Banana Pro 的生成效果。一个超难提示词为“生成一个用左手写字的人,背景有一个显示 5:25 的模拟时钟”,Seedream 5.0 与 Nano Banana 都失败了,要么是拿笔的手不对,要么是背景的钟表时间不对。

Nano Banana Pro 生成的图片中,人物握笔的手为左手,可以从模糊的时钟看出其时间为 5:30 左右。

▲ Nano Banana Pro 生成的图片

虽然 Seedream 5.0 有些图片生成的并不准确,但其一次性生成的图片更具多样性,从现代风、古风到卡通都有。

▲ Seedream 5.0 生成的图片

在比较 Seedream 4.5 和 Seedream 5.0 时,智东西上传的提示词是“帮我生成西红柿炒鸡蛋的菜谱,卡通风格”。相比之下,Seedream 5.0 的整体排版、架构设计会更为美观。

▲ 上为 Seedream 4.5 生成的图片,下为 Seedream 5.0 生成的图片

03. 结语:图像模型正朝,实用能力升级迭代

当前头部图像模型的迭代路径,正朝着提升理解能力、可控生成、编辑精度等实用能力升级。

从 Seedream 5.0 的升级来看,其选择在检索增强、细节纹理、精准调整、4K 增强上做优化,生成的结果并没有颠覆性效果,这或许更贴近用户的实际需求。但从实测与舆论反馈来看,用户对小版本迭代的感知正在变弱,尤其在抽象语义理解、文字渲染、复杂逻辑构图等方面仍存在技术瓶颈。

本文来自微信公众号:智东西(ID:zhidxcom),作者:程茜

【来源:IT之家】
关于Seedream 5.0,Nano Banana Pro,图像生成模型,字节,Capcut,剪映,小云雀,即梦AI,4K分辨率,检索生图的新闻
亲爱的 17173 玩家们~我们正在打磨平台的找游戏功能,想听听你平时是怎么筛选、导航找游戏的?你的真实习惯和偏好,能让后续找游戏更顺手哦!立即点击填写问卷 参与问卷