-
DeepSeek V4 Lite 原生多模态 AI 曝光:百万 tokens 上下文,非思考生图秒杀前代
2 月 26 日消息,消息源 @legit_api 今天(2 月 26 日)在 X 平台发布推文,报道称 DeepSeek 正在测试 V4 Lite 模型,代号为“Sealion-lite”,上下文窗口为 100 万 tokens,并是原生支持多模态推理。...[详细]
2026-02-26 18:09:51 -
研究显示:AI 生成人脸已“好得不真实”,人类识别能力落后于技术进步
感谢网友 不一样的体验 的线索投递! 2 月 21 日消息,新南威尔士大学(UNSW Sydney)和澳大利亚国立大学(ANU)前天发布的一项研究表明,大多数人虽然相信自己能识别 AI 生成的人脸,但这种直觉已经跟不上技术发展。▲ 上图有六...[详细]
-
免注册、免费用:DuckDuckGo 上线 AI 修图功能
2 月 20 日消息,DuckDuckGo 昨日(2 月 19 日)发布博文,宣布旗下隐私 AI 平台 Duck.ai 上线 AI 图像编辑功能,该功能可免费使用(有限额),且无需注册账户即可直接使用。DuckDuckGo 已于 2025 年年底推出图...[详细]
2026-02-20 10:02:44 -
Apple Creator Studio 用户反馈苹果 AI 额度触顶过快:官称 50 个 PPT,测试仅能做 2 个
2 月 13 日消息,科技媒体 Appleinsider 昨日(2 月 12 日)发布博文,报道称苹果在其 Apple Creator Studio 套件中大力宣扬“无限创意”,但实际测试表明其生成式 AI 功能存在隐性限制。苹果公司 1 月上架 App...[详细]
2026-02-13 10:03:56 -
蚂蚁集团发布并开源全模态大模型 Ming-Flash-Omni 2.0,看得更准、听得更细、生成更稳
感谢网友 若怡 的线索投递! 2 月 11 日消息,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出。据介绍,Ming-Fl...[详细]
2026-02-11 12:03:44 -
性能对标Gemini 2.5 Pro!蚂蚁开源新一代全模态大模型Ming-Flash-Omni 2.0
2月11日消息 今日,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越 Gemini 2.5 Pro,成为...[详细]
2026-02-11 12:01:49 -
文字渲染更专业,阿里千问推出新一代图像生成基础模型 Qwen-Image-2.0
感谢网友 F宝、Domado、斯文当不了饭吃 的线索投递! 2 月 10 日消息,今日阿里千问宣布推出新一代图像生成基础模型 Qwen-Image-2.0。据介绍,Qwen-Image-2.0 主要特色包括:更专业的文字渲染:1k tok...[详细]
2026-02-10 16:06:36 -
千问Qwen-Image-2.0发布!超强文字渲染 信息图 PPT轻松做
今日,阿里巴巴正式发布新一代图像生成及编辑模型Qwen-Image-2.0。作为千问大模型的图像生成模型底座,Qwen-Image-2.0集生图和编辑于一体,在AI Arena文生图评测中斩获1029分,超过Seedrea...[详细]
2026-02-10 16:04:48 -
日本学生利用Grok“脱衣”同班女生 现担心面临刑事责任
一系列围绕X公司旗下AI工具Grok的事件在日本引发关注。部分日本中学生和大学生被发现,在未经当事人同意的情况下,利用Grok生成同学的性暗示或性化图像,这一行为已引起广泛不安,相关使用者也开始担心可能面临法律后果。自2...[详细]
-
历史一刻!华为:SOTA多模态模型首次在国产芯片上完成全程训练 实测效果惊艳
今日,华为、智谱宣布,双方联合开源新一代图像生成模型GLM-Image,模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程,是首个在国产芯片上完成全程训练的SOTA多模态模型。...[详细]
-
NVIDIA RTX PRO 5000 72GB正式上市!显存狂增50%、性能提升3.5倍
NVIDIA宣布,基于Blackwell架构的RTX PRO 5000专业显卡的72GB显存升级版现已全面上市。该产品的推出,旨在为AI开发者提供在48GB基础款,与96GB旗舰款(RTX PRO 6000)之间的完美过渡方案,...[详细]
2025-12-19 13:01:07 -
AI颠覆朋友圈
TheVerge的编辑想研究一下AI生图进化到哪一步了,她试用谷歌的Nano Banana Pro工具后惊讶地发现,由AI生成的图像逼真得难以置信,这下她知道这个工具为什么叫“Banana”了(俚语有疯癫的意思)。这张合影在...[详细]
2025-12-05 23:35:36 -
6B参数硬刚旗舰模型 阿里最新生图模型掀桌了
近日,阿里通义实验室低调推出的新一代模型Z-Image-Turbo迅速成为焦点。数据显示,这张细节繁复的图像在RTX4090显卡上仅耗时2.3秒即渲染完成,而显存占用指针稳稳地停在了13GB。这一成绩让无数围观的开发者和...[详细]
2025-11-28 16:39:49 -
OpenAI全球上线ChatGPT群聊功能:最多支持20人同时在线
据媒体报道,OpenAI的ChatGPT群聊功能正式面向全球所有登录用户开放,覆盖免费版、Go版、Plus版及Pro版订阅计划。这标志着ChatGPT从“个人智能助手”向“协作平台”转型。用户现可通过任意对话界面右上角的...[详细]
2025-11-21 20:01:00 -
谷歌宣布推出大模型Gemini 3:图像生成、编程与AI搜索全面增强
当地时间周二,Alphabet旗下的谷歌宣布发布其最新的人工智能(AI)模型Gemini 3,在与OpenAI等公司的竞赛中加快追赶步伐。受此消息影响,谷歌A盘中股价爆拉3%。Alphabet首席执行官桑达尔·皮查伊当天表...[详细]
-
谷歌最“离谱”AI名字诞生!Nano Banana本是占位符
谷歌在最新一期《Made by Google》播客中揭晓了其AI生图模型“Nano Banana”这一有趣名称的由来。该名称最初只是产品经理在深夜工作中随意构思的临时占位符,却因模型爆红后受到用户广泛喜爱,最终被官方正式采纳。...[详细]
2025-11-08 10:40:18 -
谷歌 Chrome 浏览器 Canary 测试版打造“AI 首页”,整合 Deep Search 和 Nano Banana
据外媒 Windows Report 今日报道,谷歌在 Chrome 浏览器的最新 Canary 测试版中,为“新标签页”加入了两项由 Gemini AI 驱动的新功能按钮 ——“Nano Banana”和“Deep Search”。这两项新工具...[详细]
2025-10-31 22:48:30 -
用AI骗报销 “假小票”越来越逼真 全球企业叫苦不迭
随着AI技术的持续发展,不少欧美企业近来正越来越多地被员工使用一种“老套骗局”所欺骗:伪造报销单据。据多家费用管理软件平台透露,OpenAI和谷歌等顶尖AI公司近几个月来推出的新型图像生成模型,已引发企业内部涌现大量由A...[详细]
-
AI渗透Windows 画图新增Restyle功能:生成不同艺术风格图片
随着生成式AI日渐渗透到Windows系统的各个角落,画图(Paint)应用也不例外。微软正在为Windows 11的画图添加一项全新的AI功能,名为Restyle,可以帮助用户轻松地将现有图像重新设计成各种艺术风格。这项...[详细]
2025-10-25 09:03:53 -
微软推出首款自研 AI 图像生成器 **,降低对 OpenAI 依赖
微软正持续推出内部开发的人工智能模型,进一步降低对**伙伴 OpenAI 的依赖。今天,微软推出了其首款内部开发的图像生成式 AI 模型 **。据** 在生成逼真图像方面表现尤为出色,能够创建自然的光照效果和景观场景。目前,该模型正...[详细]
-
Bug变奖励:AI的小失误,揭开创造力真相
你一定见过那些奇怪的AI画:人物手上多出几根手指、脸部细节怪异,却又带着某种说不出的新鲜感。这让人产生一个疑问:扩散模型明明只「复刻」,为什么还能画出前所未见的作品?最新一项研究给出了答案:其实,AI的创造力并非「神来之...[详细]
2025-10-13 22:30:07 -
大模型的尽头是开源
大模型的战争,正悄然换牌。闭源一度是顶尖玩家的主流选择,视为坚实护城河。然而,2025年9月,阿里、腾讯、百度等大厂几乎同一时间,将模型开源大举摆上牌桌,集中且密集的动作令人关注。从能看图、能对话,到能写代码、能做3D建...[详细]
-
腾讯混元视觉模型跻身全球Top 3 国内排名第1
日前,腾讯混元宣布,国际大模型竞技场LMArena发布最新视觉模型榜单,腾讯混元最新视觉模型Hunyuan-Vision-1.5-Thinking表现抢眼,取得全球第三,国内第一的成绩。据介绍,LMArena是美国加州大...[详细]
2025-10-08 13:21:05 -
可能是目前效果最好的开源生图模型 混元生图3.0来了
腾讯混元最新发布并开源原生多模态生图模型——混元图像3.0(HunyuanImage 3.0)!模型参数规模高达80B,是目前参数量最大的开源生图模型。同时,HunyuanImage 3.0将理解与生成一体化融合,也是首个开...[详细]
-
“香蕉”模型爆火出圈,《GoogleGemini》美区免费榜霸榜,AI发展进入新阶段?
9月13日,谷歌旗下AI大模型同名应用《Google Gemini》达成了自去年11月上线以来的历史性突破,即超越赛道内长期被视为无可撼动的领导者,OpenAI旗下大模型同名应用《ChatGPT》,成功登顶美国地区App S...[详细]
2025-09-25 13:51:06 -
Nano Banana团队谈AI产品和图像模型:最终希望各种模态能融合在一起
在美国红点创投的播客Unsupervised Learning最新一期节目中,红点创投合伙人Jacob Effron对话了负责Nano Banana的两位Google研究员Nicole Brichtova和Oliver Wang。...[详细]
2025-09-18 22:57:10 -
首个图像生成基础模型 阿里通义千问深夜开源Qwen-Image 支持中英双语
今天凌晨,阿里通义千问宣布开源Qwen-Image,一个20B的MMDiT模型。这是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得显著进展。据了解,该模型专注于提升AI在两大核心场景的能力:复...[详细]
2025-08-05 13:42:06 -
OpenAI 扩展 Responses API:支持 MCP、图像生成等
OpenAI 公司昨日(5 月 21 日)发布博文,宣布扩展 Responses API,支持远程连接 MCP 服务器、图像生成、Code Interpreter 以及文件搜索优化等,帮助开发者构建更智能的智能体应用。Responses AP...[详细]
-
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成
首次在统一框架内实现理解与生成的“双优表现”,打破了多模态统一建模的僵局!复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领...[详细]
-
图像生成技术新突破:小米大模型团队提出对角蛇形自回归图像生成方式,超越此前所有自回归方法
小米大模型团队与北大信科提出了一种具有方向感知的对角蛇形扫描自回归图像生成框架(DAR,diagonal snake-likeorder),有效地确保相邻索引的 token 在空间上紧密相邻。相对于传统的逐行生成方式,它可以沿...[详细]