本文由第三方AI基于17173文章http://news.17173.com/content/03052026/100521865.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
微软发布 Phi-4-Reasoning-Vision-15B 开源模型,能自主决定何时思考的小型多模态 AI
2026-03-05 10:05:21
神评论
17173 新闻导语
微软发布Phi-4-Reasoning-Vision-15B开源模型,小型多模态AI能自主切换推理模式,实现图表分析到GUI自动化的智能应用。点击了解性能对比!
感谢网友 不一样的体验、补药吖 的线索投递! ▲ 非推理模式 ▲ 推理模式
3 月 5 日消息,据微软官方开发者社区博客今日消息,微软发布了一款 Phi-4-Reasoning-Vision-15B 模型,这是一款视觉推理模型。
它结合了高分辨率视觉感知与选择性、任务感知的推理,使其成为 Phi-4 系列中首个同时实现“看得清楚”和“想得深入”的小语言模型(SLM)。

传统的视觉模型仅执行被动的感知 —— 识别图像中“有什么”。Phi-4-Reasoning-Vision-15B 更进一步,执行结构化、多步骤的推理:理解图像中的视觉结构,将其与文本上下文连接,并得出可操作的结论。这使开发者能够构建从图表分析到 GUI 自动化的智能应用。

该模型最关键的设计特征是其混合推理行为。它可以根据提示在“推理模式”和“非推理模式”之间切换:
当需要深度推理时(例如数学问题、逻辑分析)→ 启用多步推理链
当快速感知足够时(例如,OCR、元素定位)→ 直接输出以降低延迟
该模型最重要的应用领域之一,就是搭配计算机智能体使用。模型接收一个屏幕截图和自然语言指令后,可输出目标 UI 元素的标准化边界框坐标,其他智能体模型可以执行点击、滚动和其他交互。
以下是 Phi-4-Reasoning-Vision-15B 与其他模型在关键任务上的性能对比:


附开源地址如下:
https://huggingface.co/microsoft/Phi-4-reasoning-vision-15B
【来源:IT之家】
今日热点
- 《大话西游2》元宵节任务灯谜与字谜答案整理!欢迎补充
- 一看吓一跳:雷死人不偿命的囧图集(1033)
- 经典MMORPG《冒险岛M》上线PC!盘点3月外服端游
- 一看吓一跳:雷死人不偿命的囧图集(1035)
- 一看吓一跳:雷死人不偿命的囧图集(1034)
- 正惊GIF:人神共愤!如此漂亮女教师被气到动手,学生竟一脸无所谓
- 颜值COS,玉足、白丝过膝袜,体操服双马尾,简直太迷人
- 一看吓一跳:雷死人不偿命的囧图集(1036)
- 热游情报:宝可梦、守望、古印度黑猴新作曝光!首款二次元GTA抢先定档
- 2月多款重磅新游测试:腾讯网易完美新作齐发、经典韩国MMO新作
- 《蔚蓝档案》「白丝透肤VS发光腹肌!砂狼白子体操服侧拍,腰线凹陷度堪比3D建模」
- 「体操服の‘液态曲线’!橘望顶配身材|白丝厚D呼之欲出,腰臀比秒杀建模」
- 《燕云十六声》掌中宝+特殊蹊跷位置大全,三寸之身任务合集,仅剩7天10连抽连袅袅之音!
- 经典MMORPG《冒险岛M》上线PC!盘点3月外服端游
- 「纯欲天花板」2B花嫁撕破次元!白丝过膝陷肉感,透粉脚底VS发光蛮腰の双重暴击
- 《传奇5》真的要来了?还有《绝地求生》衍生作上线!盘点2026年能够玩到的韩国游戏
- 《大话西游2》元宵节任务灯谜与字谜答案整理!欢迎补充
- 和平精英2025灵敏度分享码:最稳压枪灵敏度方案推荐
- AI大姐姐:胸猛美女,挑战你的视觉极限(221)
- 《魔兽世界》时光服:附魔1-450快速性价比冲级攻略

