-
400辆Robotruck在内蒙盈利了
自动驾驶,第一个完全收敛的赛道出现:内蒙西北部的鄂尔多斯市境内,此刻有400辆规模的L4卡车正在昼夜不停地承担矿产、畜牧等等大宗商品的货运。每辆无人的L4重卡,相比传统重卡,年净利直接提升100%左右,对物流公司、车队老...[详细]
-
多模态大模型首次实现像素级推理,3B参数超越72B传统模型,NeurIPS 2025收录
多模态大模型首次实现像素级推理,指代、分割、推理三大任务一网打尽!AI“看图说话”现在已经so easy,但即使是GPT-5、Gemini 2.5 Pro,也只能“看个大概”,难以进行更精确的目标识别和推理。对此,来自中国香港...[详细]
-
华中科大等发布OCRBench v2,Gemini获中文榜冠军但分数仅及格
过去几十年间,光学字符识别(OCR, Optical Character Recognition) 技术的定位与价值经历了从传统图像识别工具到智能信息系统核心能力的巨大演进,最初,其主要是将印刷体或手写文字从图像中提取并转换为可...[详细]
2025-10-14 21:12:19 -
FSDrive统一VLA和世界模型,推动自动驾驶迈向视觉推理
面向自动驾驶的多模态大模型在 “推理链” 上多以文字或符号为中介,易造成空间 - 时间关系模糊与细粒度信息丢失。FSDrive(FutureSightDrive)提出 “时空视觉 CoT”(Spatio-Temporal Chain-...[详细]
-
事关下一代大模型!斯坦福顶尖1%科学家许主洪加盟阿里通义
据媒体报道,近日,全球顶尖AI科学家、IEEE Fellow许主洪转岗加入阿里通义团队,将负责多模态交互模型方向。知情人士表示:这是正常的集团内部转岗。公开资料显示,许主洪拥有超20年AI产业和学术经验,是新加坡管理大学终...[详细]
-
曝顶级AI大牛,加入阿里通义,事关下一代大模型
智东西9月29日消息,据“互联网八卦小喇叭”等媒体爆料,全球顶尖AI科学家、IEEE Fellow许主洪(Steven Hoi)已加盟阿里通义,转向通义大模型的相关研发工作。?许主洪拥有超20年AI产业和学术经验,是新加坡管...[详细]
-
新智慧游戏与天禄电子竞技俱乐部达成战略合作,GameSkill首次助力职业战队备战国际电竞赛事
9月25日,新智慧游戏与国内顶级电子竞技俱乐部TYLOO(天禄)签署战略合作协议。双方将联合开展基于电竞多模态大模型的“专属AI教练”的开发和应用,打造最匹配电竞玩家的Game Agent,助力TYLOO构建智能、高效的科...[详细]
-
AI替你“剁手”的时代,真的来了
距离“百Agent混战”的序幕拉开已近一年,我们每个人的手机里,都或多或少地“饲养”着几个日益聪明的AI智能体(Agent)。多模态大模型的能力边界,早已远超我们去年的想象。此刻,你只需对着手机说一句:“根据我的年假和预...[详细]
2025-09-18 22:51:16 -
小红书开源最新多模态大模型dots.vlm1:性能跃升顶尖梯队
据媒体媒体报道,小红书人文智能实验室(Humane Intelligence Lab,简称 HI Lab)凭借其独特的多模态技术崭露头角。近日,该实验室宣布开源其最新的视觉语言模型dots.vlm1,此举不仅彰显了其技术自研的坚...[详细]
-
破晓之光 | 2025 ChinaJoy AIGC大会圆满召开
2025年8月1日,ChinaJoy AIGC大会在上海浦东嘉里大酒店三层上海宴会厅2召开。大会以“破晓之光”为主题,围统“AI基建与大模型重构的黎明之光”、“人形机器人与具身智能:从实验室到消费场景的跨越”、“AI驱动的...[详细]
-
行业首个:斑马智行发布高通 8397 端侧多模态大模型方案
据斑马智行消息,6 月 27 日,在 2025 高通汽车技术与合作峰会上,斑马智行联合高通、通义行业首发基于高通 8397 的智舱全场景端智能解决方案,并现场展示了该方案的开发预览版。▲ 图源:斑马智行公众号 |?斑马智行 CTO 司罗现场发...[详细]
-
小米多模态大模型 MiMo-VL 开源,官方称多方面领先 Qwen2.5-VL-7B
Xiaomi? MiMo 官方公众号今日发文宣布,小米多模态大模型 Xiaomi MiMo-VL 现已正式开源。官方表示,其在图片、视频、语言的通用问答和理解推理等多个任务上,大幅领先同尺寸标杆多模态模型 Qwen2.5-VL-7B...[详细]
-
文心4.5「出世」即免费,原生多模态大模型的红利期来了?
当成本与能力不再矛盾,AI应用落地就不再是一个选项,而是必然会发生的事。3月16日,百度正式发布了文心大模型X1、文心大模型4.5,两款模型目前已经在文心一言官网上线,免费向用户开放。自2019年3月文心大模型1.0版本...[详细]