-
DeepSeek V4适配国产芯片!摩尔线程MTT S5000实现Day-0支持
4月24日消息,今日,DeepSeek正式上线V4预览版并宣布开源,该模型支持百万字超长上下文处理。摩尔线程联合智源众智FlagOS社区宣布,在旗舰AI训推一体GPU MTT S5000上,完成对DeepSeek-V4-Fl...[详细]
2026-04-24 17:02:44 -
小米首次!Xiaomi MiMo-V2.5-Pro登顶全球开源大模型第一
4月23日消息,小米官方今天正式宣布,Xiaomi MiMo-V2.5-Pro登顶全球权威榜单,成为全球开源大模型综合智能指数并列第一,同时Agent专项指数开源第一,跻身全球所有大模型总榜前五,比肩Claude Opus 4...[详细]
2026-04-23 16:02:28 -
阿里通义 Fun-ASR1.5 语音识别大模型发布:精通 30 国语言及中文七大方言
4 月 20 日消息,4 月 20 日(今天)下午,阿里通义实验室正式推出语音识别大模型 Fun-ASR1.5。其基于统一的大模型架构,单模型即可覆盖 30 种语言、汉语七大方言体系及 20+ 地方口音,古诗词吟诵也能精准转写。目前,Fun-...[详细]
2026-04-20 16:06:53 -
比预期还要高60% DeepSeek V4参数量有望达到1.6万亿
距离4月下旬没有几天了,DeepSeek V4大模型的发布牵动人心,昨天该公司研究人员突然更新了DeepGEMM算子库,被视为V4发不动的千兆。然而他们显然也预料到了外界的反应,更新之后还额外添加了一个说明,强调这次更新只...[详细]
2026-04-17 20:01:25 -
消息称印度 AI 企业 Sarvam 启动新一轮融资,英伟达、亚马逊预计参与
4 月 3 日消息,彭博社在北京时间今日凌晨的一份报道中提到,印度 AI 初创企业 Sarvam 正以 15~15.5 亿美元(注:现汇率约合 103.42 ~ 106.87 亿元人民币)的估值进行新一轮融资,计划筹集 3~3.5 亿美元(现汇率约合...[详细]
-
不让中国公司独美 谷歌开源AI大模型Gemma 4即将问世:4倍参数量
开源AI大模型目前是中国科技公司主导,美国的科技巨头在AI时代基本转向了闭源,但为了不让中国公司完全占据市场,美国巨头也会象征性拿出开源大模型,谷歌的Gemma 4很快要发了。Gemma 4要发布的消息传了有段时间了,现在谷...[详细]
-
小米自研大模型!MiMo-V2-Pro晒成绩单:综合实力全球前五
小米今天公布旗下万亿参数旗舰基座大模型MiMo-V2-Pro最新成绩,该模型在全球平台调用量和权威评测榜单中均取得突破性表现,且限免调用活动已延长。在OpenRouter平台,MiMo-V2-Pro表现尤为突出,上线首周...[详细]
2026-03-31 19:00:55 -
Mistral 发布 119B-A6B 模型 Small 4,首次兼顾推理、多模态、编程优势
3 月 20 日消息,Mistral AI 当地时间本月 16 日宣布推出 Mistral Small 4 模型,这是这家欧洲领先 AI 实验室首款结合旗舰推理模型、多模态模型、编程模型优势的综合性 LLM,用户无需在多种各有优势的模型中进行选择,...[详细]
2026-03-20 12:03:44 -
小米AI团队平均年龄仅25岁!雷军宣布未来三年将对AI投入超600亿元
在今晚小米春季新品发布会上,雷军详细披露了小米在AI大模型领域的最新核心数据与研发进展。雷军宣布,小米未来三年在AI领域的投资计划将至少达到600亿元,而今年的AI研发与资本开支已超过160亿元。其首款自研旗舰大模型Mi...[详细]
2026-03-19 22:00:36 -
腾讯混元2.0正式发布:推理能力/效率业界领先
快科技12月6日消息,腾讯自研大模型混元2.0(Tencent HY 2.0)正式发布,同时DeepSeek V3.2也在腾讯生态内逐步接入。目前,这两大模型已率先在元宝、ima等腾讯AI原生应用中上线,腾讯云也已开放相关模型...[详细]
2025-12-06 18:41:48 -
字节跳动豆包团队开源MoE架构优化技术:可将大模型训练效率提升1.7倍
据报道,字节跳动旗下豆包大模型团队近日宣布了一项关于混合专家(MoE)架构的重要技术突破,并决定将这一成果开源,与全球AI社区共享。这一技术通过一系列创新方法,成功将大模型的训练效率提升了约1.7倍,同时显著降低了训练成...[详细]