17173 > 游戏资讯 > 科技新闻 > 正文

浪潮源 Yuan3.0 Ultra 多模态基础大模型开源发布:万亿参数,企业级任务表现突出

2026-03-06 10:01:11 神评论
17173 新闻导语

浪潮开源万亿参数Yuan3.0 Ultra多模态大模型!专为企业级任务优化,支持文档理解、RAG、表格分析,提升AI智能体效率。立即获取开源代码!

3 月 6 日消息,浪潮旗下 YuanLab.ai 团队今日开源发布源 Yuan3.0 Ultra 多模态基础大模型,这是一款面向万亿参数规模打造的旗舰模型。

Yuan3.0 Ultra 将 MoE 大模型的训练效率优化系统性引入模型结构设计之中,并围绕企业应用及智能体工具调用等方面开展了深度优化,在多模态文档理解、检索增强生成(RAG)、表格数据分析、内容摘要与工具调用等企业级任务中表现突出。

这些能力使源 Yuan 大模型能够处理企业环境中的复杂信息形态,如图文混排文档、多级结构表格以及跨文档知识检索,为基于 OpenClaw 等智能体框架构建多模态数据驱动的企业 Agent AI 提供能力支撑。

Yuan3.0 Ultra 采用统一多模态模型架构,由视觉编码器、语言主干网络与多模态对齐模块组成,实现视觉与语言信息的协同建模。其中,语言主干网络基于混合专家(MoE)架构构建,包含 103 层 Transformer,训练初始阶段参数规模 1515B,通过 LAEP 方法创新,团队在预训练过程中将模型参数优化至 1010B,预训练算力效率提升 49%。

Yuan3.0 Ultra 的激活参数为 68.8B。此外,模型还引入了 Localized Filtering Attention(LFA)机制,强化对语义关系的建模能力,相比经典 Attention 结构可获得更高的模型精度表现。

Yuan3.0 Ultra 大模型全面开源,不仅包括模型权重(16bit 与 4bit 模型)、技术报告,也涵盖完整的训练方法与评测结果,支持社区在此基础上进行二次训练与行业定制。

源 Yuan3.0 基础大模型将包含 Flash、Pro 和 Ultra 等版本,模型参数量为 40B、200B 和 1T 等,相关成果将陆续发布。附 Yuan3.0 Ultra 开源地址如下:

https://github.com/Yuan-lab-LLM/Yuan3.0-Ultra

【来源:IT之家】
关于Yuan3.0 Ultra,多模态基础大模型,万亿参数,MoE,企业级任务,开源,检索增强生成,智能体,视觉编码器,Transformer的新闻
亲爱的 17173 玩家们~我们正在打磨平台的找游戏功能,想听听你平时是怎么筛选、导航找游戏的?你的真实习惯和偏好,能让后续找游戏更顺手哦!立即点击填写问卷 参与问卷