本文由第三方AI基于17173文章http://news.17173.com/content/03122026/110104332.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
国产万亿参数大模型再次爆发 但还不是DeepSeek V4
2026-03-12 11:01:04
神评论
17173 新闻导语
揭秘国产万亿参数大模型爆发!Hunter Alpha与Healer Alpha引发热议,但并非DeepSeek V4。了解V4最新爆料:1万亿参数、1M上下文、多模态输出,支持INT8算法,即将发布!
作为国产大模型中最受期待的明星,DeepSeek V4最近一直被传发布,但都落空了,现在又有新的大模型引发热议。
这次又是在OpenRuter平台出现的,而且是两个型号,一个代号Hunter Alpha,1万亿参数量,而且支持1M上下文,多模态输出。
另一个代号Healer Alpha,262K上下文,也是多模态,但没有公布参数量,输出速度更快。
很多人猜测Hunter Alpha就是即将发布的DeepSeek V4,但AI大模型评测大佬@karminski-牙医表示它不是V4,还是智谱的新模型,可能是智谱新一代旗舰大模型。
如果了解过DeepSeek的风格,大家也应该认为不是V4,DeepSeek发布新品之前没有在Openruter这样测试过,而是习惯低调上线,之后在群里发布一则简短的消息确认有新品。

DeepSeek V4这几天也有很多网传的新正经,比如1万亿参数量,MOE激活320亿参数,1M上下文,原生多模态,并且为昇腾910C平台优化,而不是只为NVIDIA或者AMD等国外芯片优化。
不过这些爆料可信度一般,目前比较可信一点的反而是下面这一条:知名量化专家@bdsqlsz被发现在HuggingFace上传了DeepSeek-V4-INT8权重,暗示了V4支持INT8算法,更关键的是这意味着V4这次真的差不多要发布了。
还有爆料说DeepSeek要求供应商在6-20号期间保持稳定,最近两天还在做最后的压力测试,很快就能发了。
反正耐心等等吧,好饭不怕晚。

【来源:快科技】
热门测试游戏

