-
比利时 Imec 公布 3D CCD 内存架构,结合 DRAM 速度与 NAND 密度提升 AI 推理性能
5 月 19 日消息,比利时研究机构 Imec 于 5 月 12 日发布博文,展示了一种 3D CCD 内存架构,目标结合 DRAM 的高速度与 NAND 闪存的存储密度,提升 AI 推理性能。针对当前 AI 加速器常见的“内存墙”(算力还在等数据,无法持续处...[详细]
-
英伟达Vera CPU交付即爆单 甲骨文承诺部署数十万颗
据媒体报道,英伟达宣布,其首款专为Agentic AI(智能体AI)设计的CPU——Vera,已完成对Anthropic、OpenAI、SpaceX AI及甲骨文云的首批交付。Vera专为满足Agent AI对CPU的严苛需求...[详细]
2026-05-19 12:00:30 -
无锡将建立一座大规模“Token工厂”:首批将部署4台华为昇腾384
据媒体报道,弘信电子与无锡高新区合作,成功签约落户江苏省首个基于华为昇腾384超节点的算力集群。与此同时,以该超节点集群为首期基础设施,弘信电子将在无锡建设一座大规模Token工厂,力争打造规模化、高性能的“国芯国模”算...[详细]
-
性能两倍于x86处理器 ARM CPU预计5年后销售额可达1000亿以上
随着AI推理对CPU价值的重耕,最近CPU行业来了一波复兴,不仅AMD、Intel股价大涨,ARM也成为焦点。此前的财报会议上,ARM CEO提出了野心勃勃的目标,他们确信到2030年,按CPU类型划分的最大市场份额将属于...[详细]
-
AMD 推出 vLLM-ATOM 插件,加速 DeepSeek、Kimi 等 AI 推理性能
感谢网友 华南吴彦祖 的线索投递! 5 月 12 日消息,科技媒体 Wccftech 昨日(5 月 11 日)发布博文,报道称 AMD 推出 vLLM-ATOM 插件,在不改动现有 vLLM 命令、API 和工作流的前提下,提升 DeepSeek-R1、Ki...[详细]
-
30TBs带宽碾压HBM 国产内存新架构技术问世:不依赖国外供应链
随着AI需求转向推理时代,算力不再是主要瓶颈,内存墙的问题愈发严重,高带宽低延迟的内存架构成为挑战,现在国内公司也通过架构创新实现了飞跃。日前新紫光集团宣布推出“紫弦”三维化近存计算(PNM)架构,以3D DRAM为核心,...[详细]
-
台积电太忙 三星趁虚而入:AMD下一代CPU将打上三星造标签
据知名爆料人Jukan援引大真证券最新发布的报告称,三星晶圆代工厂成功从一家北美客户手中赢得了一份2nm笔记本CPU订单。虽然报告原文以“北美客户”代称,但业内均猜测该客户指的是AMD。这一消息与此前AMD正与三星进行订...[详细]
-
DeepSeek V4引爆软件栈大战!AMD ROCm 14天性能暴涨75倍:硬刚NVIDIA CUDA
SemiAnalysis旗下InferenceX性能测试平台发布的最新测试数据显示,自DeepSeek V4大模型发布以来,AMD ROCm软件栈在约14天内实现了75倍的推理吞吐提升。该测试覆盖了FP4和FP8精度下的8K...[详细]
2026-05-11 11:04:27 -
消息称 AI 芯片企业 Cerebras IPO 获 20+ 倍超额认购,拟调升发行价近三成
5 月 11 日消息,路透社当地时间昨日报道称,消息人士透露 AI 芯片企业 Cerebras 即将进行的 IPO 受到了投资者的重点关注,超额认购倍率突破 20。根据资本信息平台 Dealogic 的数据,有望成为 2026 年以来全球资本市场最...[详细]
-
慧荣科技总经理苟嘉章预警:NAND 闪存缺货潮或延续至 2028 年
5 月 11 日消息,据中国台湾地区媒体《经济日报》昨天报道,慧荣科技(注:Silicon Motion)总经理苟嘉章表示,AI 投资重心正在从训练快速转移至推理,进一步带动内存、存储需求增长。目前情况下,NAND 闪存可能一路缺货...[详细]
-
MI350P携开放软件栈上市 AMD高端AI卡对标英伟达!
近期,AMD正式推出Instinct MI350P PCIe AI加速卡,这也是品牌四年以来首款PCIe接口的Instinct系列产品。新品搭载CDNA4架构与台积电3nm工艺,主打企业AI推理场景,支持即插即用,部署十分...[详细]
-
AMD突然发新卡!用上144GB大显存+600W功耗
AMD正式发布Instinct MI350P PCIe GPU加速卡,这是AMD四年来首款PCIe接口的Instinct产品,基于CDNA 4架构和台积电3nm工艺,面向企业AI推理场景,主打"即插即用"的部署体验。MI350P本质...[详细]
2026-05-08 15:49:35 -
AMD发布MI350P:四年来首款PCIe Instinct加速卡!144GB显存、600W功耗
AMD正式发布Instinct MI350P PCIe GPU加速卡,这是AMD四年来首款PCIe接口的Instinct产品,基于CDNA 4架构和台积电3nm工艺,面向企业AI推理场景,主打"即插即用"的部署体验。MI350P本质...[详细]
2026-05-08 10:00:36 -
平头哥发布首款智能网卡磐脉 920 补齐AI算力最后一块短板
最近两年,AI 行业最热的词一直绕不开「算力」。从大模型训练,到今年 Agent 的火热,再到各家云厂商不断扩建智算中心,行业讨论最多的,几乎都是 GPU、芯片和算力规模。好像只要卡够多,AI 就能继续往前跑。但现实并不是。不少做...[详细]
-
国产GPU就是牛!摩尔线程全链路适配DeepSeek-V4
摩尔线程的旗舰级AI训推一体智算卡MTT S5000,搭配自研的MUSA软件栈,基于SGLang开源推理框架,成功完成了DeepSeek-V4的完整运行验证。至此,摩尔线程已构建起从硬件架构核心计算引擎承接、热点算子支持,...[详细]
2026-05-01 17:03:04 -
700万元一台还抢不到!NVIDIA B300服务器价格暴涨:较去年底近乎翻倍
据报道,NVIDIA B300 AI服务器在中国大陆市场的成交价已飙升至每台约700万元人民币,约合100万美元,较去年底的约400万元近乎翻倍。作为参照,搭载8块B300 GPU的同款服务器在美国市场的售价约为55万美元,仅...[详细]
2026-05-01 16:04:05 -
RTX 5070 12GB移动版跑分出炉:和8GB版完全一样!
笔吧对首批搭载RTX 5070 12GB移动版显卡的机械革命耀世18 Pro进行了测试,结果显示其在多项基准测试中与现有8GB版几乎完全持平。为缓解RTX 5070系列持续供不应求的局面,NVIDIA日前宣布将为移动平台推出12...[详细]
-
良率升至 80%,消息称三星 4nm 芯片工艺迈入成熟生产阶段
4 月 30 日消息,《首尔经济日报》昨日(4 月 29 日)报道,三星代工厂在 4nm 工艺上取得关键进展,良率已提升至 80%,标志着该工艺进入成熟生产阶段。三星 4nm 工艺于 2023 年 11 月启动量产,此次良率突破为其争取更多客户订单奠...[详细]
-
NPU资源谁也别想独占!AMD时间片机制逼退流氓应用:Intel早已动手
据报道,AMD正在为AMDXDNA加速器驱动程序准备一项名为“硬件调度器时间片”的新功能,专门用于防止单个应用独占锐龙 AI NPU的全部资源。这项功能直指NPU多用户场景下的核心痛点:长时间运行的AI推理任务可能持续占用全...[详细]
-
不用GPU也能跑AI!英特尔至强6联手微软Azure Local:从几百台干到几千台
英特尔与微软联合宣布,利用全新的至强6处理器,将Azure Local平台的部署规模从数百台直接拉升至数千台服务器。尤为关键的是,这种跨越式升级无需对现有数据中心架构进行重新设计。过去,部署大模型推理就意味着额外砸钱购买G...[详细]
2026-04-28 18:02:50 -
告别周末通宵配环境!Ubuntu 26.04重磅发布:NVIDIA CUDA和AMD ROCm原生支持
Canonical近日正式发布代号“Resolute Raccoon”的Ubuntu 26.04 LTS,将NVIDIA CUDA和AMD ROCm两大GPU计算框架原生集成到官方软件仓库。终结了Linux用户多年来GPU计算环境...[详细]
2026-04-28 13:00:44 -
富士康独家代工!英伟达Groq 3 LPX预计于2026年第三季度提前发货
英伟达Groq 3 LPX芯片预计在2026年第三季度提前发货。最初行业预估今年Groq 3 LPX出货量有限,但目前供应链报告数据显示,LPX机架内使用的LP30和LP35芯片今年出货量将达到150万颗,到2027年将进一步增...[详细]
2026-04-28 11:03:00 -
内存价格是降不下来了 谷歌AI芯片直接上2PB HBM:成功打破内存墙
内存价格这一年来涨了3-5倍,已经严重影响了大家对PC和手机的消费意愿,而导致这次内存大涨价的元凶就是AI需求太猛。大家都知道AI对内存(GPU上算显存)的容量及带宽要求都很高,但具体能高到什么程度?谷歌前几天发布的第八...[详细]
-
中紫星 NEU 智能原生芯片 Q4 流片:速度达顶级 GPU 百倍,且功耗降低九成
感谢网友 若怡 的线索投递! 4 月 25 日消息,在当今全球算力竞争白热化、AI 模型参数量不断膨胀并走向物理世界之际,传统 GPU 架构在超低延迟与高能效比上的局限性正日益凸显。据《科创板日报》,上海中紫星技术有限公司研发了一款名为 N...[详细]
-
PC玩家太难!CPU又要涨价了:Intel确认砍消费级产能
Intel在Q1 2026财报电话会议上透露,由于AI推理和Agentic AI工作负载激增,数据中心CPU需求急剧攀升,公司已将晶圆产能从消费级芯片转向Xeon服务器处理器。Intel CFO David Zinsner在会上表...[详细]
-
起步价约2.94万元!英伟达RTX PRO 4500服务器卡发布:10496CUDA核心+无风扇设计
英伟达RTX PRO 4500 Blackwell服务器版(简称RTX 4500 BSE)于4月24日上架开售。这款基于Blackwell架构的专业显卡自3月公布后,现已通过英伟达官网标注现货供应,并直接链接至官方商城。?在202...[详细]
2026-04-25 19:30:44 -
英特尔“库存”CPU 因 AI 推理需求意外售罄,带动股价创历史新高
4 月 25 日消息,据路透社 4 月 24 日报道,今年第一季度,AI 服务企业对英特尔 CPU 的需求异常强劲,甚至连英特尔把原本已经减记的芯片也卖掉了。这一反转相当罕见,也直接推高了英特尔周五的股价。英特尔早盘一度大涨超过 24%,股价...[详细]
-
PC玩家太难了!CPU又要涨价了:Intel确认砍消费级产能
Intel在Q1 2026财报电话会议上透露,由于AI推理和Agentic AI工作负载激增,数据中心CPU需求急剧攀升,公司已将晶圆产能从消费级芯片转向Xeon服务器处理器。Intel CFO David Zinsner在会上表...[详细]
-
CPU正在卡AI的脖子 Intel:这可不是我们自己吹牛 是客户说的
Intel今天凌晨发布了Q1季度财报,营收136亿美元,同比增长7.2%,虽然没有GPU或者内存那样暴涨几倍的业绩,但也超过了市场预期。这个业绩公布之后,Intel股价一度大涨17%,这不只是业绩变动引发的,而是Inte...[详细]
-
谷歌推出第八代TPU:最高提升2.8倍 训练推理首次拆分
谷歌云2026 Next大会召开,谷歌正式发布了第八代张量处理器(TPU)。这是谷歌史上首次将AI训练与推理任务拆分至两款独立芯片——专为模型训练设计的TPU 8t与专为推理优化的TPU 8i,标志着其AI硬件战略的重大调整。...[详细]