-
与联发科共同设计!英伟达GB10芯片算力实测达1 PFLOP
在英伟达开发者论坛上,有博主利用DGX Spark设备实测跑出1 PFLOP级别的峰值算力。该博主自行构建了命令行界面(CLI)工具,用于测量DGX Spark的吞吐性能。测试结果显示,在NVFP4精度下,算力约为1014–1...[详细]
-
Tensordyne Napier 流片:宣称平台 AI 推理吞吐 13 倍于 Blackwell 系统
6 月 16 日消息,北美-欧洲 AI 芯片初创企业 Tensordyne 当地时间 15 日宣布推出 AI 推理系统 Tensordyne Napier (TDN),宣称其可实现 NVIDIA Blackwell 系统 17 倍的按 Token(词元)计能效...[详细]
2026-06-16 12:05:09 -
边玩游戏边跑大模型!AMD RX 7900 GRE首次实现DX12+ROCm双任务并发
AMD显卡用户在Windows系统下试图同时运行AI推理和大型DX12游戏时,显卡常因驱动级资源冲突崩溃,错误代码为exit code 2或0xc0000005。这一困扰开发者数年的局面,近日被GitHub用户Beat-k通...[详细]
2026-06-15 12:03:10 -
富国银行:亚马逊 AWS 为降低 AI 推理成本,有望采购高通 AI200 芯片
感谢网友 华南吴彦祖、不一样的体验 的线索投递! 6 月 14 日消息,据 Wccftech 报道,富国银行 (Wells Fargo) 的最新研究报告指出,高通有望深化与亚马逊旗下 AWS 部门在人工智能芯片领域的合作关系,为亚马逊 AWS 提供 A...[详细]
-
谷歌推出DiffusionGemma文本扩散AI模型:本地AI推理速度提4倍
据媒体报道,谷歌正式发布全新开放人工智能模型DiffusionGemma。该模型基于文本扩散机制打造。相比传统自回归大语言模型,本地AI推理速度提升4倍,为端侧及本地人工智能应用优化开辟了新路径。当前,GPT、Gemin...[详细]
2026-06-11 19:00:56 -
史上首次!AMD Lemonade SDK新增NVIDIA CUDA支持
AMD主导开发的开源本地AI服务器解决方案Lemonade发布了10.7版本,正式集成NVIDIA CUDA后端,首次实现对NVIDIA GPU的完整本地AI推理适配。Lemonade此前已广泛支持AMD Ryzen AI NPU...[详细]
2026-06-11 13:00:25 -
小米发布MiMo-V2.5-Pro-UltraSpeed:生成速度提升10倍!突破1000 tokens/s
6月9日消息,小米联合TileRT正式推出MiMo-V2.5-Pro-UltraSpeed,实现行业里程碑式突破:基于万亿参数大模型,在单台标准8卡通用GPU节点上,首次将文本生成速度提升至1000 tokens/s。甚至...[详细]
2026-06-09 09:01:26 -
Intel至强6+:再现CPU王者之风!一个机柜60000+核心
随着AI重心从训练转向推理,尤其是加速进入Agentic AI智能体时代,GPU加速器、CPU处理器的角色悄然间发生了翻天覆地的变化。整个行业都意识到,GPU为王的时代已经过去了,CPU正在回归C位,重新成为数据中心算力需...[详细]
-
铠侠计划 2026 年夏天出样下代 BiCS10 1Tb TLC NAND 闪存
6 月 3 日消息,KIOXIA(铠侠)当地时间昨日举行了 2026 年投资者日活动。该企业宣布将在今年夏天出样 BiCS10 1Tb TLC NAND,这一闪存将用于下代支持 PCIe Gen6 的 CM 系列企业级固态硬盘中。BiCS10 采用 3...[详细]
-
芯片双雄互攻腹地!NVIDIA杀入PC CPU市场:Intel推480GB平价AI芯片
今天的芯片产业上演极具戏剧性一幕,NVIDIA高调杀入Intel深耕数十年的PC芯片腹地,Intel则强势加码NVIDIA主场的数据中心与AI芯片赛道,两大巨头同日互攻对方核心领地。NVIDIA在GTC 2026上公布面向...[详细]
-
芯片双雄互攻腹地!NVIDIA杀入PC CPU市场:Intel推480GB平价AI芯片
今天的芯片产业上演极具戏剧性一幕,NVIDIA高调杀入Intel深耕数十年的PC芯片腹地,Intel则强势加码NVIDIA主场的数据中心与AI芯片赛道,两大巨头同日互攻对方核心领地。NVIDIA在GTC 2026上公布面向...[详细]
-
480GB LPDDR5X!Intel预告Xe3P架构下代GPU加速卡
Intel GPU的工作重心逐渐从游戏卡,转向了专业卡、AI加速卡。比如下一代的Xe3P架构,目前就没有安排消费级产品,而首款产品就是代号“Crescent Island”(新月岛)的AI加速卡。回顾历史,Intel Xe架构...[详细]
2026-06-01 14:08:22 -
至高 480GB 内存,英特尔进一步介绍数据中心 GPU "Crescent Island"
6 月 1 日消息,Intel(英特尔)在今年 COMPUTEX 前夕对将在本年度晚些时候面世的 AI 推理工作负载优化数据中心 GPU "Crescent Island" 进行了进一步的介绍。"Crescent Island" 将支持从原生 FP4/MX...[详细]
2026-06-01 12:01:09 -
NV曾花200亿美元收购技术 国产也要有LPU芯片了:能让豆包变聪明
随着AI推理算力的需求暴增,国内的芯片研发也从GPU转向了CPU为核心,日前有消息称ByteDance要研发自己的CPU,现在进一步明确是LPU类型的芯片。爆料很准的海外分析师Jukan日前提到,该公司正在跟国内的一家R...[详细]
-
慧荣科技推出专为AI PC打造的SM2524XT主控,提供2.5M IOPS的AI推理与KV Cac
全球NAND闪存主控芯片领导厂商慧荣科技(NasdaqGS: SIMO),今日宣布推出SM2524XT,专为AI推理和KV Cache密集型工作负载所打造的新一代PCIe Gen5 DRAM-less SSD主控芯片。SM2524...[详细]
-
华为鸿蒙开源 SGL 高性能 GPU 加速框架,开发者三行代码即可调用 GPU 滤镜
感谢网友 Autumn_Dream 的线索投递! 5 月 29 日消息,据 HarmonyOS 开发者技术消息,华为鸿蒙开发团队开源 SimpleGPULayer (简称 SGL )高性能 GPU 加速框架,面向鸿蒙原生应用提供一站式图形与计算加速...[详细]
-
韩 AI 芯片企业 FuriosaAI 携手博通开发下一代 2nm 推理加速器
感谢网友 华南吴彦祖 的线索投递! 5 月 28 日消息,韩国 AI 芯片企业 FuriosaAI 当地时间 27 日宣布将与 Broadcom(博通)合作开发其第三代(下一代)AI 推理加速器,目标 2028H1 出样。这一芯片将结合 2nm 先进制程的...[详细]
-
砍掉所有性能核!英特尔Nova Lake爆新料:8E+12Xe全新版本
据博主“金猪升级包”最新爆料,英特尔正在研发一款特殊的Nova Lake架构的处理器,该产品针对边缘AI与本地推理场景设计。这款处理器采用8E+12Xe的非典型配置,完全摒弃了传统的性能核,仅保留8个能效核,并集成大规模X...[详细]
-
市场占比远低于20%!黄仁勋:SRAM架构AI芯片难成主流
据媒体报道,在英伟达2027财年第一季度财报电话会议上,公司创始人、总裁兼首席执行官黄仁勋就AI芯片产业格局发表看法。黄仁勋指出,以LPX为代表的基于SRAM架构的AI推理解码加速芯片,长期将局限于利基市场,而GPU等通...[详细]
-
华为自研全新 DoB 封装技术:绕过 400 层 NAND 造出 122TB 企业级 SSD,未来还计划推出 245TB 版本
5 月 24 日消息,据 Blocks & Files 报道,华为于 5 月 20 日至 21 日在巴黎举行的 ID Forum 2026 活动上展示了基于自研 Die-on-Board(板上裸片封装,DoB)封装技术的大容量 SSD 系列。其中一款面向 AI 推理...[详细]
-
联想集团2025/26财年业绩:营收与利润双双创历史新高
在联想集团2025/26财年业绩发布会上,CEO杨元庆披露:全年总营收5899亿元,同比增长20.3%,逼近6000亿关口;调整后净利润同比增长42.1%,增速约为营收的两倍,营收与利润双双创历史新高。 杨元庆表示...[详细]
2026-05-23 17:42:50 -
英伟达黄仁勋:LPX 等 SRAM AI 芯片将长期属于利基市场
5 月 22 日消息,NVIDIA 创始人、总裁兼首席执行官黄仁勋在企业 FY2027Q1 财报电话会议上回答分析师问题时表示,LPX 等基于 SRAM 的 AI 推理解码工作负载加速器芯片将长期属于利基市场,GPU 等仍将占据主要地位。黄仁勋...[详细]
-
AMD CEO 苏姿丰:中国内地占公司营收 20%,是非常重要的市场
感谢网友 取什么名 的线索投递! 5 月 22 日消息,据《日经亚洲》今日报道,AMD CEO 苏姿丰表示,中国内地占据大约 20% 的公司营收,仍将是非常重要的市场。苏姿丰预测,未来五年 CPU 市场将大幅增长,她表示,业内没有人预料到在全球...[详细]
-
从拼性能转向算细账:英伟达GPU毛利过高惹争议 定制化ASIC正成为行业新宠
投资银行(Evercore ISI)发布最新AI渠道调研报告指出,一线AI工程师对英伟达GPU的评估标准正在发生转变。由于功耗和散热成本激增,超大规模数据中心正在加速转向自研定制ASIC和替代**。预测到2028年,英伟达...[详细]
-
英伟达计划允许GPU直接访问存储 有望加速HBF
随着AI模型的持续扩展,HBM可能难以满足未来显存容量的需求,也促使行业将GPU驱动的存储架构视为潜在的下一个技术前沿。去年就有消息称,英伟达分别与SK海力士和铠侠合作,推动AI SSD的开发,使用量身定制的SSD部分取代...[详细]
-
跳过CPU!英伟达联手亚马逊:GPU直接控制SSD
据报道,英伟达与亚马逊正积极推进新一代存储架构研发,该架构将允许GPU直接操控SSD等存储设备,绕过传统CPU调度环节。英伟达计划率先在其下一代Vera Rubin AI平台上导入“GPU发起直接存储访问”(GIDS)技术。...[详细]
-
百纳秒超低时延!阿里真武M890刷新纪录 128卡超节点服务器畅跑大模型与Agent
今日,在2026阿里云峰会上,阿里发布基于平头哥新一代AI芯片真武M890的128卡超节点服务器,搭载互联芯片ICN Switch 1.0,通信时延低至百纳秒级,可让128张AI芯片组成一台计算机,满足Agentic时代的并...[详细]
-
英特尔数据中心 AI 推理 GPU "Crescent Island" PCB 曝光
5 月 20 日消息,爆料人 @结城安穗-YuuKi_AnS 北京时间今日凌晨释出了英特尔数据中心 GPU 新品 "Crescent Island" 的 PCB 图片,让我们对这块 AI 推理工作负载优化产品有了更多的了解。可以看到这款显卡采用 PCIe...[详细]
2026-05-20 09:34:35 -
比利时 Imec 公布 3D CCD 内存架构,结合 DRAM 速度与 NAND 密度提升 AI 推理性能
5 月 19 日消息,比利时研究机构 Imec 于 5 月 12 日发布博文,展示了一种 3D CCD 内存架构,目标结合 DRAM 的高速度与 NAND 闪存的存储密度,提升 AI 推理性能。针对当前 AI 加速器常见的“内存墙”(算力还在等数据,无法持续处...[详细]
-
英伟达Vera CPU交付即爆单 甲骨文承诺部署数十万颗
据媒体报道,英伟达宣布,其首款专为Agentic AI(智能体AI)设计的CPU——Vera,已完成对Anthropic、OpenAI、SpaceX AI及甲骨文云的首批交付。Vera专为满足Agent AI对CPU的严苛需求...[详细]
2026-05-19 12:00:30