-
中国电信携手阿里云打造粤港澳大湾区首个“真武”国产万卡智算集群,可承载千亿参数级 LLM 推理任务
感谢网友 不一样的体验 的线索投递! 4 月 8 日消息,中国电信广东公司联合阿里云宣布在广东韶关数据中心集群上线“粤港澳大湾区首个基于‘真武’芯片的万卡智算集群”,该集群实现了从芯片、云平台到模型应用的全链路自主研发。获悉,该集群...[详细]
-
苹果发布 SQUIRE 工具:让 AI 听懂人话,精准控制生成界面
4 月 8 日消息,科技媒体 9to5Mac 昨日(4 月 7 日)发布博文,报道称苹果研究团队发表 SQUIRE 工具研究论文,通过中间表示技术,解决 AI 生成界面的不可控难题。援引博文介绍,自然语言开发过程中面临的核心痛点,就是语义歧义性...[详细]
-
小米罗福莉谈 Token 价格战:建议 LLM 公司不要盲目压低价格,会导致恶性循环
感谢网友 会弹琴的九号 的线索投递! 4 月 7 日消息,小米集团 MiMo 负责人罗福莉昨天在 X 平台发文,谈及最近 AI 业界火热的 Token(注:词元)价格战。▲ 图源:罗福莉本人社媒账号罗福莉表示,Anthropic 几天前切断了 Clau...[详细]
-
随身AI算力!华硕推出UGen300 USB加速器:即插即用 随处部署
华硕近日发布了旗下首款人工智能USB设备——UGen300 USB AI加速器,将强大的AI推理能力便捷地带到任何设备上。这款外形小巧的加速器内置了Hailo-10H芯片,可提供高达40 TOPS的AI算力,并支持运行LLM和...[详细]
-
刷新全球性能纪录!阿里巴巴5nm旗舰CPU发布:台积电生产
今日阿里巴巴达摩院正式发布最新一代旗舰RISC-V CPU玄铁C950,探索打造面向AI Agent时代的新型CPU。据悉,这款芯片采用RISC-V开源架构,采用5nm工艺制程,由台积电生产。根据阿里巴巴的说法,这款芯片专为...[详细]
-
刷新全球RISC-V性能纪录!阿里巴巴发布5nm旗舰CPU:台积电生产
3月24日,今日阿里巴巴达摩院正式发布最新一代旗舰RISC-V CPU玄铁C950,探索打造面向AI Agent时代的新型CPU。据悉,这款芯片采用RISC-V开源架构,采用5nm工艺制程,由台积电生产。根据阿里巴巴的说法,...[详细]
-
韩国 Upstage 宣布将分阶段部署 AMD Instinct MI355 显卡加速器
3 月 23 日消息,韩国人工智能初创企业 Upstage 当地时间 18 日宣布扩大与 AMD 的战略合作,将在未来一年内分多阶段部署 AMD 的 Instinct MI355 显卡加速器。这些算力基础设施将助力 Upstage 开发和推广其 LLM 和...[详细]
2026-03-23 18:03:44 -
颠覆!NVIDIA发明新技术KVTC:内存使用量缩减20倍
NVIDIA研究人员推出一项全新技术KVTC(KV快取转换编码),能把大型语言模型(LLM)追踪对话历史的内存用量,最高缩减20倍,而且不用修改模型本身。这一突破有望解决大型语言模型长对话推理时的内存不够用问题,大大降低...[详细]
-
Mistral 发布 119B-A6B 模型 Small 4,首次兼顾推理、多模态、编程优势
3 月 20 日消息,Mistral AI 当地时间本月 16 日宣布推出 Mistral Small 4 模型,这是这家欧洲领先 AI 实验室首款结合旗舰推理模型、多模态模型、编程模型优势的综合性 LLM,用户无需在多种各有优势的模型中进行选择,...[详细]
2026-03-20 12:03:44 -
微星发布 DGX Station 系统 XpertStation WS300
3 月 18 日消息,微星 MSI 美国当地时间 16 日宣布推出该企业版本的 DGX Station 桌面超级计算机整机系统 XpertStation WS300。这款搭载数据中心级芯片的台式机专为 LLM、GenAI、高阶数据科学领域工作流快...[详细]
2026-03-18 12:00:52 -
中国信通院:联合高校发现 OpenClaw 高危漏洞并协助快速修复
3 月 16 日消息,据中国信通院官方微信公众号消息,近期,中国信息通信研究院(简称“中国信通院”)与上海交通大学、南京大学组成的联合研究团队,对开源自主智能体框架 OpenClaw 进行了深度安全审计,通过静态分析与动态实战测试...[详细]
-
苹果成功验证 AI 搜索优化,App Store 年下载量有望暴涨数千万次
3 月 7 日消息,苹果研究团队于 2 月发布研究报告,通过引入大语言模型(LLM),显著提升了 App Store 的搜索转化率。援引博文介绍,苹果 App Store 的排名系统目前主要依赖行为相关性(即用户是否点击或下载)来优化搜索结果...[详细]
-
美光全球首发256GB LPDDR5X SOCAMM2内存条:AI TTFT性能飙升2.3倍
退出消费级内存和SSD市场后,美光在企业级尤其是AI领域继续发力,发布了全球第一款256GB超大容量的LPDDR5X SOCAMM2内存条,并已向客户送样。SOCAMM2是面向数据中心、高性能计算、AI的低功耗内存模块,基...[详细]
-
LLM 芯片初创企业 MatX 完成 5 亿美元 B 轮融资,正打造高吞吐低延迟产品
2 月 25 日消息,MatX 是一家专注 LLM 工作负载的 AI 芯片企业,由两位前谷歌 TPU 工程师创立。该企业当地时间 24 日宣布完成了 5 亿美元规模的 B 轮融资(注:现汇率约合 34.45 亿元人民币),吸引了行业参与者世芯 AIchip、...[详细]
-
苹果联合顶尖高校探讨前沿 AI:昨日上线 8 场核心演讲视频
2 月 24 日消息,苹果公司昨日(2 月 23 日)发布博文,分享了“AI 推理与规划研讨会”的现场视频。该研讨会于去年 7 月举办,为期两天,重点聚焦推理与规划、智能体应用以及模型开发三大 AI 核心领域。会议汇集了苹果内部工程师,以及来...[详细]
-
每秒 12000 tokens 吞吐:Taalas 集群跑 DeepSeek R1 创速度纪录
2 月 21 日消息,科技媒体 Wccftech 昨日(2 月 20 日)发布博文,报道称 AI 芯片初创公司 Taalas 为解决大模型的延迟与成本难题,推出“硬连线”(Hard-wiring)技术,直接将 AI 模型固化在硅片中。在 AI 算力竞争...[详细]
2026-02-21 10:02:16 -
宣称“从 0 构建”,印度 AI 实验室 Sarvam 发布两款 MoE 架构 LLM
2 月 20 日消息,印度 AI 实验室 Sarvam 当地时间本月 18 日在印度人工智能影响力峰会上发布了 2 款“从 0 构建”的最新一代 MoE 架构大语言模型。这两款模型即将在 Hugging Face 上以开源权重的形式提供,API 访问和仪表盘...[详细]
-
谷歌 Gemini 遭蒸馏攻击:被大量提问内部逻辑,单次行动提示超 10 万次
2 月 15 日消息,当地时间 2 月 12 日,谷歌称其 AI 聊天机器人 Gemini 正遭遇大量“蒸馏攻击”(distillation attacks)—— 即通过重复提问诱导聊天机器人泄露内部机制。谷歌表示,这些攻击者试图通过反复提问不断...[详细]
-
SK 海力士探索 H3 混合存储:发挥 HBM 与 HBF 各自优势,优化 AI 推理负载能效
2 月 12 日消息,SK 海力士在一篇发布于本月 4 日的论文中提出了 H3 混合存储架构,其混合配置 HBM 高带宽内存与 HBF 高带宽闪存,充分发挥两种介质各自的优势而避免其短板。SK 海力士在论文中表示,HBF 与 HBM 相比,带宽相当、容...[详细]
-
苹果 iOS 26.4 前瞻:Siri 史诗级重构,预估 4 月上线
2 月 7 日消息,科技媒体 MacRumors 昨日(2 月 6 日)发布博文,汇总梳理了苹果 iOS 26.4 更新。该版本有望 2026 年春季发布,重点将整合基于大语言模型(LLM)的全新 Siri。一、升级架构援引博文介绍,不同于现有的指...[详细]
-
索尼新专利让游戏角色变节目主播!卡关了AI会吐槽
据Tech4Gamers报道,他们最近发现了一项全新的索尼专利,内容涉及利用AI大语言模型(LLM) 为玩家生成个性化播客。这些播客可以是音频或视频形式,并将使用游戏角色的“深度伪造”语音与形象,打造更具沉浸感的节目内容。...[详细]
-
AI助手OpenClaw爆火:一个24小时不休息的数字管家
近日科技圈一个名为OpenClaw的个人AI代理工具走红网络。据悉,这款工具原来名为Clawdbot,因被AI巨头Anthropic指控Clawdbot与其旗下的Claude商标相似,Clawdbot被迫更名为OpenC...[详细]
-
摩尔线程自研长江智能SoC芯片正式发布!8全大核最高2.65GHz
在今天的首届开发者大会上,摩尔线程正式发布了全新长江智能SoC芯片。CPU方面长江智能SoC搭载8个全大核,主频最高2.65GHz,全功能GPU支持高性能3D渲染和大模型端侧推理,可编程双核NPU能多模态加速处理语音图像...[详细]
-
锤子手机太超前?李楠:GPT反而证明了罗永浩
快科技12月12日消息,熟悉机圈的读者都了解2018年5月的那场鸟巢发布会,当时罗永浩在鸟巢推出了号称革命性的设备TNT。所谓TNT,其全称为Touch and Talk,坚果TNT工作站是基于Smartisan OS大屏版桌...[详细]
-
AI游戏NPC缺乏足够保障,《Stellar Cafe》暴露安全隐患
我正坐在一个数字咖啡馆的隔间里,对面是一个健谈的机器人,我同意作为嘉宾上她的播客。麦克风在我们面前弹出,视频游戏中的NPC开始了一段介绍性独白,准备问我一些关于我兴趣的轻松问题。没过几分钟,事情就变得奇怪起来。“这太有趣...[详细]
2025-12-11 23:50:39 -
吉尼斯认证全球最小迷你AI超算发布!搭载12核CPU+80GB内存
美国初创公司Tiiny Lab推出了其最新产品Pocket Lab,这是一款专为个人LLM设计、主打完全离线运行的“口袋AI超级计算机”。这款设备凭借其极其紧凑的尺寸和强大的硬件配置,在“最小迷你PC(本地运行100B参数L...[详细]
2025-12-11 17:41:54 -
研究揭示:大语言模型无法真正理解双关语
一项关于人工智能(AI)的最新研究表明,大语言模型(LLM)在理解双关语方面有所欠缺。来自英国和意大利多所高校的专家团队近期开展了一项研究,重点考察大语言模型对双关语的理解能力,结果发现其表现令人失望。该团队由南威尔士卡...[详细]
-
因“多次泄密”,知乎8.6粉大V、Seed 研究员任某某被字节跳动开除
新浪科技援引知情人士消息称,字节跳动 Seed 研究员任赜宇于11月11日离职,其离职原因是“因多次泄密被开除”。任赜宇在“知乎”平台上开设有个人账号,关注者数量 8.6 万。其个人主页显...[详细]
-
黄仁勋与李在镕吃鸡后 NVIDIA宣布将在韩国部署26万枚GPU:史上规模最大
“吃鸡宴”之后,韩国总统办公室传来最新消息——韩国将在公共和私营部门部署超26万片NVIDIA最新款GPU。据悉,NVIDIA周五表示,计划与韩国政府和主要公司合作,在韩国部署多达26万枚GPU,在韩国建立大规模AI工厂...[详细]
-
维基百科创始人谈 Grokipedia:那么多夸马斯克的内容,能中立才怪
埃隆?马斯克(Elon Musk)挑战维基百科的新项目“Grokipedia”在公开亮相之初便遭遇“坎坷开局”,维基百科创始人吉米?威尔士(Jimmy Wales)当地时间周二在纽约举行的 CNBC 科技高管理事会峰会(CNBC...[详细]
2025-10-29 22:25:51