-
LLM 芯片初创企业 MatX 完成 5 亿美元 B 轮融资,正打造高吞吐低延迟产品
2 月 25 日消息,MatX 是一家专注 LLM 工作负载的 AI 芯片企业,由两位前谷歌 TPU 工程师创立。该企业当地时间 24 日宣布完成了 5 亿美元规模的 B 轮融资(注:现汇率约合 34.45 亿元人民币),吸引了行业参与者世芯 AIchip、...[详细]
-
苹果联合顶尖高校探讨前沿 AI:昨日上线 8 场核心演讲视频
2 月 24 日消息,苹果公司昨日(2 月 23 日)发布博文,分享了“AI 推理与规划研讨会”的现场视频。该研讨会于去年 7 月举办,为期两天,重点聚焦推理与规划、智能体应用以及模型开发三大 AI 核心领域。会议汇集了苹果内部工程师,以及来...[详细]
-
每秒 12000 tokens 吞吐:Taalas 集群跑 DeepSeek R1 创速度纪录
2 月 21 日消息,科技媒体 Wccftech 昨日(2 月 20 日)发布博文,报道称 AI 芯片初创公司 Taalas 为解决大模型的延迟与成本难题,推出“硬连线”(Hard-wiring)技术,直接将 AI 模型固化在硅片中。在 AI 算力竞争...[详细]
2026-02-21 10:02:16 -
宣称“从 0 构建”,印度 AI 实验室 Sarvam 发布两款 MoE 架构 LLM
2 月 20 日消息,印度 AI 实验室 Sarvam 当地时间本月 18 日在印度人工智能影响力峰会上发布了 2 款“从 0 构建”的最新一代 MoE 架构大语言模型。这两款模型即将在 Hugging Face 上以开源权重的形式提供,API 访问和仪表盘...[详细]
-
谷歌 Gemini 遭蒸馏攻击:被大量提问内部逻辑,单次行动提示超 10 万次
2 月 15 日消息,当地时间 2 月 12 日,谷歌称其 AI 聊天机器人 Gemini 正遭遇大量“蒸馏攻击”(distillation attacks)—— 即通过重复提问诱导聊天机器人泄露内部机制。谷歌表示,这些攻击者试图通过反复提问不断...[详细]
-
SK 海力士探索 H3 混合存储:发挥 HBM 与 HBF 各自优势,优化 AI 推理负载能效
2 月 12 日消息,SK 海力士在一篇发布于本月 4 日的论文中提出了 H3 混合存储架构,其混合配置 HBM 高带宽内存与 HBF 高带宽闪存,充分发挥两种介质各自的优势而避免其短板。SK 海力士在论文中表示,HBF 与 HBM 相比,带宽相当、容...[详细]
-
苹果 iOS 26.4 前瞻:Siri 史诗级重构,预估 4 月上线
2 月 7 日消息,科技媒体 MacRumors 昨日(2 月 6 日)发布博文,汇总梳理了苹果 iOS 26.4 更新。该版本有望 2026 年春季发布,重点将整合基于大语言模型(LLM)的全新 Siri。一、升级架构援引博文介绍,不同于现有的指...[详细]
-
索尼新专利让游戏角色变节目主播!卡关了AI会吐槽
据Tech4Gamers报道,他们最近发现了一项全新的索尼专利,内容涉及利用AI大语言模型(LLM) 为玩家生成个性化播客。这些播客可以是音频或视频形式,并将使用游戏角色的“深度伪造”语音与形象,打造更具沉浸感的节目内容。...[详细]
-
AI助手OpenClaw爆火:一个24小时不休息的数字管家
近日科技圈一个名为OpenClaw的个人AI代理工具走红网络。据悉,这款工具原来名为Clawdbot,因被AI巨头Anthropic指控Clawdbot与其旗下的Claude商标相似,Clawdbot被迫更名为OpenC...[详细]
-
摩尔线程自研长江智能SoC芯片正式发布!8全大核最高2.65GHz
在今天的首届开发者大会上,摩尔线程正式发布了全新长江智能SoC芯片。CPU方面长江智能SoC搭载8个全大核,主频最高2.65GHz,全功能GPU支持高性能3D渲染和大模型端侧推理,可编程双核NPU能多模态加速处理语音图像...[详细]
-
锤子手机太超前?李楠:GPT反而证明了罗永浩
快科技12月12日消息,熟悉机圈的读者都了解2018年5月的那场鸟巢发布会,当时罗永浩在鸟巢推出了号称革命性的设备TNT。所谓TNT,其全称为Touch and Talk,坚果TNT工作站是基于Smartisan OS大屏版桌...[详细]
-
AI游戏NPC缺乏足够保障,《Stellar Cafe》暴露安全隐患
我正坐在一个数字咖啡馆的隔间里,对面是一个健谈的机器人,我同意作为嘉宾上她的播客。麦克风在我们面前弹出,视频游戏中的NPC开始了一段介绍性独白,准备问我一些关于我兴趣的轻松问题。没过几分钟,事情就变得奇怪起来。“这太有趣...[详细]
2025-12-11 23:50:39 -
吉尼斯认证全球最小迷你AI超算发布!搭载12核CPU+80GB内存
美国初创公司Tiiny Lab推出了其最新产品Pocket Lab,这是一款专为个人LLM设计、主打完全离线运行的“口袋AI超级计算机”。这款设备凭借其极其紧凑的尺寸和强大的硬件配置,在“最小迷你PC(本地运行100B参数L...[详细]
2025-12-11 17:41:54 -
研究揭示:大语言模型无法真正理解双关语
一项关于人工智能(AI)的最新研究表明,大语言模型(LLM)在理解双关语方面有所欠缺。来自英国和意大利多所高校的专家团队近期开展了一项研究,重点考察大语言模型对双关语的理解能力,结果发现其表现令人失望。该团队由南威尔士卡...[详细]
-
因“多次泄密”,知乎8.6粉大V、Seed 研究员任某某被字节跳动开除
新浪科技援引知情人士消息称,字节跳动 Seed 研究员任赜宇于11月11日离职,其离职原因是“因多次泄密被开除”。任赜宇在“知乎”平台上开设有个人账号,关注者数量 8.6 万。其个人主页显...[详细]
-
黄仁勋与李在镕吃鸡后 NVIDIA宣布将在韩国部署26万枚GPU:史上规模最大
“吃鸡宴”之后,韩国总统办公室传来最新消息——韩国将在公共和私营部门部署超26万片NVIDIA最新款GPU。据悉,NVIDIA周五表示,计划与韩国政府和主要公司合作,在韩国部署多达26万枚GPU,在韩国建立大规模AI工厂...[详细]
-
维基百科创始人谈 Grokipedia:那么多夸马斯克的内容,能中立才怪
埃隆?马斯克(Elon Musk)挑战维基百科的新项目“Grokipedia”在公开亮相之初便遭遇“坎坷开局”,维基百科创始人吉米?威尔士(Jimmy Wales)当地时间周二在纽约举行的 CNBC 科技高管理事会峰会(CNBC...[详细]
2025-10-29 22:25:51 -
谷歌开源全栈平台Coral NPU,能让大模型在手表上全天候运行
今天,谷歌有点忙。一方面,他们与耶鲁大学合作基于 Gemma 研发的 Cell2Sentence-Scale 27B (C2S-Scale) 首次预测了一种新的潜在癌症疗法,引发世界广泛关注。另一方面,他们又更新上线了 Veo 3.1,...[详细]
-
不用跟AI客气了!新研究:语气越粗鲁回答正确率越高
找AI帮忙不要再客气了,效果根本适得其反。宾夕法尼亚州立大学的一项研究《Mind Your Tone》显示,你说话越粗鲁,LLM回答越准。语气越冲,AI正确率达到84.8%。特别客气时,AI正确率反而低了。什么情况,难道是我...[详细]
-
骂得越狠,ChatGPT回答越准,PSU研究实锤,狂飙84%准确率
别对你的ChatGPT太好了!一项来自PSU的最新研究,给所有人当头一棒——对LLM越粗鲁,它回答得就越给力。诸如「请、谢谢」之类的客气话,以后不要再说了...实验中,团队创建了一个包含50个基础问题的数据集,涵盖了数学...[详细]
-
不用跟AI客气了!新研究:语气越粗鲁回答正确率越高
找AI帮忙不要再客气了,效果根本适得其反。宾夕法尼亚州立大学的一项研究《Mind Your Tone》显示,你说话越粗鲁,LLM回答越准。语气越冲,AI正确率达到84.8%。特别客气时,AI正确率反而低了。什么情况,难道是我...[详细]
-
微调已死?Agentic上下文工程登场,无需微调实现模型进化
是什么,让一位 AI 自动化架构师发出了「微调已死」的感慨?一篇来自斯坦福大学、SambaNova、UC 伯克利的论文近日引发了广泛讨论。他们提出了一种名为Agentic Context Engineering(智能体 / 主动式上下...[详细]
2025-10-11 17:57:02 -
大摩:市场低估了明年潜在的“AI重大利好”,但存在关键的不确定性
一场由算力驱动的AI能力大跃升可能正在酝酿。据硬AI,摩根士丹利在一份最新报告中表示,市场可能严重低估了即将在2026年出现的一项人工智能领域的重大利好——由算力指数级增长驱动的模型能力“非线性”飞跃。根据这份由Step...[详细]
-
IBM 推出 Granite 4.0 系列模型:混合架构降低内存需求,Apache 2.0 开源
IBM 当地时间 2 日宣布推出 Granite 4.0 系列企业级 LLM 模型,新一代的模型采用 Mamba-Transformer 混合架构,可在不牺牲性能的前提下大幅降低内存需求,这降低了推理部署的成本。Granite 4.0 系列模型...[详细]
2025-10-05 09:12:08 -
“10倍速度,0倍理解?”AI代写代码的那些坑
如果你观察过别人“写代码”的过程,可能就会发现他们花在“发呆”上的时间比敲键盘的时间还多。当然,也不要想太多,这些程序员大概率不是在偷懒。毕竟软件开发本质上就是一种解决问题的过程,就像解复杂的填字游戏一样,真正的工作大多...[详细]
2025-09-29 22:09:02 -
小扎「梦之队」首批论文上线,LLM自举进化,单步性能狂飙22%
Meta超级实验室「Meta Superintelligence Labs,MSL」发了新论文!如果你不断让大语言模型回答「把它改进一下」,会发生什么?上周,MSL的三位成员上传了一篇ArXiv论文,探索了如何利用强化学习(...[详细]
-
英伟达推出通用深度研究系统:可接入任何 LLM,支持个人定制
英伟达也做深度研究智能体了。最新论文介绍了英伟达的通用深度研究(UDR)系统,该系统支持个人定制,可接入任何大语言模型(LLM)。这意味着它能够围绕任何语言模型运行,用户可以完全自定义深度研究策略,并交给智能体实现。为展...[详细]
-
重塑记忆架构:LLM正在安装「操作系统」
众所周知,现代大型语言模型(LLM)的上下文窗口普遍有限 —— 大多数模型只能处理数千到数万 token,比如早期的 GPT-3 仅有~2,048 token。虽然近期有些模型已经拓展到了百万级甚至千万级 token 窗口(如 Meta 的...[详细]
-
AI进化时间表已现,LLM每7个月能力翻倍,2030年职场不复存在?
LLM智能每7月翻倍,2030年颠覆人类工作LLM正以前所未有的速度进化:METR发现,它们的智能每7个月就翻一番。到了2030年,一个模型可能只需几小时,就能搞定人类工程师几个月的工作。别眨眼,你的岗位或许已在倒计时中...[详细]
-
别跟LLM太交心,斯坦福新研究:AI不能完全取代人类心理治疗师
AI被爆“过度谄媚”,迎合用户妄想小心!AI的“贴心回应”可能致命。最新研究表明包括ChatGPT和Llama在内的流行AI模型在处理抑郁、妄想等复杂心理问题时,竟然频频输出危险建议。这项研究涉及来自斯坦福大学、卡内基梅...[详细]