NV曾花200亿美元收购技术 国产也要有LPU芯片了:能让豆包变聪明
国产LPU芯片来袭!ByteDance携手RRAM厂商研发类Groq处理器,AI推理速度比H100快10倍、成本仅1/10。豆包AI将更聪明,降低推理算力成本,媲美NVIDIA 200亿美元技术。点击了解LPU如何改变AI生态。
随着AI推理算力的需求暴增,国内的芯片研发也从GPU转向了CPU为核心,日前有消息称ByteDance要研发自己的CPU,现在进一步明确是LPU类型的芯片。
爆料很准的海外分析师Jukan日前提到,该公司正在跟国内的一家RRAM存储芯片厂商合作,研发一款类似Groq LPU处理器的产品。
他还提到NVIDIA黄仁勋之前表示LPU芯片只是个小众市场不过是有意淡化他们的企图,最终所有大厂都希望打造类似的张量处理器。
LPU这个芯片相对GPU、TPU来说确实还没那么出名,上一次有重大动作还是3月份NVIDIA在GTC大会上发布LPU30,而这个芯片的技术也不是NVIDIA自研的,是他们去年底花了200亿美元从Groq手中买的授权。
能让NVIDIA这么着急花大价钱买芯片授权,LPU自然不可小觑,创造它的公司Groq创始人乔纳森·罗斯(Jonathan Ross)正是10年前研发出谷歌TPU芯片的主管之一,2016年带领多位TPU核心人员成立了Groq公司。
相比GPU,LPU芯片专为大语言模型而设计,LPU芯片速度比H100快10倍,成本仅为其十分之一,以满足全球企业对“实时、低延迟”的AI推理服务的渴求。

具体到LPU30上,它整合500MB SRAM缓存,980亿晶体管,FP8性格1.2PFLOPS,AI算力性能远不如Rubin GPU,但150TB/s的带宽远高于HBM4的22TB/s。
Groq 3 LPU芯片会以Groq 3 LPX机架的形式出现,可集成256个LPU30芯片,缓存容量达到了128GB,内存总带宽则提升到了40PB/s,互联带宽也有640TB/s。
可以说LPU芯片在AI算力上不如GPU,但带宽、延迟等指标上比GPU提升了数倍,对AI推理作用极大。
如果ByteDance也搞定了自己的类LPU芯片,大家能有什么体验变化呢?很多人都吐槽过豆包情商极高,但智商不详吧,本质上就是推理算力不够,如果有LPU这种芯片加入,不仅可以极大降低成本,还可以让豆包更聪明,能干的事就多了。

- 1《龙之剑:觉醒》公开预告视频 首个冒险地区曝光
- 2又一款经典童年网游!《飘流幻境》复刻重置,Q版画风超高自由度
- 3最近大家都在玩什么?盘点五款近期在Steam热度霸榜的网游,两款即将上国服!
- 4《仙境传说RO》IP新作MMO美服测试将于6月4日开启
- 5《剑灵》韩服直播爆料总结,NEO巅峰服武功体系改版究竟是什么?
- 6《洛奇英雄传:反抗命运》公开全景欣赏功能和成就系统
- 7魔兽故事:魔兽最虚伪的守护者!篡改史书洗白自己,亲手玩崩英灵殿
- 8《流放之路2》国服与国际服分道扬镳?游戏就不该服务于玩家?
- 9坚持11年帮助其它玩家打高难boss!如今宣布引退:再也没人召唤我了
- 10回忆录:以为白捡一个号,结果免费当“代练”一年多,这口气实在咽不下!

