本文由第三方AI基于17173文章http://news.17173.com/content/03082025/094813088.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
美团开源首发INT8满血版DeepSeek R1!老显卡也能用
2025-03-08 09:48:13
神评论
IT之家 3 月 7 日消息,美团搜推机器学习团队 3 月 4 日公布最新首发开源成果,实现对 DeepSeek R1 模型基本无损的 INT8 精度量化。
DeepSeek R1 原生版本的模型权重为 FP8 数据格式,对 GPU 芯片类型有严格限制,仅能被英伟达新型 GPU 支持(如 Ada、Hopper 架构芯片),其他型号 GPU(如 A100)无法直接部署。
目前,量化代码已经合入到了开源 LLM 推理框架 SGLang,量化模型已经发布到了 Hugging Face 社区,方便用户使用。官方测试,满血版 DeepSeek R1 部署 A100,基于 INT8 量化,相比 BF16 实现 50% 吞吐提升。
【来源:互联网】
热门测试游戏
- 1全新黑暗奇幻动作搜打撤游戏《雾影猎人》6月15日新品节免费试玩
- 2《卧龙2》正式公布:赤壁对决曹操,2027年初发售
- 3《流放之路2》高价值暗金排名,国服新赛季必备
- 4时光服插件收费引发热议!魔兽国服的付费内容越来越离谱了
- 56月搬砖党必看!真正值得搬砖党关注的,这两款新游千万别错过
- 6《山海经》题材ARPG《定海》曝光宣传片 东方奇幻+双武器玩法
- 7腾讯入股后,《古剑》终于到了必须证明自己的时候
- 8TVB大尺度节目 女星互爆怪癖!每天穿情趣内衣都行
- 9燕云十六声:10套全新外观确定!端午节活动预告!白飘仙和鸣+黑白无常聆音卡池上线
- 10俄博主批评《剑星:血雨》性化未成年人 被网友扒出是个双标



