本文由第三方AI基于17173文章http://news.17173.com/content/10062025/132711028.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
华为发布开源技术SINQ:可大幅降低大模型硬件需求!一张4090就能跑
2025-10-06 13:27:11
神评论
17173 新闻导语
华为开源SINQ技术:大模型显存需求降低70%,单张RTX 4090即可运行,支持Qwen3/LLaMA,免费商用!
据报道,华为苏黎世的实验室发布了一种新的开源量化方法,可在不牺牲大模型输出质量的情况下,减少显存需求。
该技术名为 SINQ(Sinkhorn-Normalized Quantization),目前已在GitHub和Hugging Face上开源,采用Apache 2.0许可,允许企业和研究机构免费使用、修改和商业部署。
SINQ的核心优势在于其快速、无需校准,并且易于集成到现有模型工作流中,通过独特的量化方法,将模型的显存需求降低了60%至70%,具体取决于模型架构和位宽。
这意味着原本需要超过60GB显存才能运行的模型,现在可以在大约20GB的环境中运行。原本需要在高端企业级GPU(如A100或H100)才能运行的大模型,如今可在更经济的硬件上运行,例如单张RTX 4090。
SINQ已在多种架构和模型(如Qwen3系列、LLaMA和DeepSeek)上进行了评估,并在WikiText2和C4等基准测试中表现出色,显著降低了困惑度和翻转率。
它还支持非均匀量化方案(如NF4),并可与校准方法(如AWQ)结合使用,进一步缩小与全精度模型的差距。
在运行效率方面,SINQ的量化速度比HQQ快约两倍,比AWQ快30倍以上,非常适合对量化时间有实际限制的研究和生产环境。
【来源:快科技】
关于SINQ,华为,大模型,量化,开源,显存需求,RTX 4090,Qwen3,LLaMA,DeepSeek的新闻
- (2025-11-15) Mate 80同期发布!华为新款二合一平板电脑配置揭晓:14.2英寸+麒麟9系
- (2025-11-15) 天猫双11战报出炉:四年来最好增长!苹果、小米、华为等成交破10亿
- (2025-11-14) 安卓首款三折叠屏!三星Galaxy Z TriFold来了:对标华为
- (2025-11-14) 任正非亲自取名!启境汽车官宣11月20日发布
- (2025-11-14) 华为宣布完成拉美首次5G-A双路径性能验证:单用户下行峰值突破5Gbps
- 一看吓一跳:雷死人不偿命的囧图集(955)
- 一看吓一跳:雷死人不偿命的囧图集(956)
- 「体操服の‘液态曲线’!橘望顶配身材|白丝厚D呼之欲出,腰臀比秒杀建模」
- 一看吓一跳:雷死人不偿命的囧图集(954)
- 一看吓一跳:雷死人不偿命的囧图集(957)
- 盘点10部有些年头的冷门动画,其实当年火得要命!只是那时的你还没入坑~
- 苦等数年终于来了!《永恒之塔2》领衔,盘点G-STAR 2025值得关注的游戏
- 正惊GIF:医护责任心呢!短裙美女护士不打针光转悠,看呆患者小伙
- 精灵vs绿皮《堕落精灵·芙蕾雅》将登Steam,征服G杯精灵女王的调教
- 回眸瞬间腰臀比炸裂!俄罗斯继母cos新皮肤:紫色包臀裙+白毛,挡不住的丰腴感!





