本文由第三方AI基于17173文章http://news.17173.com/content/03122025/184812460.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
实测苹果M3 Ultra运行DeepSeek R1满血版:速度超过8卡A100!
2025-03-12 18:48:12
神评论
近日,B站UP主“虽然但是张黑黑”分享了一段视频,展示了满血版苹果M3 Ultra运行6710亿参数的DeepSeek R1模型的测试结果,其速度甚至超过了8张A100显卡,而成本却低得多。
运行6710亿参数的DeepSeek R1模型通常需要一台搭载6-8张A100的专业级服务器,总价轻松超过百万元这对于普通用户来说几乎是不可能负担的。
然而满血版M3 Ultra仅需一台Mac Studio即可实现类似性能,性价比极高。
测试结果显示,在运行DeepSeek R1模型时,8张A100显卡的性能为16.41 Tokens/s,而满血版M3 Ultra在GGUF格式下达到15.78 Tokens/s,
切换到能发挥统一内存优势的MLX格式后,速度提升至19.17 Tokens/s,超越8张A100显卡,此外M3 Ultra在运行DeepSeek V3 6710亿参数模型时,速度也达到了19.66 Tokens/s。
不过这并不意味着M3 Ultra在所有场景下都能超越A100,单用户进行单一模型推理时,主要依赖内存带宽和容量,无法完全发挥A100的潜力,在多用户推理和大模型训练场景下,M3 Ultra则完全无法与A100相提并论。
此外,M3 Ultra在大语言模型推理速度测试中表现优异,无论是Llama 3.1 70B、Gemma2 27B还是Qwen 2.5 14B模型,其速度都明显优于其他M系列芯片,与M2 Ultra相比,速度分别提升了13%、34%和18%。
此次测试的满血版M3 Ultra配备了512GB统一内存,总价为74249人民币,对于大多数用户来说,如果不需要运行如此大规模的模型,可以适当降低统一内存容量,从而节省成本。
【来源:快科技】
热门测试游戏
- 1《永恒之塔2》国服要来了?简体中文本地化工作已开启!
- 2韩国大厂将有大动作?DNF手游腾讯化重构,多款新作延期怀旧服成救命稻草?
- 3重回盛大的冒险!《冒险岛》官方怀旧服来啦!
- 4保姆级拆解《王者荣耀世界》的战斗系统!这些战斗机制,开服前必须知道!
- 5《希望OL》全新独立战区首服“巴哈姆特”今日正式启航
- 6国产一人制作独游《破晓》正式发售 大雷翘臀性感女主!
- 7从国民级网游到无人问津,那些曾制霸网吧的游戏你玩过几个
- 8曝《明末:渊虚之羽》制作人夏思源被开除,团队已解散
- 9MMORPG《王权与自由》俄服来了,将继承全球版本的核心玩法
- 10腾讯最新股权结构披露:马化腾持股升至8.8% 获派息42亿港元






