本文由第三方AI基于17173文章http://news.17173.com/content/10212025/234642395.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
阿里云推出全新AI计算解决方案:大模型所需GPU狂降82%!
2025-10-21 23:46:42
神评论
17173 新闻导语
阿里云Aegaeon方案GPU用量狂降82%!通过Token级虚拟化与模型切换优化,大模型服务成本锐减,已应用于百炼平台。
在近日于韩国首尔举办的顶级学术会议SOSP 2025(操作系统原理研讨会)上,阿里云发布了其“Aegaeon”计算池化解决方案。
Aegaeon方案的核心在于解决AI模型服务中普遍存在的GPU资源浪费问题,尤其针对那些需求突发或不可预测的大型语言模型。
它打破了传统的“一个模型绑定一个GPU”的低效模式,而是在Token级别虚拟化GPU访问,这意味着单个GPU可以被多个不同模型共享服务,实现精细化的资源调度。
阿里云Aegaeon系统作为一种推理时间调度器,它能在每次生成下一个token后,动态决定是否切换模型,从而将微小的工作片段安排到共享池中。
通过组件复用、显存精细化管理和KV缓存同步优化等全栈技术,Aegaeon将模型切换开销降低了97%,确保了token级调度的实时性,可支持亚秒级的模型切换响应。
在阿里云模型市场为期超三个月的Beta测试中,Aegaeon系统在服务数十个参数量高达720亿的大模型时,所需的NVIDIA H20 GPU数量从1192个锐减至213个,削减比例高达82%。
GPU用量的大幅削减,对于硬件采购成本高昂的大型模型服务商而言,意味着成本将显著降低。
目前,这项核心技术已成功应用在阿里云百炼平台。
【来源:快科技】
今日热点
热门测试游戏
- 1《深海迷航2》上线12小时累计销量突破200万份
- 2可永久提升属性!韩国MMO《王权与自由》全新赛季上线
- 3《权力游戏国王大道》能不能搬?如何提升战力?9小时游玩感受!
- 4韩国奇幻背景FPS新作《枪与巨龙》公开实机视频
- 5从扮演007特工到2.5D动作,5月这些新游值得一玩!
- 6暗黑4社区左右互搏:一边用新“不死”Build冲层,一边骂游戏已“坏掉”
- 7亚马逊逼开发者做AI游戏,做完了把所有懂AI的人都开了
- 8暗黑4“树的馈赠”回归,经验、金币、材料三倍速毕业?
- 9好莱坞女星艾丽·范宁穿“碎蛋”高跟鞋引发热议
- 10感谢全国网友支持!央视拿下两届世界杯版权 美加墨费用约4亿:揭秘国际足联服软原因


