您当前的位置: 首页 >> 行业资讯

破局算力浪费 阿里云AI成果入选顶会 GPU用量削减82%

日期:2025-10-18 22:08 点击数:5

【破局算力浪费 阿里云AI成果入选顶会 GPU用量削减82%】 近日,阿里云提出的计算池化解决方案“Aegaeon”成功入选顶级学术会议SOSP 2025,该方案可解决AI模型服务中普遍存在的GPU资源浪费问题,大幅提升GPU资源利用率,目前其核心技术已应用在阿里云百炼平台。
数据显示,在阿里云模型市场为期超三个月的Beta测试中,Aegaeon系统在服务数十个参数量高达720亿的大模型时,所需的英伟达H20 GPU数量从1192个减至213个,削减比例高达82%(见下图)。GPU用量削减82%意味着公司硬件采购成本将显著降低,这对于动辄使用成千上万张GPU的大型模型服务商至关重要。未来AI的发展将不仅依赖于硬件算力的单纯增长,更需要通过系统级的软件创新来深度挖掘现有硬件的潜力。(财联社)