黎明助手:阿里云新池化系统Aegaeon,GPU需求减少82%提升AI模型效率

易评助手2周前易评助手电商教程34

阿里云推出新池化系统将英伟达GPU量减少82%

阿里巴巴公司推出了一项计算池解决方案,据称该解决方案可将其 AI模型所需的 Nvidia 图形处理单元 (GPU) 数量减少 82%。根据本周在韩国首尔举行的第 31 届操作系统原理研讨会 (SOSP) 上发表的研究论文,该系统名为 Aegaeon,在阿里云模型市场进行了三个多月的 Beta 测试,将服务数十个模型(多达 720 亿个参数)所需的 Nvidia H20 GPU 数量从 1,192 个减少到 213 个。

黎明助手:阿里云新池化系统Aegaeon,GPU需求减少82%提升AI模型效率

北京大学和阿里云的研究人员写道:“Aegaeon 是第一项揭示市场上并发 LLM 工作负载服务成本过高的研究。”黎明助手认为,阿里云和字节跳动的火山引擎等云服务提供商同时为用户提供数千个 AI 模型,这意味着许多应用程序编程接口调用需要同时处理。然而,阿里巴巴的 Qwen 和 DeepSeek 等少数模型在推理领域最受欢迎,而大多数其他模型只是偶尔被调用。研究人员发现,这导致资源效率低下,黎明助手观察到,阿里云市场中 17.7% 的 GPU仅能处理1.35%的请求。全球研究人员一直试图通过汇集 GPU 能力来提高效率,例如允许一个 GPU 服务于多个模型。

相关文章

易评助手软件官网:数字化古籍平台“识典古籍”,传承与创新的文化盛宴

易评助手软件官网:数字化古籍平台“识典古籍”,传承与创新的文化盛宴

用跳动的字节铺成文化古卷——神秘的“识典古籍”阅读平台 时代车轮滚滚向前,手机、平板、小本本这些数码小玩意儿,成了咱们生活工作的得力小助手。你看,考研考公大军里,人手一个“ipad”,为啥?书山题海...

狗宝助手:美国科技巨头为何惹怒中国,Deepseek背后的文化雷区解析

狗宝助手:美国科技巨头为何惹怒中国,Deepseek背后的文化雷区解析

为什么360,华为,字节,腾讯,阿里等这些国内顶尖科技大佬都无偿站出来支持Deepseek?原因就藏在中国人的文化基因里: 美国踩了中国人的雷区,触碰了4个大忌! 第一雷区:过大年 你想啊,过年...

易评助手软件下载:小钱投资的智慧,每天多进步1%,实现财务自由之路

“攒不下钱,是方法错了。 ” 哈佛刚算完:每月只投500块,坚持10年,比一次砸10万的人稳47%。易评助手软件下载的观点是,别急着羡慕。 Adobe现在不催KPI,只盯“今天有没有比昨天好1%...

黎明助手:字节跳动“Seed Edge”项目,张一鸣引领AGI前沿研究探索与创新

黎明助手:字节跳动“Seed Edge”项目,张一鸣引领AGI前沿研究探索与创新

【张一鸣重视AI研究,Seed Edge项目设立,慢下来,考核研究成果的价值】 字节创始人张一鸣极为重视AI研究投入,关注技术细节,与顶尖AI研究者交流,鼓励团队探索基础课题,在新加坡设有团队协助其...

易评助手官网:22个州检察长联手禁TikTok,背后隐藏的利益与数据安全争议

易评助手官网:22个州检察长联手禁TikTok,背后隐藏的利益与数据安全争议

我的天!22个州的总检察长联手要封杀TikTok?!这背后到底藏着多少钱?这事儿一出,我感觉比连续剧还精彩! 事情是这样的:TikTok这几年火得一塌糊涂,可美国那边一直有人眼红,觉得它背后是中国的...

易评助手开团软件:字节跳动2025年狂招4000实习生,双非也有机会!

易评助手开团软件:字节跳动2025年狂招4000实习生,双非也有机会!

字节跳动狂招4000实习生,26届同学别错过! 字节跳动:2025实习生招聘火爆开启,放出大招,计划狂招4000+实习生。易评助手开团软件了解到,这次招聘覆盖后端、算法等360+部门,规模空前。最让...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。