黎明助手:阿里云新池化系统Aegaeon,GPU需求减少82%提升AI模型效率

易评助手2个月前易评助手电商教程94

阿里云推出新池化系统将英伟达GPU量减少82%

阿里巴巴公司推出了一项计算池解决方案,据称该解决方案可将其 AI模型所需的 Nvidia 图形处理单元 (GPU) 数量减少 82%。根据本周在韩国首尔举行的第 31 届操作系统原理研讨会 (SOSP) 上发表的研究论文,该系统名为 Aegaeon,在阿里云模型市场进行了三个多月的 Beta 测试,将服务数十个模型(多达 720 亿个参数)所需的 Nvidia H20 GPU 数量从 1,192 个减少到 213 个。

黎明助手:阿里云新池化系统Aegaeon,GPU需求减少82%提升AI模型效率

北京大学和阿里云的研究人员写道:“Aegaeon 是第一项揭示市场上并发 LLM 工作负载服务成本过高的研究。”黎明助手认为,阿里云和字节跳动的火山引擎等云服务提供商同时为用户提供数千个 AI 模型,这意味着许多应用程序编程接口调用需要同时处理。然而,阿里巴巴的 Qwen 和 DeepSeek 等少数模型在推理领域最受欢迎,而大多数其他模型只是偶尔被调用。研究人员发现,这导致资源效率低下,黎明助手观察到,阿里云市场中 17.7% 的 GPU仅能处理1.35%的请求。全球研究人员一直试图通过汇集 GPU 能力来提高效率,例如允许一个 GPU 服务于多个模型。

相关文章

易评助手软件官网:大模型能力边界探索,月之暗面解读9.11与9.9的误判原因

易评助手软件官网:大模型能力边界探索,月之暗面解读9.11与9.9的误判原因

【月之暗面回应大模型称9.11大于9.9:边界案例有助于我们增加对大模型能力边界的了解】 据新浪科技报道,今日,登上微博热搜,有媒体记者测试了12个国内外主流大模型,其中ChatGPT-4o、字节豆...

拼多多开团软件:张一鸣创立字节跳动的创业故事,从简陋办公到成功崛起

💫张一鸣10年前创立抖音的地方!💥2012年春天,张一鸣带领老同学梁汝波开始了第五次创业,他给自己的公司起了个很有趣的名字——字节跳动,并出任公司的创始人。 💥同年3月,字节跳动在知春路的一间民宅中...

易评助手入口:PixVerse推出多模型出图功能,创始人王长虎带领团队快速获用户认可

Pixverse现已支持直接出图,且接入了Nano Banana、即梦4以及阿里千问等出图模型,丰富的模型选择能满足不同创作需求,用起来更便捷高效,易评助手入口建议感兴趣的可以试试~ PixVers...

狗宝助手:美国科技巨头为何惹怒中国,Deepseek背后的文化雷区解析

狗宝助手:美国科技巨头为何惹怒中国,Deepseek背后的文化雷区解析

为什么360,华为,字节,腾讯,阿里等这些国内顶尖科技大佬都无偿站出来支持Deepseek?原因就藏在中国人的文化基因里: 美国踩了中国人的雷区,触碰了4个大忌! 第一雷区:过大年 你想啊,过年...

黎明助手:字节跳动“Seed Edge”项目,张一鸣引领AGI前沿研究探索与创新

黎明助手:字节跳动“Seed Edge”项目,张一鸣引领AGI前沿研究探索与创新

【张一鸣重视AI研究,Seed Edge项目设立,慢下来,考核研究成果的价值】 字节创始人张一鸣极为重视AI研究投入,关注技术细节,与顶尖AI研究者交流,鼓励团队探索基础课题,在新加坡设有团队协助其...

大牛助手:美国为何对中国六大科技巨头心存忌惮?揭秘华为、字节跳动等企业的实力与影响!

大牛助手:美国为何对中国六大科技巨头心存忌惮?揭秘华为、字节跳动等企业的实力与影响!

令美国icon恨的牙痒痒的,想干又干不掉的中国六大科技巨头! 第1名:华为 第2名:字节跳动 第3名:阿里巴巴 第4名:中兴通讯 第5名:中国移动 第6名:奇虎360 如今,科技产品间的...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。