IT大嘴巴 · 2023年03月13日 · 天津市

构建“下一代”ChatGPT,算力才是破局根源

ChatGPT 发布之后,引发了全球范围的关注和讨论。根据相关数据显示,ChatGPT 的单次回复至少要花费1美分。在未成为“爆款”前,满足当时100多万用户的需求,公司每天至少需要10万美元运行成本。然而当用户数高达数亿之后,每年的成本支出就将超过50亿美元。算力成本高昂,限制了ChatGPT 等 AI 模型的参数量,也限制了模型的智慧能力,还限制了模型的广泛使用。

试想一下,如果算力能够大踏步地发展,在成本不变的情况下,把算力提升千倍万倍,比 ChatGPT 更高级别的智能就一定会出现。算力作为继热力、电力之后新的关键生产力,也是制约AI发展的最关键因素。

突破算力瓶颈

当下,正是算力爆发的时代。以 ChatGPT 等 AI 大模型的发展为例,其算力需求大致是每两个月就会增加一倍。这样的增长要求,即便是实现了翻倍的摩尔定律也难以企及,更不消说巨大的成本需求。高昂的成本对任何一家企业来说,基本上都是无法接受的。在这种情况下,想要成百上千倍地提升算力,必然需要全新的算力平台。

而亚马逊云科技正在为此做出努力,突破算力瓶颈。2月28日,市场调研机构 Counterpoint 最新公布的服务器 CPU 报告显示,亚马逊云科技3.16%的市场份额,较2021年提升了近一倍。

image.png

在亚马逊云科技2022 re:Invent 全球大会上,亚马逊云科技自研的基于 Arm 架构 CPU 芯片 Amazon Graviton 发布了增强的第三代版本 Amazon Graviton3E,并将之用于更多的计算实例。Amazon Graviton 不仅仅是 Amazon EC2 的基础,更是亚马逊云科技更多的托管服务如容器等的打造基础,为云计算提供更加普惠的算力。在使用这些服务的时候,企业都可以享受到 Amazon Graviton 带来的性价比提升。

算力引领产业变革

“不管是智能语音、自动驾驶,抑或是最近火热的 AI 绘画,所有的 AI 发展都使得机器学习模型变得越来越复杂。”在日前的一场交流中,亚马逊云科技的技术专家这样表示。

过去几年里,模型的规模不断扩充,参数更是从数亿增加到数千亿个之多,训练和部署这些日益复杂的机器学习模型的高成本,正在将很多企业,尤其是小型创新公司拒之门外。

image.png

从“芯”出发

在芯片的设计和构建方面,亚马逊云科技拥有业界顶尖的团队,在十多年的发展中已经开发出众多优秀的产品,譬如 Amazon Graviton 系列、Amazon Inferentia,以及 Amazon Nitro 系统 等。

亚马逊云科技在2019年设计和推出了 Amazon Inferentia,来为机器学习应用程序提供高性能,让广大客户在尽享 AI 红利的同时,能够负担得起成本。作为一种专门用于机器学习推理及驱动的服务器芯片,Amazon Inferentia 与同类基于 GPU 的服务器相比,提供了无与伦比的性价比价值、更高的吞吐量和更低的延迟。

为应对训练模型复杂度的不断提升,亚马逊云科技专门为云中高性能模型训练而搭建的 Trn1 实例最多可以搭载16颗专门用于机器学习训练的 Amazon Trainium 芯片。与基于 GPU 的类似实例相比,Trn1 实例训练成本降低了50%。

在2022 re:Invent 全球大会上,推出了一款基于 Trn1 的网络优化型实例 Trn1n,进一步把网络带宽增加一倍,能够将超过1万个 Amazon Trainium 芯片构建在一个超大规模集群里进行模型的并行训练。亚马逊云科技还推出了 Amazon Inferentia2 芯片和 Inf2 实例。与前代相比,新的 Inf2 实例的每瓦性能提升45%,吞吐量提升4倍,延时只有1/10,支持 GPT-3、Mask R-CNN、VIT 等超大型复杂模型。

而且,除了高性能和低成本,Amazon Inferentia 系列芯片与实例在减碳方面表现卓越,符合全球绿色可持续发展的生态命题。

image.png

创“芯”显效

Finch Computing 是一家软件初创公司,致力于使人类生成的文本具有机器可读性。然而,由于机器学习带来的高昂成本,使得该公司不得不强行减缓他们的前进步伐。

Amazon Inferentia 的推出,让 Finch Computing 的管理者眼前一亮,该公司迅速将其计算密集型模型从原有的 GPU,迁移到 Inferentia,他们的回报也是立竿见影——其推理成本足足降低了80%以上。

就这样,通过以极低的成本提供强大的性能,Amazon Inferentia 为客户的创新开辟出全新的途径。

探索AIGC发展

人工智能的火热出圈,并不只是被最近的 ChatGPT 点燃。事实上,去年游戏设计师杰森·艾伦通过 Midjourney 平台创作的画作《太空歌剧院》赢得艺术类比赛一等奖,已是最好的例证之一。

在创意、表现力、迭代、传播、个性化等方面,AIGC 能够充分发挥技术优势,打造出新的数字内容生成与交互形态,现有的 AI 绘画、AI 写作,以及前面所说的 ChatGPT 等,都属于 AIGC 的具体表现形式。

当然,AIGC 并不是只用于聊天、绘画,必然会在大量的探索和尝试之后,转向更有价值的行业应用领域,从而对经济和社会发展产生巨大的影响力。从这一点来说,强大和经济的算力支撑,同样是 AIGC 深入发展的必要前提。亚马逊云科技通过在芯片、服务等方面的不断创新,帮助广大客户更深入了解和探索 AIGC 在各个领域的实践,实现 AIGC 的关键趋势洞察和快速落地。

未来,更强大的人工智能服务,需要解决的问题核心是落后的算力基础和先进的业务需求之间的矛盾。这并不是简单的技术探索,而是随着业务场景不断升级的持续性创新。亚马逊云科技一直致力于利用创新的云技术推动产业发展,为数字化发展提供技术底座和驱动引擎。亚马逊云科技广泛而深入的人工智能专属解决方案,正以先进的性能、更优的性价比和全面的服务赋能千行百业,助力各个规模的企业拥抱人工智能的浪潮。

推荐阅读
关注数
1943
内容数
252
专注开放计算、大数据应用、人工智能、企业数字化转型、云计算等领域产业观察及产学研合作。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息