2021 年,百度公布了 2030 年碳中和目标以及 6 条科学实现路径。首要举措便是建设更环保的数据中心。百度自建的数据中心 PUE 一直处于非常领先的位置。百度一直秉持“科技为更好”的可持续发展理念,依托全栈和领先的人工智能技术和丰富的产业实践,在自身达成“碳中和”目标的基础上,也会通过技术输出为全社会节能减排助力。
数字化转型过程中,算力多元化和异构化已然成为发展趋势。为解决算力需求不断增长在节能减排大势下的挑战,除对既有数据中心基础设施进行技术升级之外,还可以采用更高效的解决方案,在不增加数据中心空间和能源消耗的情况下,实现低碳发展和算力供给的协同。
为此,百度智能云正式发布了新型 BCC 实例产品 Gr1。不同于其他云服务器,Gr1 所搭载的 Ampere®Altra®云原生处理器基于 Arm 指令集架构,采用单核单线程设计,让云实例的每一个计算核独享 ALU(逻辑计算单元),缓存等关键物理资源,每核恒定主频 3.0GHz,实现稳定可预测的性能,拥有更好的安全保障。更重要的是在提供同等性能时,采用 Gr1 实例所消耗的电力将减少一半以上,不但为每一个百度智能云的用户在享受 Gr1 所带来的新特性,还能实现主动减排。
百度智能云 Gr1 云实例支持 1:2 和 1:4 的核存比,可选核数从 1 核到 64 核,支持 ESSD 云盘,最高可支持 25Gbps 内网带宽,具有超高网络收发包能力,可满足极高的内网传输需求。
Gr1 实例产品非常适合最为常见的云原生应用负载,如开源数据库、Java 应用程序、视频编解码、AI 推理(数据治理)、大数据分析、DevOps、Web 服务应用等。相对传统的云服务器,Gr1 的性能表现出明显的优势。比如对于 Web 服务应用中常见的三个工作负载 NGINX,Redis 和 MySQL,Gr1 可以实现成倍的性价比提升。
今天 AI 推理已经在数字应用中被广泛使用,对于大规模 AI 模型或者对性能很高的场景,多数是利用 GPU 或者专用芯片来实现。但是对众多诸如 Web 应用,或者像数据治理这类独立数据服务系统来说,采用 GPU 平台并非是成本效益最好的选择。随着其工作负载动态波动,GPU 的工作量很少饱和,GPU 的算力并不总是被充分利用,很难实现随着实际业务量的变化进行灵活的扩展。
这时,采用 CPU 做 AI 推理可以依靠最为常见,配置丰富的标准型云服务器就能满足业务需求。除了更低的云服务器采购成本,用户将拥有更好的可控性,不依赖第三方硬件,涉及操作系统、驱动程序、运行时的软件复杂性较低,而且更易于扩展并与其他软件堆栈和微服务集成。百度智能云 Gr1 实例支持经过优化的 AI 框架(TensorFlow, PyTorch, ONNX),开箱即用,无需做任何修改即可无缝集成。Gr1 采用的 Ampere Altra 处理器原生支持 fp16 的数据格式,释放极致性能而无精度损失。
近年来新兴的源自终端市场的 Arm 原生应用,诸如云终端仿真、云手机,云游戏,规模化 App 开发测试等,得益于指令集同构,Gr1 实例原生支持 64 & 32-bit 应用,更是完美适用。使用云端 Gr1实例,能充分利用高效的云开发平台和工具链,实现跨设备的可迁移性,以及云/边缘到设备的跨平台的兼容性。
目前 Gr1 实例已经已支持 CentOS7.9、CentOS7.6、Ubuntu22.04、Ubuntu20.04 等常用 Linux 公共镜像。下一代计算技术将是以云原生软件技术(如微服务、容器)进行设计。为了让客户更轻松地部署云原生的工作负载,作为百度智能云容器化工作负载的关键基础设施 Cloud Container Engine(CCE)目前已提供对 Gr1 实例的支持,后续更多云产品将会被使能。
百度智能云在 Arm 架构技术方面拥有多年的经验,并将继续参与日益完善的 Arm 生态系统,帮助云用户在更高效的 Gr1 平台上构建优秀的解决方案,收获更好性价比。同时,通过百度智能云技术让更中小企业和广大的软件开发者共同参与到碳减排中来。
作者:安晟培半导体
文章来源:安晟培半导体
推荐阅读