天翼云开发者社区 · 2023年12月11日 · 北京市

“碳”出新路!天翼云紫金架构给产业发展一点“颜色”!

由广州开发区管委会、黄埔区政府主办、上海浦东新区格物科创金融研究院协办的“2023粤港澳大湾区绿色计算产业大会”,于2023年11月28日在广州市黄埔区知识城国际会展中心隆重举行。大会主题围绕“绿色计算·驱动未来”进行讨论,向来自全球的与会嘉宾分享、交流了当前数字经济领域前沿的算力技术、人工智能技术以及最新的绿色算力产业的机遇与挑战。天翼云科技有限公司基础架构事业部技术总监刘禄仁参会,分享了天翼云在加速算力底座升级、为数字产业赋能方面的实践。

image.png
天翼云科技有限公司
基础架构事业部技术总监 刘禄仁

随着“双碳”战略持续推进,我国绿色计算产业发展驶入快车道,新技术、新业态、新模式不断涌现,算力基础设施建设更是呈现出绿色低碳、安全可靠的基本特征。天翼云作为云服务国家队,积极践行绿色发展理念,建设泛在覆盖、架构先进、云网融合、安全可控、绿色低碳、全球部署的新型云网基础设施,目前已形成“2+4+31+X+O”的资源布局架构。

面向新应用与新场景不断涌现所带来的算力需求激增,高性能、大带宽、低时延、低成本几乎已经成为业务对于算力基础设施的刚性要求。天翼云推出了为云而生的新一代天翼云算力架构——紫金架构,以紫金DPU为核心,通过与紫金系列定制硬件以及自研云服务器操作系统与云操作系统的深度融合,形成软硬一体的整体解决方案,构成天翼云下一代云计算的算力基础底座。

image.png

天翼云自研紫金DPU是整个算力架构的核心,能够实现对计算、网络、存储等算力资源的快速云化加速。紫金山计算服务器、紫金湖存储服务器及紫金桥交换机是紫金系列硬件的基石,覆盖了计算、存储和异构等多种场景。天翼云凭借紫金架构“一云多芯”的能力,使不同架构的极致算力得到有效释放,并将国产资源池和多样化算力集群同步纳入云操作系统TeleCloudOS4.0,实现算力一体化服务,结合绿色、智能、弹性的IDC基础设施,为用户提供超高性能、安全可靠、自主可控、绿色低碳的云计算基础设施。

当前,人工智能大模型加速落地应用,智算作为一种AI驱动的计算新形态迎来爆炸式增长,以大模型为代表的智算集群,要求算力损耗尽可能少的情况下进行模型的训练推理。天翼云发挥自主创新的技术优势,全面提升智算服务能力,应对AI时代下的适配、能耗和散热等算力发展瓶颈。

在异构算力方面,天翼云研发的基于内核虚拟化的容器共享技术,支持多个容器共享一张GPU卡,并提供算力、显存、故障强隔离能力,既实现了业务的安全运行,也达到提升GPU利用率、降低用户使用成本的目的;推出大模型训练/推理评测标准,快速评测国产GPU的性能、功耗以及成本,为快速引入GPU芯片打下坚实基础。

在云化算力方面,天翼云通过紫金DPU,以弹性裸金属的方式对外提供算力,实现虚拟化零损耗;通过大带宽的DPU接入,将VPC流量以及多个平面的存储访问流量收敛,统一由一个DPU来承载。

在高速互联方面,天翼云推出400G接入、51.2T交换的自研RoCE RDMA网络,支持多路径流量负载均衡;通过自研CTCC拥塞控制算法,提升网络吞吐,保障流间公平。

在绿色低碳方面,推出冷板液冷方案并定制液冷DC舱,融合定制化液冷智算服务器,实现低至1.12的PUE,另外通过IDC监控系统,持续优化智算IDC的能耗,为智算提供整套绿色低碳、灵活高效的算力基础设施。

此外,天翼云还在技术、应用、服务、渠道多个领域持续搭建全方位的生态体系,携手合作伙伴共建繁荣国云生态,共促产业发展。未来,天翼云将持续推动算力基础设施升级,加速绿色算力普惠应用,以坚实国云算力底座助力千行百业转型升级。

推荐阅读
关注数
8770
内容数
279
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息