天翼云开发者社区 · 2023年08月29日 · 北京市

天翼云加速落地紫金DPU实践应用,让算力供给更高效!

近日,以“智驱创新·芯动未来”为主题的第三届DPU峰会在北京成功举办。会上,天翼云凭借紫金DPU在架构革新、算力释放、场景落地等多方面的成果,荣膺“2023芯星品牌奖”,技术实力与品牌影响力再获行业认可。天翼云科技有限公司基础架构事业部高/级产品经理雷晓龙在技术生态论坛发表了题为“天翼云紫金DPU产品升级及应用实践”的演讲,分享天翼云以紫金DPU为核心的紫金架构,及其在多个算力应用场景中的探索实践,为业界提升计算系统效率、推动算力普惠应用提供了参考。

image.png

构建高效算力基础设施
打造新一代云计算体系架构

当前,人工智能、大数据应用进入快速发展阶段,催生海量算力需求,拥有强大集群算力的新型数据中心成为突破人工智能发展瓶颈的突破口。DPU通过业务卸载和硬件加速,释放主机CPU的计算资源,实现任务加速处理,提升算力算效,成为构建新型算力基础设施的重要基础部件。

天翼云作为云服务国家队,一直以来积极加码布局算力新基建,推出了新一代云计算体系架构——紫金架构,通过紫金DPU与紫金系列定制硬件、自研云服务器操作系统、云操作系统的深度融合,形成软硬一体的整体解决方案,构成天翼云下一代云计算的算力基础底座。

作为紫金架构的核心,紫金DPU完成了虚拟化全卸载、多种业务硬件加速和自研三栈合一高性能网络协议三大技术突破,具有“极/致高性能、虚拟化全卸载、超高可靠性、硬件加速、国产化兼容、安全隔离”六大特点,为企业打造高性能、低延时、高可靠性并且可大规模部署的环境,助力算力基础设施升级。

紫金DPU不仅性能卓越,在使用上也更灵活简单,支持统一管控和自动化运维。通过实现对不同产品形态、不同平台的统一管控和相互迁移,提高整体算力基础设施的效率和稳定性。为了应对规模部署所带来的运维挑战,紫金DPU提供了丰富的自动化运维工具集,依托这些工具可有效缩短故障分析、故障定位和故障恢复时间,保障用户业务的高可用

探索三大实践场景
紫金DPU促进算力应用降本增效

依托产品技术突破及性能优势,天翼云目前已将紫金DPU广泛应用到弹性裸金属、云主机、容器产品等,在越来越多的关键业务场景中落地实践,助力客户真正实现算力应用方面的降本增效。

核心数据库场景是紫金DPU应用的重要场景。天翼云弹性裸金属大量部署了数据库实时应用集群,在该场景中,通过应用紫金DPU大幅提升网络和存储性能,满足云上核心数据库对于高性能计算能力的要求。从业务总体性能提升来看,在同等配置下,基于紫金DPU的弹性裸金属,相比传统裸金属产品在此场景下,性能提升了30%。另一方面,天翼云弹性裸金属利用存储和网络的“弹性”可实现业务和数据的高可用。

在国产化场景中,紫金DPU也有深入实践。紫金DPU的物理隔离功能使算力基础设施的兼容性得到大幅提升,可快速兼容不同的算力架构,支持主流芯片的产品化适配和规模部署,并同步适配天翼云自研服务器操作系统CTyunOS以及麒麟、统信等国产操作系统,真正做到一云多芯、即插即用,推动国产化算力基础设施发展。此外,在智算场景中,天翼云也在探索通过紫金DPU同时实现VPC/RDMA网络的接入,将VPC网络/存储网络合二为一,实现单卡支持多种网络形态接入,减少设备数量,简化组网方案,降低组网成本,提高可靠性。

在大模型等AI技术、应用高速发展的大趋势下,算力需求将持续走高。天翼云将继续坚持科技创新,深挖DPU产品潜力,加速DPU应用在更广阔的业务场景中,以前沿技术助推产业升级,赋能千行百业数字化转型。

推荐阅读
关注数
8770
内容数
279
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息