近日, “2023英特尔客户端解决方案论坛”在珠海举行,此次论坛以“百岛城 百川归海有渠道,珠江口 珠联璧合领芯潮”为主题,英特尔分享了其专为中国市场打造的创新解决方案,并与来自全国各区域的全栈解决方案服务商合作伙伴们一同就区域数字化转型进程中的诸多合作成果与宝贵经验,以及产业数字化升级的未来趋势进行分享和探讨,助力多领域数字化发展。
在此次会议中,英特尔携手生态合作伙伴展示了基于英特尔技术的诸多创新应用,多项软、硬件产品与服务结合至整体解决方案涵盖了包括AI、高性能计算、教育、泛娱乐等领域,灵活、快速地满足用户的多样化需求。
洞察趋势 精准预判
在客户端领域,相对于PC的销售增长趋于平缓,工作站继续保持强劲增长。过去,工作站是少数人使用的先进计算机,随着工程设计、仿真、视频、人工智能等应用趋于广泛,工作站代表的是稳定、可靠的高效率生产力工具。在数字化、智能化时代,各个行业对生产力的更高要求进一步凸显了专业化工具、专业化服务的价值。
英特尔(中国)客户端与分销平台业务部产品经理牛玉鑫介绍了中国市场的工作站发展趋势:中国市场工作站年销售已经突破百万台,且预计2020~2025年的复合增长率可以达到10%左右。得益于CPU、GPU等算力核心的持续发展,工作站在性能、扩展性等方面不断取得突破。那么,除了性能的增长,工作站的形态会有什么样的变化?从用户需求角度看,目前工作站有三个大趋势。
英特尔(中国)客户端与分销平台业务部产品经理 牛玉鑫
首先是定制化,因为工作站的使用场景非常广泛。譬如,有的用户的实验室中有非常多的工作站,因此他们希望每个人的设备尽可能的静音。同时,中国拥有非常全面的IT产业链,可以提供多样化的组件,包括主板、机箱、电源、风冷/液冷散热等等,有充足的实力将客户的定制化需求转变为现实方案。
第二点是便携化和云化,因为工作站的部署场景越来越灵活。譬如家装设计师需要在现场测量,根据实物进行调试,实时渲染出图,现场讨论设计方案。还有一些影视的用户,素材容量很大,甚至有保密的需要,他们希望把工作站搬到云上。
第三点是AI化。2023年的人工智能大潮让我们看到未来AI运算将无处不在,工作站如何来去承载 AI运算,包括AIGC应用,是我们需要去思考的趋势。与AI相关的元素,包括处理器指令集、加速器,包括异构计算的结合,也包括各种软件栈的助力,以及持续地深度优化等等。
算力筑基 全栈赋能
英特尔将工作站处理器分为两类:性能型和移动型。性能型主要面向于机架式或塔式的应用场景。移动型主要面向笔记本电脑的便携移动场景。
对于性能型工作站,根据用户的工作负载划分为三个等级:专家级、主流级、入门级。入门级可以满足相对简单的图形图像处理,如设计草图、高清视频、简单的AIGC应用。主流级工作站面向最为广泛的工作负载,复杂模型、视频特效等。专家型工作站用于计算机辅助设计、模拟仿真、8K视频编辑,还有AI大模型开发等。
对于移动型工作站,英特尔提供三种功耗等级的处理器:55瓦、45瓦、28瓦。可以根据用户对性能和便捷性的需求进行选择。
处理器是工作站的性能核心,但工作站的价值不仅仅在于处理器。英特尔通过深度的整合中国的IT产业链,构建了从硬件到系统,再到应用方案的全栈布局。从平台技术层面看,英特尔可以提供丰富的软、硬件产品,这是工作站生态的基石。硬件方面,除了处理器,还有GPU加速卡、网络(以太网、WiFi、雷电)等,有vPRO、EVO等平台技术。软件方面,有oneAPI、OpenVINO等,可以提升应用开发的效率。
基于英特尔的平台技术,工作站硬件生态也非常丰富,包括主板、内存、电源、散热、机箱等,并且不断创新。系统设计层面,操作系统、OEM、ODM等提供了稳定可靠的高水平工作站方案,有的小巧便携,有的可以灵活部署,有的强调噪音控制,有的追求部署密度,有的提供高可扩展性。
工作站的应用方案涵盖了工程设计、媒体/娱乐、数据科学、生物医药等领域,也包括地理信息、人工智能、金融计算等新兴领域。AIGC是今年非常热门的赛道,英特尔至强 W平台如何满足AI应用的需求?
大模型可以分为两类:大语言模型、多模态大模型。大语言模型主要用来处理自然语言,如今年大火的ChatGPT、Llama 2、百川等。多模态大模型,可以让文字、图片、视频、音乐等多种不同的信息互相转换,如Studio Diffusion、Midjourney等。
大模型的开发工作流程可以分为四个部分:数据预处理、模型训练、模型微调、部署推理。两类大模型、四种工作场景,组合为8种需求。至强W处理器可以满足其中7个场景的需求,除此之外的大语言模型训练更适合使用至强可扩展处理器实现。目前的至强 W处理器可以达到56个核心, PCIe扩展能力可以支持多达7个GPU,拥有AMX加速器等特性,非常适合完成AI相关应用。
聚合生态 协同创新
全球市场的工作站销售主要依靠品牌商提供,但中国市场的特色是渠道的占比很大,而且份额稳步提升,已经达到20%以上,预计2025年会接近30%——这与其他国家有非常明显的不同。
多年来,英特尔始终秉持“水利万物而不争”的理念,致力于坚持联合产业上下游构建开放生态,在构建多项行业统一标准的同时,为生态合作伙伴提供全链路资源支持,加速实现企业业务拓展与升级。
目前英特尔已经建立起了强大的生态系统,英特尔渠道伙伴展示出独特的竞争优势:离最终用户更近,对细分市场拥有更专业的研究,将基于对众多行业发展趋势的精准把握和产业实际需求,转化为更具通用性的系统解决方案和创新产品。
英特尔致力于以行业领先的产品技术和创新的解决方案为中国产业合作伙伴提供全方位技术支持,解决方案论坛是展现英特尔合作伙伴实力的一个绝佳舞台。以强调高性能运算的数据科学工作站为例,“专业应用解决方案”区就有多台外观、配置思路近似的产品。为了提供充沛的性能和扩展能力,它们都采用了高大的全塔式机箱、水冷散热,以搭配顶级至强处理器和GPU加速卡。但是,在硬件配置之外,渠道商通过不同的方式,展现了不同领域的软实力。
在展示区,“高端发烧友及工作站产品”占据了C位,“专业应用解决方案”区块更是集中了多样化的工作站应用场景:既包括三维建模、广播电视、科学计算、运动重建等专业程度极高的行业,也包括新兴的高清视频剪辑、AIGC应用。这些应用场景均需要高性能、高稳定性、高可用性解决方案。
赋能生态 合力致远
英特尔与渠道伙伴们紧密合作,在快速服务终端用户的同时,推动产品技术同步创新,助力数字技术与实体经济的深度融合。
1)深刻理解应用特点,好钢用在刀刃上
分子动力学计算是典型的高性能工作站应用,其中的代表有GROMACS、MBER、NAMD3、LAMMPS等,这些软件均可使用多块GPU加速运算。攀升磐龙TW-S4一体式液冷工作站提供了强大的CPU、GPU全液冷方案,充分释放性能,而且更为静音,完全胜任分子动力学计算的需求。
在验证、调优过程中,攀升发现CPU运行 MD 模拟时需要 CPU 参与部分计算工作,CPU的频率、跨内核调度的效率、内存带宽等,对最终性能影响较大。经过不同品牌、系列的CPU、GPU的组合与对比测试,使用W9-3495X、3475X为代表的高频处理器能够取得更为优异的效果。
针对分子动力学应用场景优化的攀升磐龙TW-S4一体式液冷工作站解决方案,具有4块NVIDIA GeForce RTX4090 24GB GPU,每块GPU享有直连CPU的PCIe Gen5 x16总线,单节点FP32性能高达495.6TFLOPS。每节点采用1颗最新一代Intel 至强 W9处理器,具有36颗Golden Cove架构核心,功耗墙最高可配置到900W,全核心满载加速频率4.6GHz,Per-core性能极高。在对比同价位服务器测试中,每块4090性能在实际测试中的表现提升了22%,噪音降低了50%。
磐龙TW-S4工作站的CPU和GPU均采用了液冷散热。目前攀升正在进一步验证外形更紧凑的单宽GPU液冷方案,可更充分地发挥Sapphire Rapids处理器和W790主板的PCIe通道数量优势,力争将高性能GPU加速卡的安装数量从4块提升至7块,大幅度提升工作站的总体算力。
2)一站式部署AI应用,轻松运维私有云
倍联德数据科学工作站是基于英特尔至强W-3400/2400系列处理器开发的人工智能计算专用解决方案,提供异构硬件融合和算力优化,可以按照算力需求和模拟的规模灵活选择 1~4 张双宽GPU加速卡。液冷散热技术可让CPU和GPU得以全速运转,甚至可以超频运行。ATX3.0 标准的双电源设计,提供稳定可靠和充沛的电源供应。支持12个3.5/2.5英寸硬盘位和4个M.2 NVMe SSD接口,提供充沛的存储能力。
尤为值得一提的是,倍联德数据科学工作站不仅仅提供强大的硬件解决方案,还为用户提供 AI应用研发和运行的工程环境。一方面,通过 GPU资源虚拟化和分布式训练技术提供高效的算力优化管理,弹性灵活地满足不同场景机器学习对算力、性能、安全和成本的需求;另一方面,平台预置常用AI框架,通过提供高效的机器学习开发运维,全流程地支持AI模型的构建训练部署和运维。譬如,通过后台,可以查看工作站的资源分配情况,多用户可进行训练任务提交和多版本管理等。
高性能、静音的硬件特点,结合易于部署、共享的运维能力,使得倍联德数据科学工作站尤其适合工作组、实验室、高校教育等场景的需求,也体现了集成商贴近用户、深刻理解场景的服务优势。
结语
英特尔客户端解决方案论坛提供了一个非常好的纵观英特尔工作站解决方案的机会,从整体解决方案,到包括电源、散热器、主板等组件,让我们认识到产品的竞争其实是非常立体的。首先,当然需要“好产品”,其中包括产品线丰富,譬如工作站处理器可以涵盖高性能或者移动场景需求,提供了6核到56核的绵密选择,也包括高频率、高扩展性、加速指令集等优秀的性能特性。其次,需要构筑“好生态”,包括多种类型的合作伙伴,丰富的软件栈,以实现多样化的、不断创新的优秀系统设计——也就是获得第三点,大量的“好方案”,满足千行百业的需求,应对已知或未知的挑战。有了以上“三好”,才能够让整个生态系统、供应链上下游,包括用户,筑牢算力基础设施,拥抱数字化转型,挖掘智能涌现的创新价值,共同拥有“好未来”。