今年春节期间,人工智能有一个天方夜谭般的话题——奥特曼宣称要用7万亿美元扩大芯片产能。业界对这个数字的态度不必在此赘述,但显而易见的是,这个天文数字体现的是人们对算力的焦虑。
人工智能铁三角是:算力、算法、数据。算法正在快速迭代,Sora又开辟了新的路线。数据呢?似乎研究机构们已经几乎穷尽了互联网上的所有数据,但是,这是全部吗?大模型将人工智能的发展带入了新的领域,在带来一波又一波新的兴奋点的同时,也推升了业界对算力的预期和渴望。
精准洞察,
生成式AI重在落地
随着工程设计、仿真、视频、人工智能等企业业务应用趋于广泛,以工作站为代表的单路计算解决方案以其稳定、可靠、高效率的特点受到用户的重视,持续保持强劲增长。英特尔研判:中国市场基于Xeon W的单路计算解决方案年销售已经突破百万台,且预计2020~2025年的复合增长率可以达到10%左右。得益于CPU、GPU等算力核心的持续发展,单路计算解决方案的性能、扩展性不断取得突破,在数智世界扮演越来越重要的角色。目前大模型为公众提供的主要服务方式是生成式AI,算力部署在云端,通过网页或类似于Copilot 这样的助理提供交互式的人工智能服务,可以帮助总结文档、撰写报告、生成图像等等。随着部分大模型开源,基于用户专有内容的人工智能也得到了充分地重视。部分垂直行业和企业用户利用开源模型和调整过的算法对本地数据做训练和处理,以补充通用模型。训练专有的垂直领域模型既提高了人工智能的专业性,又保护了私有数据和知识产权。
例如,律所可以利用自己的历史资料形成专属的知识库,方便交互式的咨询问答。设计师可以把自己的设计方案智能化,或者将自己和用户已有的作品进行训练,可以高效率地生成设计初稿,提升创意质量。
Xeon W,
为AI算力而生
在当今快速发展的数字时代,AIGC技术正逐渐成为创新和内容创作的前沿。无论是在自动生成艺术作品、编写新闻报道,还是在复杂的数据分析和模式识别中,生成式都在不断地推动着可能性的边界。与大模型训练需要部署服务器集群相比,基于基础模型的微调、训练和推理并不需要昂贵的算力和漫长的迭代过程,可以交由高性能的Xeon W来完成。使用Xeon W做AIGC有六大独特优势。
·多核心带来的高性能计算能力:Xeon W处理器拥有众多物理核心和线程,能够提供强大的并行处理能力,特别是16到32大核,这对于执行复杂的AIGC任务,如深度学习、神经网络训练和图像识别等,是非常关键的。
·更高主频:Xeon W的高主频意味着处理器在单位时间内可以执行更多的计算操作。对于AIGC应用,这直接转化为更快的数据处理速度和更高效的模型训练。在机器学习和深度学习任务中,这可以显著减少从数据准备到模型输出的总时间。
·扩展性强:Xeon W处理器支持的主板和服务器解决方案通常具有良好的扩展性,用户可以轻松升级硬件资源。经过测试,4-7张显卡是TCO最优配置。
·内存通道多:Xeon W处理器支持高速内存,如DDR4或DDR5,这意味着它们可以快速处理和分析大量数据,这对于数据密集型的AIGC应用尤为重要。
·支持ECC:Xeon W处理器专为工作站和服务器应用设计,具有高可靠性和稳定性,这对于长时间运行AIGC任务和保证业务连续性至关重要。
·支持专业AI加速指令集:AMX是专门为AI计算设计的硬件加速器,它在CPU核心中集成了专为AI计算优化的加速模块。AMX技术支持INT8和BF16数据格式,这些格式专为AI计算优化,能够在保持足够精度的同时减少计算资源的消耗。这对于AIGC应用来说至关重要,因为它们通常需要处理大量的数据,而支持AMX的Xeon W能够帮助在有限的资源下实现更高效的计算。
联手超微,
大模型“下沉”
为了推动Xeon W在大语言模型应用的落地,英特尔联手超微合作推出了优惠的组合方案,并进行了实际的验证测试,使用的场景为利用Baichuan-7B大模型为基座对本地数据集进行训练。以英特尔至强W9-3495X处理器和超微X13SWA-TF主板搭建的平台,搭配8条64GB DDR5内存,4块RTX5880 ADA 48GB GPU卡,完成一次训练迭代的时间约需要21小时。对比采用Xeon 8352双路服务器适配四张A800显卡的参考平台,至强W平台的提供了约55%的算力负载,但对应成本仅约不到40%,具有极高的性价比。Xeon W处理器的多核心和高频率设计,结合超微主板的优化设计,可以确保系统在处理AI工作负载时具有高效率和稳定性。英特尔与超微合作推广单路计算平台,提供的不仅仅是优惠价格,更重要的是展现了一套经验证的、可用的、稳健的企业级AI解决方案。
英特尔至强W9-3495X处理器
超微X13SWA-TF主板
实际的测试案例也证明,大语言模型的实际应用并非大型企业的专利,生成式AI的本地化部署更非高不可攀。其中的示范效应有助于鼓励用户尝试拥抱AI算力、挖掘企业内部数据的更深层价值,也赋能渠道合作伙伴拥抱时代潮流、赢得新的商机。
英特尔Xeon W 社区在路上
AIGC作为一种新质生产力的载体,目前在企业中的应用仍处于探索阶段,但从其进化速度来看,必将迅速催生新业态、新技术和新应用。未来,客户需求将不断地升级更迭,也对工作站生态链中的开发能力、创新协同能力,售前支持能力提出了更高的挑战。
为了帮助行业客户在2024年抓住AIGC赛道的机遇,英特尔也以此为契机,通过官方渠道强化对生态链的支持力度,建立Xeon W社区(W community),聚合耕耘在不同细分场景的合作伙伴,强化生态链间的高效沟通协作,结合用户需求加上未来趋势的明确预判,将基于对众多行业发展趋势的精准把握和产业实际需求,转化为更具通用性的系统解决方案和创新产品。不断加强社区解决方案的宣传和推广,从静态化的专业支持向动态化的产业链协作迈进,给合作伙伴提供更大的平台,提升社区合作伙伴的竞争力,加速生态社区建设,将合作伙伴的方案与场景协同、技术与业务深度融合,最终满足客户需求。
结 语
回顾这个信息爆炸的时代,计算机技术深入千行百业。其中,至强W平台一直以其高性能与RAS特性被广泛认可为高效能、高可靠性的生产力工具。在各类高算力要求的通用场景,如影视后期制作、工程设计、生物医药、地理信息测绘等,英特尔W为核心的单路计算解决方案以满足高主频、低延迟,以及充足的存储、显卡拓展性赢得客户青睐。
迈入大模型时代,与订阅通用的人工智能服务相比,越来越多的企业会更重视充分发挥数据价值,构建私有的垂直领域大模型,以期获得独特的竞争力,并节省长期成本、避免数据外泄。单路计算解决方案除了继续发挥高性能、高可靠性传统优势,还进一步强化了扩展性,并对AI应用提供了指令集优化与加速器。随着成功案例的不断复制,相信未来每一个企业都能够以合理的投入拥有自己的人工智能工作站,挖掘数据价值,不断强化自有模型,服务于各种业务场景中的自然语言处理、机器视觉等应用。