申耀的科技观察 · 2022年06月13日

英特尔® 至强® 创新与迭代背后,加速千行百业的智能化进程

进入2022年,随着全球疫情持续影响、宏观环境愈发复杂多变,以及整个社会走到了重建和转型的关键时期,这种前所未有的变化都让以人工智能(AI)为代表的新技术更加受到全球主要经济体的高度重视。

背后的关键原因在于,整个社会需要新的科技生产力来进一步驱动和提升生产效率和抗风险能力。此前,AI释放出的科技革命和产业变革的巨大能量已有目共睹——小到资讯获取、交通出行,大到场景重塑、助力产业完成数字化转型,实现降本增效和转型升级,可以说对于整个产业而言,AI最大的价值就在于其可以解决最根本的问题:产业智能化。

也正因此,无论是此前国家提出的“新基建”中的信息基础设施方面,还是融合基础设施方面,再到用于支撑科研、技术开发的创新基础设施方面,AI技术都是其中不变的交集,堪称“新基建”和产业智能化转型中的真正内核。

在日前举办的2022英特尔On产业创新峰会上,英特尔CEO帕特·基辛格在主题演讲中也指出:“四大超级技术力量:人工智能,无所不在的计算,无处不在的连接,从云到边缘的基础设施,他们相互增强,共同放大,可以帮助我们驱动数字化转型,推动产业创新升级,应对更复杂和更大规模的挑战。”

确实如此,作为全球芯片领域的“领头羊”,今天在世界各地的数据中心中,英特尔® 至强® 可扩展处理器都拥有着广泛的部署,同时作为集成深度学习加速技术的主流数据中心级CPU,更成为了绝大多数行业用户开启AI之旅的起点。

不仅如此,为了更好地满足用户对AI的需求,英特尔® 至强® 可扩展处理器从发布至今,也始终围绕着AI能力不断进行迭代和升级,不仅驱动AI走向了更为广阔的行业舞台,帮助越来越多的行业用户能够应对不同应用场景带来的各种挑战,更为千行百业智能化的转型和升级按下了“加速键”,真正让数字经济更快地实现了扎根和落地,也就有了更多解读的价值和意义。

英特尔® 至强® 四次创新与迭代

毫无疑问,今天计算力就是生产力已成为业界共识,特别是计算力作为数字经济时代的关键生产力要素,更成为了挖掘数据要素价值,推动数字经济发展的核心支撑力和驱动力。

与此同时,随着以AI为代表的新一代信息技术的进步,人类社会更以加速度进入智慧时代,同样传统计算也正朝着智慧计算升级,计算力也逐渐升级成为了智算力,正所谓“有多少计算力,就有多少生产力;有多少智算力,就有多少创新力”。

在这方面,英特尔® 至强® 可扩展处理器内嵌的AI加速能力的创新和迭代的历程,就是这一变化过程的“最佳写照”,具体来看:

早在2017年,第一代英特尔® 至强® 可扩展处理器面世,就加入了英特尔® 高级矢量扩展512技术,即AVX-512 指令集,AVX-512用途十分广泛,包括科学模拟、金融分析、人工智能深度学习、3D 建模与分析、图像和音频/视频处理、加密及数据压缩等应用,都是它的“用武之地”。

据了解,第一代英特尔® 至强® 可扩展平台与其上一代产品(英特尔® 至强® 处理器E5 v4产品家族)集成的英特尔® 高级矢量扩展2.0(AVX2)相比,该处理器数据寄存器的宽度、数量以及FMA单元的宽度都增加了一倍,可以看作是英特尔® 至强® 可扩展处理器在AI领域的第一次“小试牛刀”。

2019年,英特尔又推出了第二代英特尔® 至强® 可扩展处理器,集成了英特尔® 深度学习加速(DL Boost)技术,当时主打CPU对INT8推理的加速,有了它的加成,第二代英特尔® 至强® 可扩展处理器的推理性能相比英特尔® 至强® 可扩展处理器提升多达30倍,这使其成为英特尔首款集成AI加速能力的主流数据中心级CPU。

应该说,第二代英特尔® 至强® 可扩展处理器集成英特尔® 深度学习加速(DL Boost)技术,能够让更多的行业用户使用较低精度的数据格式来加速推理,同时不影响结果准确性,更重要的是还减少了处理器的消耗,实现了更高的性能,从而实现了对算力的更为充分的利用。

2020年,第三代英特尔® 至强® 可扩展处理器推出,这是英特尔首款集成bfloat16支持的主流服务器CPU,而bfloat16则是英特尔® 深度学习加速技术新增的指令集技术。数据显示,不同于INT8加速主攻AI推理,bfloat16加速可以兼顾对推理和训练的加速。增强型英特尔® 深度学习加速技术实现增强型人工智能推理和训练性能,在人工智能训练性能方面至多达到上一代的1.93倍。

在此基础上,针对大数据和人工智能领域的开发难题,英特尔还推出了打通大数据平台与AI应用的“直通车”Analytics Zoo,以及能够加速深度学习推理,支持异构部署,具备模型量化功能并预置多种优化过的AI框架OpenVINO™ 工具套件等,都进一步推动了AI在行业中的进一步应用。

而在2022英特尔On产业创新峰会上,英特尔又公布了第四代英特尔® 至强® 可扩展处理器(代号Sapphire Rapids)细节,比如支持DDR5、PCIe 5.0和CXL 1.1,具备强劲性能,同时内置人工智能深度学习加速技术和数据流加速器,从软硬件同时入手优化AI工作负载,相较上一代产品性能更强,同时还可以高效管理所有CPU内核,提高处理器的利用率。

由此可见,从第一代英特尔® 至强® 可扩展处理器开始,英特尔就把其处理器通过从AVX256升级到AVX512,将AVX的能力提高了一倍,这极大地提高了深度学习训练和推理能力;一年后,在第二代英特尔® 至强® 可扩展处理器中引入(DL Boost,大大提高INT8的吞吐量;而第三代英特尔® 至强® 可扩展处理器,又将BFloat16添加到DL Boost指令集中,以进一步提高深度学习训练和推理性能;到了第四代英特尔® 至强® 可扩展处理器,则是从“软硬兼施”的角度优化AI工作负载,而英特尔® 至强® 可扩展处理器四次创新和迭代背后,不但为更多的行业用户利用AI,挖掘更多数据红利奠定了关键基础,更为英特尔未来在行业智能化转型中进一步发挥其技术优势,提供了足够大的想象力。

加速千行百业的智能化进程

我们知道,在中国市场,由于线上线下生态及场景远比其他国家丰富、多元,中国经济中结构性的差异,以及细分行业中不同的应用场景需求,都给了AI等新技术创新以巨大的空间。同样,英特尔® 至强® 可扩展处理器以其在AI领域领先的技术优势,也为加速千行百业的智能化转型进程起到了重要的助推作用。

在医疗行业,英特尔与汇医慧影的合作就是典型的“代表”。汇医慧影一直致力于计算机视觉和深度学习技术应用开发,其自主研发的Dr.Turing® AI平台、可为医院和患者提供10余种常见疾病的医学影像AI分析能力,并提供结构化的报告。

在实际应用中,Dr.Turing® AI平台需要进行一些有针对性地优化升级。例如,Dr.Turing® AI平台需要通过收集大量新冠肺炎数据,由专业医生进行标注后,结合平台内置的深度学习算法,实现对肺炎病灶区精准分割和测量;此外,Dr. Turing® AI平台需要结合Inception V4、Inception ResNet V2等深度学习算法模型,将原本二维的CT切片进行一系列的“三维”重构,以便更加清晰直观地反映出量化数据。

这两个方面的优化会让Dr. Turing® AI平台在推理和计算过程中有更高的性能要求,基于此,汇医慧影与英特尔合作,借助英特尔® 至强® 可扩展处理器实现更强算力支持,同时还引入OpenVINO™ 工具套件,最终将平均推理性能提升2.89倍。除此之外,汇医慧影还和英特尔合作,基于英特尔® 至强® 可扩展平台中AI加速技术能力,构建了以ResNet-50卷积网络模型作为基础网络的RetinaNet目标检测模型,对乳腺癌影像实施模型训练及推理等等。

在制造行业,京东方同样也基于英特尔提供的、适用于智能边缘计算平台的软硬件组合,整合产线工作负载,并通过云边协同、AI 和大数据技术实现更高效的产品缺陷检测及不良根因分析,打造出了更适用于生产一线的智能化品质管控解决方案,实现了产能与品质的双赢。

其中,为有效提升AI缺陷检测系统的工作效能,京东方引入了英特尔® 至强® 可扩展处理器,作为其边缘服务器的核心计算引擎,该处理器不仅具备优秀的微架构设计,通过集成更多的核心、线程、以及更大容量的高速缓存来提供出色的基础算力,它还集成了英特尔® AVX-512等技术,来对深度学习推理任务中的密集计算提供特定硬件加速支持。数据显示,基于云边协同的新AI缺陷检测系统在京东方各厂区上线部署后,不仅在检测准确率上取得了高达96%成绩,同时还使人工替代率达到了70%。

除提升AI缺陷检测 、大数据不良根因分析等方面的能力,借助英特尔软硬件解决方案组合强化了边缘计算能力的京东方工业互联网解决方案,也开始将其应用进一步扩展到园区管理、设备维护、能耗管控等场景中。目前,基于这个全面、强大的整体架构,京东方已打造了全价值链智能工厂、园区物联、企业运营三大场景解决方案,可以说为整个中国制造行业的智能化转型树立全新的标杆。

其实,上面的案例仅仅只是英特尔在加速千行百业智能化转型进程中的一个“缩影”,今天诸如教育、交通、政务、智慧城市等多个领域都与AI应用有很高的契合度,而借助英特尔® 至强® 可扩展处理器中的AI加速能力,显然可以将AI应用融入到应用场景和业务发展中方方面面。从这个角度来看,英特尔可以说既是行业AI赋能之路上的探索者,也是落地的实践者,是未来的推动者。

驱动AI走向更大的行业舞台

今天,AI技术正在加速走向现实,它正如同“毛细血管”一样渗透进产业领域的方方面面,直至深刻改变人类生产生活方式和思维方式,推动社会生产力整体跃升。

正如帕特·基辛格所言:“目前全球科技产业发展正站在战略转型点上,供应链断裂、疫情肆虐、不确定的地缘政治影响和潜在的通货膨胀预期都是产业共同面临的挑战,而成功的关键取决于企业快速采用和最大化利用领先技术和基础设施的能力。”

也正因此,除了英特尔® 至强® 可扩展处理器始终坚持创新与迭代之外,英特尔也正从CPU到XPU领域做更为全面的产品和方案布局,希望推动包括AI在内的新技术走向更大的行业舞台,更好地赋能千行百业抓住千亿级行业AI落地的超级红利。

一是,在深度学习领域,英特尔正式推出了英特尔Habana® Gaudi® 2 AI处理器,通过支持多样化架构,让更多的行业用户也能充分利用AI处理器的高性能和高能效。据了解,英特尔Habana® Gaudi® 2 AI处理器的优势在于更具经济效益、训练速度更快,在自动驾驶测试、医疗影像、工业检测以及自然语言处理等场景领域能够发挥更大的作用;此外,英特尔也提供SynapseAI软件,针对深度学习模型进行优化。

与此同时,英特尔也推出了全新软件和服务“阿波罗计划”,希望通过为企业提供经过优化设计的逾30种开源AI解决方案,让其能够在本地、云端亦或是边缘环境中都更易于部署AI。

二是,在IPU领域,英特尔公布了其到2026年的IPU(基础设施处理器)产品路线图,其中包括基于全新FPGA和英特尔架构平台的代号为Hot Springs Canyon的产品,Mount Morga(MMG)ASIC,以及下一代800GB产品,而通过“加持”IPU,企业就能够更好地满足其基础设施计算需求,高效处理任务和解决问题。

三是,在GPU领域,英特尔也发布了面向多媒体转码、视觉图形处理和云端推理的单一GPU解决方案——代号为Arctic Sound-M(ATS-M)的英特尔数据中心GPU,这是英特尔在该领域首款配备AV1硬件编码器的独立GPU。ATS-M是一颗支持高质量转码和高性能的强大GPU,能够提供每秒150万亿次运算(150 TOPS)。

全文总结,从AI加速到深度学习的全新迭代,从CPU到XPU的全面布局,从硬件到软件的不断优化,英特尔正在帮助企业将数据转换为价值的过程变得更快速、更简单和更容易,这无疑会更好地帮助企业加速走向智能化,由此在这个不确定性的世界中,更加确定性的赢得先机和未来。

推荐阅读
关注数
2395
内容数
425
专注产业互联网、企业数字化、渠道生态以及汽车科技的 观察和思考。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息