说起英特尔,无人不知、无人不晓。而对英特尔英文本名“Intel”的来源,未必就人尽皆知了。
实际上,Intel取自integrated electronics(集成电子)中的inte、el的组合,甚至会自称为一家“材料”公司。实际上,英特尔在IT软硬件方面均有深厚的造诣和贡献。而随着9月19-20日在美国加州圣何塞举行的主基调为“Bringing AI Everywhere”的2023英特尔on技术创新大会的举行,也宣告了Intel从硬到软、从云到端全面加速向AI进军。在笔者看来,这一系列的AI操作,大有可将Intel重新定义为Intelligent的架势——The future starts here, AI redefines Intel ligent future(未来从这里开启,AI重新定义英特尔闪耀的未来)。
英特尔公司首席执行官帕特·基辛格(Pat Gelsinger)在开幕主题演讲上表示:“AI代表着新时代的到来。AI正在催生全球增长的新时代,在新时代中,算力起着更为重要的作用,让所有人迎来更美好的未来。对开发者而言,这将带来巨大的社会和商业机遇,以创造更多可能,为世界上的重大挑战打造解决方案,并造福地球上每一个人。”
硬件:突出 AI 能力,硬刚英伟达
硬件作为看家本领,英特尔公司首席技术官Greg Lavender介绍了英特尔的这一波猛虎攻势。
英特尔Gaudi 2加速器作为深度学习大杀器,为大模型而生。英特尔在大会现场宣布,与英伟达H100相比,Gaudi2取得了极具竞争性的成绩。并且经测试,Gaudi 2的每瓦性能在服务器环境、离线环境分别达到了英伟达A100的2.4倍、2倍,这将显著降低运行深度学习工作负载的能效和环境资源成本。不仅如此,在FP8这种新数据类型的处理上,Gaudi 2取得了99%的准确率。
英特尔数据中心GPU Max系列已用于美国阿贡国家实验室Aurora超级计算机,63744个Max系列GPU的规模,使其成为全球最大的GPU集群。此外,在科学计算工作负载领域,Max 1550相比于英伟达H100有30%的计算速度提升。
代号为Emerald Rapids的第五代英特尔至强可扩展处理器将于12月14日发布,可在相同的功耗下为全球数据中心提高性能和存储速度。此外,具备高能效的能效核(E-core)处理器Sierra Forest将于2024年上半年上市。与第四代至强相比,拥有288核的该处理器预计将使机架密度提升2.5倍,每瓦性能提高2.4倍。紧随Sierra Forest发布的是具备高性能的性能核(P-core)处理器Granite Rapids,与第四代至强相比,其AI性能预计将提高2到3倍2。
而面向消费端,代号为Meteor Lake的酷睿Ultra处理器同样将于12月14日发布,该处理器配备英特尔首款集成的神经网络处理器(NPU),用于在PC上带来高能效的AI加速和本地推理体验。据介绍,酷睿 Ultra的分离式模块架构在AI驱动的任务中实现了性能和功耗的平衡:GPU具有性能并行性和吞吐量,适合媒体、3D应用和渲染管线中的AI计算;NPU是一个专用的低功耗AI引擎,用于持续AI和AI卸载;CPU可以快速响应,是轻量级、单推理、低延迟AI任务的好选择。这种架构设计非常适合从CPU迁移有高质量和高能效计算需求的工作负载,或者由于缺乏有效的客户端计算力而通常在云端运行的工作负载。
OpenVINO:基于oneAPI的AI推理和部署工具套件
硬件之外,英特尔在软件、开源、云原生等领域有深厚的积淀,是众多软件基金会、开源基金会的重要成员。
观察到系统自动化和通过AI分析数据的需求在不断增长,边缘计算蕴含巨大机遇,英特尔由此为客户端和边缘平台上的开发人员打造了AI推理和部署运行工具套件OpenVINO,使边缘AI的访问更加容易。过去一年中,OpenVINO工具套件的开发者下载量同比增长了90%。
此次Innovation大会上,英特尔正式发布了OpenVINO 2023.1版。该版本由oneAPI提供支持,使生成式AI更容易部署到真实世界的场景中,并让开发者能够一次性编写后在广泛的设备和AI应用中进行部署。而oneAPI是英特尔推出的统一的软件开发套件,旨在使软件开发人员能够使用单一的代码库在不同的计算平台上开发应用程序,其通过提供一组标准化的应用编程接口(API),可以让软件开发人员在不同的计算平台(包括CPU、GPU、FPGA、AI加速器等)上使用相同的代码开发应用程序。
OpenVINO 2023.1版本让英特尔更进一步实现了在任意硬件上部署任何模型的愿景,使开发者能够优化标准PyTorch、TensorFlow或ONNX模型,并为即将推出的酷睿Ultra处理器提供全面支持。此外,还提供了更多的模型压缩技术、改进的GPU支持和动态输入的内存消耗,以及在整个计算连续体(跨云、客户端和边缘端)运行时具有更高的可移植性和更好的性能表现。
英特尔开发者云平台:更轻松地获取最新的开发体验
此次大会上,还有一个非常振奋人心的消息——英特尔开发者云平台全面上线,将为开发者提供更轻松的开发途径,在最新英特尔CPU、GPU和AI加速器上测试和部署AI及科学计算应用程序和解决方案,利用尖端工具来实现先进的AI和性能。
英特尔开发者云平台建立在专门为AI构建的高级中央处理器(CPU)、图形处理单元(GPU)、用于深度学习的英特尔Gaudi 2加速器以及开放软件和工具的基础上。云平台开发环境还授权开发者使用最新英特尔硬件平台,如第五代英特尔至强可扩展处理器以及英特尔数据中心GPU系列Max 1100和1550,其中第五代英特尔至强可扩展处理器将在未来几周内就能在英特尔开发云平台中率先使用。
在英特尔开发者云平台,开发者可以构建、测试并优化AI和科学计算应用程序,运行从小规模到大规模的AI训练、模型优化和推理工作负载,以实现高性能和高效率。英特尔开发者云平台建立在oneAPI这一开放的多架构、多厂商的编程模型基础之上,为开发者提供硬件选择,并摆脱了专有编程模型,以支持加速计算、代码重用和满足可移植性需求。
目前,英特尔开发者云平台由英特尔在美国自建,而在不久的将来,也将以合适的方式开放给中国开发者使用。
AI PC:革新PC体验
在帕特·基辛格看来,AI也将变得更个人化。他在大会上表示:“AI将通过云与PC的紧密协作,进而从根本上改变、重塑和重构PC体验,释放人们的生产力和创造力。我们正迈向AI PC的新时代。”
而这种变革的实现,将随着英特尔酷睿Ultra处理器的到来,变成可能。前面已经提到,该处理器配备英特尔首款集成的神经网络处理器(NPU),用于在PC上带来高能效的AI加速和本地推理体验,是英特尔客户端处理器路线图的一个转折点——该款处理器是首个采用Foveros封装技术的客户端芯粒设计。除了NPU以及Intel 4制程节点在性能功耗比上的重大进步外,这款处理器还通过集成英特尔锐炫显卡,带来了独立显卡级别的性能。
在台上,基辛格展示了全新AI PC的众多使用场景,宏碁还现场介绍了搭载酷睿Ultra处理器的宏碁笔记本电脑,并且与英特尔合作,通过OpenVINO工具包共同开发了一套宏碁AI库,以充分利用英特尔酷睿Ultra平台,还共同开发了AI库。
短短两天时间,英特尔释放出了海量的让AI无处不在的洞察和举措,本文只是冰山一角。作为一家有55+年历史并对IT产业发展抱有责任感的企业,英特尔在AI上的持续发力,让我们看到了加速AI产业发展的一个新引擎的努力。
由此,我们期待有一天可以将前面那句话改成——AI redefines Intel ligent future, the future starts there(AI重新定义英特尔的闪耀未来,未来从那里开始)。