飞桨 & 英特尔联合优化AI算法CPU部署性能，推动产业低成本智能化升级

现如今，深度学习技术为工业质检、安防巡检、金融、医疗、能源等各行各业降本增效的效果已被广泛验证。然而，深度学习算法往往需要较高性能的计算芯片，以满足大计算量、高推理速度等产业需求。这带来一个问题，如果对前期大批量投入的低性能设备进行升级甚至更换，都将是一笔非常大的费用，从而提升了产业智能化升级时前期投入的硬件成本。比如，在工业界，产线上已有的工控机大多只配备了CPU，而深度学习涉及海量计算需要运算速度更快的GPU来处理，而GPU的价格非常昂贵，如果全部升级为高性能GPU，成本非常高。

有没有什么好办法，可以在不升级硬件或者不使用低功耗芯片的情况下，尽量提升算法的性能呢？

飞桨全流程开发工具PaddleX，在打通深度学习全流程开发的基础上，为产业开发者提供了多种高性能部署方案及详细的示例工程。

事不宜迟，让我带您快速了解一下这套方案吧！

首先，飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础，是中国首个开源开放、技术领先、功能完备的产业级深度学习平台，集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体。目前，飞桨已凝聚超230万开发者，服务企业9万家，基于飞桨开源深度学习平台产生了31万个模型 [1] 。

而PaddleX 是飞桨产品矩阵中的一个重要工具组件，它提供了一套极其易用的开发方案，使开发者可以快速完成多种计算机视觉算法的开发、优化、并实现高效部署上线。

得益于Paddle Lite--飞桨轻量化推理引擎，凭借其多平台高性能深度学习预测引擎的能力，可以使开发者极其便捷地完成从Mobile到Server多种硬件平台的部署（包括ARM CPU、Mali GPU、Adreno GPU、华为NPU以及FPGA等架构），并持续增加更多新硬件。

此外，基于飞桨与英特尔的长期合作，开发者也可以使用OpenVINO来提升飞桨模型在英特尔的CPU、VPU等芯片上的性能。

目前，全流程深度学习开发套件PaddleX，为开发者提供了一套完整的基于OpenVINO的部署方案。通过这套方案，对部分企业来讲，无需额外配置任何硬件，便可以快速便捷地将最先进的深度学习算法模型部署至CPU工控机，进行深度学习算法的升级。

具体的技术实现的流程如下图所示：

当前PaddleX对OpenVINO的支持情况如下表所示：

随着飞桨与英特尔合作的持续深化，支持适配的算法及加速性能将会进一步提升。那么OpenVINO到底是什么？又为什么可以提升飞桨的模型性能呢？下面逐一为您解答。

OpenVINO是英特尔针对自家硬件开发的深度学习部署工具套件，它基于通用API接口，支持多种英特尔硬件平台，包括CPU、VPU(视觉处理单元)、iGPU、FPGA；并且支持异构计算，可以加速工控机或服务器CPU设备上深度学习模型的预测性能。同时，通过集成OpenCV、OpenGL等工具套件，为开发者简化并加速部署流程。

对于边缘侧设备部署场景，OpenVINO还可以通过支持神经计算棒(一种基于VPU的深度学习硬件USB驱动器)实现在树莓派等低性能的嵌入式设备上部署复杂的深度学习模型，让AI在边缘侧的硬件设备上有更丰富的应用场景。在云端或者是工业场景，OpenVINO更是可以直接在不添加任何其他算力设备的情况下加速CPU上深度学习模型的部署性能，大大提升现有硬件设备的性价比。