马毅煌@驭势资本 · 2021年09月17日

一文看懂人工智能

223.gif

1.人工智能无所不在-半导体篇

人工智能平台是应用还是工具?

人工智能平台(包括芯片,模组,软件)在一般人认为是一种新型应用,但我们看来人工智能芯片在整合软硬件后将成为各种物联网应用的提升效能工具平台,这就像我们常用的微软,微软是让我们在办公室应付各种应用,因被广泛利用在云端大数据的深度学习训练和推断外,人工智能平台也将出现在各种各样的应用端的边缘设备,来达到帮助使用者或取代使用者来执行更佳的智能判断推理。
image.png

虽然目前人工智能芯片仍多是以昂贵的图形处理器 (GPU)张量处理器(Tensor Processing Unit)或现场可编程门阵列芯片配合中央处理器(FPGA+CPU)为主,来用在云端的深度学习训练和推理的数据中心,但未来特定用途集成电路(ASIC)将在边缘运算及设备端所需推理及训练设备遍地开花,及逐步渗透部分云端市场,成为人工智能芯片未来的成长动能。
image.png

人工智能会渗入各领域应用-无所不在

许多产业研究机构将自动驾驶、虚拟/扩展现场、无人商店、安全智能监视和智能医疗智能城市、智能亿物联网分别作为半导体产业的不同驱动引擎,国金半导体研究团队实际上认为自动驾驶/电动汽车、5G、虚拟/扩展现场、无人商店、安全智能监视、智能医疗、智能城市只是人工智能亿物联网的延伸。

智能医疗:智能医疗系统可利用三维脸部个人辨识来挂号,减少排队时间,让看诊更顺畅。医院可收集资料并整合个人在不同医疗院所的所有医疗纪录;医生可利用人工智能数据平台辅助做更精准的医疗判断,减少重复用药的浪费和对病人的副作用,医院可利用此大数据资料做更深入的医学研究,数家政府医院应先抛砖引玉,带头做整合。

三种主流人工智能演算法

最早的人工智能出现及运用在1950-1980年代,接着转换到1980-2010年机器学习,从2010年以后,随着各种演算法CNNs,RNNs,DNNs等图影像视觉学习,辨识,推理的普及,让深入人工智能深入学习的突飞猛进。深度学习是人工智能和机器学习的一个子集,它使用多层人工神经网络在诸如对象检测,语音识别,语言翻译等任务中提供最先进的准确性。深度学习与传统的机器学习技术的不同之处在于,它们可以自动学习图像,视频或文本等数据的表示,而无需引入手工编码规则或人类领域知识。它们高度灵活的架构可以直接从原始数据中学习,并在提供更多数据时提高其预测准确性。

人工智能的深入学习最近取得了很多突破。例如谷歌Deepmind的AlphaGo和更强大的AlphaZero陆续在围棋中获胜,在西方棋类比赛中获胜,谷歌Waymo、英伟达的Xavier/Pegasush320、Intel/Mobileye的Eye4/5自动驾驶汽车解决方案、亚马逊的Alexa、谷歌的GoogleAssistant、苹果Siriri、微软的Cortana、三星的Bixby智能语音助手等。借助加速的深度学习框架,研究人员和数据科学家可以明显加快深度学习训练,从几天或几周的学习缩短到几个小时。当模型可以部署时,开发人员可以通过人工智能芯片加速的推理平台实现云、边缘运算设备或自动驾驶汽车,为计算密集型深度神经网络提供高性能、低延迟的推理。
image.png

卷积神经网络CNNs(Convolutional Neural Networks ):卷积神经网络(CNN)是建立在模拟人类的视觉系统,并透过图影像分类模型的突破,也将是,主要来自于发现可以用于逐步提取图影像内容的更高和更高级别 的表示。CNN是将图像的原始像素数据作为输入,并‚学习‛如何提取这些特征,并最终推断它们构成的对象。首先,CNN接收输入特征图:三维矩阵,其中前两个维度的大小对应于图像的长度和宽度(以像素为单位),第三维的大小为3(对应于彩色图像的3个通道:红色,绿色和蓝色)。

卷积神经网络的末端是完全连接的层,完全连接的层将层中的每个神经元连接到层中的每个神经元。原则上类似于多层感知器神经网络,工作是根据积分提取的特点进行分类的,CNN可以包含更多或更少数量的积分模块,以及更多或更少的完全连接层,工程师经常试验找出能够为模型产生最佳结果的配置。也就是说,CNN专注于自动驾驶汽车、安全、脸部识别、疾病图像识别解决方案等图像处理。

image.png

循环神经网络RNNs(Recurrent Neural Network):RNN是一类人工听觉及说话的神经网络,具有记忆或反馈回路,可以更好地识别数据中的模式。RNN是常规人工神经网络的扩展,它增加了将神经网络的隐藏层送回自身 的连接-这些被称为循环连接。循环连接提供了一个循环网络,不仅可以看到它提供的当前数据样本,还可以看到它以前的隐藏状态。具有反馈回路的循环网络可以被视为神经网络的多个副本,其中一个的输出用作下一个的输入。

在神经机械翻译(NMT)中,我们不是从设计规则中翻译,而是从数据中学习。由于我们处理时间序列数据,其中语境的上下文和顺序很重要,NMT的优先网络是循环神经网络。可以使用称为注意力的技术来增强NMT,有助于模型将焦点转移到输入的重要部分,改善预测过程。举两个RNN的例子,为了跟踪你自助餐厅主菜的哪一天,每周同一天运行同一道菜的严格时间表。例如星期一的汉堡包、星期二的咖喱饭、星期三的披萨、星期四的生鱼片寿司和星期五的意大利面。如果使用RNN,输出的生鱼片寿司为了确定周五的菜品被网络反馈,RNN就那么RNN就会知道,顺序中的下一道主菜大利面。

image.png

深度神经网络DNNs:DNN在视觉、语言理解和语音识别等领域取得了重要突破。为了实现高精度,需要大量的数据和后期的计算能力来训练这些网络,但这些也带来了新的挑战。特别是DNN可能容易受到分类中的对抗性示例,强化学习中遗忘任务,生成建模中的模式崩溃的影响以及过长的运算时间。为了构建更好,更强大的基于DNN的系统,是能否有效地确定两个神经网络学习的表示何时相同?我们看到的两个具体应用就是对比不同的网络学习的表现,说明DNN中隐藏层学习的表现。设置的关键是将DNN中的每个神经元解释为激活向量,神经元的激活矢量是它在输入数据上产生的标量输出。
image.png

到底哪种人工智能芯片将成云计算的主流?

深度学习是一种需要训练的多层次大型神经网络结构(请参考图表),其每层节点相当于一个可以解决不同问题的机器学习。利用这种深层非线性的网络结构,深度学习可以从少数样本展现强大的学习数据集本质特征的能力。简单来说,深度学习神经网络对数据的处理方式和学习方式与人类大脑的神经元更加相似和准确。谷歌的阿法狗也是先学会了如何下围棋,然后不断地与自己下棋,训练自己的深度学习神经网络,更厉害的阿法零 (AlphaZero)透过更精准的节点参数,不用先进行预先学习就能自我演化训练学习。

深度学习模式需要通过大量的数据培训来获得理想的效果,培训数据的稀缺使深度学习人工智能在过去不能成为人工智能应用领域的主流算法。但是,随着技术的成熟,加上各种行动、固定通信设备、无人驾驶交通工具,可以穿戴技术,各种行动、固定监视感知系统可以相互连接和交流的亿物网络,突然爆炸的大数据满足了深刻的学习算法对训练数据量的要求。

image.png

训练和推理所需要的神经网络运算类型不同。神经网络分为前向传播(Forward algorithm)其中包括输入层, 隠藏层,输出层和后向传播(Backward  algorithm)主要指的是梯度运算,两者都包含大量并行运算。训练同时需要前向和后向传播,推理则主要是前向传播。一般而言训练过程相比于推理过程计算量体更大。

云人工智能系统通过大量的数据集和调整参数优化负责训练和推理,边缘运算终端人工智能设备负责推理。推理可以在云中进行,也可以在边缘运算方和设备方面进行。模型训练完成后,将训练完成的模型(主要是通过训练获得的参数)用于各种应用。应用过程主要包括大量的乘累矩阵运算,并行计算量较大,但与培训过程相比参数相对固定,不需要大数据支撑,除云实现外,还可以在边缘运算方实现。推理所需参数可在云培训结束后定期下载更新到应用终端。
image.png

在深度学习半导体领域里,最重要的是数据和运算。谁的晶体管数量多,芯片面积大,谁就会运算快和占据优势。但是,由于未来各处理器的特性不同,英伟达的图形处理器GPU和谷歌的张量处理器仍然可以主导通用云人工智能深度学习系统的训练,可编程芯片FPGA的低功耗和低延迟性应该有助于主导云人工智能深度学习系统的推理,特殊用途集成电路(ASIC)将来主导边缘运算和设备方面的训练和推理,但由于成本、运算速度、功耗优势和功耗优势:

image.png
image.png

中央处理器CPU:X86和ARM在内的传统CPU处理器架构往往需要数百甚至上千条指令才能完成一个神经元的处理,但对于并不需要太多的程序指令,却需要海量数据运算的深度学习的计算需求,这种结构就显得不佳。

CPU具有优化顺序逻辑处理的几个核心组成的串行结构,决定了更擅长逻辑控制、串行运算和通用类型的数据运算。目前最高的CPU只有6核或8核,但普通级别的GPU包括数百个处理单元,因此CPU在影像、影像计算中具有天生的弱点。

图形处理器GPU仍主导云端人工智能深入学习及训练: 最初是用在计算机、工作站、游戏机和一些移动设备上运行绘图运算工作的微处理器,但其海量数据并行运算的能力与深度学习需求不谋而合,因此,被最先引入深度学习。GPU只需要进行高速运算而不需要逻辑判断。GPU具备高效的浮点算数运算单元和简化的逻辑控制单元,把串行访问拆分成多个简单的并行访问,并同时运算。

与超威和英特尔的GPU芯片不同,英伟达的人工智能芯片拥有CUDA的合作软件是领先人工智能市场的主要因素。CUDA编程工具包使开发者能够简单地编程画面上的像素。在 CUDA发布之前,GPU编程对程序员来说是一件苦差事,因为这涉及到编写大量低层面的机器码。CUDA经过英伟达多年的研发和改进,成功地将Java或CTA这样的高级语言开放到GPU编程中,使GPU编程更加简单,研究者也能更快更便宜地开发深入的学习模式。

image.png

现场可编程门阵列芯片FPGA的优势在低功耗,低延迟性:CPU内核并不擅长浮点运算以及信号处理等工作,将由集成在同一块芯片上的其它可编程内核执行,而GPU与FPGA都以擅长浮点运算着称。FPGA和GPU内都有大量的计算单元,它们的计算能力都很强。在进行人工智能神经网络(CNN,RNN,DNN)运算的时候,两者的速度会比CPU快上数十倍以上。但是GPU由于架构固定,硬件原来支持的指令也就固定了,而FPGA则是可编程的,因为它让软件与应用公司能够提供与其竞争对手不同的解决方案,并且能够灵活地针对自己所用的算法修改电路。

目前,云中使用的人工智能解决方案是用XeonCPU与Nervana合作,用于云中间层和边缘运算设备的低功耗推测解决方案是用XeonCPU与FPGA合作编程加速卡。赛灵思(西安)于2018年底以低成本、低延迟、高能效的深度神经网络(DNN)算法为基础的Alveo加速卡,采用台积电16nm工艺的UltraScaleFPGA,预计将获得众多人工智能数据中心云推理芯片市场的份额。
image.png

谷歌张量处理器TPU 3强势突围,博通/台积电受惠,可惜不外卖:因为它能加速其人工智能系统TensorFlow 的运行,而且效率也大大超过GPU―Google的深层神经网络就是由TensorFlow引擎驱动的。谷歌第三代张量处理器(TPU,Tensor Processing Unit,大约超过100 Tera  FLOPS/hp-16bit)是专为机器学习由谷歌提供系统设计,博通提供ASIC芯片设计及智财权专利区块,台积电提供16/12纳米制程工艺量身定做的,执行每个操作所需的晶体管数量更少,自然效率更高。TPU每瓦能为机器 学习提供比所有商用GPU和FPGA更高的量级指令。

TPU是为机器学习应用特别开发,以使芯片在计算精度降低的情况下更耐用,这意味每一个操作只需要更少的晶体管,用更多精密且大功率的机器学习模型,并快速 应用这些模型,因此用户便能得到更正确的结果。以谷歌子公司深度思考的阿尔法狗及零(AlphaGo, AlphaZero/DeepMind)利用人工智能深度学习训练和推理来打败世界各国排名第一的围棋高手,世界排名第一的西洋棋AI程式Stockfish 8,世界排名第一的日本棋Shogi AI专家,但我们估计AlphaZero系统使用至少近5大排人工智能主机,5,000个张量处理器,1,280个中央处理单元而让云端的设备异常昂贵,且无提供任何的边缘运算端设备。
image.png

ASIC特定用途IC需求即将爆发:即使研发期长,初期开发成本高,通用性差,但国内芯片业者因缺乏先进x86 CPU,GPU,及FPGA的基础设计智慧财产权(IPs),可完全客制化,耗电量低,性能强的特定用途IC(ASIC  Application-specific integrated circuit)设计就立刻成为国内进入人工智能云端及边缘运算及设备端芯片半导体市场的唯一途径。但因为起步较晚,除了比特大陆的算丰(SOPHON)BM1680及BM1682云端安防及大数据人工智能推理系列产品已经上市之外,其他公司在云端人工智能训练及推理芯片设计都还停留在纸上谈兵阶段。

最后可惜的是国内搜寻引擎龙头百度的昆仑芯片(818-300采用Samsung 14纳米),阿里巴巴的Ali-NPU,及亚马逊的Inferentia目前都还没有提供更确实的芯片速度,耗电量,应用,价格,量产时点,及软件框架规格让我们做出更好的比较图表。
image.png

哪种人工智能芯片将成边缘运算及设备端的主流?

从算法,IP,边缘运算及设备端芯片转换到模块,平台或生态系的战争谷歌在Google Cloud NEXT 2018活动中,首次推出人工智能推断用边缘运算张量处理器(Edge Tensor Processing Unit,Edge TPU,<30mm2)具有低 功耗,低延迟,高运算效率,其开发版系统模块套件中还包括有恩智浦的CPU,图芯的GPU,再配合谷歌开源简易版机器学习框架软件(Open-source TensorFlow Lite),设备端物联网核心运作(Edge IoT Core)和边缘运算端张量处理器,来推动各种应用,像是预测性维护,异常检测,机器视觉,机器人,语音识别,医疗保健,零售,智能空间,运输交通等等。

image.png

在谷歌的Waymo建立了全球最大的无人驾驶车队后,谷歌再次利用其在深度学习及云端软,硬件的技术领先优势,提供机器学习边缘运算端软件,固件,安卓物联网作业系统及专用半导体芯片整体解决方案模块,让客户对其智能物联网解决方案的黏着度提升,这不但对中国大陆人工智能芯片公司是利空,也对目前主要提供云及边缘运算物联网服务的竞争厂商亚马逊(AWS),微软 (Azure),阿里巴巴造成市场压力。

image.png

但是,目前谷歌终端型张量处理器目前只能算是个机器学习的加速器,不能独立运作,其解决方案中还要配合其他半导体公司的芯片,像是恩智浦以安谋为核心的中央处理器,图芯(Vivante Corporation)的GC7000 Lite图形处理器(请参考图表),我们认为谷歌的解决方案效能比较与量产时间未定。
image.png

从英伟达、谷歌、英特尔和华为深入学习边缘运算方面的解决方案模块和软件和固件之间的竞争,高吞吐量和联发科将人工智能专利区块通过嵌入式整合到其手机应用程序处理器中,可以看出未来在人工智能方面的应用领域不仅仅是人工智能算法,从IP(智能财产权)到芯片设计提出新的竞争,中国大陆的人工智能算法/IP/芯片领导公司就像寒武纪一样,地平线为了生存,必须与应用领域的系统公司紧密合作比特大陆和嘉楠云智进入人工智能芯片领域很晚,但在采矿机业务和采矿生态系统的系统整合经验中,比只有算法/IP/芯片的人工智能设计公司有机会。

image.png

谁能引领国内人工智能芯片产业突围?

未来因人工智能边缘运算推理端和云端推理(Inferencing)芯片及设备成本,性能,耗电,效率的考量,以及各种处理器的特性不同,我们预期特定用途集成电路(ASIC)或系统集成电路(SoC,system on chip)未来将在设备,边缘运算,及云端推理市场和设备,边缘运算,小部分云端训练市场遍地开花,百花齐放,根据产业链调查,我们认为中国在处理器/芯片领域的投资有加速的迹象,AI芯片的创业企业目前已达到40家左右。

而中国的人工智能半导体公司像华为海思(HiSilicon),寒武紀(Cambricon),地平线(Horizon Robotics),彼特大陆 (Bitmain),耐能(Kneron),肇观(NextVPU),及大数据系统公司如百度,阿里巴巴及安防龙头海康威视,大华将追随国际大厂陆续推出人工智能特定用途集成电路和系统芯片,从过去的模仿和追赶模式改为提前布局的思路, 加上今年中国科创板融资平台的加持,相信一定可以孵育出未来世界级的人工智能芯片设计龙头公司。

image.png

华为海思后发先至:在供应全球智能手机第二大厂,中国智能手机第一大厂华为超过近六成的应用处理器及基频芯片,及率先数月于高通及联发科采用台积电的7纳米制程工艺推出的麒麟980芯片,让华为的Mate 20手机大卖,并让华为整体智能手机在国内的市占从2017年的 20%,提高到2018年的27%,及2018年四季度的 29%,预期这也将同时拉升华为海思(HiSilicon)在全球无晶圆设计公司的市占到6-7%或是在2019年成为前五大。

而7纳米的麒麟980芯片是整合了寒武纪 (Cambricon)设计的Cambricon-1M神经处理单元 (NPU,Neural Processing Unit)专利区块来让摄像头看得更全,更清,更快,更久,让麦克风听得更清,更广,识别场景,推测用户行为意图 和适时处理高性能或高效率任务, 根据华为公布的资料,在人工智能性能比上,其NPU是一般CPU的25倍,GPU的6.25倍(25/4),能效比上,NPU更是达到了CPU的50倍,GPU的6.25倍(50/8)(请参考图表)。但因为目前其边缘运算端神经处理单元架构简单,我们估计此专利区块芯片应不超过整体芯片面积(基频和应用处理器整合在一起的系统芯片面积)的 10%。

华为海思拥有这样强大的财产资源,支持7纳米以下先进工艺的电子设计自动化软件(EDAtool),验证(Verification),仅口罩成本上升,拥有国内最强的半导体设计团队,拥有庞大的系统知识和各种设备对人工智能化的需求,华为海思今后将引领国内人工智能芯片产业。华为海思今年陆续登场的7纳米升级Ascend-Max910ASIC(集成8个芯片,1,024个升级910芯片的AscendCluster(256个PETAFLOPS),12纳米升级Ascend-mini(310),-Lite,-Tiny,-NanoASIC推出的Atlas200加速模块,Atlas300加速卡,Atlas500智能站,Atlte,-Tiny,-NanoAte,-NanoAnoASIC推出的Atlas200加速模块。

我们预期这些AI芯片及系统,陆续将对英伟达,赛灵思,英特尔,谷歌在云端及边缘运算端人工智能芯片及平台的地位,带来挑战,但特定用途IC的专用性缺点会让华为海思切入像是外部安防等系统公司客户时,碰到些安防公司系统知识领域不愿意外泄的问题。
image.png

寒武纪从设备端步入云端:寒武纪(Cambricon)是于 2016年在北京成立,核心成员陈天石及陈云霁兄弟都曾在中科院计算所工作,专攻计算机处理器结构优化和人工智能,而后来寒武紀在拿到中关村科技园区支持资金及上海市政府对神经网络处理器,深度学习处理器IP核项目,智能处理器核项目等多项补助近6,000万人民币,加上多次拉高估值的融资,于2018年5月3日,发布了使用 TSMC 7nm工艺IP的1M,每瓦速度达3.1-3.3兆次运算,为10纳米1A智财权专利区块的10倍左右,且超越英伟达V100的每瓦速度达0.4兆次运算,其8位运算效能比达5Tops/watt(每瓦5兆次运算)。寒武纪提供了三种尺寸的处理器内核(2Tops/4Tops/8Tops)以满足不同领域下,不同量级智能处理的需求(智能手机、智能音箱、摄像头、自动驾驶)。

Cambricon也介绍以TSMC 16nm工艺制程设计的MLU 100及MLU 200云端服务器 AI芯片,具有很高的通用性,可满足计算机视觉、语音、自然语言处理和数据挖掘等多种云端推理,甚至训练的任务。在发布会上,联想(ThinkSystem SR650),中科曙光(Phaneron服务器),科大讯飞(翻译机2.0)都介绍了使用Cambricon MLU100芯片相对应的云端服务器。

此外,专为开发者打造的Cambricon NeuWare人工智能软件平台,加上支持TensorFlow,Caffe,MXNet等主流机器学习框架(Framework),让寒武纪在尚未扭亏为盈的情况下(估计2017年亏损超过1,000万人民币以上),2018年营收连1,000万美金都达不到的状况下 (2016/2017年营收估计约400万人民币上下),市值已被拉高到超过25亿美元。

image.png

卖人工智能解决方案模块的地平线:地平线(Horizon Robotics)创办人是前百度深度学习研究院负责人余凯、还有前华为芯片研发架构师周峰,地平线不是只做芯片,在软件方面,地平线已经研发出了自动驾驶的雨果神经网络OS平台及智能家居的安徒生平台。地平线的目标是做分支处理单元(BPU,Branch processing unit)的人工智能算法架构+嵌入式芯片的(Embedded ARM,CPU,GPU,FPGA)自动驾驶(征程2.0处理器),智能城市,智能商业(旭日1.0处理器)的人工智能设备终端解决方案模块(具有感知,识别,理解,控制的功能)给产品厂商。

地平线的整个流程是根据应用场景需求,设计算法模型,在大数据情况下做充分验证,模型成熟以后,再开发一个芯片架构去实现,该芯片并不是通用的处理器,而是针对应用场景跟算法是结合在一起的人工智能算法处理器,得到芯片大小,执行,耗能(Area、Performance、Power)的综合解决方案。地平线BPU 架构的解决方案只可以用在符合车规的FPGA或GPU等计算平台上,下一步地平线会将自己的BPU处理器IP授权给国际厂商,让他们生产车规级处理器。

智能驾驶方面,基于高斯架构研发的ADAS产品(征程1.0处理器) 也会作为重点推进,SAE L3/L4的无人驾驶Matrix 1.0平台,也会持续落实与系统厂商像是博世的技术合作,计划在年中实现特定道路的自动驾驶;智能生活方面,除与美的的合作之外,地平线继续在家电、玩具、服务机器 人等领域发力;公共安防方面,地平线去年与英特尔在北美安防展上进行联合展示。类似于寒武纪,地平线于 2018年11月27日获得近10亿美金的B轮融资,持续拉高其市值。

image.png

从挖矿机转云端人工智能推理模块的比特大陆:由CEO 詹克团及创办人吴忌寒于2013年联合成立的挖矿机及芯片霸主比特大陆(BITMAIN)于2017年11月,正式介绍其 AI ASIC芯片品牌SOPHON(算丰),宣布全球首款云端安防及大数据人工智能推理系列的张量加速计算芯片 28nm BM1680的震撼面世,并展示了视频图像分析、人脸人体检测的演示。并同步发布了SOPHON.AI官网,并将系列产品在官网中面向全球发售。

比特大陆将于2019年推出第二代产品BM1882,以及2020年的BM1884,按照规划,BM1882和 BM1884的主要应用场景将是智能摄像机、智能机器人和智能家居等。虽然目前比特币跌破4,000美元以下,占比特大陆98%的矿机销售,自营挖矿业务要是采用两年折旧几乎是无利可图(除了于4Q18推出的7纳米 BM1391挖矿芯片及S15挖矿机应可获利外),而AI芯片导入云端系统又遥不可期,但不同于其他新兴AI芯片设计公司大多缺乏现金,比特大陆在手现金(7-8亿美元现金,4-5亿美元的加密货币)应该还是有超过10亿美元,芯片研发设计资源仍然丰厚,每一代芯片代与代之间的间隔是快于摩尔定律而达到9-12个月。摩尔定律是指芯片行业每18到24个月的周期里,计算能力能翻一倍,或者在相同的单位芯片面积里,晶体管数量翻一倍。
image.png

image.png

耐能专注于低功耗设备端的人工智能芯片:耐能 (kneron)是由一群留美华人于2015年成立于圣地牙哥,CEO刘峻诚博士是毕业于UCLA,并于2018年7月延揽前高通多媒体研发部总监李湘村(前展讯,华为,VIVO VP)为其首席科学家,其余团队成员多有UCLA,清华大学,高通,三星电机,电子,计算机背景,并于2017年11月,耐能宣布完成超过千万美元的A轮融资,阿里创业者基金(Alibaba Entrepreneurs Fund)领投,奇景光电(HIMX,Himax Technologies,Inc.)、中华开发资本(CDIB)、高通、中科创达(Thundersoft)、红杉资本(Sequoia Capital)的子基金Cloudatlas,与创业邦跟进投资,2018年5月由李嘉诚旗下维港投资 (HorizonsVentures)领投的A1轮融资,还有最近一轮从Iconiq capital(Mark Zuckerberg’s private fund)拿到的融资。

耐能目前手机加OEM/ODM客户可达6-8家,主要客户有手机相关的高通,格力,奇景光电,互联网的客户包括搜狗,腾讯,钰创,钰立微,工业计算机客户有研扬,安防客户有大华,苏州科达等。格力已经使用其智财权区块量产,目前一些芯片已经量产。因扩大研发团队及产品线,耐能从2017年的获利扭赢转到2018年亏损达400-500万美元,但2019年将有二颗芯片流片(Tape out)。

image.png

亿智是有实力又低调的AI芯片公司:的由前全志团队组成的亿智电子科技于2016年7月在珠海高新区注册成立。同年10月在北京设立人工智能(AI)算法研究团队。亿智核心团队是中国最早一批进行SOC系统设计的专家,有20多年的行业经验,目前亿智在珠海的研发团队已近100余人。亿智电子科技已于2018年2月完成了数千万元天使轮融资,并于2018年8月由北极光创投领投,达泰资本跟投。亿智的商业模式主要为代理商和大客户提供整套的解决方案。

亿智在音视频编解码和AI视觉算法方面积累了10多年的领先经验,通过人工智能需求市场的垂直化、场景化应用研究,在汽车电子应用方面,亿智的产品线具有车牌识别、车牌识别、文字识别的能力,ADAS智能算法可以实现4路全景连接、全景停车、行车记录仪/智能后视镜/智能中控车机等汽车电子产品应用。现在的夜视镜产品,长焦夜视摄像头,短焦行驶摄像头,显示车辆的燃料费、速度、水温等,信息都是手机连接的。4G后视镜提供线上导航、线上音乐、云狗、行车记录,ADAS安全驾驶辅助系统。

亿智占领抓拍产品可进行车牌检测、车牌识别、抓拍路段时间规划、黑白名单管理、车辆轨迹显示、后台管理系统多车道实时识别,具有软件能力,团队现在的识别成功率达到95%。志向成为视频安全、汽车电子、智能硬件领域智能化的世界领导者。

2.AI让行业应用插上腾飞的翅膀-电子应用篇

近年来,在计算、大数据、深度学习等技术的综合应用下,AI技术得以大幅度提升,应用场景也越来越多。2017年人工智能市场中,计算机视觉位居第一,占比达到37%,语音第二,达到22%,而在计算机视觉应用中,安防占比高达68%,基于计算机视觉开发的人脸解锁、人像美颜功能在AI手机应用中渗透率分别高达75%与90%,而语音主要应用在智能手机、可穿戴设备、智能家居中。

AI让安防升级换代,催生更多应用场景

稳健发展中的安防产业

根据中安协发布《中国安防行业‚十三五‛(2016-2020 年)发展规划》,十三五‛期间,安防行业将向规模化、自动化、智能化转型升级,且到2020年,安防企业总收入达到8000亿元左右,年增长率达到10%以上。

image.png
AI技术助力安防行业智能化升级

随着GPU等硬件设备的研发和人工智能相关软件算法的成熟,人工智能逐渐被大规模应用各个领域,而安防行业对实时性、准确性要求极高,人工能+安防应运而生。在安防产业链中,硬件设备制造、系统集成及运营服务是产业链的核心,渠道推广是产业链的经脉。未来安防产业的运营升级势在必行,通过物联网、大数据与人工智能技术提供整体解决方案是众多企业的发展趋势。
image.png

安防是人工智能最理想的落地行业之一。随着深入学习、大数据等技术的不断突破,人工智能+钟已经成为中国经济增长的新引擎。人工智能的产业化是AI+垂直行业的变革。安防行业的海量数据以及事前预防、事中响应、事后追查的诉求与人工智能训练需求及技术逻辑完全吻合,是人工智能最理想的落地行业之一。AI+安全已经从概念普及、技术竞争进入产品、场景、实战应用和生态建设阶段。

智能安防云边结合成为新趋势。目前,安全系统中常见的中心计算结构问题越来越严重,主要表现为网络传输带宽问题、及时问题无法有效解决。边缘计算的出现有效缓解了上述问题。云计算着重于非实时、长周期数据和业务决策场景,边缘计算在实时、短周期数据、当地决策等场景中具有不可替代的作用。这使得云和边缘结合成为一种新趋势:一些需要集中处理的计算将继续交给大型云计算中心,如大数据挖掘和大规模学习。大量实时的互动计算和分析将在边缘节点完成。

image.png

海康威视提出云边融合AI Cloud架构。海康威视AI Cloud架构由边缘节点、边缘域和云中心三个层次构成。边缘节点侧重于多维感知数据的收集和前端的智能处理,边缘域侧重于感知数据的收集、存储、处理和智能应用,云中心侧重于业务数据的融合和大数据的多维分析应用。数据从边缘节点到边缘域,实现‚聚边到域‛;从边缘域到云中心,实现‚数据入云‛。边缘域和云中心可以多种多样,边缘域汇集的数据和传达到云中心的数据在格式和内容上也不同。边缘域发挥的作用就像足球、中场一样,什么时候决定,什么样的数据,处理到什么程度,送到云中心,按需集中。

image.png

智能安防产业链:上游有零组件供应商、算法和芯片供应商等;中游为软硬件设备设计、制造和生产环节,主要包括前端摄像机、后端存储录像设备、音视频产品、显示屏供应商、系统集成商、运营服务商等;下游为产 品分销及终端的城市级、行业级和消费级客户应用。上游零部件供应商,代表企业有华为海思、索尼、中星微,还有视频算法提供商Object Video等;中游软硬件供应商、系统集成商的主力厂商包括海康、大华等。下游为终端客户,主要涉及到政府、公共行业、民用行业等。

image.png
image.png

智能安防算法:算法环节主要包括图像处理、视频压缩和内容识别三个分类。计算机视觉、深度学习、集成算法等重要的人工智能算法的引入和革新,助力安防产品适应大众不断增长的安防需求。在安防领域智能算法的 运用主要体现在,利用无间歇工作的智能算法对视频画面进行监控,以弥补人力无法长时间保持监控状态的缺失;利用生物识别技术解决人脸、指纹、语音等生物特征被盗用的情况;提高安防产品保密和防御级别,确保 场所安防布控。此前,算法的基础框架的研发几乎被国外企业垄断,但近年来,伴随人工智能深度学习算法的快速成熟,中国芯片设计公司和设备产品厂商都致力于在基础算法上进行改进和优化,培养自己独有的算法技 术,部分优质的图像内容识别、算法供应商陆续出现。

image.png

安防监控芯片:在智能安防监控领域,芯片是硬件设备中成本占比最高的零组件之一,也是安防视频监控设备的核心部件,通过前端摄像机内置人工智能芯片,可实时分析视频内容,检测对象,识别人、车属性信息,并 通过网络传递到后端人工智能的中心数据库进行存储。目前,安防视频设备中所需要的处理器芯片主要包括网络摄像机中的SoC芯片、后端DVR/NVR中的SoC芯片以及深度学习算法、加速器芯片以及前端模拟摄像机中的 ISP芯片四种类型。目前,高性能的深度学习算法加速器芯片仍由国外芯片厂商提供,但其余三类处理器芯片已实现了较大程度的国产化替代。

image.png

安防用人工智能芯片:目前安防领域最主流的深度学习芯片方案是GPU,但GPU存在成本、效率、功耗等瓶颈,现已有针对安防产业开发的FPGA/ASIC智能芯片,如深鉴科技(去年被Xilinx赛灵思以3亿美元并购)的DPU芯片(FPGA)、北京君正的NPU协处理器(ASIC)、寒武纪的AI服务器芯片(ASIC等)。

未来随着根据应用场景定制的ASIC或专用SoC智能监控芯片的逐渐成熟(安霸、海思的方案已经在小排量测试,而海康及大华也都在开发自研智能监控ASIC/SoC芯片),高性价比的专用芯片对边缘运算及部分云端通用GPU芯片的替代,将使得智能监控设备的成本有望大幅降低,安防监控智能化进程在未来加速落地可期。

image.png

智能安防才刚进入初级阶段,AI占比低于1%,未来大有可为

目前AI在安防领域仍处在发展阶段,具有较好的发展前景:《2018年中国AI+安防行业发展研究报告预告版》的报道中指出,人工智能在安防领域的应用早在2012年就已经取得一定成就,但是无论是人脸识别、结构分析 等其他定制化服务,也就2016-2017年左右才稍有起色。

安防领域智能摄像头应用率1%:智能摄像头无疑在智能安防领域充当着最基础也最重要的眼睛作用,单单就智能摄像头来说,我国一年有5000万个摄像头需求。实际上我们只有50万不到智能摄像头进入到安防领域应用,用率也就刚刚达到1%而已。

AI摄像机在公安动态识别系统渗透率0.4%:2018年市场较为理性,从铺设速度看,AI摄像机在公安动态识别系统项目中渗透约达到16.6%,而若考虑全国近2300万路现存公安监控摄像头,则渗透率约0.4%,从设备能力看,符合应用场景可用指标为核心准则。

image.png

智慧安防22.6%复合增长:在安防领域,智能化逐渐成为行业转型升级的方向,智能安防在安防行业占比也逐步提升。据中商情报网数据,2018年中国安防行业市场规突破六千亿元,其中,智慧安防行业市场规模约2001 亿元,预计到2022年智慧安防行业市场规模将达到 4514亿元,2018-2022年均复合增长率达到22.6%。

image.png

2018年安防AI产品营收在前端营收占比中增长100%,后端增长70%:2017年和2018年人工智能开始真正落地安防场景,其中2018年更是飞速发展的一年。按前端产品、后端产品、中控产品、工程施工和其他划分的营收结构在这两年中基本没有发生变化,而AI产品的营收在前端营收占比中增长了100%,在后端营收占比中增长了70%(注:图中蓝色区域AI产品占比为前端产品或后端产品中的占比,并非整体营收占比。),说明在符合已有市场需求结构的基础上,AI产品越来越受到市场的重视与欢迎,虽然整体占比还很小,但在公安部门‚新建一批、利旧一批、淘汰一批‛的准则下,2019年AI产品在安防厂商视频监控业务中的占比增速不会低于2018年。

image.png

image.png

AI、安防企业有望整合:新兴AI企业比一些安全上市企业早推出智能安全产品,技术领先,但AI需要通过数据进行机械学习,AI创业企业在数据方面稍差,没有数据支持就难以实现更大的突破,大量数据在政府国安手中,没有数据支持就难以取得更大的突破这形成了资源和技术不能很好地匹配,资源手中缺乏AI技术,AI产品难以大规模应用。

安防AI面临的三大挑战

安防AI的发展主要面临以三个方面的挑战:算法的场景适应能力、大规模应用的技术与经济可行性和面向业务应用的解决方案。

算法的场景适应能力:以人脸识别为例,目前绝大多数厂商的算法来源于对人脸静态图片的学习训练—比如标准证件照,对所采集的人脸照片的清晰度、光照、角度、妆容都有着严格的要求,但在实际监控场景中,除了室内个别环境外,绝大多数现场环境采集的人脸图片无法满足这样的要求,造成人脸识别精度的大幅度衰减。如国内某知名厂商的人脸识别算法在静态人脸比对测试中总是名列前茅,但其复杂环境下动态人脸识别的效果就比较差,特别是在偏转角度较大(超过30°)、化妆、戴墨镜、戴口罩等情况下识别率会大打折扣。

大规模应用的技术与经济可行性:目前,计算机视觉的大规模运算主要依赖于GPU和CPU的计算能力,以脸部识别和视频结构化分析为例,一般利用GPU进行视频图像处理和特征分析运算,使用CPU进行脸部特征的比较运算。在复杂的动态面部采集环境下,1台8卡GPU(TESLAP4)2台16核CPU服务器每秒支持80路1080PHD视频的实时动态分析和100万库的实时动态比较运算,硬件成本4000元/路,电力消耗(服务器自身消耗电力采用800万像素监视图像,硬件成本再增加3倍,算法和应用软件系统的费用还没有计算,这么高的建设和运行费用很难得到大规模的应用普及。

面向业务应用的解决方案:AI是一项技术,从AI技术到客户价值,需要一整套的产品与解决方案,向客户最终交付的是应用,尤其是面向业务的应用软件,不同行业、不同场景、不同用途的业务应用都不尽相同,需要针对性的集成与应用软件开发,否则无法规模化推广。而目前情况来看,无论是AI算法厂商、安防产品商还是系统集成商,都不具备全行业应用软件的开发能力。

AI+安防使用技术

(a)视频结构化技术

一是目标检测——从视频中提取出前景目标,然后识别出前景目标是有效目标(如:人员、车辆、人脸等)还是无效目标(如:树叶、阴影、光线等)。在目标检测过程主要应用到运动目标检测、人脸检测和车辆检测等技术。

二是目标跟踪——实现特定目标在场景中的持续跟踪,并从整个跟踪过程中获取一张高质量图片作为该目标的抓拍图片。在目标跟踪过程中主要应用到多目标跟踪、目标融合以及目标评分技术。

三是目标属性提取——对已经检测到的目标图片中目标属性的识别,判断该目标具有哪些可视化的特征属性,例如人员目标的性别、年龄、着装,车辆目标的车型、颜色等属性。目标属性提取过程主要基于深度学习网络 结构的特征提取和分类技术。

(b)情感计算技术

情感计算在安防领域具有广泛的应用前景。计算机通过对人类面部表情、语音表情、姿态表情、生理表情和文本情感的获取、分类和识别,可以及时获取目标对象的情感变化,并对异常危险行为提出预警,实施相应的应对措施。

脸部表情:国际著名心理学家Paul Ekman和研究伙伴W.V.Friesen对人脸面部表情作了深入的研究,通过观察和生物反馈,于1976年描绘出了不同的脸部肌肉动作和不同表情的对应关系,即面部表情编码系统FACS。FACS根据人脸的解剖学特点,将人脸划分成若干既相互独立又相互联系的运动单元,分析了这些运动单元的运动特征及其所控制的主要区域以及与之相关的表情,并给出了大量的照片说明。FACS是如今面部表情的肌肉运动的权威参照标准,也被心理学家和动画片绘画者使用。

为满足视频信息传输的需要,人们进一步将人脸识别和合成的工作融入到视频图像编解码之中。典型如MPEG4 V2视觉标准,其中定义了3个重要的参数集:人脸定义参数、人脸内插变换和人脸动画参数。当前人脸表情处理技术研究的热点多侧重于对三维图像的更加细致的描述和建模。通常采用复杂的纹理和较细致的图形变换算法,达到生动的情感表达效果。在此基础上,不同的算法形成了不同水平的应用系统。

语音理解:目前,国际上对情感语音的研究主要侧重于情感的声学特征的分析。中国科学院自动化研究所模式识别国家重点实验室的专家们针对语言中的焦点现象,首先提出了情感焦点生成模型。这为语音合成中情感状态 的自动预测提供了依据,结合高质量的声学模型,使得情感语音合成和识别达到了实用水平。

姿态变化:针对肢体运动,科学家专门设计了一系列运动和身体信息捕获设备,例如运动捕获仪、数据手套、智能座椅等。国外一些著名的大学和跨国公司,例如麻省理工学院、IBM等则在这些设备的基础上构筑了智能空 间。也有人将智能座椅应用于汽车的驾座上,用于动态监测驾驶人员的情绪状态,并提出适时警告。意大利的一些科学家还通过一系列的姿态分析,对办公室的工作人员进行情感自动分析,设计出更舒适的办公环境。

生理识别:不同的生理信号的特征模式也是情感识别的重要依据之一。人的生理信号比起面部表情和语音,识别难度更大,所以目前生理模式的情感识别研究还处于初级阶段。哪些信号可以转化为情感参数、信号各个方面的权重、比例应该是多少,这些都还需要进行进一步的研究和探索。

文本情感计算:文本情感计算是自然语言处理的一个研究分支,其工作展开的关键在于情感特征提取和情感分类方法的不断进步优化。尽管经过了大量研究,文本情感计算取得了很大的进展,但整体仍处于探索阶段,存在一些亟待解决和研究的问题:缺乏规范统一的实验语料和词典。目前针对语言规律和句子语义成分的分析问题,还没有成熟的解决方案。

多模态的情感计算:虽然人脸、语音、姿态、生理、文本均能独立地表示一定的情感,但只有实现多通道的情感信息采集,才能实现完整的情感识别。这通常要求系统集自然语言、语音、手语、人脸、唇读、头势、体势等多种交流通道于一体,进行综合的采集、分析和识别。目前,多模态技术正在成为情感计算的研究热点,实现情感的多特征融合,能够有力地提高情感计算的研究深度。美国麻省理工学院、日本东京科技大学、美国卡内 基·梅隆大学均在情感机器人和情感虚拟人的研究领域做出了较好的演示系统。中科院自动化所模式识别国家重点实验室也已将情感处理融入到了多模态交互平台中,结合情感语音合成、人脸建模等技术,构筑了栩栩如生的情感虚拟头像。

(c)大数据技术

大数据技术为人工智能提供强大的分布式计算能力和知识库管理能力,是人工智能分析预测、自主完善的重要支撑。

一是海量数据管理被用于采集、存储人工智能应用所涉及的全方位数据资源,并基于时间轴进行数据累积,以便能在时间维度上体现真实事物的规律。同时,人工智能应用长期积累的庞大知识库,也需要依赖该系统进行 管理和访问。

二是大规模分布式计算使得人工智能具备强大的计算能力,能同时分析海量的数据,开展特征匹配和模型仿真,并为众多用户提供个性化服务。

三是数据挖掘是人工智能发挥真正价值的核心,利用机器学习算法自动开展多种分析计算,探究数据资源中的规律和异常点,辅助用户更快、更准地找到有效的资源,进行风险预测和评估。

AI+安防场景应用

安防与人工智能技术结合是大势所趋,‚AI+安防‛朝着视频结构化、数据可视化、安防移动化、云防立体化演进。但在发展过程中软硬件问题尚待解决,只有妥善解决这些问题,才能满足市场需求,提升整个安防领域的智能化水平,从而推动安防产业的升级换代。

公安行业场景应用:公安行业用户的迫切需求是在海量的视频信息中,发现犯罪嫌疑人的线索。前端摄像机内置人工智能芯片,可实时分析视频内容,检测运动对象,识别人、车属性信息,并通过网络传递到后端人工智能的中心数据库进行存储,再利用强大的计算能力及智能分析能力,对嫌疑人的信息进行实时分析,为案件的侦破节约宝贵的时间。其强大的交互能力,真正成为办案人员的专家助手。

交通行业场景应用:在交通领域,利用人工智能技术,可实时分析城市交通流量,调整红绿灯间隔,缩短车辆等待时间,提升城市道路的通行效率。城市级的人工智能大脑,实时掌握着城市道路上通行车辆的轨迹信息,停车场的车辆信息,以及小区的停车信息,合理调配资源、疏导交通,实现机场、火车站、汽车站、商圈的大规模交通联动调度,提升整个城市的运行效率,为居民的出行畅通提供保障。

智能楼宇场景应用:在智能楼宇领域,人工智能是建筑的大脑,综合控制着建筑的安防、能耗,对于进出大厦的人、车、物实现实时的跟踪定位,区分办公人员与外来人员,监控大楼的能源消耗,使得大厦的运行效率最 优,延长大厦的使用寿命。

工厂园区场景应用:在工厂园区场所,利用可移动巡线机器人,定期巡逻,读取仪表数值,分析潜在的风险,保障全封闭无人工厂的可靠运行,真正推动‚工业4.0‛的发展。

民用安防场景应用:在家庭安防中,当检测到家庭中没有人员时,家庭安防摄像机可自动进入布防模式,有异常时,给予闯入人员声音警告,并远程通知家庭主人。而当家庭成员回家后,又能自动撤防,保护用户隐私。 夜间期间,通过一定时间的自学习,掌握家庭成员的作息规律,在主人休息时启动布防,确保夜间安全,省去人工布防的烦恼,真正实现人性化。

2018年安防AI发展情况

2015年以来,旷视、依图、商汤、云从等人工智能算法团队率先将人脸识别技术应用到公安科技中,帮助公安机关侦破了很多旧案积案,抓获了不少长期潜逃的案犯,引起了轰动,安防AI应用才始见庐山真面目。经过 2016、2017两年的认知、试用和推广,2018年开始进入一轮人脸识别初级阶段应用的小高潮。

(a)2018年安防AI发展特点

2018年安防AI市场发展的特点可概括为四句话十六个字:‚看脸时代‛、‚风正起时‛、‚群雄并起‛、‚两营对垒‛。

‚看脸时代‛:2018年谈到安防AI就离不开人脸识别,一方面是因为一流算法团队的人脸识别技术已经超越人眼的辨识能力且得到了众多现实场景的检验,技术上完全达到了实用化阶段;另一方面人脸识别的应用范围和场景比较宽,如公安追逃、身份核查、案件侦查和所有需要身份鉴别认证的场景都用到人脸识别技术,人脸识别是目前最成熟、最广泛的安防AI应用。

‚风正起时‛:作为全国性的安防行业最大的工程项目——雪亮工程和天网工程的建设重点都已经从原来点位建设转移到AI应用上来,以及其它垂直应用领域的安防系统建设也都在关注AI应用,从而催生出了未来巨大的安防AI产品与应用市场,安防AI‚风‛已经吹起,AI算法团队、AI芯片厂商、传统安防厂商、系统集成商、传统IT厂商都吹响了‚集结号‛,意欲掘金未来庞大的安防市场。

‚群雄并起‛:受安防AI风口的驱动,除了目前国内几家知名的视觉AI算法团队外,传统安防厂商、新AI创业团队、垂直行业应用集成商也都在投入人力物力来开发自己的AI技术和产品,形成了群雄并起的局面。

‚两营对垒‛:2018年以前,率先在安防AI市场刮起旋风的是依图、商汤、旷视、云从等AI新锐。2018年,传统安防厂商布局AI技术产品,在市场竞争层面主要是AI算法专业团队与传统安防厂商两大阵营的对垒,在到底是AI+安防还是安防+AI的问题上各自演绎。从当前竞争的初步结果来看,AI算法团队在算法精度和云端算力上具有较为明显的碾压优势,传统安防厂商在AI边缘产品——特别是人脸检测抓拍摄像机产品化和安防AI行业应用方面处于领先地位。

(b)安防AI技术、产品应用落地情况

目前安防AI技术主要集中在人脸识别与人、车、物视频结构化解析两个方面,其中人脸识别技术已经成熟,人脸静态识别准确率已经达到98%以上,人脸动态识别(利用监控摄像头进行实时人脸识别)的准确率也已达到90%以上(百万人脸比对库以内),已经满足绝大多数场景下的应用需求。人/车/物视频结构化解析在机动车特征解析上的准确率已达到95%以上,而在人体特征和非机动车识别上准确度与实战要求还存在一定的差距,特别是在大场景、多目标、复杂光照条件下,准确度还难有保证。

在AI产品上,云端产品主要是基于GPU运算的人脸识别与视频结构化解析服务器,受限于前端芯片算力的影响,边缘运算产品主要是人脸抓拍摄像机和支持小规模人脸库的人脸门禁终端机,其中以人脸抓拍摄像机和人脸闸机的市场销售已经初步放量。在落地应用场景上,以雪亮工程、天网工程等社会公共安全为主要应用场景,占安防AI市场的80%以上,但目前还仅仅是小规模试点和少量项目落地应用,还远没形成规模化应用的格局。另外,人脸门禁在政府机关、对安全有较高要求的企事业单位、居民小区、校园等也有试点场景落地。

AI+安防发展趋势

(a)从最初的‚谁是你‛,到‚你是谁‛

近些年因为AI技术的出现,视频监控层面从最初的数字化、网络化、高清化向智能化快速转变,安防行业达成的共识是从‚看得清‚到‛看得懂‚,从‛看视频‚到‛用视频‚进行过渡。最初摄像头解决的是图像传输和处理,网络、互联网普及后开始进行万物互联,无论是依托大数据还是云计算技术来判别人与人、人与物之间的关联性。但最近在近期AI或安防上市企业发布会或展会上,我们看到一些多功能AI产品面世。

比如感知型IPC,在车辆识别方面精细化程度从车牌、车型、车身颜色、品牌到驾驶员是否系安全带、是否打电话、是否开启遮阳板,再到车辆通过的时间、道路名称、车辆行驶方向进行车辆轨迹分析,包括人员以图搜图,整理你的行为轨迹。AI+安防要解决的将不再是人与人之间、人与车之间的结构联系,而是能自主判断‚你是谁‛,相信在不久的将来人工智能技术将会取代众多传统的安防技术,整个安防行业的发展已经到了比拼核心技术的关键节点。

(b)投资并购,完美结合

因为AI技术和供应链资源参差不齐的事实客观存在,我们发现,不少传统安防企业通过投资/并购AI公司的方式来弥补各自短板,向完美结合体演进。2008年,全球视频监控领域三大巨头AXIS、BOSCH、Sony宣布合作,安防领域内企业开放、合作呼声渐高。2015年英飞拓收购藏愚科技,高新兴收购创联电子,东方网力收购华启智能、动力盈科等6家新技术企业;2016年海康威视收购英国报警企业SHL,佳都收购华之源,东方网力再次投资爱耳目、数智源等等。

我们看到安防市场格局逐渐明朗,已经形成了‚两超多强‛的格局,海康威视和大华股份领跑市场,东方网力、佳都、苏州、汉王等第二梯队企业奋起直追。当有了新技术的运作,尤其在AI应用正式落地安防之后,投资或收购AI技术公司成为传统安防企业最有效创新升级的方式,而AI+安防企业也将面临行业集中度提高,市场份额向头部集中的洗礼。

(c)AI+安防企业的业务逻辑是先TOb

公安部门属于比较高端的市场,但从历史来看,都是从政府这边去切入,然后成熟之后再往民用方向普及,随着AI成熟度的进一步加强,很多安防产品已经开始逐步下沉到更多细分的民用场景,如社区、学校、工业园区、智能家居等。

受益于安防领域深度学习算法的快速发展,智能安防已经得到了越来越广泛的应用。在AI+安防时代,面对安防视频产品下游的需求,运营服务将有较大的市场空间,这也将成为我国安防产业未来的发展方向。以人脸识别为例,可广泛应用于公安、零售、教育、金融、医疗等行业;除此之外,未来也可以尝试新兴的场景,如智慧景区,完成物品遗留检测、客流统计以及智能巡检等;智慧商业,对客流量统计以及人流密度检测等。

而对于具体做法,AI初创公司未来需要选择和深挖垂直行业解决方案。做解决方案的好处就是能够端到端地了解行业应用,从系统化、全局化的角度才能真正理解业务对于技术的需求,重新定义问题才有可能更好解决问 题。

AI对安防领域的改造才刚开始,这一点从几家传统安防企业的AI产品落地情况可以看出来。2017年是AI+安防企业正式落地应用的第一年,具备深度学习算法或AI产品开始在政府国安得到小范围运用,包括提供个性化定制解决方案,随着未来技术的成熟,以及国家政策的推动。在原有安防场景里,AI+安防产品大规模运用最多只有5年左右时间,这些年弯道超车的AI初创企业,以及积极拥抱AI新技术的传统安防企业的行业格局变化值得期待。

(d)安防AI应用场景落地需要算法、算力、产品与应用共同推动

安防AI应用场景落地需要算法、算力、产品与应用四个方面的合力才能推动,其中算法仍然是核心。随着算法、算力、芯片的快速发展和泛AI业务场景的深度应用,行业将迎来泛AI时代,预计到2022年,AI将成为几乎所有安防监控系统的必备能力。

算法层面:除了需要不断提升应用场景的环境适应能力外,还需要在保证算法精度的前提下对模型的持续精炼,以降低对算力的消耗,从而控制硬件资源的投入、系统建设成本和电力消耗,为大规模泛智能化应用创造条件。因此谁掌握了深度学习的核心技术,具备算法的持续优化迭代能力,谁就会在未来的市场中占据主导地位。虽然安防AI市场的参与者都宣称具有自主开发算法的能力,但绝大多数是利用开源深度学习框架进行二次开发和模型训练,本身并不掌握核心技术,而开源框架多数来源于美国的公司或研究机构,未来在算法的迭代能力上将面临极大的考验。

算力层面:无论是云端算力和边缘算力将会得到大幅度提升,英伟达不断刷新其推理型GPU芯片的运算性能和能耗比,为云端运算提供强大的算力支撑。Intel、NXP、AMD、GOOGLE、苹果、IBM、ARM、高通、博通、三星等国际知名芯片厂商以及华为、寒武纪、比特大陆,深鉴、地平线、中星微等国内芯片厂商都在AI 芯片上持续发力,未来必将呈现众彩纷呈的局面,让每个安防设备都具备强大的AI能力。

产品层面:目前云端产品主要以GPU服务器为主,未来会出现集成ARM、高通、华为海思、FPGA等芯片架构的云端AI运算服务器。随着高性能、微功耗、低成本AI 芯片的推出,未来最值得期待的将会是边缘节点泛智能 产品,如可同时运行多种AI算法模型的AI摄像机、智能 NVR等产品,AI将会是安防监控设备的标配能力。

应用层面:AI来源于深度学习与大数据,AI同时也产生大数据,如基于人脸、人体、车辆特征的时空轨迹大数据。AI的核心是算法,本质是大数据,特别是在公安行业,AI给警用大数据注入了新鲜血液,有了AI才算真正有了警用大数据。因此未来在安防AI应用层面,不仅仅是目前简单的人脸比对、黑名单布控、身份甄别等简单化应用,而是具备更大可挖掘价值的AI大数据应用,也将会涌现出一批专注于面向各行业的AI大数据挖掘和应用的企业。

智能手机AI应用势如破竹

随着移动互联网的发展,智能手机已经从单纯的通讯工具成为了人们生活和工作的入口,智能手机的快速普及也带动了诸多产业的发展,AI也瞄准了智能手机这个大蛋糕市场,同时手机厂商意识到了AI给智能手机行业带来的价值,AI手机应运而生,从2017年开始,‚AI手机‛如雨后春笋,2018年主流手机厂商更是在各自的旗舰机型中全面引入AI技术,甚至搭载AI芯片的手机正在成为市场的主流。

AI视觉给手机带来新方向

目前手机AI应用较多的还是体现在摄像头上,无论是拍照、解锁,还是认知、优化、分析等都是基于这个‚AICamera‛。最浅层的AICamera即人脸解锁,再往上则可能是AI的智能优化。视觉应用是手机AI应用中最主要的诉求,从图中我们可以明显地看到,目前主流的手机应用大多与视觉应用相关(蓝色柱状图),可以说,提升视觉技术在当前是改善用户体验的最直接和最有效的手段。目前,计算机视觉技术在手机种的应用主要可以分为三大方向:识别与认证、AI摄影、3D感知。AI手机基于计算机视觉开发的人脸解锁、人像美颜功能在手机应用中渗透率分别高达75%与90%。与此同时,AI视觉需求的日益强烈对产业链因此提出了更高的要求,应用、算法、解决方案、硬件将会环环相扣、缺一不可。

image.png

想要给用户带来超预期的视觉体验,需要产业链的协同发展。视觉技术的推陈出新与产业链的发展紧密相连。IDC将计算机视觉技术对安手机的影响分为四个层面,每一个层面的创新既相对独立又相互促进。利用新器件、新算法打造新方案探索新应用,改善用户体验,提升用户粘性是AI手机快速普及的重要助推力。

image.png

AI视觉方案对手机产业链的革新需求:随着人工智能视觉需求的日益强烈AI视觉解决方案整合将加速,对产业链提出了更高的要求。计算机视觉技术将成为手机产业链的关键环节,可见计算机视觉技术在手机领域的应用正在趋于成熟,但就技术本身来讲还有太多应用场景尚未被开发出来。当前市场关注度、渗透率及技术采用度相对较高的应用场景,如人脸识别、物体识别、物体检测等还停留在较为基础的物体探测阶段,在更具体的事件检测、更灵活的人机交互及更复杂的信息重组、自主行为等方面的应用明显不足。

AI视觉产业生态的整合正在发生:以高通、联发科、紫光展锐等公司为代表的芯片厂商,以及以奥比中光、艾迈斯、舜宇光学、欧菲科技为代表的光学器件和模组厂商正在通过战略合作资本等形式与上层算法和应用公司 进行深度合作。未来,无论是计算机视觉技术本身还是‚AI手机‛行业的市场前景,都还具有非常大的想象空间。

AI算法加持,手机摄像头实现AR测量:2018年11月,OPPO R17 Pro正式发售,其搭载的‚AR测量‛令人瞩目,成为首款实现景深距离测量的安卓手机。‚AR测量‛就是可以直接借助手机AR代替尺子、量角器等工具测量实际物体长度、角度、距离、面积的应用。开启‚AR测量‛创意功能,用户可以测量物体的角度、长度、测距离以及面积。那么,OPPOAR测量的精度如何呢?OPPOAR通过景深距离的测量,透过手机屏幕,用户可以直观看到被标记物体与自己的距离,其绝对精度为1%,相对精度为0.5%。

image.png

解放双手,AI语音助手发展在路上

语音助手是‚人工智能‛应用的一种具体表现方式,‚人工智能‛最初的形态就是语音助手;特别是AI语音助手可以通过不断学习和整合服务,从而变得更智能和更实用。AI 语音助手应用在智能手机中,可以实现智能对话和即时问答等智能交互,帮忙手机用户解决各种问题。因此,智能手机搭载AI语音助手,也是希望智能手机变得更加智能。

2023年,智能手机AI助手渗透率将达90%:AI语音是仅次于AI视觉的在智能手机中第二大应用,2017年,全球销售的智能手机中,只有36.6%的智能手机配置AI语音助手,而2018年,这个数字将达到47.7%A;

Strategy Analytics预测到2023年前,全球90%的智能手机势必会配置AI语音助手。这说明智能手机配置AI语音助手功能,已经成为一种越来越流行的发展趋势。

谷歌Assistant的AI技术明显超前:2017年,谷歌的Assistant语音助手就占了46.7%的市场份额,其次是苹果的Siri语音助手,占了40.1%的市场份额。预计2018年,谷歌Assistant语音助手的市场份额可能会增长到51.3%;并且到2023年,它的市场份额预计增长到60.6%。

智能穿戴‚钱‛途无量

可穿戴设备保持快速成长

Gartner预测,2018年全球可穿戴设备出货量预计将达1.79亿部,较2017年的1.41亿部同比增长27.1%。新兴市场可穿戴设备的出货量进一步增长,智能可穿戴设备未来五年复合年增长率将达到26.3%,预计2022年发货量将跃升至4.53亿部。举例而言,至2022年,耳戴式设备、头戴式设备、智能手表的出货量分别将达到1.58亿台、8018万台、1.15亿台,五年出货量复合增速分别为49.1%、33.3%、22.7%,耳戴式设备将取代智能手表成为可穿戴设备领域最主要的产品。到2022年,苹果AirPods之类的耳机设备,将占可穿戴设备市场份额的30%以上。

image.png

image.png

可穿戴AI市场增速更快

AI助手需求量的不断增加、医疗行业运作量的增加、物联网技术的出现、无线技术的整合、可穿戴组件技术的增长前景,以及消费者对先进可穿戴设备的喜爱和需求的增加,都是全球可穿戴市场不断增长的主要驱动力。MarketsandMarkets预测,2018年全球可穿戴AI市场规模预计为115亿美元,到2023年,该数字余预计将达到424亿美元,预测期(2018年~2023年)内的年复合增长率为29.75%。

image.png

蓝牙耳机有望会成为私人‚AI小秘‛

2019年,在AI技术的引入下,蓝牙耳机的功能将会更加千变万化,这也将是各家厂商竞争的焦点之一,具体有可能碰撞出什么火花?大致可以分为这些:

(1)智能降噪将成为标配
(2)运动耳机将加入更多检测功能
(3)耳机也能识别你是谁:声纹ID与AI语音
(4)私人定制EQ
(5)更多AI功能,如智能实时翻译、听译功能等。

AirPods仍是最受欢迎的无线耳机:AirPods是苹果设备中最具备成长动能的产品,预计2018年AirPods出货量约2800万台,占比全球耳戴式设备出货量的80%以上。此外,苹果新款AirPods获蓝牙技术联盟认证,并支持健康追踪、无需手动可直接语音唤醒Siri等功能,其充电盒也有望增加无线充电技术,市场预计全新设计的AirPods将于2020年发布,18-21年苹果AirPods将是全球耳戴式设备快速成长的主要驱动力。

image.png

安防+AI让智能家居正式迈入智慧家居

智能家居产品已经悄然飞入‚寻常百姓家‛,如今的智能家居产品早已不只停留在概念阶段,各种神奇的‚脑洞‛已经纷纷落地成为现实。智能语音助手快速崛起,使其成为串联智能家居设备的重要‚入口‛;智能安防产品不断发展,明显提升了生活质量‛。

在2019年的CES(美国消费电子展)上,智能语音助手成为谷歌和亚马逊两大巨头展台上的主角,智能语音助手连接的摄像头、温度计、空调和门铃占据了最显著的位置。亚马逊方面表示,其语音助手已被安装在超过1亿台设备上;谷歌则公布数据称,2018年包括智能手机、智能手表、智能家居设备等在内,内置谷歌语音助手的产品数量从4亿台升至10亿台。

image.png

智能音箱,智能家居设备的入口

搭载智能语音助手的智能扬声器被制造商们视为可以串联智能家庭设备的入口。厂商们争夺智能音箱市场的主导地位,其实就是在争取首次购买人群以及刚刚开始建立自己智能家居设备系统的消费者,预计到2019年,通过智能音箱将可以控制超过80%的智能家居设备,2018年语音助手在智能家居市场出货量中的搭载率为 28%,预计到2019年将达到39%,未来将更多应用在智能插座、智能摄像头以及智能网关等产品上。

家庭智能安防渐成‚刚需‛

如果说智能语音助手作为‚入口‛的价值在于‚串联‛,那么以智能门锁、智能摄像头等为代表的智能安防设备作为‚入口‛,其价值则在于‚刚需‛。人脸识别技术作为AI最为成功的应用之一,其虽然已经大范围应用于智慧城市、平安城市等大型项目中,但大部分技术并未下放至家居安防产业中,家居安防依然以普通视频监控为主,而一旦家居安防与AI相结合,将进一步推动智能家居智能化的发展步伐,让智能家居正式迈入智慧家居。

3.AI信息服务的蓝海已至-系统平台战略篇

政策、技术、资本三轮驱动

全球主要国家均将人工智能作为未来主导性战略,美中领跑

美中暂时领先,中国在人工智能领域强在应用层,基础和技术层是相对短板。全球已有超22个国家发布AI计划,2017年与AI相关的VC投资达140亿美元。美国和中国在人工智能领域处于领先位置,根据腾讯研究院的统计,全球人工智能企业总数达到2542家,其中美国拥有1078家,占42%;中国其次,拥有592家,占据23%。其余872家企业分布在瑞典、新加坡、日本、英国、澳大利亚、以色列、印度等国家。从中美两国在人工智能版图的产业布局看,中国在基础层(计算硬件及基础设施,核心为处理器、AI芯片和底层系统、数据等)和技术层(算法理论、开发平台和应用技术,包括开源框架、自然语言处理、计算机视觉与图像等)与美国差距巨大,在应用层(AI向各传统行业的渗透,包括机器学习应用、智能无人机、智能机器人、自动驾驶辅助驾驶、语音识别等)则与美国平分秋色。

美国AI创业公司中排名前三的领域分别为自然语言处理、机器学习应用以及计算机视觉与图像;中国AI创业公司中排名前三的领域分别为计算机视觉与图像、智能机器人以及自然语言处理。在基础和技术层的处理器/芯片,技术平台领域中国与美国存在巨大差距。
image.png

image.png

人工智能上升至中国国家战略层面,行业发展全面加速:2017年7月,国务院印发《新一代人工智能发展规划的通知》,首次从国家战略层面对人工智能进行了系统布局,规划提到至2030年,人工智能行业将在中国产生10兆的产业带动效益;2017年10月,人工智能写入十九大报告;17年12月,《促进新一代人工智能产业发展三年行动计划(2018-2020年)》;18年3月,人工智能再次被写入政府工作报告。政策密集出台,行业已进入发展黄金阶段。

5G+AI是特朗普政府让美国再次伟大的关键:美国希望在人工智能领域延续移动互联网时代领先优势,在5G领域重新抢占制高点。2019年2月,美国总统特朗普签署行政命令,正式启动美国人工智能计划,这是美国政府首次推出国家层面的人工智能促进计划。美国人工智能计划包括研发领域、开放资源、政策制定、人才培养、国际合作等五个关键领域。5G+AI将成为支撑川普承诺‚再次让美国变得伟大‛的关键。

image.png

技术变革促使AI突破应用瓶颈,推动产业应用爆发

人工智能的概念形成于1956年代的达特茅斯会议。其发展阶段经历了三次浪潮

第一次是50-60年代重视逻辑推理的机器翻译时代,现阶段机器人和智能软件开始出现

第二次是70-80年代依靠知识积累构建模型的专家系统时代,但由于实用性行业不足,很快又变冷了

第三次是从2006年开始深度学习算法的推出,开始了重视数据、自主学习的认知智能时代。在数据、算法和计算能力条件成熟的条件下,这次人工智能的爆发浪潮中,技术开始真正落地,深入应用水平,帮助传统行业创造切实的经济效果。

image.png

经过六十多年的发展,人工智能已从实验室(AI in vitro)全面走向了产业与行业的应用和研发。根据Gartner 2018年发布的人工智能技术成熟度曲线,VR/AR等技术已逐步进入稳步爬升的光明期,语音识别技术甚至已经到达实质生产的高峰期。

image.png

资本涌入加速产业成熟,AI+、视觉、大数据等领域成为投资热点

根据《2018世界人工智能产业发展蓝皮书》,从2013-2018Q1全球人工智能投融资的分布来看,投资热点主要集中在AI+(垂直行业)、计算机视觉、大户数及数据服务和智能机器人等领域。

image.png

资本不断涌入,助推AI技术及应用进一步走向成熟:2017年我国人工智能行业融资金额达645亿,融资事件达492起;2018年前三季度我国AI发生融资事件441 起,总金额达825亿元。据CB Insight数据,2017年全球人工智能融资规模达到152.42亿美元,中国已对美国实现超越,融资规模占比49%。资本的涌入将进一步催熟AI技术,加快技术在应用层的下沉。

image.png
image.png

人工智能重塑产业生态,芯片和软件平台是产业制高点

ICT产业正在跨界和重构,传统的芯片商、运营商、设备商和互联网公司及云服务商的合作和竞争边界变得越来越模糊,设备商和云服务商巨头进入芯片领域成为普遍趋势。

AI颠覆芯片产业格局,行业进入群雄逐鹿阶段:不同于传统通用芯片功能,AI时代,底层芯片的设计目的并非为了执行逻辑复杂的指令,而是为了实现大规模数据训练和推理。随着AI+成为普遍商业模式,人工智能已成为芯片产业最重要的增长动力,未来将加速普及渗透。芯片市场蛋糕将越做越大,拥有不同功能和定位的芯片将长期共存,百花齐放。

全球AI芯片产业目前已初步形成五大阵营:

一是传统的芯片企业转型升级做AI芯片,典型海外公司如Intel,英伟达,赛灵思,高通,国内公司如杭州国芯、瑞芯微等;

二是初创AI芯片公司,海外如SambaNova Systems、Movidius,国内如寒武纪、地平线、深鉴科技,耐能,肇观等;

三是互联网公司巨头进入AI芯片领域,海外如Google、Facebook,Amazon等,国内包括阿里巴巴、百度等;

四是传统的ICT巨头进入AI领域,海外如IBM,国内如华为;

五是中国独有的产业生态,即从矿机芯片向AI芯片进行转型,典型的如比特大陆、嘉楠耘智等。

image.png

人工智能的软件技术平台将是巨头的必争之地:人工智能平台被认为是AI领域的‚下一代操作系统‛,这一领域将成为Google、微软、Facebook、Amazon等大玩家的竞争重点。Google推出了TensorFlow跨平台深度学习架构,能够实现云端大规模学习到终端多平台部署的无缝衔接;Microsoft推出的CNTK支持对常用深度神经网络架构的结构性执行,比如卷积神经网络(CNNs),循环神经网络(RNNs)和长短期记忆网络(LSTMs),同时支持多个计算设备以及多个GPU的计算;此外Amazon, Facebook,阿里,腾讯等均已推出了自己的AI软件平台。我们认为,人工智能平台的技术壁垒高,马太效应强,且需要长期持续的的大规模研发资本投入,未来这一领域将是国际巨头间博弈。

image.png

AI是全新的生产要素及工具AI+行业将成为普遍商业模

高数字化行业将优先实现人工智能的应用

人工智能作为全新的生产要素,将改变企业竞争及增长方式:人工智能作为全新的生产要素,将至少在三个方面推动增长:首先是智能自动化效应,AI能够自动执行实体环境中对敏捷性及适应性要求较高的复杂任务,同时伴随大规模的重复工作能够进行自我学习以实现持续升级;第二,AI可以补充和增强现有劳动力及资本,对其赋能,提高资源利用效率;第三,人工智能可以激发大量创新,如自动驾驶,新零售等。

因此,人工智能将成为社会发展的基础设施,作为新的生产要素彻底改变企业的竞争和成长方式。据埃森哲数据,未来与AI深度融合的企业能够将盈利能力平均提升38%,同时AI将为包括教育、制造、批发、零售等16个行业额外带来超14万亿美元的总附加值。

image.png
image.png

人工智能的应用进展取决于数字化程度,高数字化行业将优先实现应用:AI时代是数据驱动的时代,深度学习算法的优化需要大规模数据来训练提升,数据越丰富完整,应用效果越完美。高数字化程度的行业拥有较密集数据资源,成为AI优先落地的领域。在落地应用场景中,目前来看安防、高技术/电信业、金融、汽车等行业落地最快,医疗、零售、旅游、地产等行业较为滞后。

未来人工智能将成为基础设施,科技巨头将成为人工智能基础设施的提供者,普通企业拥抱人工智能的前提是先云化,实现核心业务在线才能加入人工智能的大生态圈,这将不是IT支出转云服务支出‚左右互搏‛的零和游戏,而是涉及未来生死存亡的抉择。

image.png

安防、自动驾驶是当前和未来人工智能重点应用领域

人工智能引发的产业变革,涉及到所有行业,从交通、教育、医疗到翻译、运输和自动驾驶等。我们认为,人工智能在行业中的应用进展取决于行业的数字化程度,除了科技行业之外的应用现在整体上还处于初期阶段,但在一些领域已经取得了巨大的进展。人工智能首先应用的场景,一定是有大量数据和大量计算需求的场景,安全和自动驾驶是这样的场景之一。

AI推动安防行业进一步升级,拓宽行业成长空间:由于人工智能机械视觉技术的快速成熟,安全行业也逐渐从人工智能机械视觉技术的发展中看到,智能安全可以自己提取更多的细微特征,大幅度降低人力和开发成本,将原来的事后追究责任转变为事前预防和事件识别,大幅度提高政府/企业的工作效率安防行业从过去的模拟到数字到高清时代,产业升级随着市场需求的进一步释放。我们认为,在智能时代,安全行业的市场边界将进一步扩大,未来的AI视频监视将逐渐沉入自动驾驶、智能医疗、环境监视等下游新兴应用,市场空间将进一步扩大。预计2020年中国安防行业总体规模将超过9000亿元。

自动驾驶是人工智能的重要落地领域:Intel曾经预估,由于激光雷达(每小时可产生36-252 Gigabyte的影像资料)和摄像头(每小时可产生72-144 Gigabyte的影像资料)的大量使用,每辆无人驾驶车每天将产生4Terabyte or 4,000 Gigabyte的路况原始影像资料。目前各整车厂及科技巨头均在自动驾驶领域有所布局:整车厂方面,奥迪L3级A8已实现量产上市;特斯拉已宣布覆盖各类驾驶场景的完全自动驾驶将于19年年末上市;通用汽车18年计划生产数千辆自动驾驶汽车用于Lyft出租车服务。科技巨头方面,谷歌Waymo18年已拿到首个商业自动驾驶打车服务执照;百度Apollo于11月与一汽共同宣布了中国首款L4级自动驾驶乘用车的量产计划。
image.png

image.png

华为在自动驾驶领域近期也动作频频,去年10月华为联合奥迪发布了自动驾驶方案MDC600。利用8个升级芯片CPUISP构成的系统,基于升级自动驾驶方案的奥迪Q7自动驾驶汽车主张达到了L4水平。我们认为,在L3以上级别,自动驾驶未来的数据处理方式将从单一的自带处理单元当地处理,发展为自带处理单元和网络边缘服务器处理简单的计算过程,云处理大量复杂的计算过程模式。在自动驾驶领域,我们也将看到人工智能多场景的融合,即设备端智能(车) 边缘运算智能(MEC) 云端计算智能的统一。

计算机视觉、智能语音是AI时代入口中国初创龙头企业具备全球竞争力

计算机视觉:AI行业最具商业化价值的赛道

计算机视觉是国内外AI企业最集中的领域,商业成熟度较高:从AI企业的应用技术方向分布来看,计算机视觉技术企业在全球AI企业中占比约40%,在国内占比约46%;无论国外还是国内,计算机视觉都是AI企业最集中的领域。从市场规模来看,2017年计算机视觉市场占全球AI市场总规模的16.9%,排在语音识别之后;而国内计算机视觉市场占AI市场的34.9%,排名第一。国内外计算机视觉的市场规模差异要远大于企业分布差异,说明国内计算机视觉公司的总体盈利能力较其他AI领域的公司较强,商业成熟度较高。

image.png

image.png

计算机视觉是AI领域应用场景最丰富、商业化价值最大的赛道:

目前,AI技术处理的数据类型有文字、声音、图像和视频4种。从信息维度来看,从文字到视频维度增加,文字的信息维度最少,包含的信息量也最少,视频的信息维度最多,包含的信息量也更大。反映在数据量的比例上,以在线数据为例,根据Cisco的研究,2022年世界在线视频流量占总流量的比例从2017年的75%上升到82%,在线数据越来越被视频数据所主导。

由于信息维度高,数据量大,以图像和视频为主要处理对象的计算机视觉比以文字和语音为主要处理对象的其他AI技术具有更丰富的应用场景和商业价值。现在的资本市场也以资源配置、资产价格功能充分反映了计算机视觉与其他AI领域的优势。

例如,根据公开资料,目前计算机视觉行业的4家头部创业企业(商汤、视野、图、云从)的总评价已经超过1000亿元,语音识别行业的几家头部创业企业(思必驰、云知声、外出问题、图灵机器人、捷通华声)的总评价加上了a股AI语音领导科大通信的市场价格总和。

科技巨头把控基础层,初创企业领跑应用层:计算机视觉架构从下至上:

1)基础层——核心芯片被Intel、Nvidia等传统芯片厂商把控,新型芯片厂商尚未崛起,规模应用有待时日;开源平台以谷歌的Tensorflow、Facebook的Caffe等为主,其他企业的深度学习框架多为二次开发;

2)技术层——算法,初创企业占优;云计算,几乎被亚马逊的AWS、谷歌的Cloud、微软的Azure、阿里云等垄断;

3)应用层——垂直行业龙头占据场景,技术层初创企业向上渗透。根据IDC的统计,2017年中国计算机应用市场商汤、旷视、依图、云从等算法及软件解决方案公司‚四小龙‛总体市场份额达69.4%,其中商汤市场份额20.6%排名第一。
image.png

image.png

国内以安防、金融、互联网为主vs.国外消费、机器人(及机器视觉)、智能驾驶领先:

根据IDC的市场跟踪,2018年中国计算机视觉技术输出规模最大的3个行业是政府、金融和互联网,最大的两个场景为政府行业中的平安城市以及金融行业中基于人脸识别的身份认证。而根据Tractica的预测,2018年全球计算机视觉技术输出规模最大的3个行业分别为消费、机器人(及机器视觉)以及智能驾驶。
image.png

中短期核心竞争壁垒是技术和产品能力

长期是生态构建能力在这里技术能力是指企业算法的设计能力、迭代速度等,产品能力是指企业技术的落地能力。中短期来看,包括人脸识别、人体识别、图像识别等在内的主要计算机视觉技术的研发将保持基于使用神经网络的深度学习算法,而神经网络的种类选择、结构设计以及参数调整等是一连串极其复杂的工作,因此算法的优劣和迭代速度将直接取决于算法设计人员的知识和经验储备,也会进一步决定计算机视觉技术的准确率、可靠性等关键性能。

在技术方面,随着自动机械学习技术AutoML的出现,机械学习模型的设计门槛降低了。AutoML的起点是用强大的计算能力通过多次训练提高模型的精度,其最大特点是自动化机械学习模型的设计过程。算法设计师只需了解模型的基本概念,提供标签数据即可,神经网络的参数和结构调整自动完成,无需人工干预。目前,AutoML已入落地阶段。

去年1月,谷歌发布了提供自定义图像识别系统自动开发服务的CloudAutoMLVision,用户从引入数据到培训模式都可以通过拖拉式界面完成。AutoML早已被Google应用于CIFAR-10高度标准测试数据集中化,并出与手工设计不相上下的模型。我们认为,随着AutoML技术的成熟,算法设计的门槛将越来越低,但相应地,算力的重要性将越来越明显。从长远来看,它可能成为计算机视觉企业的核心竞争力之一。
image.png
image.png

产品层面,我们认为,随着竞争的加剧,成功的企业不仅要具备大量的跟技术落地相关的know  how,还必须能够主动地去挖掘甚至创造客户的需求,具备类似苹果在智能手机上的理解力。

头部算法企业横向建立平台,垂直领域龙头纵向深耕行业,科技巨头立体式打造全产业生态。

头部算法企业的布局是横向拓展基础技术,建立基础平台。例如,商汤以人脸识别技术起家,逐渐拓展到人体分析、机器人、无人驾驶等领域,加上GPU超算中心和云计算平台,逐渐将自身打造成一个基础的人工智能平台,然后探索在应用端的迅速落地。垂直领域龙头公司的布局是纵向打通计算机视觉框架,深耕所在行业。例如,安防设备龙头海康威视逐渐脱离了与初创算法企业的合作,自主研发关键技术,并在ILSVRC(2016)图像分类获得第一名;

智能语音:产业进入爆发期,看好对话式人工智能发展

智能语音技术逐渐成熟,未来几年市场将维持高速增长:根据Gartner发布的2018年AI技术成熟度曲线,语音识别已经进入‚实质生产高峰期‛。另外,自然语言处理、虚拟助理等相关智能语音技术洗涤后,落入泡沫化的低谷期,商业模式越来越成熟,进一步推进智能语音的落地。据ReportLinker预测,全球智能语音市场规模将从2018年75亿美元增长到2024年215亿美元,其中医疗健康、移动银行、智能终端智能语音技术快速增长的需求将成为主要驱动因素。

国内外市场均已相对集中,头部企业占据大部分市场份额:根据中商产业研究院的数据,2018年智能语音世界市场CR5达到88%,中国市场CR5达到84.6%,呈现出比较集中的市场结构。值得注意的是,国内市场结构与国外有明显差异,主导海外市场的大型玩家如Nuance、谷歌等在中国市场没有获得同样的市场地位。这种现象主要是由于中文和外语在分词和句法逻辑等方面有明显差异,中国有很多独特的方言,这种语言的差异使国内企业在中文处理方面有独特的优势,二是由于国内互联网和移动互联网的快速发展,智能语音在国内有更丰富的落地场景和商业环境这种天时、地利的优势使中国企业领先国内市场。

现阶段,产品化能力是智能语音初创企业的核心壁垒:

一方面,从技术的角度,在无噪音环境下,机器的语音识别准确率已经达到相当高水平,未来上升空间有限。科研界将错词率(Word Error Rate,WER)视为衡量语音识别技术的核心指标(准确率=1-WER),其中人类的平均WER为5.9%(即94.1%的准确率),受过严格专业训练的速记员平均WER为3%(即97%的准确率)。自2016年机器的语音识别准确率首次超过人类平均水平以来,目前最好的算法已经可以将准确率做到97.03%,超越专业速记员。

另一方面,从商业化角度,技术难以成为企业核心壁垒,产品化能力才是成长的关键。这是因为技术的门槛越来越低,单纯依靠提供技术的商业模式将面临越来越大的竞争因而难以持续,这一点从近几年头部智能语音初创企业如云知声、思必驰等纷纷从技术提供商转向产品/服务提供商就可以看出。
image.png

技术全栈化已经成为新的趋势,产业链延伸是当前最好的策略:对于智能语音来说,许多场景普遍存在的问题是落地体验差,技术上和产业上的两个影响:技术上,落地体验的改善依赖于从硬件到软件、算法到产品各个环节的紧密协调,在这种情况下,头部企业倾向于走技术全栈化路线,即通过全链接的技术环节最能说明上述两种走势的例子,目前几乎所有头部创业企业都在布局专用语音芯片,主要原因是专用语音芯片的应用性能可以达到通用芯片的40-50倍,同时成本只有通用芯片的1/4-1/3。
image.png

对话式人工智能即将规模化落地,看好智能家居、随身设备、智能车载三个场景:

与一般的智能语音应用相比,对话式人工智能中人与机器之间是双向交互的,机器在追求理解人的意图的同时也会给人以反馈(比如要求人进一步明确意图或者给出选择等)。对话式人工智能的整个人机交互过程可分为唤醒、识别、理解、反馈四个环节。
image.png

市场玩家的布局:通用平台商打造开放语音生态,专业应用商抢占重点赛道:

智能语音市场玩家大体上可以分为两种,一种是通用平台商,另一种是专业应用商。通用平台商如谷歌、百度等科技巨头,致力于围绕智能语音开放系统打造智能语音生态。以百度为例,公司在2017年全面开放了语音接口,目前依托DuerOS打造出较为完整的技术、开发与商业生态系统,截至2018年7月底搭载DuerOS的智能设备激活数量已突破1亿台。专业应用商以垂直领域和细分场景为突破口,均有重点布局的赛道。

领先初创企业介绍:商汤、旷视、依图、云从、云知声

商汤:AI算法提供商龙头,平台化战略赋能公司和行业

AI算法提供商龙头,‚1+1+X‛打造核心平台:公司成立于2014年,创始人为香港中文大学工程学院教授汤晓鸥,业务聚焦于计算机视觉和深度学习领域,拥有2200位员工,其中约150位拥有世界顶级大学博士学位。当前公司战略推进顺利,去年5月31日公司公告表示2017年已实现全面盈利,业务营收连续三年保持400%同比增长,2018年主营业务合同收入同比增长10多倍。

内生+外延,围绕计算机视觉展开全方位布局:公司通过内生和外延不断扩大技术和业务界限,提前进行产业布局。在内生中,公司以脸部识别技术开始,现在的核心技术复盖了脸部、人体、图像、视频、SLAM和3D、机器人、无人驾驶等多个领域的计算机视觉技术,并且还在横向扩展,智能视频、身份验证、移动互联网、智能商务等多种产品和服务在外延方面,公司通过设立投资部门,以直接投资或产业基金的方式向下游扩展新的应用和新的场景,投资目标是在垂直领域设立行业场景,占有一定的地位,或者具有一定的行业认知和顾客资源,但技术和产品还不成熟的创业企业。

image.png
image.png

算法储备丰富、算力供应充沛,长期发展具有深厚底蕴:据公开资料统计,公司2015-2017年在三大顶级计算机视觉会议(CPVR、ICCV和ECCV)上发表了119篇论文,内容涵盖了深入学习、无人驾驶、物体检查等多个领域,数量仅次于微软和CMU,远远领先于国内其他企业。2018年,公司以81篇CVPR和ECCV论文创下了中国人工智能学术的新纪录,显示了越来越强的学术研究能力,表明公司在算法领域有丰富的储备。另外,公司自主研发了支持千亿级参数模式、百亿培训模式、亿级类目分类任务的深度学习框架Parrots,以及拥有6000多个GPU、支持千卡并行培训的亚洲最大超算中心,算力供应充足,保证模式能够快速验证。我们认为公司重视基础研究,强调技术原创,在算法、算力方面充分保障自己的技术顺利反复,长期发展有深刻的基础。

image.png

image.png

旷视:优秀的人脸识别平台企业,战略进军IoT

人脸识别先行者,软硬件结合深入垂直场景:公司早于‚四小龙‛其它三家公司成立,三位联合创始人印奇、唐文斌、杨沐均毕业于清华姚班,当前拥有约1500名员工。公司早期业务以开发C端人脸识别相关互联网应用为主,后转向提供B端计算机视觉相关产品和服务,旗下Face++是当前世界上使用量最大的人脸识别引擎。公司主要的业务模式是基于核心计算机视觉技术,深入垂直场景提供行业解决方案。目前,公司旗下的Face++是目前,相关产品和服务已经广泛应用于金融、安防、手机等多个领域,拥有包括阿里、蚂蚁金服、富士康等在内的上千家核心客户。

战略进军AIoT,打造个人、城市、供应链‚大脑‛:2019年1月16日,公司发表了从AI到AIoT的新战略,战略定位从算法提供商全面升级为AIoT解决方案提供商,发表了智能供应链操作系统河图。根据我们的整理,公司现在以个人生活大脑、智能城市大脑、智能供应链大脑三大大脑的情景业务组为中心,以个人生活大脑连接个人终端为中心,为c方用户提供面部解锁、面部支付等服务,应用场景包括手机解锁、身份检查等智能城市大脑以连接城市摄像终端为中心,为g方客户提供智能门禁、智能迎宾等产品/服务,应用场景包括智能社区、教育管理等近两年来,公司在外延方面活跃,相继投资机器人、娱乐、零售等多个领域的创业企业,业务布局持续扩大。

image.png

强大的软硬件结合能力以及‚阿里系‛背景是公司核心差异化优势:公司从2015年开始涉足硬件,相机、脸部识别面板机、人证验证一体机、服务器、搬运机器人等十几种硬件和软件相结合产品陆续发售,在创业企业中绝对领先。我们认为,从算法到产品/服务都有天然的隔阂,优秀的算法并不能保证优秀的产品。公司的历史发展表明,它具有强大的硬件和软件结合能力,可以保证其技术领先优势在产品方面的延续。硬件和软件一体化是创造商业闭环的必要条件,仅靠算法就不能满足业界客户的整体需求,安全业界内的AI算法提供商可以获得一部分项目的机会,但是不能动摇安全设备的领导地位是最明显的例证。

依图:注重实战,业务聚焦于安防和医疗

实战型AI公司,善于从行业里寻找研究课题:公司成立于2012年,创始人是ULCA统计学博士朱龙和前蚂蚁老云计算专家林晨曦,现有约700名员工。公司与四小龙中其他几家企业最大的区别在于,其技术并不是来自创业团队的科研成果转变,而是从零开始,先选择行业,然后针对企业需求进行课题研究。根据这种做法,公司于2013年为苏州公安开发了车辆识别系统,将夹克车的识别率从不到30%提高到90%,初战胜利后发表了脸部识别系统,同样成功,吸引了公安客户。

业务聚焦于安防和医疗,积极布局智慧金融:公司的战略是深耕行业,深挖痛点,业务着重于安全和医疗两个行业:安全领域,公司的主要产品是蜻蜓眼睛系列,包括蜻蜓眼睛人像大平台和蜻蜓眼睛车辆大平台,目前在全国20多个省、数百个地市公安系统、海关总署、中国边境检查等应用的医疗领域,公司的主要产品是care.ai系列,深入疾病预防、检查、诊断、治疗、科研等各个环节,目前在全国落地除了安全和医疗,2015年公司通过为招商银行提供脸部识别技术进入金融领域,相继提出了远程核身、脸部提取、智能网站等多种解决方案,客户以银行和网络金融公司为中心。

先发优势明显,实战指标领先:公司是最早进入智能安全领域的AI企业之一,从2014年开始实现了智能安全产品的规模化落地。公司的实战指标在国内领先。以人脸识别的准确率为例,公司在美国国家标准局NIST组织的人脸识别供应商测试FRVT(2018)的最新报告中综合排名世界第一,同样的错误率泄漏率为商汤的30%-45%。与学术机构组织的人脸识别竞赛不同,FRVT更接近安全实战,测试集来自美国国土安全局的真实业务场景,数据更加复杂多样,参加者的成绩可以代表实战水平。

image.png

云从:AI国家队,银行、机场人脸识别产品第一大供应商

公司是银行和机场人脸识别产品第一大供应商:公司成立于2015年,创始人是UIUC博士、中科院‚百人计划‛人选周曦,当前拥有员工400余人。公司以计算机视觉技术为焦点,产品以脸部识别、文字识别、活体检查为主,应用方向集中在金融、交通、安全三个行业,目前是国内银行和机场脸部识别产品的第一供应商:在银行领域,截至2018年3月,121家完成招标,具有自营系统能力的银行,公司中标包括4家银行在内的88家总公司平台,市场占有率达到72.7%。

公司深耕三大行业,布局智慧商业:公司想法是在金融、交通、安全三个行业深入挖掘应用场景的同时,合作布局业务。在商业领域,公司中标中国电信生物识别平台项目,配合电信实现全网实名制,杜绝电信诈骗。国家队的背景有助于公司扩大安全敏感行业。公司是中科院重庆研究院孵化的高新技术企业,股东名单上有很多国家战略投资基金,是四小龙中唯一没有外资的企业。此外,公司是唯一参与人脸识别国标、部标、行标制定的研发企业,承担发改委领导的国家人工智能基础平台的重大项目。

云知声:‚云端芯‛战略,重点布局家居、车载及医疗三大领域

公司是优秀的智能语音专业应用提供商,多个垂直领域市场地位领先:公开资料显示,在智能教育领域,公司教育评价平台的高峰调用量每天达到3亿次的智能车载领域,已经落地了30多辆车,在智能医疗领域,已经与500多家医院合作,处于业界领先地位。

‚云端芯‛全产业链布局,重点经营家居、车载、医疗三大领域,抢占教育、机器人赛道:公司2014年正式定位做AIoT服务商,确立了‚云端芯‛战略,即将基于云端的智能语音技术与终端设备和芯片紧密联合,通过云端提供服务、设备端实现算法、芯片提供算力的全栈方式打造生态闭环。公司近一年在芯片方面的力量迹象很明显,2018年5月制定了UniOne系列芯片计划,发表了面向智能家庭和智能扬声器的第一代芯片雨燕,计划于2019年和2020年发表面向智能车载领域的第二代芯片雪豹,面向智能城市的第三代芯片旗鱼。

公司重点经营家居、车载以医疗三大领域:家居领域,面向家电厂商推出了UniHome智能语音解决方案芯片;车载领域,面向车联网产品开发商以及整车厂商推出了UniCar‚云端芯‛一体化解决方案;医疗领域,面向医生推出了智能语音录入软硬件一体化解决方案。除了上述三个领域外,公司还积极占领教育和机器人课程:教育领域,推出了面向教育机构的智能语音评价系统的机器人领域,推出了软硬件一体化的行业服务机器人和面向儿童早教的UniToy机器人解决方案,还有面向呼叫的SaaS模式的SAMANTHA智能电话机器人。

人才优势、先发优势铸就公司核心竞争力:IDC调查显示,对话人工智能落地面临的两个最大问题是人才和落地案例的不足。公司的核心团队来自IBM、摩根大通、中科院、剑桥等全球顶尖公司和院校,人工智能研究院研究员中博士占比超过45%,产品和运营团队来自Nuance、阿里巴巴等国内外知名公司,人才优势明显;另外,公司较早进入家居、车载、医疗领域,在跟B端企业合作上以及终端用户需求的理解和隐私保护等方面都具备较多know how,后进者难以在短时间内完成追赶。我们认为,人才优势与先发优势相结合,公司在场景扩大和深耕方面具有很大的竞争优势,看公司的发展。

4.投资建议

国内重点关注公司:华为海思(半导体设计),寒武纪(设计),海康威视(安防AI系统),商汤(算法软件),伊图(算法软件);

全球重点关注公司:英伟达(云端AI训练芯片),谷歌(半导体及AI云,边缘运算系统整合),及赛灵思(AI 推理芯片)及台积电(AI芯片制造),新思(AI专利权区块)。

参考资料来自:国金证券、驭势资本研究所

推荐阅读

驭势资本是一家以研究驱动的硬科技精品投资银行,深耕集成电路5G物联网数据智能汽车科技领域,为顶尖的科技创业者提供专业资本服务。核心团队在硬科技领域拥有丰富的投融资经验,先后投资及服务的项目包括翱捷科技、臻驱科技、微众银行、微医集团、宏晶科技、晟矽微电子、地大信息、曼荼罗、美林数据、事成股份.
原文链接:https://mp.weixin.qq.com/s/Z0PA7rJqnO4iQPLvWQQFyQ
yushi.jpg

更多硬科技领域的技术和市场分析请关注驭势资本专栏。

推荐阅读
关注数
971
内容数
62
驭势资本是一家以研究驱动的硬科技精品投资银行,深耕集成电路、5G、物联网、数据智能和汽车科技领域,为顶尖的科技创业者提供专业资本服务。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息