第三十四期回顾
《安创“芯”视野》第34期,邀请到了安谋科技AI技术高级市场经理吴彤,他从技术角度为我们解读,扫地机器人从功能化到智能化的升级之路。
视频回放:https://aijishu.com/l/1110000000274661
大家好!我是吴彤,在安谋科技负责AI技术市场工作。今天和大家分享的主题与扫地机器人有关。之所以今天和大家分享这个主题,是因为我们关注到整个扫地机器人赛道正经历着一个非常大的变化趋势,它正在从偏功能性的产品升级到偏智能化的产品。而这里说的智能化,因为包含了很多AI功能在里面,相应地对扫地机器人内部芯片的算力要求也会逐步提升。
今天的分享主要有两部分,第一部分会介绍整体的智能服务机器人市场;第二部会给大家分享整个扫地机器人的市场和技术趋势。
上图是一个智能服务机器人的整体详细分类,包括专业机器人和家庭机器人等等。这里,我用红色框框出了两类,是目前我们公司以及很多业内同仁都比较关注的两个领域。一类是物流机器人,即英文的ADV或是AMR,是移动类的物流领域机器人。这个赛道目前有很多公司,比如海康、快仓等公司对此都非常的关注。但是他们现在在这个领域的出货量并不是很大,去年大概有10万左右。因为是用在物流领域,所以整个机器人的单价比较高,会达到几万以上。因此整个物流机器人领域的市场空间是比较大的。另外一类是我们今天重点要讲的扫地机器人。从公开数据来看,2020年,扫地机器人中国地区的出货量大概在600万左右,未来的增长率是非常客观的。像IDC等一些专业机构预测,未来扫地机器人出货量可能很快会突破千万,甚至达到几千万的量级。
对于扫地机器人玩家,大家应该都有所耳闻,比如科沃斯、石头科技以及小米。小米现在主要由一些比较知名的ODM做代工。当然还有美国的iRobot,这家公司其实是扫地机器人的鼻祖。至于物流机器人AGV的话,主要有以海康、京东、美团、快仓等为主的一些玩家。我大概总结了一下这两类产品,无论是扫地机器人还是物流机器人,它们从技术路径来看都很像现在比较热的自动驾驶。所以,我把它们归结为一类,叫做一种低速的无人驾驶技术产品。其实无论从Slam还是AI层面来看,它们与自动驾驶的技术层面都是非常像的,只不过它们是一个低速的相对封闭的场景。
上图是对于整个智能服务机器人市场规模的大概分析。以中国市场为例,19年整个服务机器人的中国市场空间大概是22亿美金,5年的CAGR平均增长率超过了35%。今年,整个国内服务机器人市场规模预计将接近40亿美金,增速很快;其中,家用服务机器人和公共机器人的市场增速也相对领先。但是,虽然国内的服务机器人的市场空间增长很快,但是它的渗透率却非常低,目前仅有百分之五点几,而美国的产品渗透率已经超过了15%。这意味着国内的市场空间增速有待提高,未来的市场增长空间非常大。
扫地机器人的市场和技术趋势
2020年整个国内扫地机器人的出货量大约已经达到了600万,年均增长率也已经超过了40%,但它的市场渗透率依然很低——不足5%,其中带有AI功能的产品的渗透率更低,只有2%左右。在这个市场里,排名第一的是科沃斯,目前它的市占率在国内甚至在国际上都非常高。在国内,它应该占了40%~50%的市场份额。其余的玩家如小米、石头科技、云鲸智能等等。云鲸智能是近几年上升速度比较快的一家公司,目前也是以线上销售为主。目前来看,它已经与石头科技的市场份额非常接近了。在扫地机器人行业,这几家加起来的市占率处于25%-30%区间,所以整个行业的前景依旧是非常广阔的。预计2021年,中国扫地机器人市场规模将达到151亿元,销量预计达到1000万台。
目前我们看到的扫地机器人的市场趋势是:它会朝着中高端甚至智能化的趋势演进。第一,从购买人群来分析,35岁以下的消费者占到了97%以上,我们的用户群体非常年轻。第二,从销售渠道来看,19年甚至2020年,线上渠道销售额已经超过90%,线上已经成为绝对的主流。第三,产品均价。之前可能大家认为扫地机器人就是一个放在屋子里给大家做清扫的工具而已,认为它的价格可能不会很贵。但是在2020年扫地机器人的整体均价为1870元。以科沃斯和石头科技为代表的企业也推出了一些高端产品,比如石头科技的T7 Pro,它的整体均价比19年提升了三成以上。另外,还有一个很明显的趋势是,2500元到5000元的高端机型增速非常明显。
上图是整个扫地机器人技术演进的趋势。扫地机器人早在2002年就已经问世了。最早是由iRobot公司推出的,它是扫地机器人行业的鼻祖。另外,科沃斯公司也很早就推出了扫地机器人。那时候,扫地机器人还比较简单,基本上用的都是陀螺仪式导航。把一个扫地机器人放在屋里,它可能只是来回撞来撞去,碰到一个障碍物就弹开了。这种有规则的简单的碰撞类型,我们把它叫做随机式的清扫模式。进入到2010年之后,以石头科技、科沃斯、iRobot为主的一些企业基本上都推出了以激光导航为主,甚至VSlam视觉导航为主的产品。它们加入了更多的规划式的地图建图。扫地机器人根据已经订好的地图,加上自身路径规划的能力,就能去做更加智能的清扫。这种产品目前已经成为现在的主流。未来,我们认为扫地机器人会演变成三维规划式。机器人会以三维建图式为主,然后结合多个传感器融合在一起。比如,现在石头科技和科沃斯等公司已经推出的激光和视觉混合在一起的多传感器融合方式。这会让机器人变得更加聪明,甚至其在导航和避障方面的能力也会远远高于之前的产品。
部分业内人士把扫地机器人像现在的自动驾驶汽车一样分成了五个阶段:L1-L5。L1是随机碰撞式,L2是部分自动化,L3是有条件自动化,L4是高度自动化,L5就是其理想状态即完全自动化。如果从现在的技术路径来看,目前的主流产品应该还处在L3到L4的过渡区间。未来,理想层面肯定是希望能够达到L5完全自动化,当然这里面也需要具备很好的人机交互能力。到那时,扫地机器人就不仅仅是一个工具了,它可能会被定位为整个智能物联网的一个中心,甚至可能具备一些家庭助手的功能。这就是扫地机器人未来的一个发展趋势。
扫地机器人LDS SLAM vs VSLAM
扫地机器人有两个比较重要的技术路径,一个是LDS激光导航,还有一个是VSlam视觉导航。简单来说,激光导航的算法相对是比较成熟的。比如它能够做建图、定位等等,精确度比较高;也能做全局的定位或者规划。但是与视觉导航相比,它有几处短板。第一,其自身成本比较高,而且其维护性会稍微弱一些。第二,也是很重要的一个短板,就是它只能提供二维的数据,没法识别障碍物。而视觉导航的优势就很明显,首先它的硬件成本比较低,而且它采集的信息以及它的环境感知能力都远远高于激光导航,因为它本身带有摄像头,这就加了AI的能力和识别能力。不过,它的问题在于导航的精度容易受到环境光照的影响。所以,有些公司可能会针对这种视觉导航能力做一些补光硬件的补充,来解决这种所谓的环境光照的影响。此外,还有一个影响视觉导航的因素就是过于复杂的环境。因为它需要通过纯视觉的方式去做识别、避障等等,所以会有大量的信息输入,从而使得它的计算量或者算法复杂度非常高,进而影响精准定位。这就要求很多做视觉导航的企业需要具有很强的算法计算能力。
那么,扫地机器人是怎么运转、怎么工作的呢?我举个例子为大家进行说明。比如,一个人到了一个陌生的环境里,首先可能他需要定位,他要知道自己在哪儿。其次,他可能需要知道他想去哪儿,也就是他要去什么地方,走什么样的路线。这个用专业的技术词语来讲,叫做导航;还有,他在行走的过程中不能去撞到身边的一些物体。这个用专业的技术词语来讲,叫做识别;同时,还要绕开这些障碍,这就叫避障。总的来看,这就是人类的四个行为,基本上也就是扫地机器人在室内或者室外工作的原理。与我们人类的思维是一样的,它也需要有这么几个过程。在这个过程中,它其实融合了大量的技术,包括人工智能以及刚才跟大家提到的Slam。Slam主要是做定位和地图构建的,这个技术在业内已经非常成熟了。它里面有大量的算法。
简单来说,基于视觉导航的扫地机器人从VSlam架构层面可以分为四个部分。第一部分叫Input。Input其实就是扫地机器人需要接收大量的输入图像信息,一般都是实时的图像信息。第二部分叫Front End。简单来说,就是做两件事,一个是做Feature Detector,会用到大量的传统的OpenCV的方式或者是现在基于深度学习的方式来做特征提取等等。另外一个是做Map Generation,就是地图的构建。第三个模块叫后端,即Back End。这里包含了几类功能。一个是语义标签。建图之后,其实有很多基于AI的算法会对构建的地图做语义标签。当然,这也需要大量的AI算法和很多NPU的支持。此外,后端还包括Position Estimation,即位姿估计。最后还有一个叫Sparse Map Creation,叫稀疏建图。以上就是整个VSlam分成的四个部分的介绍。
3D视觉技术是目前靠视觉方式运行的扫地机器人一个非常重要的技术体系。3D视觉技术有4类流派。第一类是TOF类型的。它采用了相当于通过把一个光打出来再收回来的模式来测距。第二类是现在市场上比较主流的,叫双目视觉。这是以石头科技为代表的一类公司引导的一个技术领域。比如,石头科技的双目视觉是采用一个激光雷达加一个双目来做扫地机器人的导航和避障。第三类是结构光。像iRobot可能用结构光的体系会多一些。
扫地机器人有两项非常重要的技术,一是识别,目前扫地机器人基于视觉的方式能够识别室内各种各样常见的物体。很多大厂目前做的扫地机器人的识别是有一定策略的。它的策略基本是这样的:约2-3厘米高度以下的比如鞋子、插座、插线板、袜子等等物体,它们都要识别;如果高度超过2-3厘米,可能它就不做识别了,因为这些物体可能并不影响清扫。目前在室内能够识别的物体目前还比较有限,大概可能有90种左右,因为室内常见的物体也是有限的。最常见的识别物体主要是鞋子,根据我们的分析,鞋子的识别占比超过40%,这是它们识别的最主要的物体之一。那么从芯片层面来讲,为什么我们要引入这种带NPU的芯片呢?首先,它的算力和功耗比较低,发热也较小。如果使用这种带独立NPU的芯片来做识别,它运行的精度会更高,而且可以支持识别更多种类的AI模型。因为很多AI模型的演进速度非常快,这就需要有更好更多的芯片做支持。同时,AI模型里还有一个很重要的指标叫帧率。如果使用带NPU的这种专用芯片做识别,那它的效能会比传统的比如DSP、CPU做识别的效能提高一倍以上,甚至可能更多。这是我们从识别层面来讲的目前的几个趋势。此外,在建图时,还涉及到一种语义地图模式,也就是说,我们会在地图里标出很多地图里的具体的语义信息,让机器人能够更聪明地工作。
除了识别之外,扫地机器人另外一个在技术层面比较重要的功能是避障。这是石头科技的一个产品:T7 Pro,它的避障能力非常强。目前经过我们的分析,避障存在一个痛点。有的扫地机器人采用的是单目渗透方式的激光导航,当这类机器人避障的时候,会遇到一些困难。主要原因在于这些传感器大多位于扫地机器人的顶部,那它的可视角度比如FOV角度会相对比较小,因此就可能检测不到一些较大范围的障碍物。所以,大家看到很多扫地机器人的避障做得并不好。它总是试探性地去撞一些东西,但它可能并没有真正看到这个东西到底是什么。这是目前关于避障我们看到的一个问题,那怎么去解决这个问题呢?以石头科技的T7 Pro为例,T7 Pro采用了激光加双目视觉的方式:激光做前期的建图,双目视觉做比较精准的导航和避障。从技术层面来看,双目视觉能够通过很强的AI算法能力精准地获取障碍物的信息甚至包括其属性信息来做到很精准的避障;同时,它也结合了很多语义识别的能力。目前来看,这种带双目视觉的方案,无论从成本还是从技术层面来讲,可以认为是业内扫地机器人最佳的避障方案之一了。而且从用户反馈来看,石头科技推出的双目视觉加激光雷达避障的这款产品,在京东上基本是零差评,这表示用户对这个产品的使用体验是非常好的。
扫地机器人的主控芯片
首先,从主控芯片层面来看,比较主流的芯片有来自高通的两个芯片,分别是APQ8009和8053,是高通主打IoT领域的芯片。CPU的话,基本都是四核A7或是八核A53。这两颗芯片都不是带独立NPU的,都采用了高通的DSP—— 536和546,也带了自研的NPU。同时,它们都支持双ISP,分别是800万和1300万左右。它也支持video编码能力,最高大概能做到4K30帧。为什么要加video能力呢?因为现在扫地机器人的一个发展趋势是往家庭安防方向发展,所以如果加上这种视觉能力的话,它就能把室内的视频编码,然后传到比如手机端上,你在外面就能实时看到家里的情况。对于AI算力,我没有看到公开的数据,但是根据我的评测,它应该不会超过1T,甚至可能小于0.5T。
另外比较常见的芯片是瑞芯微RK。RK在国内产品里比较常见。从芯片的宣传来看,它们主要应用于扫地机器人这个行业,大概有四颗,分别是3308、3326、带一颗独立DSP的RV1108、现在比较主流的3399。我对这四颗芯片大概做了一个总结。除了RV1108是带一颗DSP以外,其它都不带独立的AI能力。配置上,也有支持到800万~1300万的DSP。如果从AI算力层面分析的话, RV1108应该不会超过1T。
此外,国内扫地机器人比较重要的一个芯片玩家是全志科技。全志科技有两个与扫地机器人相关的芯片,分别是MR133和 R16。实际上,全志科技这两个芯片并不是专门针对扫地机器人推出的,它们是跟另外一个产品线智能音箱共用的。我们对这两个芯片做了一些分析。它们基本上也是四核A7,带有Arm的Mali GPU。camera的话,有的是单ISP,有的是双ISP,最高可能也有1300万的水平。Encoder最高水平可能比高通的稍微低一点,大概是1080P 60帧左右。从AI算力层面来看,其实这两个芯片是比较早期的芯片,是没有独立NPU的,它们的算力应该小于0.5T。
我们对业内相对比较知名的一些算法公司和ODM厂商做了调研和总结,得出如下结论:以科沃斯、石头科技、小米等为代表的品牌基本上占了整个市场7成以上的份额。这几家大厂的算法以自研为主,尤其是石头科技和科沃斯,它们对算法的研究非常深。另外,ODM厂商有追觅、杉川、银星智能等等。前两家基本都是给小米做代工。银星智能也是ODM里比较大的一家厂商,它主要服务于小米,也服务于其它一些家电类的扫地机器人品牌。ODM的特点是做整机的同时也有一些自研算法,但是也会用一些业内算法公司的解决方案。此外,业内还有几家公司主要是以算法和模组为主。这里我列了两家,分别是Indemind和PerceptIn。这两家公司都做VSlam,都是做以视觉为主的算法研发(包括双目视觉)以及模组。它们的算法可能更多服务于ODM公司以及其它类型的二线扫地机器人品牌比如海尔、美的等等。
上图是扫地机器人与人工智能相关的创新点。从功能角度出发,用户对人工智能的需求主要有两部分。一个是语音控制,我们看到用户对这个功能的需求占比超过了50%,也就是说,很多用户都希望扫地机器人有语音控制的功能。同时,还有个功能是用户非常期望的:监控。刚才提到为什么很多芯片都带video encoder的能力,就是因为扫地机器人未来可能会变成家居物联网的一个中心。其实很多用户非常希望它能够提供一个可以在家里代替摄像头专门做家庭监控的功能。另外,我们还关注到大约超过五成以上的用户都在吐槽扫地机器人的避障功能。大家认为现在很多主流产品的避障都做得不太好,比如机器人走着走着可能就会撞到一些不该撞的物体,或者把地上的一些线头吸走,又或者因为识别能力比较差就被卡到室内一些空间比较狭小的地方出不来了。显然,它还不具备真正的AI纯智能化的能力,这也是用户吐槽和关注的一个方面。除此之外,超过60%以上的用户都希望扫地机器人能够完全取代人工。也就是说,用户把扫地机器人放在屋里后就不用再去管它了,不需要用户时不时查看机器人是否被卡住了等等情况。所以说,从用户的这种期望来看,基本上带AI功能比如导航和避障做得非常好的产品则是用户现阶段最关注的产品之一。
这里列举了扫地机器人与AI有关的主要创新点。第一个创新点是基于3D视觉技术的深度相机。深度相机最大的优势在于它可以很好地解决避障问题。这也是为什么石头科技的主力产品T7 Pro加了双目视觉的方式,其最主要原因就是要解决避障问题。第二个创新点是多传感器融合,它可以增强整个环境感知的能力。如果基于这种多传感器融合的方式来做,基本上都可以解决刚才提到那些扫地机器人的痛点,比如轮子被卡住了或者被电线缠绕了等等。第三个创新点是基于AI的一个主要创新能力:端侧AI赋予环境语义理解能力。如果扫地机器人的芯片带上独立NPU,就能够让你对整个环境的建图加更多的语义标签,从而使得机器人能够更好地理解环境和更好地完成导航、识别、避障功能。
关于扫地机器人AI功能现状及未来
最后,我对目前整个扫地机器人领域的芯片解决方案做个总结。在算力层面,在目前这些主流芯片公司的芯片方案中,算力最高的应该是地平线的旭日3。它已经有5T的算力了,这是目前我们看到的行业内算力最高的一颗扫地机器人的芯片。其它家芯片的算力平均在0.5T到2T的区间。因此,我们基于目前的这个结论做了一个判断,即大概在未来的2~3年内,这个行业对整个AI算力的主流需求应该在2~5T区间。
关于扫地机器人,安谋科技的解决方案
关于安谋科技的整体解决方案,主要分为三个部分。第一块是IP层面。关于IP层面,大家可以看上图。这是我们安谋科技本土团队完全自主研发的一套针对扫地机器人或是安防、视觉领域的完整的solution,从CPU到AI——指“周易”,包括了“玲珑”ISP、VPU等等。而且,不管是我们的ISP能力还是video encoder能力,与之前那几家方案相比都算是top的。关于“周易“,现在它有两代产品,分别是Z1和Z2。因为它是一个AI带IP,所以根据用户的配置可以实现不同算力的组合,几T甚至几十T的算力都完全可以实现,能够很好地满足扫地机器人场景。目前,我们也在与一些业内比较知名的基于双目视觉解决方案的公司进行合作。基于我们的整体solution的平台,我们会提供一个完整的解决方案给到业内客户,即基于我们的IP组合加上我们的一些双目视觉为主的VSlam再加上识别避障的深度学习算法能力。这是我们目前在IP层面的一个解决方案。
而在算法层面,我们AI的“周易“平台可以支持很多预训练模型的平台。在算子层面,目前我们支持超过120个算子,后续我们会支持更多的operator。这个是目前安谋科技完全自研的一套工具链。这套工具链基本涵盖了AI相关层面的所有主流工具,包括driver、build tool、compiler以及所有调试工具。这个工具链非常完整,基本可以满足客户现在的需求,也可以做大量的二次开发。
以上就是我今天的分享,谢谢大家。