棋子 · 2021年04月29日

“为了这点醋,包了一顿饺子”-AI芯片的落地之道

江湖上有一位赫赫有名的大师,曾经传授过一句口诀“站在风口上,猪都会飞”;当很多后起之秀凭借口诀能够御剑飞行时,其中最想请教大师的问题就是“在风口上飞起来了,但是要怎样“落地”

当下的AI芯片创业公司都遇到这个问题,融资一轮又一轮,顶会论文一篇又一篇,PR一场接一场,流片一款又一款,现在最纠结问题还是怎么落地?对于AI产业来说,万物AI可能早晚都能实现,但是对于一个AI芯片公司,最重要的活着看到那一天,而芯片产品落地是活着的前提条件;

一:缘起

世界上本没有AI芯片,AI算法多了,便有了AI芯片;

AI算法出现后,业界发现原来CPU这种计算体系结构,效率太低,可用性极差,特别是在IOT端,都没有什么有效的解决办法;如果一个东西满足不了应用,那么就需要有更有效的计算架构来替代,DSA(领域专用架构)应运而生,这个就是AI芯片的缘起。

一位AI大师苦思冥想,悟道新算法;或者一个电路或者体系结构大师,苦思冥想,悟道新结构,他们不约而同做了一款AI芯片,可以在ISSCC/Hotchips等顶会上一鸣惊人;有效提升性能,降低存储代价,于是想做一个AI芯片公司;大体上,AI芯片分为云侧AI芯片和端侧AI芯片;云侧,用在数据中心;端侧,用在IOT,也被称为AIOT;,做AI芯片也面临两条路,端侧AI芯片和云侧AI芯片;AI大师觉得,如果芯片面积小,功耗低一点,就走端侧;面积大,性能高一点,那就走云侧;但这两条路的落地都充满挑战;

如果在云端:就是主CPU和AI芯片分离,AI芯片是专用的加速芯片,以加速卡的形式用于服务器上;而在端侧,需求截然不同,必须是一个完整的SOC;所有端侧AI芯片都是SOC,不存在不存在独立AI芯片的空间。AI芯片好比一个人的右脑,负责音乐,绘画,空间几何想象;但是用户对终端AI芯片的需求,是一个完整的人,不但需要右脑,还需要左脑(CPU),五脏(其他功能模块),四肢(IO模块)等等,这些都齐备,这才能满足用户的需求;

以安防领域(智慧视觉)举例,IPC SOC 摄像头芯片,目前有好多AI公司计划在此方面发力,IPC SOC 芯片在AI芯片不存在时,就已经是业界相对标准的做法了;一个IPC SOC,由CPU,视频编解码模块(H.264/H.265), 图像处理模块(ISP),  音频编解码模块, 视频和图形处理模块,安全引擎,外围接口(mipi,ddr,I2S,USB,SDIO等等)组成,最后才是AI处理模块;

有AI模块的加入,支持神经网络加速,可以完成目标(人脸)检测与跟踪、场景识别,这个只是这个IPC SOC中其中一个较小的功能;AI是IPC SOC是一个特性(feature);没有AI也是一个具备广泛应用IPC的SOC芯片,况且如果内嵌GPU的话,也能做不少AI的特性的工作;从中可以看出,在终端AI芯片侧,AI是辅助,上单、打野、中单、射手都是必须的,否则5V5根本赢不了比赛;

道生一,一生二,二生三,三生万物;

从AI大师悟道AI算法,到AI IP,现在到AI SOC芯片;一个比一个难;但还不是最难的,完成了整个软件解决方案SDK;这才达到了这个及格线;

道是AI算法,一是AI的IP,二是SOC芯片,三是软件方案SDK;

走到这一步才具备推广的基础,是万物皆可AI的前提;

二:雷神之锤

既然万物可AI,那么AI就可以赋能传统行业,这个逻辑没有问题,那么有哪些传统行业可以被"赋能",这个是AI落地的核心问题;

目前在终端侧AI,看的比较清楚的,一个是视频监控(安防),已经有很多玩家了;另一个是自动驾驶,也有很多玩家了;其他的领域还有哪些?

AI芯片公司就像《复仇者联盟》里的雷神托尔,拿着一把锤子(AI芯片),在所有行业,都砸一遍,看看有什么油水;俗话说,手里有一把锤子,看什么都是钉子;

智能眼镜,智能家电,自动驾驶,安防,智慧零售,能源勘探,智能硬件,所有的地方都要拿锤子敲一下;用AI芯片赋能传统行业,AI芯片这把锤子,不论看到什么有公司打算去砸两下;现在被AI这把锤子没有被敲过的传统行业已经不多了;

本来是要给传统行业赋能,结果要靠传统行业续命,这个就是很多AI芯片公司要面对的现实;“拿着锤子找钉子”是无奈之举,但是这个是一个有效的手段,AI芯片公司实际上花了很大力气来教育市场;但是能够产生价值的地方不多,更多的时候是被市场教育了;但是找到目标客户,尽快产生价值,一方面可以实现芯片及方案落地,另一方面可以实现AI芯片的快速迭代;

找到最擅长的落地场景,给客户提供一整套的解决方案,便于拿下商业合同,就需要变成所谓的行业解决方案专家;传统的芯片公司,都是提供芯片给方案厂家,方案厂家做成整机或者方案给用户,现在AI这一波潮流催生很多公司,一个是专门的AI方案厂家本身就不成熟,能够赚到钱的AI方案公司也不多,能出真金白银来采购芯片就更少;另一个方案厂家本身就直接开发AI芯片;搞得很多AI芯片公司只能去推方案;所以为了这瓶醋,不得已就得去包一盘饺子;

三:华山论剑

与终端AI芯片形态各异完全不同,云端AI芯片的形态非常类似,就是服务器插AI加速卡,接口目前是PCIE;同时都需要外接DRAM存储,原来直接DDR,现在都是直接HBM;总之,这个形态已经固定好了,就是在云数据中心领域,提供AI算力,看谁的芯片性能更高,适用性好,评价软件和标准都一套成熟的模式和框架;

目前NVIDIA的A100芯片,目前有826mm2, 采用TSMC 7nm工艺,通过这两个指标都来看,云端芯片面积大,制程工艺先进,因此可见,云端芯片的资金投入规模高,对芯片设计公司的技术挑战也非常之大;但是技术挑战虽大只是小问题,落地才是大问题;

这个领域已经被NVIDIA占据了;这个就是华山论剑;做出来就需要和NVIDIA正面碰撞;不论做出任何一款云端的AI芯片,客户就会灵魂三问:与NVIDIA的同款相比性能指标如何?功耗对比如何?适配AI算法如何?

如果芯片厂商说,孩子刚生出来,就要和业界大佬去比,这个太苛求了吧。但是云端客户为什么苛刻,非要和NVIDIA去比,因为这个领域的客户也是非常集中,并且很强势。世界范围内是亚马逊,谷歌,微软,阿里;国内是阿里云,腾讯云,华为云,天翼云,百度云,金山云,京东云等等。NVIDIA目前在云端的AI加速卡占据了95%以上的市场,如果他们要换解决方案,必然必须要比NVIDIA有优势,功耗,性能,价格,适配性等等,这个是绕不过去的。"利不百,不变法;功不十,不易器",就是这个道理;

另一个取巧的方法,根据对云端业务的深入理解,避开NVIDIA的九阳神功,做云端AI的定制化,不采用类似NVIDIA可编程的SM(流处理器)的路线,走谷歌TPU的道路,不用支持所有的AI算法,不用可编程,只支持某些AI算法,走专用芯片路线,好处比较高效,比GPU更专用;功耗面积成本肯定对NVIDIA都有优势,这种做法的风险就是,AI领域每年都会有很多新的算法及特性出来,是一个不断发展进度的领域;如果不是高度灵活的可编程架构,今天的AI芯片船票,还能不能赶上明天客户应用的客船,就要打一个大大的问号?

还有一点不利的因素,不论是国外还是国内,很多云厂,一方面都用NVIDIA的解决方案,另一方面都在自己做芯片;谷歌的TPU,阿里的含光,华为的昇腾,百度的昆仑等等;最近的字节跳动也挤入了这个行业;不禁令人感叹,大厂做芯,有需求,有动力,已经蔚然成风,既是裁判又是运动员,云端AI芯片创业公司如何与之竞争?

四:落地

虽然万物可AI,对于客户来讲,可能需要的AI场景值不值得投入很多钱,是一个大问题;例如客户需求就是一个MCU,原本就是一片几块钱的预算,带上AI功能后也不会偏差太多;对于AI公司来讲,如果在这个细分赛道上再提供详细解决方案,这点钱是否值得这么大的软件及方案投入是一个大大的问号?

以前有的公司做AI项目的时候,经常会收到各种定制需求,比如在废物回收领域,用户要用AI实现物品的分拣,就需要定制一套AI解决方案,这种例子不胜枚举。算法要实现,应该没有问题,但是用户不是需要一个AI算法或者芯片,而是一整套AI解决方案,开动这套方案软件的投入就更大;

到底为了这瓶醋,包盘饺子值不值?

AI芯片厂商高投入研发过后,却不知道自己的产品要卖给哪些客户或者说应用到哪些产品上,无法找到可持续性的落地场景。如果通过系统方案或者示范性项目,把芯片用上,让客户看到真正的价值,形成行业示范性应用案例,甚至推广规范,那就是非常值得的;在这个过程中,可以发现芯片的一些问题,同时为下一步芯片的迭代提供了方向,而AI应用则要通过数据来进行功能迭代,形成数据闭环迭代,一举数得,非常有效。

AI芯片细分赛道越来越多,天下大势,分久必合,合久必分;不可能每个赛道都有一颗AI芯片;量上不去,成本也cover不住;那么就是要聚类;对于AI芯片公司,不可能每个行业场景都要一套方案,需要认清自己的能力边界,成为细分行业的老大,才能真正站稳脚跟。推广过程中,用户会发现AI芯片公司对行业的理解远远不及用户,但是只有成为这个行业的专家,对行业背景的深入理解,才能够带给用户物超所值的解决方案,这个要求比传统的芯片公司对芯片的理解又更深了一层,也更难了一层;

AI的技术之风催熟了很多AI芯片公司,而AI的应用落地则是滞后的;当AI芯片脱离单纯讨论"技术能力"的范畴,如何能够教育市场,减少技术到应用的时间,把研发投入快速转换成销售和利润,是一个很有挑战的问题。因此瞄准万物AI的目标,催化整个AI的应用落地;"为了这瓶醋,而包一顿饺子"的方法在目前阶段也不失一个解决之道;


来源于: 歪睿老哥
作者:歪睿老哥

更多IC设计技术干货请关注IC设计技术专栏。

推荐阅读
关注数
20187
内容数
1307
主要交流IC以及SoC设计流程相关的技术和知识
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息