自今年新基建概念从政府文件中被放大并上升至全民关注的高度以来,新基建七大领域中的人工智能再一次成为了业界关注的焦点。只不过,在经历了资本竞逐之后泡沫破灭的萧条后,经历了寒冬与疫情洗礼过后的 AI 赛道变得更加理性且冷静了。致力于挖掘务实推进新基建发展的科技创新企业与行业技术领导者,传播并报道他们对于新基建相关领域的认知以及商业化探索,由 InfoQ 特别策划推出的 「中国技术力量」 之 「中国新基建 50 人」 栏目持续进行中。
在完成了上一期对星环科技创始人兼 CEO 孙元浩的采访报道后 (查看文章),此次我们成功约访了人工智能语音赛道独角兽企业出门问问创始人兼 CEO 李志飞先生。
在创立出门问问之前,李志飞的身份是美国约翰霍普金斯大学计算机系博士,前 Google 总部科学家,主流机器翻译开源软件 Joshua 主要开发者。作为国内最早一批参与人工智能创业的企业领导人,李志飞对于新基建以及下一步人工智能产业的发展有着深入且细致的理解。
打造纯中文智能语音助手
2010 年前后,伴随着谷歌、微软、苹果等国外科技巨头先后在智能语音技术领域的动作频现,国内老牌智能语音技术企业科大讯飞紧随跟进,一批本土初创型人工智能语音技术企业也开始借助资本市场的助力,涌入智能语音赛道,智能语音技术创业热开始在国内盛行。
成立于 2012 年的出门问问,正是这样一家从创业之初就踩中了智能语音技术发展风口,并一步步发展成为如今的人工智能语音赛道独角兽。
据李志飞介绍,由于他个人研究的方向是自然语言处理和人工智能,所以从谷歌回国的那一刻起,他的第一动机就是希望凭借全链路的语音技术,打造一个中文的虚拟个人助理。在李志飞所描述的技术版图中,未来所有消费者将能够通过一个统一的虚拟个人助理,在任何地方、任何设备上调出最理解自己的语音交互系统,进行高效的数字生活操作,真正实现出门问问的使命,定义下一代人机交互。
基于这一创业动机,出门问问自主研发并建立了包括声音信号处理、热词唤醒、语音识别、自然语言理解、对话管理、垂直搜索、智能推荐、语音合成、知识图谱等在内的全栈式人机交互技术栈,并分别面向消费端以及企业端发力,逐步拓展形成今天的规模布局。
人工智能下半场,单纯依靠算法模型驱动企业融资发展的老路已经走不通了,如何让 AI 技术更加贴近人们的真实生活场景,解决实际问题,这成为了人工智能企业获取资本以及市场认可的关键。
面向消费级场景,出门问问推出了智能手表、智能耳机、智能后视镜、智能音箱等一系列人工智能软硬结合产品,并且实现了公司旗下产品均可通过出门问问中文虚拟个人助理实现联动。与此同时,出门问问还进一步将消费级场景积累的 AI 能力和经验向车载、物联网、金融、电信、健康养老、餐饮等企业级场景延伸。
以智慧出行这一 AI 落地场景为例,在驾驶场景下,通过语音进行车内控制、在线服务搜索等操作能够大大提高驾驶安全系数,是非常明确的刚需和行业趋势。围绕汽车生态链,出门问问打造了包括车载语音交互系统平台、AIoT 联动以及面向开发者的车载语音交互系统平台等一系列 AI 落地产品。据透露,目前出门问问主导研发的前装车载语音交互系统平台已用于奥迪、帕萨特、新迈腾等多个车型,2020 年预计前装量将达 100 万辆。
尽管囊括了 ToC 与 ToB 领域的诸多产品以及商业概念,让出门问问在外界看来像一家产品型企业,但出门问问的核心能力是语音交互和软硬结合能力,AI 技术一直是支撑公司发展的基础设施。
“我们是一家人工智能技术公司,但区别于其他纯技术厂商,我们希望将技术应用到具体的产品和场景中去体现技术的价值。”在李志飞眼里,出门问问本质上依然是一家技术驱动企业,“我们的工程师氛围特别浓厚,研发人员占全公司人数的 60% 以上。”
AI 新基建前进的两条腿
2020 年以来,伴随着新基建概念的盛行,信息技术领域从底层芯片,到硬件之上的操作系统、核心算法、程序开发框架等一类非常核心的能力,都被囊括进入了数字新基建这一概念之下。新一代的信息高速公路,开始在新基建的产业发展热潮中迎来各方关注。
但高速公路建好之后,由什么样的车辆来行驶?这成为了一个值得深思的问题。
从互联网产业发展的经验来看,底层的互联网基础设施建设好之后,上面还需要非常多的运用支撑。“对于 AI 新基建而言,他应该是两条腿在走路,一方面是底层技术的发展在不断的形成并深化,另一方面则是上层应用形态的不断发展成型。”在李志飞看来,底层技术的研发与上层运用的开发,对于接下来即将开展的 AI 新基建发展都不可或缺。
未来 5 到 10 年之内,AI 首先会在技术层面形成一些新的范式转变,开始从更擅长处理单一场景的模式,走向能够适应更加通用的场景。与此同时,理论层面的符号主义与连接主义的创新突破也将取得进展,人工智能的计算方式也将变得更加的“类人脑化”。
“AI 的基础设施,将会变得更加通用,也更加的像人脑一样智能;而基础之上的应用与产品也将会更加智能、体验感更强、效率更高,并在某种程度下完全代替人。”李志飞表示。
如今的 AI 技术正相当于 2000 年左右的互联网,虽有泡沫,但是假以时日必将走向成熟。
需求牵引下的旧瓶出新酒
迈过新基建因为疫情被放大并推到台前时带给大众的新奇阶段,在经过一段时间的媒体炒作与思考沉淀之后,如今大众对于新基建的概念与认知已变得更加清晰,态度也趋于冷静和理性,如何避免新基建“新瓶装旧酒”成为了大家更为关注的话题。
无论新基建是否“雷声大,雨点小”,有一点不变的是,在政府的主导号召之下,越来越多的人开始思考并关注新基建是什么,这些观念层面的转变,会逐步带动一些新的需求变化的产生,这有望牵引传统基建向新基建背景下的“新酒”转型,进而带来更多的技术与产品创新。
以出门问问所在的语言赛道领域为例,李志飞将未来智能语音领域的发展需求主要概括为对话式语音交互与长文本检索两大类型,围绕着这两种需求类型,将产生大量的新兴业务场景。
在语音交互领域,当人们需要与机器实现对话的时候,更多的会聚焦在三大场景:不安全不方便等极限场景下不得不说;对于不需要组织语言,以高效、简洁为目的性的快速地说;以及为了形成某种反馈闭环,选择被动式应答(如贷款授信时采用机器人问答)。
在长文本检索方面,人们在大多数场景中的交流以及内容输出其实往往是没有被记录下来的,运用智能语音技术,通过将语音转化成为文字,经过分类、抽象、结构化处理等多重加工后变成可存储信息,后续便可以通过搜索等方式,实现更多有意思的事情。
此前,在 InfoQ 与网易副总裁汪源的采访交流过程中,汪源曾将新基建带来的发展机会分为信息化、数字化、以及智能化三个层次,并指出国内企业由于行业、所处地区发达程度以及技术采用程度均不同,不同企业分别对应着不同阶段的“新基建”机会。新基建的“新酒”,其实只要存在企业借力 IT 技术转型升级的需要,便会一直存在。
围绕着语音交互以及长语音处理这两大环展开,出门问问正挖掘市场需求,做新的运用,产品的创新。“将 AI 做成一个新的基石,深入到底层中去,新技术的加持将有效提升服务效率以及质量,增强体验感。
拥抱全球化与更高层次理想
毕业于美国约翰霍普金斯大学,创立出门问问之前李志飞曾在谷歌美国总部任职科学家。在 2015 年创业两年之后,出门问问更是成为了谷歌退出中国 5 年后再次布局中国市场的首笔直接投资对象,李志飞对于中美两国之间科技及其产业化的理解,因此也比绝大多数人要更加深刻。
对于最近比较敏感的中美关系问题,李志飞发表了自己的看法。
“中美两国发展到今天,其实谁脱离了谁都能够发展,只不过彼此的发展都不会那么好。回顾过去的 20 年,全球化确实为我们带来了许多的进步,如果非要强行脱钩,对双方都不利。”在李志飞看来,我们还是需要有更高维度的追求与抱负,不能只盯着眼前的得失。
从以一名技术者身份创业之初,李志飞早期带领着一批实习生去做技术,技术出来之后由于赚不到钱又去做产品,思考企业的商业模式,当完成了从技术到商业的全部闭环之后,李志飞打通了自己创业的“任督二脉”,因此也更容易平衡技术与商业发展之间的关系。
“任何一个商业化的公司,20%-30% 左右的精力会花费在底层技术研发之上,另外 70-80% 的东西更多是需要将这些技术、算法的运用到实际的生活当中,将他变成商品。”李志飞并不太担心如今业界谈论已久的 AI 技术理论趋于停滞造成的商业化影响。
“即使前沿技术发展缓慢了,依然会有其他一些新的维度可以创新”,李志飞对下一步 AI 商业化持乐观态度。而在新基建的大背景之下,AI 技术的运用与发展同样将大有可为。
嘉宾介绍
李志飞,中国领先的人工智能科技公司出门问问创始人兼 CEO。美国约翰霍普金斯大学计算机系博士,前谷歌总部科学家,世界级自然语言处理及人工智能专家。
2012 年,李志飞获得来自红杉资本和真格基金的天使投资,从谷歌美国总部辞职回国创办出门问问。李志飞召集了来自斯坦福、马里兰、MIT,以及清华、北大等海内外著名高校的工程师,组建了出门问问最初的核心创始团队,并通过人工智能技术自主研发,构筑起语音识别、语义理解、对话管理、垂直搜索等核心技术基础。
本文转自 公众号:AI前线 ,作者周文猛,点击阅读原文