甲子光年 · 2023年05月15日 · 北京市

力争半年内超越ChatGPT!科大讯飞发布星火认知大模型

科大讯飞终于迎来属于自己的时代。

作者|刘杨楠
编辑|栗子

在发布大模型这件事上,科大讯飞没有食言。

早在今年2月,ChatGPT刚在国内引爆热度时,科大讯飞便透露将在5月6日发布产品级落地应用。而两周前的业绩说明会上,科大讯飞也公布了星火认知大模型的发布消息,并向外界开放体验。

今天,星火认知大模型正式如约而至。

发布会现场,科大讯飞研究院院长刘聪在现场通过语音直接与大模型对话。发布会全程开放了大模型的真机互动,供参会人员现场体验。

除模型本身的能力展示外,科大讯飞还展示了星火认知大模型在教育、办公、汽车、数字员工等多个方向的商业应用成果。

在这轮大模型军备竞赛中,科大讯飞的存在感极强。作为“A股第一家以人工智能为主业上市的公司”、老牌人工智能“国家队”企业,科大讯飞多年来光环与争议并存,无数双眼睛正在盯着科大讯飞在这次大模型浪潮中会如何表现。

1.一套标准、七大能力与四大应用

此次发布会前,公众已经对开放体验的星火大模型“百般刁难”,由于开放体验的模型版本不支持多模态输入与生成功能,还曾有投资者向科大讯飞董秘表示“颇为失望”。「甲子光年」也进行了内部测评。

好在,今天科大讯飞用实际行动回复了投资者的期待。

发布会开始后,科大讯飞董事长刘庆峰表示:“我们要向OpenAI致敬和学习,同时也要快速追赶并努力超越,而这需要一套科学系统的评测体系。”

为此,科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型。7大类能力分别为文本生成、语言理解,知识问答、逻辑推理、数学能力、代码能力、多模态能力。发布会现场,科大讯飞研究院院长刘聪还就七大能力进行了实时演示。

刘庆峰表示,目前海内外的大模型技术普遍存在一些缺陷,例如新知识难以及时更新,事实类问题容易张冠李戴,对史实、典籍内容添油加醋等,但对于这些缺陷,科大讯飞都有办法一一解决。

不过,无论是发布会上的实时演示,还是「甲子光年」的内部测评,星火大模型目前依然存在上述缺陷。

刘庆峰还预告了星火大模型在今年内的三个升级节点:

6月9日,实时问答与多轮对话的开放式问答能力将进一步提升;

8月15日,代码能力与多模态交付能力将进一步提升,并正式向客户开放;

10月24日,星火认知大模型将赶超ChatGPT,英文能力与ChatGPT持平,中文能力超越ChatGPT。

除技术成果外,本次发布会还发布了星火大模型在公司现有产品上的四大商业应用成果:

大模型+AI学习机:AI可以像老师一样批改作文,像口语老师一样实景对话;

大模型+智能办公本:根据手写要点自动生成会议纪要;

大模型+智慧驾舱:车内跨业务,跨场景人车自由交流;

大模型+数字员工:基于自然语言生成业务流程和 RPA(RPA 即机器人流程自动化),帮助企业员工完成大量重复性工作。

此外,讯飞开放平台也新增星火认知大模型,将赋能开发者打造更具价值的AI应用。目前,讯飞开放平台已经开放了560项AI能力,并聚集了超过500万生态合作伙伴。刘庆峰宣布,首批来自36个行业的3000余家企业开发者将接入星火大模型。

只不过,尽管科大讯飞全方位展示了星火大模型的各种能力,但模型训练方法、模型参数、训练数据量、数据来源等关键技术指标均未公布。

此前,在4月20日的业绩交流会上,科大讯飞董事长曾向媒体提到,星火认知大模型的研发成本远低于外界想象,并不需要像OpenAI那样花费100亿美元。

2.成为人工智能“国家队”

显而易见,ChatGPT点燃了中国科技界久违的创新热情。

一时间,一众科技企业纷纷为自己贴上“AI大模型”的标签,并争先发布自研大模型。不同于当前轰轰烈烈的追风者,科大讯飞自成立以来几乎一直在“等风来”。

五年前,科大讯飞联合创始人、聆思科技董事长胡郁便对「甲子光年」表示:“语音还在技术爆炸之前,但爆炸的临界点已越来越近,肯定有人会赢。”

终于,ChatGPT为科大讯飞吹来了东风。在此之前,以科大讯飞为代表的语音语义类人工智能企业已经在“冷板凳”上坐了20多年。

熟悉科大讯飞的人大多听过这个传奇的学生创业故事:

1999年,18位年轻人挤在一间租来的三室一厅中,埋头开发语音源头技术。18位年轻人中,有6人都是中科大BBS论坛的版主,全部来自于当地的高考状元或榜眼。这个项目后来成长为一家市值千亿的上市公司——科大讯飞。

项目的牵头人叫刘庆峰,当时是中科大六系(电子工程系)“人机语音通信实验室”的主力干将,如今是科大讯飞董事长;项目里还有一个22岁的年轻人叫胡郁,此后多年出任讯飞研究院院长,主导多项技术与产品发布。在科大讯飞的二十余年里,刘庆峰和胡郁一直是灵魂人物。

传奇背后,往往是残酷的现实。

1999年,IBM推出ViaVoice,2000年前后,Intel、摩托摩拉、松下、东芝、微软等相继建立语音研发中心,新一轮交互革命似乎正在到来。同时,国内正掀起一阵大学生创业热潮。这一背景下,中科大的18位年轻人怀着一腔热血,立志做出一家年收入100亿元的伟大企业。

但这波语音技术的热潮仅持续了几年,市场高估了PC端对语音的需求,加之语音技术尚未成熟,商业化路径也不清晰,当时入局语音赛道的企业后来都逐渐没了踪影。

科大讯飞虽然已经在语音技术领域坚持多年,也实现了百亿营收的目标,但这个成果来之不易。

1999年底,科大讯飞拿到了第一笔3000万元融资,投资方均为安徽省本地国企,如美菱集团、安徽省信托投资公司等。

拿到这笔钱后,刘庆峰联合中科院声学所、社科院语言所及清华大学等语音研究机构成立联合实验室,整合语音源头资源。

之后,科大讯飞推出了第一款to C产品——畅言2000。当时国内正流行PC带手写板输入,为了形成差异化,讯飞将语音技术集成到手写系统中,形成差异化,一套系统售价超2000元。同时,讯飞在全国建立总代理,下设多个大区代理,但效果却很差,大量存货被积压在渠道中,产品根本卖不动。

直到1999年,讯飞在高交会(中国国际高新技术成果交易会)上遇到了华为,成为华为的语音技术提供商,由此赢得第一桶金,也开启了to B的商业化道路。

此后几年,为了活下去,讯飞开始尝试系统集成项目。现在看来,做系统集成是一把双刃剑,虽然分散了讯飞在部分核心业务的精力,却也给讯飞创造了可观的收入,终于在2004年实现盈亏平衡。

尽管语音技术的商业化进程较为坎坷,但国家层面却对这项技术十分重视。

20世纪90年代,基于大语料库的单元挑选与波形拼接合成方法出现,可以合成出高质量的自然人语音。当时,中科大的王仁华教授,即刘庆峰的导师,便从这时开始深耕语音合成领域。

1993年,在中科大召开的全国语音识别与合成研讨会上,王仁华教授提出了使用播音员录音的基因片段加处理的方法,获得了863专家组成员的首肯。之后,专家组向王仁华团队拨款20万元作为“人机语音通信实验室”的研究经费。此后,王仁华教授的课题也获得了863计划的滚动支持——这为科大讯飞的诞生提供了肥沃的土壤。

2014年,科大讯飞正式启动“讯飞超脑计划”,研发基于类人神经网络的认知智能系统。

2017年7月,我国出台新一代人工智能规划,并推出了首批四大人工智能开放平台,讯飞便是其中之一——科大讯飞正式加入国家队。同年12月,科技部依托讯飞建设了认知智能国家重点实验室,预训练模型是认知智能的重要环节,也为科大讯飞此后的大模型训练打下了基础。

科大讯飞不仅让机器在全球首次通过了国家职业医师资格考试、超过了96.3%参加考试的医生,并且在SQuAD机器阅读理解中全球首次超过人类平均水平,刚刚过去的2022年在OpenBookQA 科学知识推理中,单模型也超过人类平均水平。

进入“国家队”后的科大讯飞,也有了更多资源支持相关研发。

2022年,科大讯飞将“讯飞超脑计划”升级为“讯飞超脑2030计划”,提出让懂知识、善学习、能进化的通用人工智能技术成为每个人未来发展的重要机会,让机器人走进家庭。

同年,国家重点实验室重组,在首批20个国家标杆实验室里,科大讯飞是唯一承建认知智能的全国重点实验室。

3.不被理解的科大讯飞

尽管科大讯飞头顶“国家队”光环,但过往20年,科大讯飞却一直有着让人难以看懂的一面。

首先是多年增收不增利,过度依赖政府补助的尴尬。

在2021年的4月20日业绩沟通会上,科大讯飞董事长刘庆峰提出了“千亿目标”:按计划到“十四五”末,教育业务要贡献300亿元,医疗、消费者智能硬件和开放平台各自贡献200亿元;汽车业务、运营商、智慧城市3个方向各100亿。

如今两年过去,今年4月20日,科大讯飞发布了2022年年报。年报显示,科大讯飞2022年总营收188亿元,同比增长仅2.77%,净利润为17亿元。而这17亿中,政府补助高达11亿元。

此外,科大讯飞在二级市场的投资也收益甚微。

2015年起,科大讯飞陆续投资三人行、寒武纪、商汤科技等企业。其中,除三人行为一家综合型广告传媒企业外,寒武纪和商汤分别为智能芯片和人工智能领域的科技企业。

尽管几家企业都陆续IPO,科大讯飞也曾在2020年、2021年小赚了一笔。但进入2022年,AI赛道开始杀估值、挤泡沫,二级市场上场接近八成的科技股出现破发。寒武纪和商汤股价大跌,科大讯飞“炒股”赚来的少量收入又大把赔了进去。

科大讯飞2022年年报显示,其证券投资仍为这三只股票,报告期末账面价值为3.21亿元,较2022年半年报的6.88亿元又缩水超50%。

科大讯飞自身的股价在2022年也不断走低,从2022年1月3日至2022年12月30日,科大讯飞股价从52.77元每股跌至32.83元每股,跌幅高达38%。 不过,在ChatGPT推出后,科大讯飞的股价在今年一路回升,市值重回千亿俱乐部。

此外,作为一家人工智能企业,过去15年,科大讯飞的研发投入增长不敌销售、管理费用增长,这一点也为人诟病。

不过,从最新发布的年报看,科大讯飞2022年的研发投入达33.55亿元,较上年增长14.28%;研发人员也扩充至9281人,同比增长10.92%,占公司总人数的61.68%。可见,科大讯飞正在将投入重心向技术本身倾斜。

总体看,科大讯飞想要如期实现“千亿目标”,依然要面临不小压力。

4.大模型时代,科大讯飞能否华丽转身?

大模型的出现,无疑向科大讯飞提供了一个机会窗口。

在许多人看来,大模型是继互联网之后下一个平台型机会,而生态的建设,将是大模型商业化进程中的重要话题。

在AI的商业化过程中,有一个核心命题是“+AI”还是“AI+”。

李开复曾表示,“AI+”是以AI为核心,工程师、科学家主导寻找商业机会。而“+AI”是以传统公司为主导,AI赋能传统行业产生价值。换言之,“+AI”生态中,产业本身是“1”,AI是“1”后面的无数个“0”;“AI+”生态中,AI就是“1”本身。

若以ChatGPT的出现为分界,其出现之前许多AI公司都在做“+AI”的事情,而ChatGPT出现后,AI+的生态逻辑有了现实依据。回看科大讯飞的业务布局,科大讯飞更倾向于“AI+”逻辑。

目前,大多数国内的大模型入局企业大多都在“两条腿走路”——一边训练底层大模型,一边寻找上层应用场景,逐步搭建生态。

而科大讯飞的不同在于,多年的业务积累已经让科大讯飞搭建起了相对完善的应用生态。

例如,在2022年的业绩说明会上,科大讯飞屡屡提及智慧教育的“G-B-C发展模式”,即讯飞智慧教育产品主要分为面向地市县等区域(G端)的因材施教解决方案,面向学校(B端)的校内大数据精准教学、英语听说考试等,面向家长孩子(C端)的AI学习机。

除教育外,科大讯飞在医疗、汽车、智慧城市、智慧金融等领域均有布局。

科大讯飞大而全的业务布局也曾屡遭质疑。有人剖析科大讯飞的营收结构后,认为其真正来自AI技术的部分很少。对此,胡郁曾向「甲子光年」回应道,“做技术,永远不可能在整个生态系统里做成一家很大的公司”,要在生态中往上爬,做产品,做方案。

如今看来,星火认知大模型的加入,给科大讯飞此前的业务布局添了一层合理化色彩。

打一个不太恰当的比喻,大模型及其商业生态的搭建类似于“先有鸡”还是“先有蛋”的问题。

目前大多数投身大模型的创业公司属于“先有鸡”的一派:做出大模型,选择教育、医疗等知识密度高、数据质量好的场景优先落地;而科大讯飞则属于“先有蛋”的一派:在过往的商业化过程中,他们在多个行业寻找落地机会,这样不断做大营收的同时,这些业务也让这些科大讯飞真实积累了大量行业数据与know-how,而大模型出现后让这些散落各个领域的业务都有了归处。

话虽如此,科大讯飞能否在大模型混战中拔得头筹还是未知数。

一方面,互联网大厂和创业公司都在迅速投入大模型赛道,市场供给已经很多。完善的应用生态固然能让科大讯飞在大模型落地上有更清晰的路径。但长期来看,要在大模型混战中取胜,提升模型解决问题的能力与降低推理成本,依然是所有大模型玩家需要持续努力的两件事。

另一方面,基于“AI+”的商业模式依然还在探索期,真正在大模型时代赚到钱的玩家还未出现。

可喜的是,做了20余年冷板凳的科大讯飞终于迎来了属于自己的时代舞台,但科大讯飞能否成为大模型时代的主角,显然还需要更多时间来证明。

推荐阅读
关注数
4537
内容数
184
精品科技产业服务机构,致力于推动科技落地 修改信息
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息