应对ChatGPT，中国AI需要这三种能力

这段时间，ChatGPT成了全球科技企业“群起而攻之”的风口，几乎打开每一个社交媒体平台、每一个微信群，都在激情讨论ChatGPT。

不过我发现，经过一段时间的发酵，大家的情绪不再只是猎奇和兴奋，一部分AI业内人士，已经率先进入了ChatGPT冷静期。

一位长期从事NLP/AI的研究人士告诉我，NLP本来属于长期坐冷板凳的领域，ChatGPT对话中错误随处可见，LLM大语言模型的商业模式还不清晰，认知智能刚刚划过了冰山一角，对目前ChatGPT的一波波信息轰炸已经审美疲劳了，是时候给ChatGPT降降温了。

降温是不可能降温的，但找回常识和理性是必须的。

大胆预测，今年会是一个ChatGPT大年。

国产化的必然选择，股市与投资者的热捧，大量中国科技企业已经切实在跟进类ChatGPT，而且“chat”问答天然的低门槛和娱乐性，确实会吸引大量原本不关心技术的人开始玩AI。所以，尽管围绕ChatGPT，有很多疯狂炒作和无稽之谈，但热度势必还会持续一段时间。

当然，如果你已经对ChatGPT资讯有点审美疲劳了，好消息是，大部分人在“调戏”ChatGPT之后，猎奇心理也会消失。加上ChatGPT在应用和体验上还需要迭代，个人关注度会下降，而能够用ChatGPT带来业务价值的产业关注度，还会持续保温。

所以，ChatGPT接下来的发展，不是“要么火要么凉”那么两极分化，而是会经历一个恒温培育孵化的发展期。

担心中国做不好ChatGPT的，不用急，一切才只是刚刚开始；认为中国ChatGPT可以弯道超车的，不用嗨，新技术还是要按照规律按部就班地发展进步。

从第一代生成式预训练模型GPT-1到GPT-4，这条路OpenAI走了五年。可以说，没有对大模型的长期投入与探索，是不可能一步登天，做出ChatGPT这样的产品的。

那么，中国有没有类似的AI企业，拥有支撑起类 ChatGPT的综合实力呢？

通过国际权威咨询机构IDC新近发布的《2022 中国大模型发展白皮书》，我们可以一窥国内大模型实力分布。

图片 1.png
评估结果显示，百度旗下的文心大模型表现非常突出，在市场格局中处于第一梯队，产品能力、生态能力、应用能力全面领先，给百度即将发布的生成式对话产品文心一言，提供了强大的技术支持。

让我们暂时排除“支持国货”的民族情绪，带着理性和常识去探究一下，文心大模型的水平到底怎么样？文心一言等类ChatGPT产品，究竟能为用户和市场提供什么样的价值？

拆解ChatGPT：一匹以大模型为骨架的“特洛伊木马”

ChatGPT的出现，代表了大语言模型的突破，将对话式AI与NLP技术带到了一个全新的高度，展现了AI的更多可能性和商用潜力。

上个世纪，信息哲学领军人卢西亚诺•弗洛里迪就说过，“人工智能就像特洛伊木马，把一种更具包容性的计算/信息的范式引入哲学的城堡。”而ChatGPT就是一匹看起来极其神奇的特洛伊木马，令人类啧啧称奇，担心自己不再是城堡中唯一的万物之灵。

当然，归根结底，AI也好，ChatGPT也好，都是一匹人造的木马，由人类创造，也为人类所驱使。

图片 2.png
ChatGPT这匹“特洛伊木马”的出现，更大的意义在于，它代表了一个标志——通过大模型这种方式，人工智能的知识瓶颈，是可以被打破的。

我们知道，算力、算法、数据，这AI三要素在当下基本得到了满足，带来了AI技术应用化的突破。但许多自然语言处理NLP任务，如机器翻译、情感分析、问答系统、语言生成等，需要模型具有一定的语言知识和理解能力。张钹院士曾提出：AI最重要的能力是知识。但知识，始终是AI的一个瓶颈。

ChatGPT的出现，标志着知识瓶颈是可以被打破的。通过大模型，学习海量的语料库，可以获取丰富的语言知识，对语言中的复杂结构、语义和逻辑，进行识别和处理。

大家感觉ChatGPT特别神奇，好像真的有自主思维一样，正是源自知识能力融入大模型后，在泛化性、通用性、迁移性上的强大表现。

它是一个标志，也只是一个标志。

因为ChatGPT也并没有彻底解决知识瓶颈，还存在一些局限性。比如由于中文语料不够多，获取的深度中文知识少，所以对中文的理解和问答效果都不如英文，经常出现常识性错误。

那么，问题来了。OpenAI又不向中国大陆开放服务，对于优化ChatGPT的中文能力显然不会投入太多资源。同时，AI又广泛应用在安防、识别、智慧城市等重要领域，安全性和可靠性也决定了，发展国产化ChatGPT，成为了必然的选择。

好消息是，机会总是留给有准备的人，中国AI过去多年间不断积累升级，并没有在大模型时代令我们失望。

自2018年预训练大模型成为风潮后，中国AI领域快速跟进，已经积累了大模型所需要的全产业链要素，包括算力基础设施、数据集、算子库、深度学习开发框架、AI开发工具，以及多个领域的大模型产品。

人家牵出了盘亮条顺的“特洛伊木马”，中国科技企业将自家拉磨的驴包装成汗血宝马，显然就不太合适了。国产大模型必须足够优秀，才能让国人和企业放心支持。

IDC此时发布《2022中国大模型发展白皮书—— 元能力引擎筑基智能底座》，首提大模型评估框架，是一个大模型比武的好契机，让我们可以综合评估国产大模型的实力。

从文心的三轮驱动，称称国产大模型的重量

投资市场有句话，“在短期，市场是个投票器；在长期，市场是个称重器。”遇到短期风口“猪也能在天上飞”，但长期来看，任何公司和概念都要靠扎扎实实的核心能力，长出翅膀，才能穿越风雨，持续腾飞。

放到ChatGPT概念上也一样，各种国产类ChatGPT产品出现，到底是骡子是马，得拉出来遛遛。

图片 3.png
此次《白皮书》中，IDC搭建了大模型评估框架V1.0，选取国内主流厂商（N=9），从模型能力、工具平台能力、开放性、应用广度、应用深度、应用生态共6大维度的11项指标，进行打分评估。结果显示，百度文心大模型的产品能力、生态能力达到L4水平，应用能力达到L3水平，处于第一梯队。IDC中国副总裁兼首席分析师武连峰认为，百度文心大模型是其打造文心一言的坚实基础。

现实进展来看，百度率先打开局面，即将推出类ChatGPT的生成式对话产品文心一言。

《白皮书》中提到，“模型+工具平台+生态” 三级协同，是OpenAI在开发GPT大模型过程中的核心思路，经过长期的积累，也更容易形成竞争壁垒。

图片 4.png
我们不妨从这三个角度出发，去称称百度文心大模型的重量，究竟与OpenAI有何差距？

第一，大模型的产品能力。

模型层，是大模型的核心引擎，也是相关产品的主要优势和竞争赛点。

ChatGPT的成功，得益于大规模的数据集，较强的模型开发和算法调优能力，在NLP领域的长期积累，以及来自微软的计算资源支撑等。总的来说，打造一个像ChatGPT这样的大模型产品，需要对算法和技术有深入的理解，以及数据、算力等支持。

这方面，我们可以看到，百度要打造类ChatGPT产品，不是从零开始，而是有着长期积累和综合优势。

百度自2019年开始深入研发预训练模型，发布了知识增强的产业级大模型文心ERNIE1.0。在深度学习的基础上融入知识，将海量的知识积淀和自研的多源异构知识图谱，投入到文心大模型的预训练中，在知识的指导下，文心大模型的效率更高、效果更好，可解释性更强。用于训练的数据量级也有显著优势，模型参数达到万亿级别。2020年开始将文心大模型应用到搜索业务，可以说，百度在破解AI知识瓶颈这一问题上的探索，并不比OpenAI落后，更比国内很多科技企业要早得多。

图片 5.png
目前，困扰国产ChatGPT的算力资源和成本问题，百度也在开发文心大模型的过程当中，与国内外硬件伙伴合作寻找解决方案，百度飞桨深度学习平台向下适配各种硬件，以支持文心大模型的开发、高性能训练、模型压缩、服务部署的各种能力。

可以说，百度在大模型方面有着贯通全产业链的积累，能够满足类ChatGPT产品的开发需求，具有较强的先发优势。

第二，应用工具平台。

大模型的落地应用，是海外AI研究机构很少提及，却是产业智能化不可规避的问题。真实的产业应用场景中，企业和开发者接入大模型的方式多种多样，有的需要产品级的API接口，有的希望能够开放深度定制，有的则对成本非常敏感。

所以，要让大模型广泛应用，就必须平台提供完善的成体系的全栈工具链，包括深度学习框架、基础模型库、数据集、端到端开发套件、API接口等，才能让更多行业人员或开发者，能够低门槛甚至零门槛的将大模型应用于自己的业务中。

目前，ChatGPT还是没有开源的，想要基于ChatGPT打造集成化的行业应用产品，还不现实。这一点上，和飞桨深度学习平台生态共享的文心大模型，可以借助飞桨庞大且丰富的工具平台，以及AI开发社区，加速大模型的产业化应用，更快建立起商业闭环。

第三，行业生态。

正如OpenAI的首席执行官山姆·奥特曼所说，ChatGPT的技术不应该被保留在科技行业的狭小范围内，而应该拥抱真实世界。

但是，大模型与千行百业的融合，充满了未知的领域，要一个行业、一个行业去探索，与开发者、行业用户、上下游产业共创，这是一个苦活重活，确实大模型走向产业、拥抱真实世界的更优解。

生态建设上，百度文心大模型与飞桨深度学习平台生态共享，前期已经做了大量的工作。《白皮书》显示，百度飞桨生态已经凝聚了535万开发者、服务20万家企事业单位，与12家硬件伙伴联合发布飞桨生态发行版、推动深度学习平台与更多硬件适配，还与国内科研院所、实验室以及高校强强联手，一同攻克AI技术难关，目前赋能了389所高校，服务747名教师，学分课培养10万余名AI学子。

在此基础上，文心大模型与众多头部企业合作，融合了通用数据和行业特有知识，推出行业大模型系列，比如能源行业NLP大模型国网-百度·文心、金融行业NLP大模型浦发-百度·文心等，显著提升了大模型在行业任务上的应用效果，也在重点行业形成了大模型落地应用的参考路径，给全球大模型走向商业化，起到一定的示范作用。

“模型+工具平台+生态”，三轮驱动下，一点点将大模型推向广阔的产业天地。

化解中国AI焦虑的另一种思路：大模型的产业突围

ChatGPT火爆之后，大家可能听到了类似的声音，认为中国科技企业不像OpenAI这样长期投入，中国AI缺乏元创新、底层创新，中国在ChatGPT上已经落后了追赶要花很多钱……

其实梳理百度文心大模型的进化史会发现，这些都是一种科技自立焦虑心理的“晕轮效应”，即因为某个细分领域、垂直领域的短板，而放大到对中国AI整体能力的质疑和虚无论，这显然是不客观的。至少在大模型这个领域，中国技术自信是很真实的。

ChatGPT热潮也体现出，大模型成为发展AI技术的必然选择。这也为化解中国AI焦虑，提供了另一种思路，那就是大模型的产业突围。

图片 6.png
IDC认为，大模型将会助推数字经济，为智能化升级带来新范式。对行业用户而言，大模型已表现出巨大的潜力，企业应该尽早关注，在业务中布局。

但ChatGPT虽好，这类新技术在与行业融合时，实际中还会面对一系列适配问题，比如：

1.原始模型太大，难以在产线、矿山、园区等终端侧部署。

2.需要与行业专精知识相结合，开发定制程度更高、更安全可靠的垂直应用。

3.服务商自行开发类ChatGPT成本太高，难度很大，商业效益难保障。

所以，要打通ChatGPT等新AI技术向产业释放的一系列关节，真是“寻龙分金看缠山，一重山是一重关”，有着千山万水要过。这时候，围绕文心大模型这样的产业级平台，去撬动新技术的可能，或许才是真正的机遇所在。

在这个过程中，百度这样的AI头部玩家，接下来还需要做好三件事：

1.夯实AI基础设施。通过文心大模型与飞桨深度学习平台，夯实AI基础设施底座，加速类ChatGPT产品的开发，持续技术创新的同时，提供基础模型、丰富工具栈、API接口等必要资源，成为各行业都可以低门槛引入AI的创新底座。

2.进一步加强生态开放。有活力的创新开发环境，才有中国AI应用的百花齐放，头部企业有责任为生态赋能，不断向开发者释放资源和支持。近日来，爱奇艺、集度汽车（通过Apollo）、小度、宇信科技、汉得信息、金蝶软件、宝宝巴士、智联招聘、太平洋汽车网等知名企业，都已经加入了百度文心一言生态圈，获得该AI技术的“加持”。据说，文心一言还将会推出生态伙伴计划，全面支持伙伴，共同发展商业市场。

3.探索无人区，不断推动新技术与行业问题的结合。尽管每次AI领域的技术突破都会引发很大的舆论关注，但AI在行业当中的渗透率只有10%左右，还有大量空白地带是可以与AI相结合的，需要头部企业去引导和探索，形成示范案例。

总之，中美AI或许在顶级科研、底层技术上有差距，但中国科技企业、从业者、开发者以及无数行业和企业，从来没有“躺平”过，一直在追逐着新技术的脚步。这些要素叠加在一起，是文心大模型的重量，也是中国AI的重量。

推荐阅读

目录