华为云盘古大模型：让行业AI走出象牙塔

山城重庆，是一个有导航也未必能够找到目的地的城市，它不像其他城市，是一个平面，山城是立体的，就像是一级又一级的梯田。可想而知，在这样的一个城市，电力巡检的压力要比普通城市大得多，不仅要走很多，还要爬很多坡。

现在，细心的重庆市民会发现，在城市当中出现了一些智能无人机，它们取代了爬高的电力工人，承担了巡检任务，让山城的电力巡检不再艰难。

这是国网重庆永川供电公司落地的无人机智能巡检项目，它帮助电力部门，减轻了大量人工，还提高了巡检的效率。

有人会问，对于国网重庆永川供电公司这样一家传统的电力企业，是如何做到快速将AI应用落地的？

这个秘密在于华为云的盘古大模型，它的关键词就在于AI训练的效率。比如，以前训练一个模型要人工标注上万张的图片，现在只需要几十张；以前模型开发要一个物品识别一个模型，现在一个大模型就可以完成大量物品的识别。

很明显，当模型开发和维护的数量大幅减少了，AI应用落地的速度就加快了。

产业智能化的机遇与挑战

产业智能化正面临前所未有的大机遇。

IDC发布的《2020-2021中国人工智能计算力发展评估报告》显示：2020年新基建整体投资规模预计将达到2757.1亿美元，人工智能作为新基建的重要领域之一，也将迎来快速增长。IDC 预计，2020年中国人工智能市场规模将达到62.7亿美元，截至到2024年之前的年复合增长率高达30.4%。

《智能时代：大数据与智能革命重新定义未来》中预言，传统的行业都将采用智能技术实现升级换代，也会改变原有的商业模式。的确我们也看到，人工智能在应用端的创新如雨后春笋，无人驾驶、智能推荐等AI应用已经成为现实；在行业端，越来越多的企业将人工智能视为数字化转型的下一站。

在此进程中，AI的角色对企业来说也在潜移默化的发生改变。首先，AI是新的赛道，当新旧竞争壁垒更迭的周期，AI的能力将是企业跑赢对手弯道超车的机会，同时AI的能力也将重构企业护城河保证在未来的竞争中不容易被打败。而企业级市场，由AI驱动的智能化将改变行业的游戏规则，数字化转型的成果将很大程度上要参照智能化的水平。

根据去年IDC的数据显示：得益于安防、城市大脑等AI应用场景的带动，AI在行业渗透，推动了政府、交通、公共事业、健康等行业的智能化提速。

在巨大的机遇面前，人工智能实现大规模行业应用的挑战同样存在：

首先，行业里遇到的问题，如何转化成AI可以解决的问题，如何将行业知识与AI结合；第二，如何降低AI的算法、模型开发门槛，让AI可以普惠；第三，将AI顺利部署到实际的生产系统去中，始终是一个系统性的难题。

罗马不是一天建成的，眼下最为紧迫要解决的问题还是要尽快降低AI的算法、模型开发门槛。

因为，对于广大的企业和AI开发者来说，如果每一次开发都是从0到1的过程，那么AI开发的效率就很低，他们其实需要一种服务，能够将有共性的模型和算法预制，并沉淀一定的行业知识和经验。

这就是华为云之所以推出盘古系列超大预训练模型的背景。

今年4月，华为云发布了盘古系列超大预训练模型，包括中文语言（NLP）、视觉（CV）大模型，多模态大模型、科学计算大模型。华为云盘古大模型旨在建立一套通用、易用的人工智能开发工作流，以赋能更多的行业和开发者，实现人工智能工业化开发。

通过与行业知识结合，盘古大模型能快速实现不同场景的适配，加速AI行业应用，让AI开发由作坊式转变为工业化开发的新模式。

盘古让行业AI走出象牙塔

华为云一直认为，AI应该具备普惠属性，不应该待在象牙塔，而应该面向千行百业。

盘古正是为此而来！

传统的AI开发模式，有点像是“小作坊模式”，即针对每个场景，独立地完成模型选择、数据处理、模型优化、模型迭代等一系列开发环节。由于无法积累通用知识，同时不同领域的调试方法有所不同，这样的开发模式往往比较低效。

盘古大模型最大的价值就是打造了一种全新的“工业化开发模式”。将一套通用的流水线复用到各种不同的场景里去，减少专家的干预和人为调优的消耗，从而降低人工智能开发的门槛和成本。

是怎么做到的呢？

最关键的就是预训练模型，这个设计的目的就是为了让开发者降低使用成本。模型的预训练过程，成本是比较高的，但这个成本不需要开发者来承担。而在使用这些大模型的时候，它本身的易用性会使得使用成本进一步降低，达到一个比较合适的水平。盘古正在做这样的事，会给你更加通俗易懂的界面，能够用一些拖拉拽的方式使用盘古大模型。

目前，盘古目前的预训练模型包括了四个大的“分身”：

第一，文本大模型（NLP）重点在于文本的理解和生成能力，可以理解文字背后的含义，从文本中抽取关键信息，例如从法律文书中快速找出案件要素，提高判决效率，也可以辅助人类写作；

第二，视觉大模型（CV）重点在于视觉理解的能力，可以对各行业的图像进行识别和检测，例如快速找出工业产品的缺陷，提高质检效率；

第三，多模态大模型重点在于图像和文本的跨模态理解与生成能力，可以根据给定的文本生成图像，也可以根据给定的图像生成文本，可以帮助人类提高产品设计和艺术创作的效率；

第四，科学计算大模型的目标是帮助人类解决各种科学问题，如气象预测、海浪预测、分子动力学预测、微分方程求解等，用AI技术来促进基础科学的发展。

我们知道，预训练模型要实现AI模型的通用性、泛化性和可复制性，要满足几个条件：一是底层具备足够强的算力基础；二是算法自身的强度能够达到世界一流；三是模型兼具稳定和效率，满足工业级的企业应用；四是将人力调优转换为AI自动化调优。

其次，在算法层面，盘古的NLP模型在总榜、阅读理解排行榜和分类任务排行榜上都位列第一，总榜得分比第二名高出一个百分点；同时，CV大模型采用 “层次化语义对齐和语义调整”算法，在浅层特征上获得了更好的可分离性，使得小样本学习的能力获得了显著提升，同样达到业界第一。

最后，在调优环节，过去的模型开发需要专业技术人员投入几个月的时间进行调优，但是现在调优由于盘古提供丰富的工具，可以大大简化调优的过程，对技术人员的技能要求降低，这个能力也保证了更多传统行业，不再畏惧走向智能化转型。

推荐阅读

目录