科技正能量 · 2021年09月24日

华为云盘古大模型:让行业AI走出象牙塔

山城重庆,是一个有导航也未必能够找到目的地的城市,它不像其他城市,是一个平面,山城是立体的,就像是一级又一级的梯田。可想而知,在这样的一个城市,电力巡检的压力要比普通城市大得多,不仅要走很多,还要爬很多坡。

现在,细心的重庆市民会发现,在城市当中出现了一些智能无人机,它们取代了爬高的电力工人,承担了巡检任务,让山城的电力巡检不再艰难。

这是国网重庆永川供电公司落地的无人机智能巡检项目,它帮助电力部门,减轻了大量人工,还提高了巡检的效率。

有人会问,对于国网重庆永川供电公司这样一家传统的电力企业,是如何做到快速将AI应用落地的?

这个秘密在于华为云的盘古大模型,它的关键词就在于AI训练的效率。比如,以前训练一个模型要人工标注上万张的图片,现在只需要几十张;以前模型开发要一个物品识别一个模型,现在一个大模型就可以完成大量物品的识别。

很明显,当模型开发和维护的数量大幅减少了,AI应用落地的速度就加快了。

产业智能化的机遇与挑战

产业智能化正面临前所未有的大机遇。

IDC发布的《2020-2021中国人工智能计算力发展评估报告》显示:2020年新基建整体投资规模预计将达到2757.1亿美元,人工智能作为新基建的重要领域之一,也将迎来快速增长。IDC 预计,2020年中国人工智能市场规模将达到62.7亿美元,截至到2024年之前的年复合增长率高达30.4%。

《智能时代:大数据与智能革命重新定义未来》中预言,传统的行业都将采用智能技术实现升级换代,也会改变原有的商业模式。的确我们也看到,人工智能在应用端的创新如雨后春笋,无人驾驶、智能推荐等AI应用已经成为现实;在行业端,越来越多的企业将人工智能视为数字化转型的下一站。

在此进程中,AI的角色对企业来说也在潜移默化的发生改变。首先,AI是新的赛道,当新旧竞争壁垒更迭的周期,AI的能力将是企业跑赢对手弯道超车的机会,同时AI的能力也将重构企业护城河保证在未来的竞争中不容易被打败。而企业级市场,由AI驱动的智能化将改变行业的游戏规则,数字化转型的成果将很大程度上要参照智能化的水平。

根据去年IDC的数据显示:得益于安防、城市大脑等AI应用场景的带动,AI在行业渗透,推动了政府、交通、公共事业、健康等行业的智能化提速。

在巨大的机遇面前,人工智能实现大规模行业应用的挑战同样存在:

首先,行业里遇到的问题,如何转化成AI可以解决的问题,如何将行业知识与AI结合;第二,如何降低AI的算法、模型开发门槛,让AI可以普惠;第三,将AI顺利部署到实际的生产系统去中,始终是一个系统性的难题。

罗马不是一天建成的,眼下最为紧迫要解决的问题还是要尽快降低AI的算法、模型开发门槛。

因为,对于广大的企业和AI开发者来说,如果每一次开发都是从0到1的过程,那么AI开发的效率就很低,他们其实需要一种服务,能够将有共性的模型和算法预制,并沉淀一定的行业知识和经验。

这就是华为云之所以推出盘古系列超大预训练模型的背景。

今年4月,华为云发布了盘古系列超大预训练模型,包括中文语言(NLP)、视觉(CV)大模型,多模态大模型、科学计算大模型。华为云盘古大模型旨在建立一套通用、易用的人工智能开发工作流,以赋能更多的行业和开发者,实现人工智能工业化开发。

通过与行业知识结合,盘古大模型能快速实现不同场景的适配,加速AI行业应用,让AI开发由作坊式转变为工业化开发的新模式。

盘古让行业AI走出象牙塔

华为云一直认为,AI应该具备普惠属性,不应该待在象牙塔,而应该面向千行百业。

盘古正是为此而来!

传统的AI开发模式,有点像是“小作坊模式”,即针对每个场景,独立地完成模型选择、数据处理、模型优化、模型迭代等一系列开发环节。由于无法积累通用知识,同时不同领域的调试方法有所不同,这样的开发模式往往比较低效。

盘古大模型最大的价值就是打造了一种全新的“工业化开发模式”。将一套通用的流水线复用到各种不同的场景里去,减少专家的干预和人为调优的消耗,从而降低人工智能开发的门槛和成本。

是怎么做到的呢?

最关键的就是预训练模型,这个设计的目的就是为了让开发者降低使用成本。模型的预训练过程,成本是比较高的,但这个成本不需要开发者来承担。而在使用这些大模型的时候,它本身的易用性会使得使用成本进一步降低,达到一个比较合适的水平。盘古正在做这样的事,会给你更加通俗易懂的界面,能够用一些拖拉拽的方式使用盘古大模型。

目前,盘古目前的预训练模型包括了四个大的“分身”:

第一,文本大模型 (NLP)重点在于文本的理解和生成能力,可以理解文字背后的含义,从文本中抽取关键信息,例如从法律文书中快速找出案件要素,提高判决效率,也可以辅助人类写作;

第二,视觉大模型 (CV)重点在于视觉理解的能力,可以对各行业的图像进行识别和检测,例如快速找出工业产品的缺陷,提高质检效率;

第三,多模态大模型重点在于图像和文本的跨模态理解与生成能力,可以根据给定的文本生成图像,也可以根据给定的图像生成文本,可以帮助人类提高产品设计和艺术创作的效率;

第四,科学计算大模型的目标是帮助人类解决各种科学问题,如气象预测、海浪预测、分子动力学预测、微分方程求解等,用AI技术来促进基础科学的发展。

我们知道,预训练模型要实现AI模型的通用性、泛化性和可复制性,要满足几个条件:一是底层具备足够强的算力基础;二是算法自身的强度能够达到世界一流;三是模型兼具稳定和效率,满足工业级的企业应用;四是将人力调优转换为AI自动化调优。

其次,在算法层面,盘古的NLP模型在总榜、阅读理解排行榜和分类任务排行榜上都位列第一,总榜得分比第二名高出一个百分点;同时,CV大模型采用 “层次化语义对齐和语义调整”算法,在浅层特征上获得了更好的可分离性,使得小样本学习的能力获得了显著提升,同样达到业界第一。

最后,在调优环节,过去的模型开发需要专业技术人员投入几个月的时间进行调优,但是现在调优由于盘古提供丰富的工具,可以大大简化调优的过程,对技术人员的技能要求降低,这个能力也保证了更多传统行业,不再畏惧走向智能化转型。

推荐阅读
关注数
2834
内容数
255
新基建、云计算、数字经济、数字化转型
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息