知乎近年来总有一个讨论反复出现:人工智能还是人工智障?
例子1:“明天早上六点半的时候,叫我起床。”
“好的,明天早上六点半的时候,我将称呼你为‘起床’。”
例子2:在一个游戏AI项目中,研究人员给设定了狼吃羊的基本原则是,狼在20秒内得分越高越好,而羊在20秒内存活时间越长得分越高。在进行了数十万次训练之后,研究人员发现狼开始就选择一头撞死,原因是多数情况下狼根本吃不到羊,在抓羊的过程中因为浪费时间还要被扣分,还不如一头撞死,这样扣的分还少一点。
如上两个例子生动地解释了人工智能的“人工智障属性”,随着人工智能的发展,类似的故事已经越来越少,但是普通消费者离人工智能依然很远。
人工智能定义泛化,已不再仅仅代表计算机科学的一个分支,而是扩散到各种各样的场景,与之有关的技术也都并入其中,这促使行业更深的思考,人工智能如何更接地气?
人工智能,关键在落地
莫衷一是地,不少专业人士把人工智能视作第四次工业革命的代表技术,恰如工业1.0时代的蒸汽机,工业2.0时代的电气化,工业3.0时代的信息化,新技术在发展初期总是会遇到各种各样的麻烦,人工智能也不例外。
如果给近几年的人工智能产业做总结,那一定是落地难。
自2012年后,人工智能在全球范围内掀起一波新的高潮,算法涌现、资本追捧、创业迭起,好像人工智能即将迎来崭新的黎明,然而形势急转直下,人工智能产业有着漫长的培育周期,成熟应用也局限在图像识别和机器翻译等有限的几个场景。
一半是火焰,一半是海水,我们在赋予人工智能极大期待的同时,也深切感受到人工智能还远远没有达到历次工业革命的深入程度。
随后也就有了人工智能产业化和产业人工智能化的不同路径。前者指的是将AI技术转化为产品,典型如智能音箱,后者是将人工智能融入到千行百业,针对不同的行业应用不同的算法模型,显然后者才是人工智能产业的星辰大海,但是AI技术本身的突破也十分重要。
2018年,华为就提出人工智能在行业落地一定要围绕场景进行,并进一步总结出了海量重复型、专家经验传承型及多域协同型三大典型场景,人工智能重场景的观点,也在后续被业界所认可。
工欲善其事,必先利其器,于是华为盘古大模型来了。
盘古大模型由NLP大模型、CV大模型、多模态大模型、科学计算大模型多个大模型构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题。
它具备极强的泛化能力,一个模型适用大量复杂行业场景,少量样本也能达到高精度;基于预训练+下游微调的工业化AI开发模式,让全球领先的AI真正进入千行百业。
接下来让我们看看,盘古大模型如何落地于我们的日常生活。
例子1:羊毛衫大减价了啊,件件10元,样样10元,全部十元了啊!请问什么十元?
盘古大模型:羊毛衫
例子2:
“小明,你的睫毛好漂亮,真的假的”“假的““真的么”“真的”
请问小明的睫毛是真的还是假的?
盘古大模型:假的
如上即是盘古大模型文本大模型 (NLP)的能力,可以看出其已经能充分理解我们日常沟通,体现出惊人的理解能力和生成能力,不会再出现人工智能变人工智障的笑话。
通过 40TB 中文文本的训练,它能够通过少样本学习对意图进行识别,准确回答我们的问题,而且即使你在一句话中提出了多个问题,它也能够逐一识别并回答,具备了多重意图识别能力。
据了解,盘古系列AI大模型目前有四大分身,其中文本大模型 (NLP)重点在于文本的理解和生成能力,可以理解文字背后的含义,从文本中抽取关键信息,例如从法律文书中快速找出案件要素,提高判决效率,也可以辅助人类写作;
视觉大模型 (CV)重点在于视觉理解的能力,可以对各行业的图像进行识别和检测,例如快速找出工业产品的缺陷,提高质检效率;
多模态大模型重点在于图像和文本的跨模态理解与生成能力,可以根据给定的文本生成图像,也可以根据给定的图像生成文本,可以帮助人类提高产品设计和艺术创作的效率;
科学计算大模型的目标是帮助人类解决各种科学问题,如气象预测、海浪预测、分子动力学预测、微分方程求解等,用AI技术来促进基础科学的发展。
除了这四个分身外,华为云也在积极探索大模型在其他方向的应用,如3D点云、神经渲染等,未来会将大模型应用在更多方面。
在电力巡检项目中,国网重庆永川公司使用盘古大模型很好地解决了无人机智能巡检系统(缺陷检测)中的小样本学习、主动学习、增量学习等问题,解决了海量数据标注工作量大和缺陷种类繁多的问题。本项目中减少了人工标注工作量达170人天,同时将数据筛选效率提升30倍、筛选质量提升5倍,最终部署模型的精度相较基线方法提升18%以上。
在铁路故障检测项目中,铁路系统需要耗费大量人力来检查过往火车是否存在故障隐患。为了提高人力的排查效率,盘古大模型基于故障数据微调之后,可以在保证和人工检查同等精度的前提下,将故障误报率减少24.7%,大幅提升了故障检测中的工作效率。
等等场景不一而足,盘古大模型正在千行百业落地。
AI工业化开发的前景
华为云语音语义创新Lab主任袁晶曾表示,人工智能实现大规模行业应用,需要破解三大难题,首先需要把行业里遇到的问题,转化成AI可以解决的问题,要将行业知识与AI结合;第二,要降低AI的算法、模型开发门槛;第三,要将AI顺利部署到实际的生产系统去中。
盘古大模型即是在第二部分解决AI工业化开发的难题,华为云盘古大模型实现了一个AI大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,让众多企业和开发者们走上AI开发由作坊式转变为工业化开发的新模式,大大节约研发成本。
前沿技术的研究没有一蹴而就,背后是长久的积累。例如在最近的CLUE榜单上,盘古的NLP模型在总榜、阅读理解排行榜和分类任务排行榜上都位列第一,总榜得分比第二名高出一个百分点。
过去两年,盘古大模型获得了10多个业界挑战赛冠军, 30多个专利申请,发表了70多篇IEEE、ACM期刊论文,以及120多篇CCF A类会议论文。团队的核心目标是引领工业化AI开发的新模式,降低AI使用的门槛,实现低成本、大规模的复制。
据悉,盘古大模型已经在多个行业、100多个场景成功验证,包括能源、零售、金融、工业、医疗、环境、物流等等。其中,在能源领域,盘古预训练大模型帮助行业客户实现中央空调新风系统精准预测和控制,实现节能降耗的同时提升室内空气品质。在金融行业中的异常财务检测,大模型实现企业财务风险精准识别准确度90%以上 。
结束语
足以见得,盘古大模型正在支撑各行各业多种多样的创新、智能应用,背后是强大的AI算法、算力和数据吞吐能力做基础。
“十四五年规划”和2035年远景目标纲要中,“智能”、“智慧”相关表述达到57处,说明以人工智能为代表的新技术,将成为新一轮科技革命和产业变革的重要驱动力量,人工智能的未来发展关乎全局,AI工业化开发时代也许并不远。
2021年9月23-25日华为全联接线上大会,华为云将联合上海药物所重磅发布全球首个亿级参数的盘古药物分子大模型,该模型有什么样的应用场景,又将给行业带来什么样的革命性变革 ?请大家敬请期待!了解更多信息,请访问官网www.huawei.com/hc2021