毫无疑问,智能运维(AIOps)是最近几年全球最为火爆的新技术,自2016年AIOps概念首次出现之后,短短五年时间,AIOps就完成了技术与市场“鸿沟”的关键跨越。
根据Gartner发布的《2021年中国ICT技术成熟度曲线报告》显示,AIOps市场将持续增长并影响整个IT运营管理市场(ITOM),特别是随着企业将更多的IT运营功能自动化,以增强其灵活性,用户对AIOps平台功能的需求也将不断增长,报告预计未来2-5年内AIOps将进入成熟期并会帮助企业大幅节约成本。
但也要看到,目前中国大部分企业的运维管理能力,由于受各方面因素影响,数字化应用水平“参差不齐”,至今仍没有基于生产实践的理论体系及实施指南,这不仅让各行各业的智能运维发展呈现出“千差万别”,更影响了企业管理与业务创新的发展。 在此背景下,作为国内智能运维行业的领导者,智能运维国家标准制定单位之一,云智慧日前率先发布了智能运维分级成熟度模型,这也是业内首个智能运维分级成熟度模型,据此各个企业和组织就可以更直观地了解智能运维行业的发展现状与未来趋势,同时参考这一模型企业还可以进行针对性的改进,为业务运营提供最大程度的保障。
云智慧总裁刘洪涛
正如云智慧总裁刘洪涛所言,突如其来的疫情让数字经济成为全球的增长引擎,也让各行各业对智能运维有了更多认识,但面对日新月异的IT系统架构和业务需求,国内智能运维成熟度水平相对较低的情况下,如何将新技术与管理方法论结合,对数据进行有效治理,充分发挥智能运维的效能,提升生产与运营效率,已成为各行业在数字化转型发展中亟待解决的问题。
那么,目前国内的智能运维市场主要面临着哪些挑战?云智慧首创的智能运维分级成熟度模型,究竟能给国内的智能运维市场提供什么样的借鉴和参考?更为关键的是,基于智能运维分级成熟度模型,企业在未来的数字化转型之路上,又能获得哪些新的作用和价值呢?
智能运维亟待再创新正所谓“工欲善其事,必先利其器”,随着千行百业数字化转型的不断深入,面对上万台服务器、几千个软件模块、PB级海量数据的联袂冲击,传统人工运维方式越来越捉襟见肘,谋求运维模式转型已成为企业数字化转型过程中的“当务之急”,更让企业走向智能运维的重要性和紧迫性进一步放大。
确实如此,智能运维的概念最早由Gartner在2016年提出,从这时开始,智能运维进入了概念启蒙阶段;到2018年~2019年期间,市场普遍认为智能运维主要依赖算法,各大厂商也在积极探索并在小范围内应用;到了2020年,市场渐渐回归理性,随着人们对智能运维认知程度的加深,行业内达成了更加面向现实的共识:智能运维要以数据为基础、以场景为导向、以算法为支撑。 在云智慧高级售前总监汪欢看来,尽管市场对智能运维的未来发展达成了共识,但事实上,由于整个行业发展迅猛,不同行业,不同企业对于智能运维的认知、需求都各不相同,这就给智能运维行业带来了巨大的挑战,主要体现在:阶段有差距,指的是客户数字化发展阶段不一致;需求有差异,表现在客户体量和需求差异性表现巨大;行业有区别,是指行业的业务特性与技术门类众多;进化有不同,即业务迭代和技术演进速度快。
“过去多年的一线实践中,我们发现整个运维市场发展很迅速,但是一致性非常差,消耗的成本非常多,运维代价非常高,这就急需寻求新的路径或者框架来做支撑。”汪欢说。
而刘洪涛也认为,数字化转型是一个长期的过程,强调的是“三分建设,七分运维”,真正系统要使用得好,运维是极其关键的,同时在国家高度重视数字经济的今天,智能运维的分级模型、标准乃至体系的建设还有着更大的价值和意义。
第一,从标准制定看,目前智能运维在中国市场落地的过程中,缺乏指导思想,也缺乏支撑框架,但如果一味的照搬国外的相关标准和体系,其实也完全不适用国内的实际情况,背后的原因是,国内的数字化转型跑的更快,探索得更加深入,需要更加灵活,更加符合中国市场的智能运维分级模型和标准体系。
第二,从市场发展看,统一的智能运维标准或者体系对整个市场的长远发展无疑有促进的作用。“在智能运维领域工作多年,我们的一大困扰就是跟业内的同行或者跟我们的客户沟通时没有一个共同的语境,大家对智能运维的理解太不一样了。那么如果有一个统一的分级或者模型,大家就能有可以共同参考的标准,再沟通起来就有了统一的话语体系。”刘洪涛说。
第三,从场景创新看,由于我国线上线下生态及场景远比其他国家丰富、多元,经济中结构性的差异,以及细分行业中不同的应用场景需求,都给了智能运维在场景创新中更为广阔的空间,这也需要智能运维的服务商提供出更多针对国内实际运维实践场景的解决方案,而这也离不开统一的运维分级模型或者标准体系的支撑。
由此可见,最近几年,企业的核心数字化系统开放性越来越强,创新场景越来越多,应用性能和用户体验的要求也越来越高,这给智能运维市场带来了巨大的挑战,未来要更好的推动智能运维走向市场,那么分级模型或者标准体系先行已是大势所趋。
智能运维分级再定义也正是基于这样的考量,在智能运维国家标准编制组的指导下,云智慧结合多年为各个行业客户提供的智能运维服务经验,参考ITSS运维服务能力成熟度模型与Gartner关于AIOps的市场指南,推出了智能运维分级成熟度模型,希望以此改善智能运维行业领域缺少落地应用方法论的现状,指引企业高效建设自身IT运维。
据汪欢介绍,该模型将智能运维演进路线从Level0到Level5分为6个阶段,分别从业务用户体验、运维组织管理、流程管理、工具应用、数据管理和应用平均故障恢复时间等几个维度,描述了每个阶段的运维管理特征,同时为每个阶段的演进提供了相应的关键提升手段,具体来看:
Level0:人力运维阶段,特征是运维较为原始,运维人员疲于解决各种故障,有待建设监控工具,补全工具短板,最终借助专业工具实现实时监控并发现异常或故障,并能及时告警。
Level1:辅助运维阶段,即通过工具辅助监控与部分告警,但工具使用未形成闭环,有待构建和优化IT运维管理体系,包括对组织架构、岗位角色、管理制度、流程、考核指标、运维工具的整合规划,实现人与工具的有效结合,最终保证服务交付的准确性和高效性。
Level2:一体化运维阶段,即整合监控各类工具,引入了IT服务管理,但仍需要进一步引入运维中台的理念,以推进运维数据的大集中,为初步实现智能运维打下基础。
Level3:初步智能运维阶段,是指已引入运维中台,联动并打通了运维服务管理的全流程,可对运维数据加以分析,但有待引入机器学习和算法模型,以实现决策智能。
Level4:高度智能化运维阶段,即已建立由算法驱动、可对故障进行预测,诊断乃至自动处理等工作,但有待充分利用流程挖掘,超自动化技术(RPA),以及人工智能化。
Level5:完全智能化运维阶段,即达到理想的自治状态,即系统能够无人值守、故障自愈、自主优化,同时可做到远程接管等。
“为了形成这个成熟度模型,我们调研了金融、保险、运营商、制造等十几个行业企业,并从TOP3000的客户里选择268家客户做了深度访谈,发现现在很多客户智能运维的成熟度普遍水平是L2左右,也就是65.62%的客户实际上是处于平均数以下。”汪欢表示。
这也意味着国内的智能运维发展才刚刚起步,未来面临的挑战无疑是巨大的,而云智慧首创的智能运维分级成熟度模型显然可以在此过程中发挥更大的作用,其不仅可作为各行业实践智能运维业务发展的参考,还可以帮助各行业中熟悉各个运维场景和关键业务的IT人员,更好了解和评估企业在运维方面所处的阶段,从中找到智能运维发展中亟需解决的根源问题,从而持续提升运维和IT管理效率,带动更多企业参与到智能运维实践,在为我国的智能运维标准研制提供经验的同时,也能更好地推动智能运维在中国市场的快速发展和落地。
数字化转型再重塑值得一提的是,今天已有不少中国企业借助和参考云智慧提供的智能运维分级成熟度模型,来完成自身智能运维的应用和实践。
在某通讯设备制造商的全球共享服务中心建设项目中,其企业的运维就面临着很多的挑战,例如用户多、部门多,客户用户量超过29万+,涉及行政、HR、体验、财务等30+个部门;服务量大,日工单量超过5000+,峰值为9500+;监控与服务流程长,业务流程数量超过100+,其中最长的流程节点超过20+等,这样的项目如何评估运维投入和升级的效果呢?
显然,在没有引入智能运维分级成熟度模型之前,企业面临着“差距不清目标不明、措施依赖规划水平,效果无有效度量”等挑战,更重要的是在目标没有明确之前,冒然实施项目也很容易导致失败,而借助云智慧首创的智能运维分级成熟度模型,该企业面临的运维挑战就得以“迎刃而解”。
可以看到,通过模型对比参考,企业的运维定位阶段与发展目标就得以确认,即正处于L2级别的发展阶段,是从L1向L2进行大规模转换的一个过程,那么相应的就应该做整合与服务管理,同时经过建设之后,借助模型还可以进一步验证建设效果,最终客户通过这个模型做完之后,将30多个工具“打包组合”实现了完全自动化的运维,不仅覆盖了全球所有客户和内部客户,同时服务流程也完全覆盖了100多个流程,一点接入服务的时间也从过去的一个小时缩短到10分钟,真正实现了“智能运维升级,数字化转型升维”的效果。
刘洪涛表示,云智慧智能运维分级成熟度模型的发布,不仅仅提供一套“方法论”,能够更好的赋能企业开展智能运维的工作,同时对整个行业的发展也极具重要的价值,可以从三个维度来做观察:
首先,在运维行业发展方面,智能运维分级成熟度模型最大的意义在于,能够为中国运维行业长期发展提供一套统一的标准,在统一的“语境”下展开工作,在指引企业建设符合自身发展的智能运维系统来实践数字化转型,也能够更好地推动国内智能运维领域迈入更高的发展水平。
其次,在企业数字化转型方面,智能运维分级成熟度模型也能够为企业提供一个重要的借鉴和参考,让他们对自己目前运维的现状有一个相对客观的评价,包括了解自身运维水平处在一个什么阶段,下一个阶段应该往哪个方向去发展,进而对他下一步的运维工作提供发展建议和参考。
最后,在运维从业人员方面,智能运维分级成熟度模型也能促进整个运维从业人员个人能力的提升,这是因为运维涉及的技术和知识面太多,该积累哪些知识、要舍弃什么,这个成熟度模型都具有非常好的参考和指导意义。
回头来看,云智慧之所以能够在业内首创智能运维分级成熟度模型,其实也离不开多来年云智慧在运维市场中的探索与实践,经过多年自主研发,云智慧目前已形成了从ITOM到ITSM的智能运维产品系列,覆盖200多个应用场景的“全栈式”运维平台,为金融、政府、运营商、能源、交通、制造等数十类行业客户,提供了数字化运维体系建设及全生命周期运维管理解决方案。
在此基础上,云智慧不仅“授人以鱼更授人以渔”,特别是通过首创智能运维分级成熟度模型,云智慧还提供了一种全新的运维“方法论”,能够帮助企业更好地化解智能运维进阶之路上的挑战,这让它展现出来的价值远不止于眼下,更关乎未来。
对此,刘洪涛最后强调说:“我们希望更多的从业者一起来讨论这个事情,同时云智慧也会不断地推动智能运维分级成熟度模型的完善,因为越往后,我们相信智能运维的场景会越来越多、越来越丰富,而通过这个模型的不断创新迭代,从而带动更多合作伙伴一起以数字化转型驱动行业变革,为数字经济发展培育并催生更多创新动能。”
随着数字化转型的深入,企业的运维和管理已变得“迫在眉睫”,走向智能运维已是“大势所趋”,而在此过程中,云智慧一方面积极推动智能运维的产品化、工程化和场景化的落地;另一方面也通过首创智能运维分级成熟度模型这样的全新方式,推动智能运维的标准和体系在国内的建设和推广应用,可以说在中国市场真正走出了一条智能运维的创新之路,而未来智能运维市场中更大的创新力、想象力和实践力,也正等待着云智慧去再定义、再创新和再重塑。