Hi 朋友,本期将围绕智能运维整体市场趋势,以及国内智能运维的趋势特点、政策导向、需求背景、发展重点等多个方面对国内外智能运维状况进行介绍。

 

 

智能运维相关整体市场趋势

 

国际数据公司(International Data Corporation,IDC)在2021年10月发布了国际IT运维分析的相关预测报告。IDC预测在2021至2025年间,IT运维分析相关软件领域的市场复合年增长率(CAGR)为9.8%。

 

连载一 |《中国智能运维实践年度报告(2021-2022)》之国内外智能运维状况
 

图1  2020-2025 ITOA相关财政收入增长率情况预测

 

该报告基于截止到2021年9月ITOA领域相关市场数据,对2021至2025年进行了市场预测。根据截至 2021 年 9 月的全球分析数据,ITOA软件市场在2020年总收入约为37.2亿美元。考虑到新冠疫情在全球蔓延造成的不利影响,如全球性GDP增长放缓、IT业内软件开支降低等因素,IDC预计该市场将在 2025 年以 9.8% 的复合年增长率增长到59.3亿美元。

 

值得注意的是,在该预测中,传统预置型ITOA产品的增长几乎停滞,其复合年增长率仅为2.1%,而公有云相关的产品则保持着较高增速,其复合年增长率为20.4%。

 

到2025年,基于SaaS的ITOA云服务的收入预计将占整个市场收入的54%,高于2020年的34%。

 

 

国内智能运维的趋势特点与国家政策导向

 

1)国内智能运维技术成熟度相较于全球处于靠前位置

 

Gartner在2021发布的全球I&O自动化成熟度曲线与去年的曲线类似,从曲线上来看,AIOps仍处于通胀预期阶段的顶峰之前,同时,AIOps平台可能会在5到10年内达到生产力高原的阶段。
 

连载一 |《中国智能运维实践年度报告(2021-2022)》之国内外智能运维状况

 

图2 智能运维技术成熟度曲线

 

与全球AIOps的技术成熟度整体趋势不同,Gartner在2021发布的中国I&O自动化成熟度曲线中,AIOps已经跨过了通胀预期阶段的顶峰并处于下滑阶段,这表明AIOps在前期过高的期望之后,将迎来泡沫破灭的低谷期,各方对于AIOps的期望值会不断下滑,前期野蛮发展的范围会不断缩小,而在发展中成功并能存活的经营模式逐渐成长。从整体趋势来看,AIOps平台可能会在2到5年内达到最终成熟的实质生产阶段。对比全球和国内AIOps技术成熟度曲线可以看出,国内智能运维技术成熟度相较于全球处于靠前位置,会更快地到达成熟和实质生产阶段。

 

2)国内智能化发展的相关政策

 

2021年以来,我国对智能运维及其相关领域保持着高度重视,在《2021年政府工作报告》与《2022年政府工作报告》中指出各企业需推动产业数字化智能化改造,促进数字经济发展。

 

同时,各行业也紧跟国家政策出台了相关的指导政策。在金融领域,陆续出台了《“十四五”数字经济发展规划》、《金融科技发展规划(2022-2025)》、《关于银行业保险业数字化转型的指导意见》等一系列文件政策,表明在未来一段时间内,数智化转型将是金融行业高质量发展的重要基础和重点方向。

 

 

国内热点IT行业智能运维需求背景和发展重点

 

1)金融行业智能运维发展

 

金融行业的业务系统复杂庞大,支撑其运行的软硬件之间的关联关系复杂,承担保障的运维工作变得非常具有挑战性。在此情况下,金融行业对运维智能化升级的强烈需求,促使金融行业在各行业的数字化转型中处于前列,其中以银行的数字化、智能化转型最具代表性。

 

随着银行核心系统等信息系统和应用服务的升级,越来越多的银行启动了智能运维建设,以数据监控与采集能力为基础,结合人工智能能力提供算法服务,挖掘数据价值、提升运维效率,建立数据、服务、应用和场景的全域运维能力。

 

在银行数据中心的智能运维建设中,可以看到以下建设重点:

  • 数据服务平台和算法服务平台双管齐下;

  • 故障和风险及其相关分析治理能力是运维产品的共同关注对象;

  • 数据监控、数据分析(诊断、预测)和决策控制是智能运维发展的三个主要阶段;

  • 混沌工程的引入和发展将推动智能运维在复杂环境下的故障预判和预防能力。

 

2)电信行业智能运维发展

 

随着技术的发展,电信行业的数据量也在不断提升,移动通信网络本身正日益复杂化,通信业务生态也日益多样化。在新的5G时代,清华大学智能产业研究院院长张亚勤院士指出“互联网和通信网在协议层实现真正的融合,所以很多过去计算机领域的算法、互联网里面的技术,都可以更容易地使用到通信网络之中”,这使得电信行业在飞速发展的同时也导致了移动通信网络越来越复杂,不同的厂商、标准组织、网络接口的多样性,多网并存等问题导致的种类多样的数据和设备都给电信行业的运维提出了较高的要求,难以通过传统的人工方式进行管理。

 

面对新时期的运维挑战,依托人工智能技术的智能运维受到了越来越多的重视,通信国际标准组织等也已经开始对行业内的人工智能的发展成熟度进行了分级,将智能化按照从低到高划分为Level 0-5共6个等级,其中Level 0即为传统的完全手工运维的网络,而网络智能化的发展目标即是从手工运维向整个网络完全自治管理(Level 5)过渡。
 

连载一 |《中国智能运维实践年度报告(2021-2022)》之国内外智能运维状况
 

表1 全球移动通信系统协会智能化分级定义

 

 

智能运维相关整体市场趋势

 

1)智能运维由单一场景向体系化发展

 

早期智能运维业务场景,以实现单一功能需求为主,随着智能水平提高,智能运维从特定场景的单点智能向平台化、体系化发展,在实践中沉淀各类业务流程中的共性人工智能能力和统一数据管理能力,推动构建完整的智能运维体系。

 

智能运维产品向构建统一平台发展,是未来智能运维发展的趋势和目标,智能运维产品将考虑统一数据平台和算法平台的建设,以满足不同数据条件和业务场景下的智能运维需求。数据是算法的基础,收集、处理和存储数据,是智能运维不可或缺的一环。关注于多模态数据整合与查询的数据平台是未来智能运维发展的重要基础。在智能算法不断发展的基础上,如何针对实际需求选择、编排和调用智能算法,也影响到算法的实际效果,因此,提供多种算法能力和自定义编排能力的算法服务平台将会是智能运维实践落地的未来重点建设方向。

 

2)由被动响应向主动预防拓展、从主动预防向智能化预防发展

 

在基于故障、告警触发的被动响应式运维的基础上,以智能方法进行止损、定位,可以更为全面地展示故障原因,为运维人员处理故障带来了积极影响。同时,历史积累的故障案例和各类型的运维数据,为主动预防式的智能运维发展提供了基础。在未来发展中,针对于系统风险的主动防范也将逐渐受到人们的重视。目前,基于专家规则、统计分析、机器学习等方式的风险项识别、对识别风险的汇总、溯源、管理和处置能力也在不断探索和实施的过程中,并在未来将成为智能运维不可或缺的功能。

 

3)可观测性和可解释性释放智能运维的活力

 

可观测性一直是智能运维产品的重要需求之一。早期的智能运维产品主要侧重于算法效果等方面,在人机交互、算法效果的可视化、算法运行的可观测性方面往往存在缺失。在未来运维实践中,可观测性的重要性将不断提高,并成为智能运维产品的基础能力。除了基础的算法可观测性外,对于算法结果的可解释性也是未来智能运维产品需要关注的能力,这些能力有助于运维人员更好地理解机器决策分析,确认智能运维的操作结果,并帮助运维人员对决策结果进行反馈,从而形成智能运维的良性循环。

 

4)混沌工程将增强智能运维的运维韧性

 

混沌工程旨在通过破坏系统“稳定状态”的实验来提前探知潜在风险,检验系统稳定性。在智能运维中,混沌工程能够从多个角度提高智能运维的运维韧性。通过系统仿真、流量模拟、故障注入等手段,提供有针对性的故障演练场景,在各种故障实际发生前预先对故障场景进行模拟,从而帮助运维人员增强主动故障演练的能力,提升运维人员的故障处置能力,检验系统在异常状态下的响应能力,并验证智能运维算法及自动化脚本在异常发生时的有效性。此外,混沌工程也可以为人工智能算法进行数据准备工作,在场景不明确或没有充足历史数据的情况下,利用仿真数据提供接近于真实情况下的异常场景和相应的数据,为机器学习提供丰富的数据基础,提高智能运维算法的准确性。

 

· “国内外智能运维状况”编委介绍 ·

 

连载一 |《中国智能运维实践年度报告(2021-2022)》之国内外智能运维状况

特别鸣谢:

殷康璘(清华大学) & 温希道(北京必示科技有限公司)

 

· 精彩预告 ·

下期将分享“标准解读”之通用要求标准,主要围绕思路和内容两个方面进行详细阐述,详情敬请关注“双态IT联盟BOA”公众号!