Hi朋友,本期将围绕“样本情况”、“趋势分析”、“组织治理”、“场景应用”、“标准应用”和“热点关注”六大方面来展现用户单位的调研分析结果。

 

 

样本情况

 
连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果

本次调研共收集60家单位的智能运维实践现状,调研单位主要分布北京、上海、广东、安徽、四川、浙江、吉林、西藏、河北、广西、贵州、河南、湖北、江苏、青海、山东、山西、云南、福建、重庆等地区。
 
连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果

本次调研单位主要来自于银行、证券、保险、能源、运营商、交通运输、制造商、互联网、研究院、政府机构等。

 

 

趋势分析

 

从2021年行业在智能运维领域已经开展的工作来看:

 

1)智能运维开展的越深入,对数据治理的需求越强烈;

 

2)组织推行力度越大,场景应用越深;

 

3)监管控全面开花,同步展开智能运维的场景探索和建设;

 

4)运维数据在运维中的重要性越来越凸显,开展了新一轮的CMDB重塑工作,同时也满足智能运维对运维数据的消费需要。

 

从2022年行业在智能运维领域计划开展的工作来看:

 

1)2022年看到的是智能运维建设的延续性和持续深化;

 

2)夯实基础的调查用户已经开始着手运维洞察能力的建设。

 

从未来2-3年行业在智能运维工作期望的效果来看:

 

1)未来期望达成的效果往往是当前最急需提升的内容;

 

2)不同客户受能力建设的约束,对未来的希望有所不同。但依然保持了和2021/2022年智能运维建设的延续性。

 

在建设智能运维体系的过程中遇到的最主要的三个难点:

 

1)运维数据质量是难点之首,如何通过体系化的方式内建运维数据质量管理能力;

 

2)智能运维对技术人员的综合要求高,如何缩小能力与需求之间存在的差距;

 

3)智能运维复杂场景落地方面难。简单的都在落地,复杂的还在探索。

 

连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果

从上述调查结果来看,认为“数据管理能力域”需要迫切提升的占到47%,其次是“分析决策能力域”占到30%,“自动控制能力域”和“其它”占到23%。

 

从这个比例来看,对管理提升的迫切反应出智能运维建设处于上升期并到了一个技术和管理并重的阶段。未来2-3年甚至会在一些实践超前的调查对象中,管理提升建设的重要性会超过技术平台建设。毕竟,缺少运维数据治理的管理基础,技术平台难以克服数据质量问题带来的“Garbage in,Garbage out”。

 

 

组织治理

 

通过问卷调研,我们发现:

 

1)智能运维已从技术实践上升到组织战略层面;

 

2)运维研发的认知深入人心,但在实际工作中运维研发人员占比不高,56%的运维团队占比在10%以下;

 

3)采用专职团队和虚拟团队模式开展运维研发是大多数组织的选择,两种模式的比例不分伯仲,按需配置;

 

4)组织中建立的配套激励机制以开展培训和交流活动为主。

 

数据统计:
 


连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果
 
连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果


 

 

场景应用(一)

 

通过问卷调研,我们发现:

 

1)互联网、银行和保险行业IT新技术广泛应用,运维对象、复杂度、难度显著增加,运维的智能化突显重要并越来越迫切,因此这些行业智能运维建设一直走在时代前列;

 

2)各行各业数字化转型正在如火如荼进行,安全性也是从国家、行业到企业重点关注的话题,智能运维场景落地需要更多的围绕安全开展;

 

3)智能运维近年来一直得到国际和国内各行业的认可,场景建设是智能运维落地的主要体现形式,需要从简单到复杂逐步推进,目的是为了不断提升企业运维数据管理、自动控制和分析决策能力水平。

 

场景衡量推荐指标:

 

连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果

数据统计:
 

连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果

连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果

 

从场景已实现数量看行业特征:

 

  • 互联网行业已实现的智能运维场景最多,达到93%,其次是银行和保险行业,达到61%;政府机构和制造商已实现的智能运维场景最少;

 

  • 从实现场景数量上看,互联网、银行、保险行业具备特征:处理业务应用系统数量多、实时性要求高、系统容错性要求强,需要更多自动化智能化运维工具保障应用系统稳定性和可靠性;

 

  • 从实现场景数量上看,政府机构和制造商中的信息化系统主要是业务辅助系统,实时性要求低,需要自动化智能化运维工具不是特别迫切。

 

从实现难度看场景应用排名:

 

  • 已实现场景最多Top5多是利用规则匹配方式难度小的智能运维场景,实现相对容易。超过30家单位覆盖这些场景;

 

  • 已实现场景最少Top5多是难度大的智能运维场景,实现比较困难。只有5-7家单位覆盖这些场景。

 

从实现频率看场景特征:

 

  • 实现场景TOP排序中,超过23家单位实现了安全类8个场景,这些智能运维安全类场景表现的特点是通过经验总结的知识规则来实现的,并且多数属于数据异常检测。

 

从实现数量看行业关注度:

 

  • 银行类关注:数据中心出入人员管控、运维行为审计、威胁IP检测3个场景已实现数量最多,说明以上三个场景是银行业重点关注的,三个场景的关注点在安全方面,实现安全可靠运维目标,同时也符合国家金融安全战略和银保监安全监管要求;

 

  • 证券类和保险类关注:生产系统异常拨测和告警合并已实现家数最多,说明证券和保险行业更关注生产中的故障类场景;

 

  • 能源类关注:生产系统异常拨测、巡检机器人、漏洞检测、安全基线检测已实现数量最多,说明能源类公司更关注故障类、安全类、自动化类场景,运维目标是质量可靠、安全可控、效率提升;

 

  • 运营商关注:漏洞检测、访问控制审核、运维行为审计、健康检测场景,运营商关注点在安全类和评估类,运维目标是质量可靠、安全可控;

 

  • 互联网:28个场景的实现率达到了93%,说明互联网行业更愿意投入更多人力和物力支持智能运维的发展。

 

 

场景应用(二)

 

通过问卷调研,我们发现:

 

1)在智能运维领域,虽然从目前技术平台的建设方式上看自研和商购的比例相差不大。但随着智能运维建设逐步进入深水区,来自于技术门槛和人员能力的压力和高要求将带动更多的商购平台采购。市场需要在加快自身建设的同时减少摸索的时间;

 

2)智能运维领域的场景具有一定的复杂程度,单一平台尚不具备支撑复杂场景的能力,因此,智能运维工具平台建设更倾向于多个工具联动来实现复杂智能运维场景的落地。但同时也看到建设统一的智能运维平台未来也将是一个趋势;

 

3)在智能运维的场景应用中,运维数据的体系化、规范化和平台化管理是将影响智能运维场景的实践效果,决定智能运维未来发展的深度和广度。

 

数据统计:

 

连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果

连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果


 

 

标准应用

 

通过问卷调研,我们发现:

 

1)用户单位在标准应用和推广方面普遍期待落地场景的实践案例分享和交流,并基于此形成标准,构建统一的智能运维服务能力。

 

数据统计:

 

连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果

连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果


 

 

热点关注

 

1.在数据安全法、个保法等数据安全法密集出炉的情况下,用户单位认为智能运维建设在运维数据的全生命周期方面需要做什么调整和适配,目前在用户单位已落地哪些内容?

 

在60家企业的反馈意见中,37%反馈已落地运维数据安全的部分内容,主要集中在数据脱敏和数据访问权限控制两方面的内容,只有6%自述已完整实现运维数据的全生命周期安全(采、存、管、用)。

 

总体来看,运维数据的安全性实现程度仍较低。围绕运维数据特有的敏感性进行的管理建设,没有在本次调查中得到充分体现。如金融业的应用日志、通过网络镜像方式APM抓取的数据包和工业领域的传感器数据等均可能为敏感数据。

 

跨应用系统的数据可以将原本低级别安全的数据通过调用拼接为高级别安全的数据。

 

应用日志和交易数据包中不少场景下会包含用户名字,账号等内容,属于C2级的信息,按照数据安全分级指南已属于3级数据。且由于APM和日志平台一般均会跨应用系统收集数据,所以存在跨系统数据组合后构成某类交易授权的完整数据可能,比如A系统日志或交易包存在用户名和账号,而B系统的存在用户名和手机号,则在日志和APM平台中能关联出该用户的姓名、身份证号和手机号等完整信息,并可能提供批量下载功能,这将进一步提升数据的敏感级别和安全风险。

 

工业领域的传感器数据在上海的泄露甚至已成为《数据安全法》实施以来,首例涉案数据被鉴定为情报的案件,也是我国首例涉及高铁运行安全的危害国家安全类案件,涉及3G、4G、5G、WIFI和GSM-R信号数据案件。

 

目前金融和工业领域的运维数据数据安全性建设已有可以参考的的规范。

 

金融领域企业的运维数据安全性要求可参看《JR T 0223-2021金融数据安全数据生命周期安全规范》、《JR T 0171-2020个人金融信息保护技术规范》、《JR/T 0197-2020金融数据安全数据安全分级指南》。工业领域企业可以参看2022年2月工业和信息化部颁发的《工业和信息化领域数据安全管理办法(试行)》征求意见稿和工业领域数据安全管理试点工作内容。

 

2.在企业数字化转型,数据是新生产要素的大背景下,用户单位认为智能运维除了提供安全稳定的运维服务外,还能为业务数字化转型提供何种帮助,是否有实践场景?

 

在60家企业的反馈意见中,40%实质反馈了业务数字化支撑内容,主要集中在业务状况监控和用户体验分析两方面的内容,有个别单位已开始直接应用至对客直接服务中,如业务推荐。这代表智能运维已开始在业务运营领域进行尝试。

 

涉及业务领域后智能运维团队特别要关注运维数据在业务运营过程中可能产生的合规、安全和运维保障问题,如隐私保护、业务外规要求、数据安全和业务连续性等内容,因为这可能与传统的运维领域的认知和要求存在较大差异。一家被调研企业直接反馈“不建议涉足业务数字化,有法律风险”。

 

建议智能运维团队在涉及业务服务时应根据自身行业特性和风险偏好进行全方位地评估。

 

3.数字化转型过程中,企业出现了大量国产创新技术栈,该类技术栈目前主要聚焦在核心功能实现上,与传统成熟技术栈相比,高可用、自动化运维等非功能性需求上满足度较弱,售后体系和生态也较薄弱(如技术标准、知识库、人力资源、应急流程等),用户单位如何通过智能运维在监管控析等方面进行弥补?

 

在60家企业的反馈意见中,35%进行了实质反馈,反馈内容相似度较高,均为选型时根据企业自身的技术标准选用相对适合的国产技术栈。

 

在智能运维方面,基于企业内部智能运维技术框架进行一定量的定制化开发,把国产技术栈融入现行技术框架内,有效保持技术框架的一致性和完整性,通过监控观测国产技术栈的运行情况和应用效果,同时将缺陷和薄弱环节反馈至国产厂商,推动产品的持续迭代。

 

从调研结果来看,国产创新技术栈尚不足以影响企业现有的技术框架,也没有造成严重冲击。更多是以局部适配的方式融入并需要通过持续迭代进一步提升自身的技术实力。

 

4.云原生体系下的容器化、浮动IP、快速扩缩、微服务间复杂调用等特性,大幅提升了对运维的要求,用户单位认为智能运维如何适配和解决云原生带来的这些挑战?

 

在60家企业的反馈意见中,55%进行了实质反馈,调研企业认为智能运维整体需要往标准化、数据化、自动化和智能化演变。

 

在思维方面要从系统和资源的运维视角转向应用、业务和用户的服务视角;在组织方面需更新运维团队的人员技能、运维流程和运维标准;在技术方面主要投入在可观测性建设方面(实施全栈监控、链路跟踪、关联图谱等内容)。

 

通过以上投入能有效应对云原生带来的复杂性挑战。

 

5.在科技创新发展过程中,引入大量开源技术组件,与成熟商用技术组件相比,该类技术组件的维护管理与高可用等非功能性需求实现较少,缺少专业运维团队和研发团队支持(如log4j漏洞、es、ck应用等),用户单位是否有遇到这方面的问题?采取了哪些应对措施?

 

在60家企业的反馈意见中,63%进行了实质反馈,除2家企业基本不存在此类问题外,其余的均面临该方面问题。调研显示,大部分企业已大规模使用各类开源技术组件,在享受开源引入带来的成本降低、技术迭代速度加快等便利的同时,也面临着安全、运维支持、知识产权、外规要求等风险。

 

被调研企业主要通过架构管控控制开源软件引用的数量和质量,加强自身人员的技能培养,购买商业支持服务进行应对,成立专门的开源软件维护团队应对开源风险。除了大规模的开源使用,已有3家调研企业对外开源优质场景。

 

开源治理已成为迫在眉睫的事情,而企业针对开源组件普遍仍缺乏成熟的方法论和管理经验,治理手段仍处于碎片化的摸索和趟坑阶段。建议企业可以考虑参看以下材料:

 

1、2021年9月人民银行办公厅、中央网信办秘书局、工业和信息化部办公厅、银保监会办公厅、证监会办公厅联合发布《关于规范金融业开源技术应用与发展的意见》。虽然《意见》聚焦在金融领域,但对于其他领域也具有一定的指导意见。《意见》一是鼓励将开源技术应用纳入企业自身信息化发展规划,建立健全开源技术应用管理制度体系等;二是鼓励企业积极参与开源生态建设,加强与产学研交流合作力度,加入开源社会组织等;三是鼓励企业完善开源技术应用指导政策,探索建立开源技术公共服务平台。

 

2、2021年9月中国信通院的《开源软件治理能力成熟度模型》标准。该标准规范了企业在组织机制、管理制度、风险管理、软件测评选型、技术使用管理、技术运维管理、定期健康评估和软件退出管理、存量软件管理、外包软件管理等方面应具备的能力,帮助企业构建和提升开源治理能力。

 

· “年度调研-用户单位调研结果”编委介绍 ·

连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果
连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果

连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果
连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果
连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果
连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果
连载四 |《中国智能运维实践年度报告(2021-2022)》之年度调研Part1-用户单位调研结果

 

· 精彩预告 ·


下期分享将围绕“用户分析”、“趋势研究”、“场景应用”和“建议诉求”四大方面来展现厂商的调研分析结果,帮忙读者从另外一个视角来了解智能运维,详情敬请关注“双态IT联盟BOA”公众号!