智能运维系列国标设计—一个好汉三个帮
在标准建设方面,系列国标的第1部分是通用要求,侧重于智能运维框架的构建。在此基础上,工作组聚焦于数据、算法、技术等三个核心能力要素,致力于为智能运维框架打造坚实的“地基”。其中,数据是支撑智能运维的基石,算法是挖掘数据价值的关键,技术是实现智能运维的手段,上述三种要素也同时构成了系列国标的第2、第3和第4部分。智能运维系列标准之间的关系如图1所示。

智能运维框架解析—“三驾马车”
《信息技术服务智能运维第1部分:通用要求》国家标准的核心内容大体可归结为“三驾马车”,即“以组织治理为引领、以场景实现为中心、以能力域构建为支撑”。智能运维框架如图2所示。
《信息技术服务智能运维第1部分:通用要求》国家标准的核心内容大体可归结为“三驾马车”,即“以组织治理为引领、以场景实现为中心、以能力域构建为支撑”。智能运维框架如图2所示。

图2智能运维框架
要点问答
Q1:智能运维标准为什么要以场景为中心?
A1:运维场景,指为实现具体运维目标所需的人员、活动与对象的组合。场景无穷无尽,可以不断组合。场景是抓手,没有场景的建设方案是不可行的;能力是底座,构建能力项要特别关注其组合性和可复用性。只有同时兼顾“自上而下的场景驱动”和“自下而上的能力支撑”,才能真正把智能运维场景建设好。
Q2:智能运维场景实现有哪些关键要点?
A2:
第一,场景实现不等同于平台建设。
为了智能而智能的建设模式是不可持续的。工具和平台的作用是赋能场景,如果无法满足运维场景本身的需要,平台建设得再好也没有意义。智能运维是一套解决方案。建设智能运维场景,不仅需要工具和平台的能力支撑,还要结合组织文化、流程机制、队伍建设等维度进行落地。
第二,场景实现是一项系统工程。
站在信息系统建设的全生命周期视角来看,很多系统在运维过程中暴露出来的问题,其根治方案不在运维本身,而在信息系统的需求规划、架构设计、研发测试等前道环节。如果没有一种可持续、工程化的解决方案,运维工作就会很被动,运维压力也会不断增加。在研制标准过程中,我们总结出一套适用于场景建设的方法论。更多关注在前期的场景分析阶段,尤其是识别出场景建设的运维角色、运维活动、运维对象、智能特征等内容。场景实现也并非一锤子买卖,建议提前设立场景建设可评估、可量化的指标,在场景建设过程中不断比照、不断迭代等等。
第三,场景实现建议关注两个重点——运维数据治理和安全风险。
随着业务与技术的不断发展,运维数据量正呈现出爆发式增长。过去,运维数据通常从各业务系统和监控工具中产生和采集,缺少统一管理和数据标准,数据容易形成孤岛。因此在使用这些运维数据时存在很大的难度,更谈不上将它们整合运用、关联分析。如今,随着大数据采集、计算、处理、分析等技术日趋成熟,运维数据治理的紧迫性和重要性逐渐显现。
运维就是守底线。当我们使用人工智能(AI)技术替代运维人员的经验判断时,如何让AI守住底线,这是智能运维需要面对的新课题。这里的安全风险,一方面是运维本身就要面对的安全风险,另一方面是由“智能”技术次生的安全风险,如模型安全、算法安全等。这些安全问题,在智能运维建设过程中同样需要重点关注。
Q3:数据管理能力域建设的关键要点是什么?
A3:
第一,形成数据管理的标准
数据管理标准是为了规范对数据的统一理解,促进数据共享,增强跨团队协作中对数据定义与使用的一致性,降低沟通成本。数据管理标准通常包括组织架构、标准制度、管控流程、技术体系四个方向,应用统一的数据定义、数据分类等。在运维领域数据管理标准可以考虑如下:
· “标准解读-通用要求”编委介绍 ·








· 精彩预告 ·
下期将分享“标准解读”之运维数据治理标准、运维算法治理标准、运维技术治理标准,主要从“为何写标准”和“标准讲什么”两个角度进行解读,详情敬请关注“双态IT联盟BOA”公众号!