Hi 朋友,上期分享了“年度调研”之智能运维和运维数据治理现状部分,本期将从 “展望”“趋势追踪”两方面来展现智能运维和运维数据治理未来规划调研分析结果。

 

展望

 

1. 未来2-3年,各单位最希望智能运维在哪三个方面达到什么样的效果

 

在参与调研的机构中,未来2-3年智能运维建设,提到数据的机构最多,其次是故障和自动化,表明经过几年智能运维的发展,国内企业已充分认识到运维数据治理重要性,已从重技术到管理和技术并重的阶段。

 

 

连载十四 |《中国智能运维实践年度报告(2022-2023)》之年度调研-智能运维和运维数据治理未来规划

 

在数据治理领域,关注数据质量的提升和数据全生命周期管理的机构最多,关注监控告警数据和配置数据的机构最多,可以推断出正是由于监控告警数据和配置数据严重制约了智能运维场景建设,才有了如此迫切的需求。可见在运维数据治理的实践中,数据治理和数据消费场景紧密结合,并行建设、边用边治理,脱离消费谈治理、脱离治理谈消费都会得不偿失。

 

在故障方面,关注根因定位的机构最多,其次是故障自愈和故障预测,说明故障根因定位是故障应急场景的痛点,通过智能化手段赋能故障定位、提高效率是亟待解决的问题。

 

在自动化方面,关注自动化处置的机构最多,其次是自动化扩缩容、自动化配置管理、自动对话机器人,说明自动化运维场景仍然是聚焦于故障应急效率的提升,也有部分机构希望通过自动化手段提升配置数据的准确性,而随着ChatGPT的火爆,ChatOps也再次受到了关注。

 

2. 2023-2024年运维数据治理计划开展的工作以及希望达到的目标

 

根据调研统计,各用户单位计划在2023-2024开展的运维数据治理各类活动中,数据质量管理和数据标准管理占比最高,其次是数据服务和数据资产管理,而数据安全管理和其他方面活动则占比最低。这说明数据质量的提升和数据标准管理是公认的运维数据治理工作的重要目标,也是必须迫切开展的重点工作。

 

连载十四 |《中国智能运维实践年度报告(2022-2023)》之年度调研-智能运维和运维数据治理未来规划

 

 

各单位对于计划开展工作的出发点和希望达到的目标归纳如下:

 

1)    顶层规划

 

  • 出发点:需要进行整体规划和体系建设,以公司级数据治理为指导,借鉴大数据领域数据治理的经验,制定运维数据治理规范,明确场景和方向,指导运维数据治理建设。

 

  • 目标:建立一套完善、高效的运维数据治理体系,制定运维数据治理规划,形成整体规划方案,制定实施计划和各个阶段目标。

 

2)    数据架构管理

 

  • 出发点:针对智能运维场景需求规划合适的数据架构及技术架构,开展数据模型管理,优化存储架构,减少计算资源消耗。

​​​​​​​

  • ​​​​​​​目标:完成数据架构的梳理和完善,确定数据模型并持续优化,减少数据服务所需的加工量,提高数据使用效率。

 

​​​​​​​​​​​​​​3)    数据标准管理

 

  • 出发点:运维数据种类繁多,数据服务中存在二义性问题,数据在结构、存储等方面存在突出的“异构”问题。为了对运维数据进行有效利用,需要着重进行数据标准管理,建立标准并持续优化,从而确保各运维平台数据的有效联动,提高数据分析效率和故障定位效率,且有利于数据消费场景的输出。

 

  • 目标:建立数据标准与规范,建立数据标准化并持续优化。通过数据标准管理减少数据关联使用的二次加工和分析,实现各运维平台真正联动,促进运维数据在信息共享、数据集成及协作运用方面可以无缝消费使用。

 

4)    数据资产管理

 

  • ​​​​​​​出发点:丰富、完整的数据资产是充分挖掘运维数据价值、支撑运维数字化的需要。盘点数据家底,确立数据中心运维数据的资产地位,可以提升数据应用和数据消费。

 

  • 目标:盘点数据家底,建立数据资产体系,明确数据可信源,通过数据标签和血缘关系梳理运维数据资产明细,结合运维组织核心价值创造,确立数据中心运维数据的资产地位。

​​​​​​​

5)    数据全生命周期管理

 

  • 出发点:数据全生命周期管理可确保数据在复杂环境中维持一致性和规范性,实现数据从产生、存储到使用过程的监控管理,解决数据孤岛和准确性等问题。

 

  • 目标:形成全量数据的生命周期管理标准并进行落地,对数据生命周期的每一个环节都有监控、告警、评价,跟踪数据去向即数据血缘,实现数据全生命周期与开发、运维过程结合,实现数据生产、消费闭环。

​​​​​​​​​​​​​​

6)    数据安全管理

 

  • 出发点:数据安全是生产运维底线,且数据治理导致的数据统一存放等机制将带来更大的数据集中泄露风险,只有完善数据安全管理手段才能更好的保护数据安全。

 

  • ​​​​​​​目标:完善运维数据加密、账号权限分级、动作监控等数据安全管理手段,完善数据使用过程中的认证、访问控制、审计等措施,通过运维数据安全管理避免运维数据安全风险。

 

7)    数据质量管理

 

  • 出发点:数据质量是根本,数据质量提升是数据有效应用的前提。智能运维功能依赖数据的准确性、一致性。在部分基于运维数据进行分析决策的场景中,因“关键指标”设置不合理、分析决策模型精准度未满足要求等多方面原因,导致分析决策结论存在较大偏差,进一步导致后续用户使用时对决策结论存疑。高质量数据是智能运维功能运行的关键,也是确保消费者对数据服务满意的核心。

 

  • 目标:完善运维数据质量评估体系,推动建立运维数据常态化质量控制手段、校验机制和问题反馈机制,与数据统一采集和管理形成闭环,实现运维数据准确性、可靠性、及时性、规范性、完整性的提升,能满足数据消费场景对于数据质量的要求。

 

8)    数据共享

 

  • 出发点:运维数据共享可以快速体现运维数据的价值。

 

  • 目标:打通数据中台不同数据类型的数据的内容,提供数据粘合能力,以及快速支持数据获取的数据服务能力;在内部形成统一的数据共享平台。

 

9)    数据服务

 

  • 出发点:数据服务是发挥运维数据价值的手段,大量的运维工作都需要运维数据的支撑,需要有便捷的数据服务能力,而通过数据场景消费为运维数据治理体现工作价值,可以进一步验证数据质量,并得到更多支持和资源。另外运维数据也需要更好的为业务进行服务,结合业务类数据可从运维到运营的转型。

 

  • ​​​​​​​目标:完善数据服务和共享的机制,做好运维数据服务和共享的效果总结、宣传,营造利用数据、使用数据解决工作问题的氛围。建立数据快速获取的数据服务能力,提供多种运维数据服务形式,包括报表导出、数据查询、数据订阅等自服务形式,以及建设相对完整的数据服务接口层,形成数据统一出口,增加数据场景化应用。

 

10)  数据洞察

 

  • 出发点:基于运维数据的运维对象和运维能力洞察,深入了解运维对象的部署情况、运行情况、风险情况,为需要提供什么样的运维服务提供支撑。通过运维数据洞察提高故障发现与定位效率,洞察系统健康度。

 

  • ​​​​​​​目标:建立完善的运维数据洞察机制,持续推动运维工具利用运维数据洞察成果,在运维对象运行风险识别和管理、运维对象故障识别和根因定位等方面深入应用,通过运维对象的洞察来提升运维服务能力。通过数据洞察进一步挖掘出数据价值、丰富智能运维场景。

 

趋势追踪 

 

1. 数字孪生用于应急演练、智慧机房建设两个方面相应的运维数据治理实践情况

 

从2022年行业在数字孪生领域已经开展的工作来看:

 

  • 数字孪生应用尚处于概念认识、理论研究及规划讨论阶段;
  • 基于智慧机房建设的可视化场景应用实践,推动了局部基础数据的治理工作;
  • 逐步探索在数据中心资源规划管理和应急指挥演练场景应用。

 

2. 大模型的引入,对运维数据的价值挖掘、治理手段、技术能力、基础设施配套带来什么影响和变化?

通过问卷调研,我们发现:

 

  • 大模型未来在运维领域的场景应用,已有初步的共识,主要聚焦在运维知识图谱、运维态势感知、故障分析定位与处置等;
  • 大模型的引入将全面改变传统运维模式,加速海量运维数据整合,推动运维治理手段的转变,促进运维标准化;
  • 由于各行业特性及受制于运维领域的标准化应用现状,大模型在运维领域的应用将受到较大挑战,主要聚焦在运维数据标准化、数据质量与治理,运维人员技能提升及工作模式转型、大模型基础设施环境支撑等。

 

3. 目前许多机构正在开展分布式架构转型,在此趋势下给运维工作带来巨大的挑战,各单位相关的应对策略和解决方案

 

在35家企业的反馈意见中,14%反馈分布式架构已经成为其企业基本技术架构,相关运维已不存在挑战。其余调研企业认为需要通过加强自动化、数据化手段应对分布式架构挑战,优先实现分布式链路追踪等可观测性体系(23%)、CMDB、告警等各类数据治理(23%)和一体化运维平台等各类自动化能力(23%),这足以证明人工式、专家式的传统运维模式已无法应对分布式架构的运维压力。

 

4. 云原生体系下的容器化、浮动IP、快速扩缩、微服务间复杂调用等特性,大幅提升了对运维的要求,智能运维如何适配和解决云原生带来的这些挑战

 

共收回24家有效反馈意见。与去年调研结果比较,调研企业仍保持智能运维整体需要往标准化、数据化、自动化和智能化演变的观点。

 

在24家企业的反馈意见中,普遍认为在思维方面要从系统和资源的运维视角转向应用、业务和用户的服务视角。在技术方面,可观测性(实施全栈监控、链路跟踪、关联图谱等内容)的建设比例2022年与2021年持平,为40%;关注运维数据治理和应用的比例从2021年的21%提升至36%,强调运维标准化的建设从2021年的6%提升4倍至2022年的24%,且均强调运维标准需左移至开发设计阶段。以上的调研情况表明,智能运维仍在优先通过建设可观测性解决云原生体系下的复杂可见性,且运维数据质量的好与坏和应用是否遵循运维标准构建成为了智能运维在往更多、更复杂的运维场景演进的拦路虎。

 

5. 当前运维实践中混合云(公私混用,多种不同云架构)的应用越来越广泛,对运维工作及统一的运营管理带来了挑战,各单位的应对策略和解决方案

 

共收回40家有效反馈意见,其中42%反馈未使用混合云。在使用混合云的23家中,有44%都反馈通过统一云管用于监控、配置和管理混合云环境中的各种资源和服务,提供统一的操作界面和控制台,支持跨云、跨平台的集中管理,而有17%采用刚好相反的方案,也就是不同的云使用独立的工具和运维模式。该两种模式均有其可取之处,统一云管因为涉及屏蔽两朵云的差异性,需要企业具备极高的架构设计、统筹和开发能力,但如若成功,用户体验的丝滑性、服务的完整性和一致性、资源的统一性会得到较好的保障。而独立运作的模式放弃了一致性,但能显著降低了异构云的融合难度,能把企业精力更多的释放至集中用好某朵云的工作内容上。建议企业根据自有人员技术水平,合作方能力,各云的开放性,并结合上云进度,选择适应自己的混合云管理模式。

 

“年度调研-智能运维和运维数据治理未来规划”

编委介绍

 

连载十四 |《中国智能运维实践年度报告(2022-2023)》之年度调研-智能运维和运维数据治理未来规划

 

连载十四 |《中国智能运维实践年度报告(2022-2023)》之年度调研-智能运维和运维数据治理未来规划

 

 

 

连载十四 |《中国智能运维实践年度报告(2022-2023)》之年度调研-智能运维和运维数据治理未来规划

 

 

连载十四 |《中国智能运维实践年度报告(2022-2023)》之年度调研-智能运维和运维数据治理未来规划

 

 

精彩预告

 

 

下期将是本次连载的最后一期啦,会对整体情况进行一个回顾与展望,详情敬请关注“双态IT论坛BOA”公众号!