大规模和批量化的自动化运维,能极大地减少人力成本,降低操作风险,提高运维效率。但是自动化运维的本质依然是人与自动化工具相结合的运维模式,受限于人类自身的生理极限以及认识的局限,无法持续地面向大规模,高复杂性的系统提供高质量的运维服务。智能化运维是将人工智能应用于运维领域,基于已有的运维数据(日志、监控信息、应用信息等),通过机器学习的方式来进一步解决自动化运维没办法解决的问题。

近年来,自动化运维在企业逐步广泛应用,并最终将向智能化运维发展,在此过程中,运维人员应该如何确保跟上技术趋势,不失去自身的价值?

运维人员需要学习哪些知识去提高自己的价值?自动化运维的要求很高,不仅仅需要具备开发能力,对网络、硬件、操作系统这些也要具备才可以。但是不知道如何下手?如何开始?
专业的人做专业的事,能够各个专业领域通达兼济是难得的。从传统企业来说,自动化运维的建设需要一个团队或者多喝团队协作,而且也应该将各方面力量拉拢一起做这件事。

从自己熟悉的专业领域做起,了解日常工作中重复事项哪些可以由机器替代,可以采用什么技术替代。在开发能力上可以关注shell或Python等语言,工具搭建上可以从ansible等开源软件熟悉。

运维人员能力要求可大可小,最好是对业务与技术都了解,对开发能力要求其实并不高。但对数据库和脚本编程最好精通些,这样各种运维才能得心应手。

自动化运维人员需要具备哪些基本技能?对于传统运维人员如何需要加强那些方面知识的学习?
从实施应用情况来看,自动化运维工作在基础平台搭建完成后,更多的是脚本开发能力,从初期来看需要关注各类脚本的编写能力。同时,自动化运维后需要运维人员对方案制定与评估更为审慎,那么对业务系统架构与关联分析要更严谨。

因此建议传统运维人员在脚本开发能力(shell、Python)、应用架构设计(网络控制。集群管理、负载均衡等)等方面多做些了解。

技术发展过程中必然会有一些先驱探索,智能运维、自动化运维、传统运维之间并无很明显的界限划分。自动化运维并未发展到完全成熟的阶段,也已经在监控领域探索一些智能化的演进,比如对于海量告警的压缩提取有效告警、告警的根因分析、利用大数据拟合动态基线替代静态阈值进行系统运行态监控等。

智能化运维有哪些核心技术?
智能化运维的技术主要组成是运维大数据平台、智能分析决策组件、自动化工具。

运维大数据平台如同眼一样,能采集、处理、存储、展示各种运维数据。智能分析决策组件如同大脑,它以眼睛感知到的数据作为输入,作出实时的运维决策,从而驱动自动化工具实施操作。自动化工具如同手一样,能根据运维决策,实施具体的运维操作,如重启、回滚、扩缩容等。

1.运维大数据平台

①运维大数据组成

②运维大数据平台

2、智能分析决策组件

①运维知识图谱类组件

运维知识图谱类的组件是通过多种算法挖掘运维历史数据,从而得出运维主题各类特性画像和规律,以及运维主题之间的关系,形成运维知识图谱。

②动态决策类组件

动态决策类组件则是在已经挖缺好的运维知识图谱的基础上,利用实时监控数据作出实时决策,最终形成运维策略库。实时决策狐妖有异常检测,故障定位、故障处置,故障规避等。

3、自动化工具

自动化工具按照功能可分为两类:监控报警类自动化工具、运维操作类自动化工具。

自动化工具按照功能可分为两类:监控报警自动化工具、运维操作类自动化工具。

 

运维工程师QQ在线交流群:580175957