大数据对于运维有三个方面的意义(1)
大数据对于运维有三个方面的意义(一)
(2016年9月27日)
编者的话:这是一篇发表在近两年前的文章,偶尔查阅到,感觉对现今的MRO研究工作仍然有着借鉴意义。所以将此文推荐给大家,供参考。
大数据模式已经到来!大数据的确对社会进步会产生深远影响和意义。简单来说就是数据可以产生价值!
每个人都在工作中对结果负责并为此带来效益和价值,同时有些人冲在一线在做体系之外的绿叶。他们的工作不直接产生效益但是他们可以足够影响效益结果,这就是苦逼而沉默的运维。默默无闻的运维一代是否可以真正爆发,来证明自己的存在意义和价值。让自己的未来工作充满驱动力和想象力,这就需要运维拯救自己。特别是在互联网冲击时代下的运维更要如此,那么在运维时代的你和我,如何能够了解数据价值呢?
不要让老板在有问题的时候才感觉到你的存在!这是多么痛的领悟啊,想到这里就眼镜湿润的想起了自己的梦想,我可不是想这样工作下去。的确需要改变,一定要打破“ 出了问题是你的,不出问题你应该做的” 这样的狗屁理念。那么我们就要提出数据运维的概念。
(一)工程数据
描述出你所运维的系统或者工程项目的所有价值数据,体现如下:
1)工单数量
这里应该包括你的每天完成工单的质量和时间。而且要有平台可视化的体现。在完成工单的同时对业务的稳定性和目的要加以描述让你的工作变得更有意义。
2)SLA可用性
在老板眼里只关心两件事:一是他赚了多少钱,二是他花了多少钱。 SLA影响产品和业务性能也就间接影响老板的财路。所以这里要完美的体现出来你在帮老板赚钱了。 我希望的是运维同行们,在每周的报表里要体现出来并为此运维所做的努力和付出。
3)基础资源
我们运维的服务器数量和网络设备数量,IDC数量。之间的数据交互延时多少。我们每天的业务调用数量是多少? 调用的RTT如何? 我们报废的设备多少等等这些都要体现出来。反正这些数据即使你不主动表达一般的老板也不会台关心。除非你发生了故障……
4)故障率
没有故障是大家的集体愿望。在我们的同行中,居然有的人还请来了法师给机房开光祈福平安。但是所有的事件都是有规律和原因的。可能是我们的不经意的一个升级zlib库就会导致服务不可用。所以我还是愿意在平台化上展示出这些数据。如果有进步让老板看到实际变化,如果没有对自己的工作也是一个重要的警醒。
5)报警统计
我们通过报警数据的统计根据内容做一些数据挖掘和提前预警。同时也要对报警内容进行问题分析和指引。如果老板欣喜的看到了你把短信报警的条数已经控制在3%以内,那么老板没有理由不给你涨工资的。
(未完待续)
(原题目:大数据对于运维居然有这三方面的意义【行业分析】)
(摘编自:微信公众号 护航科技 / 编辑 严进军)