您所在的位置:操作系统 > 运维经验&工具 > 漫谈运维:半神半仙亦民工(1)

漫谈运维:半神半仙亦民工(1)

2010-08-17 11:11 sunix hilinux.com 我要评论(0) 字号:T | T
一键收藏,随时查看,分享好友!

运维工程师到底都在做什么?要回答这个问题,当然是有经验的运维自己来说最为真实。运维到底需要做哪些工作?网络,系统,安全,存储,测试,研发……全都要会!说运维是神仙都不过分。本文作者在撰写此文时已经有了6年的运维经验,让我们看看这群半神半仙的民工们到底是怎样工作的。

AD:

原帖:http://hilinux.com/bbs/thread-600-1-1.html 。51CTO编辑在转载中进行了一些文字措辞的修改,并添加了一些相关阅读。

作者前言:看到chinaunix最近出的门户网站运维板块veyron大侠写的文章《门户网站运维abc》(51CTO编辑注:这篇文章目前尚未完成,部分整理版可以在这里阅读)深有感触,特写以下文章:

51CTO编辑推荐:SA,神仙与装机男:运维的工作到底啥样儿?

《谈网站或其他服务器运维》,这里只谈运维工程师所要做的细节工作,让人们知道运维工程师到底都在做些什么,至于上级所要做的,只是提一下,不做参考。

以下是个人观点,我说的只是我自己的想法,也是我发展的目标。你可以有异议,我们是来交流的。你对的我肯定会向你学习。因为我也在摸索。运维工程师至少要能做以下的工作:

1,网络工程师的工作

你至少要能配置CISCO 6509以下的设备,熟悉各种网络协议,否则网络出问题的时候你会傻掉。

2,系统工程师的工作

你至少要理解各种系统服务,在出问题的情况下要迅速解决问题,而不是等系统工程师来解决。

3,安全工程师的工作

我不要求你一定要会各种网络编程,但是在服务器收攻击的情况下,没有防火墙的情况下,做一些简单的处理工作。

4,存储工程师的工作

至少要熟悉各个厂商的设备,各种备份和还原的办法

5,测试工程师的工作

在新版本上线之前,你至少要协同测试工程师做测试工作,因为你是运维人员,不了解程序架构导致无法解决故障,你也有一份责任。

6,研发人员的工作 

运维工具都需要自已开发,熟悉开发语言,需要有过实际开发经验,否则工作会非常痛苦,我深有体会。

7,英语  

不想说了,我的最大痛苦就在这里

8,好的沟通者

不出问题时候你可以打游戏睡觉,出问题的时候要能和项目人员沟通,快速解决问题,而不是推;我知道有很多人能推责任,你可以做替死鬼,但是离开这个工作你还能找到更好的;把责任推到别人身上的人,下次出问题的时候,绝对没人帮你。你要能和各个兄弟部门关系非常的密切,出了问题有兄弟帮你担责任;也要能非常扯皮,没事在会议上把别人都搞定。

9,库房管理员

数万台服务器让你来管理,任何丢失或者损坏都是不负责任和失职的表现。

10,运动员

不要回家就睡觉,有空还是运动下吧;在服务器down机的时候,机房恰巧就你一个人,机柜没有空间,你需要更换一台HP 585 4U的服务器,满配约80公斤的服务器,你怎么做?

11,责任心

这个我不想说什么,这是你的职业精神。

12,组织者

给你2个啥都不会的民工,再给你2000台服务器,要求你2天把服务器装完,你咋办?

13,1-7条中,你必须有一条非常精通,是这个行业的专家。否则过了32岁,没有公司要你。

大家看了肯定觉得这个人是神仙,但是这必须是你慢慢能做到的,至少是我6年来运维经验的一点总结。

因为现在的公司都在用招聘民工的钱招聘神仙,其次我也是想让各位看看,运维工程师要担负多少责任。

我去面试过的一些公司都说,你什么都会,什么都不精。我说对,正是需要我们这些什么都会的人领导什么都精的人。

我这句话没有贬低大牛的任何意思,只是当时一个临场的发挥。虽然说完就知道这个面试白来了,但是我还是想为广大的运维工程师出口气。

不怕千招会,就怕一招精。这仍旧是我给大家的建议。

最后给大家最后最大最重要的建议,做什么工作都可以,千万别做SA。

我把SA的定义成:speediness answer而不是system admin。为什么?你可以想象一下哪些工作需要快速响应。网络工程师需要,机房网络骨干交换机故障,整个机房所有服务器无法连接,需要快速响应不?系统工程师需要,系统出问题了,要快速响应不?安全工程师需要,服务器被攻击了,要快速响应不?存储工程师需要,公司核心存储有问题了,要快速响应不?

你可以做研发,出了问题可以测试,可以想办法慢慢解决;你可以做DBA,出了问题可以推到网络工程师或者系统工程师身上,说不是DB连接问题;你可以做测试工程师,你说有问题这个东西就可以不上线……在出问题的时候,倒霉的就是SA,所以不要再争论SA包含哪些工作,SA就是一个倒霉的快速响应者,你想,哪个SA 24小时不开手机?哪个SA 晚上可以舒服的睡觉或者安心的出去度假?走在路上一听到和自己手机短信铃声一样的,利马下意识的抓出自己的手机看看是不是服务器报警;晚上和老婆 XXOO00,一个电话过来,立马停下,抓出手机看流量图;包里放着笔记本,但是因为还要开机,太慢,拿着手机上putty ping或者telnet机器……

这就是大家羡慕的SA ,你也不要抱怨自己做了SA,生活就是这样。所以不要再争论哪些xxx员应该归属于SA,系统管理员或是运维工程师,如果想做这行,就安生的当一个“快速响应者”,这是你的职业,也是你需要做到的。作为一个SA,你肯定经历过通宵好几天加班做事,你肯定经历过饭买来已经忘记了吃,你肯定经历过几天加班没睡觉,着个沙发坐下就失去知觉睡倒……没有经历过不能说你不好,只能说你管理的机器太少。

我公司是每月发21天工资,某两月我一月发了44天工资一月发了47天工资,创全公司建司7年来加班记录……项目做完自然也就落了个部门通告表扬,然后的结果就是健康情况急剧下滑,然后就是某天晚上在机房内加班一通宵,穿着短裤进机房,然后一个通宵被机柜下面的冷风吹了个关节炎……这就是做SA的代价。

以下是一些实际经验,发给大家做参考,有任何问题可以mail我,answer3ai@gmail.com

内容导航
 第 1 页:运维,快速响应的神仙  第 2 页:架构设计
 第 3 页:IDC选择  第 4 页:服务器上架
 第 5 页:安装系统和布线  第 6 页:资产统计
 第 7 页:监控架构  第 8 页:企业实际面对的一些问题

分享到:
关于运维工程师的更多文章
Ubuntu 12.04- 一丝不苟的穿山甲

Ubuntu 12.04版本的代号是“Precise Pangolin”,中文解释是“一[详细]

网友评论TOP5

查看所有评论(

提交评论

  1. Ubuntu 12.04 LTS正式发布
  2. 微软大中华区董事长梁念坚离职

热点专题

更多>>

读书

非常网管——网络应用
在网络应用越来越复杂的今天,传统的网络应用已经不能满足企业和用户的需要,这就对网络管理员、信息管理部门提出了更高的要求。

51CTO旗下网站

领先的IT技术网站 51CTO 领先的中文存储媒体 WatchStor 中国首个CIO网站 CIOage 中国首家数字医疗网站 HC3i 移动互联网生活门户 灵客风LinkPhone