社区编辑申请
注册/登录
资深运维南非蚂蚁:合格的运维工程师是怎样练成的?
系统
本次采访对象:高俊峰(昵称:南非蚂蚁),是一位资深系统管理员、系统架构师、DBA和技术顾问,对Linux和开源运维有些认识,曾出版Linux入门书籍《循序渐进Linux》和运维实战书籍《高性能Linux服务器构建实战》。

  编者按:本次采访对象:高俊峰(昵称:南非蚂蚁),是一位资深系统管理员、系统架构师、DBA和技术顾问,对Linux和开源运维有些认识,曾出版Linux入门书籍《循序渐进Linux》和运维实战书籍《高性能Linux服务器构建实战》。今天有幸请到高总,和大家分享运维技术相关知识。

  CU社区:

  高总您好!从事Linux运维已经多年,您觉得一名合格的运维工程师是如何练成的?

  南非蚂蚁:

  一名合格的运维工程师,要具备两个方面的能力,分别是:

  个人素质方面:

  1:沟通能力、团队协作

  2:主动性、执行力、精力旺盛、抗压能力强

  3:工作中胆大心细、不走寻常路

  4:逻辑思维能力要强,为人谦和

  5:有探索创新精神

  技术方面:

  1、开发能力,这个很重要,因为运维工具都需要自已开发,开发语言:c/c++(必备其中之一)、perl、python、php等、shell(awk,sed,expect….等),需要有过实际开发经验,否则工作会非常痛苦。

  2、应用方面需要了解:操作系统(主要是linux、bsd)、webserver相关(nginx,apahe,php,lighttpd)、数据库(mysql,oralce),还有类似系统优化,集群方面的东西。

  3、网络、安全,存储等需要相当了解。

  在这里我把个人素质方面放到了***位,是有一定含义的,因为从长远的职业发展来说,个人素质方面决定了一个人的职业路线和发展前景。技术方面虽然也是重点,但是就目前国内环境来讲,技术当道还需要走很远的路。

  CU社区:

  现在运维安全越来越紧迫,高总是如何带领团队做好运维监控和安全防范措施的?

  南非蚂蚁:

  运维安全是个庞大的话题,涉及到网络设备、安全设备、机房环境、主机系统、数据库系统、应用系统等,对于这些软、硬件的监控是保证运维安全的重要工作,在运维监控方面,我们有一套安全管理流程和规章制度,在运维监控部署上,我们以nagios和cacti为基础二次开发了一套功能完备的监控软件,支持集中式和分布式相结合的部署方式,在数据采集方面,可以支持分布式主动轮询或被动接受的方式采集数据,我们的数据采集能够支持秒级单位的采样周期,***通过web界面展示物理拓扑结构,并通过物理拓扑结构提供全网的状态信息,***通过颜色变化表示出来,在软件或者硬件出现故障时,可以迅速发现网络故障点的位置,从而保证运维安全。在故障或者风险出现时,我们有多样化的响应与执行方式,常用的有声音、短信、E-mail等多种方式进行告警提示,同时结合监控系统强大的事件分析能力,迅速定位问题进而解决问题。

  总而言之,对于企业安全运维管理来说,三分技术,七分管理。建立一套完善的安全管理规章制度是很有必要的。

  CU社区:

  在从事运维工作中,有没有遇到过工作中的瓶颈?是否走过弯路?给大家分享一下吧。

  南非蚂蚁:

  弯路是肯定走过的,在我刚接手运维团队的时候,无论是运维管理制度还是监控软件等都处于不健全或者瘫痪的状态,众多的开源软件无法实现因地制宜,有些应用构架根本不适合我们的环境,但是仍然再用,进而导致应用系统性能低下,同时在应用出现故障时,监控软件没有统一接口,数据收集不准确,不完善,报警手段不及时,导致故障很难及时发现,故障点很难精确定位,为此不知道钻了多少次机房,在机房熬过了一个又一个不眠之夜。

  经过多年的运维,我认为,要带好一个运维团队,必须要做好下面几个方面工作。

  1:定制一套适合自己环境的运维管理流程和制度,例如定期巡查制度,故障抢救制度,责任到人制度等。

  2:有一个属于自己的运维监控软件,监控软件很多,适合自己的才是***的,不要盲目追求功能,如果无法满足自己的需求,***进行二次开发。

  3:建立一个完备的监控软件报警体系,软、硬件出现故障要在***时间发现,进而迅速解决问题,不然只能钻机房熬夜了。

  CU社区:

  对于自动化运维这一块,不知高总有什么高见?能否和大家分享一下?

  南非蚂蚁:

  充分利用现有的开源技术,结合自己的实际应用环境,进行监控软件的二次开发和整合,是我们运维团队的坚持的一个准则,在自动化运维方面,我们经常使用的工具有自动安装工具Kickstart、Cobbler等,配置管理类的有Puppet,目前正在将这些工具整合进我们开发的监控系统中,最终实现自动安装、自动配置、自动报警的联动系统。

  对于应用系统的集群构架,我们基本都是利用开源软件进行整合实现的,我们使用比较多的构架有keepalived+lvs、HAproxy+keepalived、Nginx+Keepalived等方案或者组合方案。其实这些方案的组合已经能够满足我们大部分的集群应用需求。所以做二次开发的很少。

  CU社区:

  在招聘linux运维工程师的时候,您最看重的是什么?如何留住优秀的人才?

  南非蚂蚁:

  对于运维人员,我更注重的不是技术本身,而是沟通能力,做事方式,当然技术也是衡量运维人员的标准,但是我认为仅占30%。现在做任何事情,沟通能力都显得非常重要,在一个运维团队中,及时、准确的沟通,不但可以节省很多时间和成本,而且也是留着人才的关键。

  根据运维人员的不同性格,让他们在擅长的领域发挥自己的优势,这是我的一个原则,有些运维人员性格外向,喜欢沟通交流,那么就让他做相关的协调和管理工作,而有些运维人员更喜欢细心的钻研技术,那么我们就给他提供学习空间,提供实践环境,让他成为这个领域的专家。

  CU社区:

  上次咱们的数据库大会我们有个议题是35岁后的技术人生,都说技术人35岁是个坎,那么对于您,对于IT运维这个职业,您对35岁之后的技术人生有什么想法?

  南非蚂蚁:

  对于技术人员来说,实时的转型是很有必要的,但是不能一概而论,是否转型,转型的方向要结合自己的实际情况而定。

  5年前你是个高级程序员,如果你醉心技术,而现实生活没有太大压力的话,那么现在你可以继续深造做个技术总监;如果你厌倦了程序员生活,并且自己的沟通和协调能力还可以,那么你也可以尝试转型技术管理;如果你有很强的沟通能力,那么转型销售领域也未尝不可。

  我认为35岁不是技术的坎,而是一个内心的坎,结合自己实际,结合公司的应用环境,实时而变,才能在技术的领域游刃有余。

 

责任编辑:黄丹 来源: CU论坛
相关推荐

2022-06-15 08:21:49

Linux运维工程师

2022-06-20 22:37:25

Linux操作系统命令

2022-05-09 15:01:51

运维转型技术

2022-06-07 11:16:51

云原生人工智能运维

2022-06-01 07:22:24

CloudOps云运维框架

2022-04-18 18:04:16

锐捷平台

2022-05-31 07:55:23

智能运维模型

2019-02-19 09:14:52

IT运维系统

2022-06-09 13:45:18

vivoK8S集群Kubernetes

2022-04-01 08:27:30

告警收敛运维监控

2022-06-21 10:55:59

运维自动化

2015-12-15 17:21:47

运维产品能力分层体系

2022-06-01 17:47:24

运维监控系统

2010-03-24 15:17:52

IT服务运维管理摩卡软件

2015-12-28 17:28:16

云计算运维华为

2013-03-06 19:00:48

运维安全管理云计算安恒

2015-07-28 10:15:03

云运维管理评估标准可信云

2017-05-16 14:25:35

2017-12-21 15:41:11

华为云

2012-10-10 09:46:58

云计算服务器运维服务器

同话题下的热门内容

微软 Windows 11 Build 22000.778 (KB5014668) 发布:新增搜索亮点,带来大量修复内容用这些开源工具在 Linux 上编辑 PDF 文件微软 Windows 10 21H2 Build 19044.1806 预览版发布:解决 Wi-Fi 热点问题Linux 网络性能的 15 个优化建议Docker Compose:搭建开发环境的好方式减少开发者工作量,微软向 Windows 10 推送 WebView2Windows 11年度更新22H2要来了!教你查能不能升级为什么用C语言编写操作系统?

编辑推荐

你应该知道的八款国产操作系统为什么你可能想要略过Ubuntu 17.04?HarmonyOS 2.0鸿蒙第二期开发者Beta公测申请指南让后端开发情何以堪?前端程序猿薪资大曝光谷歌“断供”华为!中国真写不出操作系统?
我收藏的内容
点赞
收藏

51CTO技术栈公众号