it运维工程师工作总结
1.如何写好IT运维年终总结数据是关键
年底将至,大部分人都面临一个课题:年终总结。
那么作为IT运维管理员,如何写好一份年终总结呢?以下有四点,供大家借鉴:一、资产清点作为整个企业的IT“管家”,首先应该对管理的资产情况了然于胸。比如说:现在的IT规模是怎样的?网络链路总长是多少?网络设备和服务器的数量、类型各是什么?都是什么品牌的?还有每个服务器上运行的数据库、中间件的类型和数量等等,这些情况都应该一个不漏、有条理地梳理清楚。
搞清楚“有什么”的问题以后,还应该做个比较,目前的资产情况和历年相比有什么变化,是增加还是减少了,这些变动都体现在哪里?这些数据整理出来,一张清晰的“资产图”便被轻松地“绘制”出来了二、业务构成及分析一个企业里,最重要的应该就是业务系统的稳定运行和增效。所以IT运维管理员的总结里,必然不能缺少对业务系统保障情况的描述。
首先也应该勾勒出“业务”的大体形象:目前我们所有的业务系统有哪些?哪些是核心的业务,它们在解决何种问题,为用户提供了哪些服务?这些业务又运行在哪些服务器上,它们的运行状态如何„?这样我们先直观地把“业务系统”介绍给大家。接下来我们可以深入地去剖析一下这些业务的运行状况,比如:我们的业务系统一年中平均每月主干链路的总流量达到了多少?将这些业务流量排名,前几位的是哪些?这些高流量的业务有多少人次在访问?这些业务的平均无故障运行时间是多少?根据其设计,这些业务的可用性指标达到多少?是远未达到使用预设,差一些到满负荷,还是已经超负荷„等等。
还有“变化”的视角是应该一直具备的,还需要与往年比,哪些业务是新增的,这些新增业务的使用情况如何,是用得较多还是较少?三、事件处理情况对一年中所做的事件处理情况进行汇总。你是否能说清楚IT部门这一年处理的事件数量有多少?这些事件分类有哪些?哪些是重大事件?这一年里产生过哪些重大的事件?这些重大事件对整个IT系统的影响是什么?是否针对此进行过全面的分析,并给到过改进的意见?采取了哪些措施保障了核心业务的SLA?这些数据也有助于对全年的运维工作进行了解。
四、未来工作开展建议一份年终总结,除了要说清楚这一年发生的事儿,还应该能对下一年乃至未来几年的工作开展提供客观依据。并且作为一个合格的IT运维管理员,眼界应该更宽一些,除了着眼于本职工作,也应该不断地关注业界的新技术、新趋势,并去分析这些新技术对本企业的IT规划是否会产生影响,可能产生的影响又是什么?结合之前对业务使用情况的统计和分析,你就可以为决策者提供出一些更有意义的信息和建议:未来企业上马一些什么样的IT业务能为企业可持续发展带来先机,哪些IT系统需要改进以满足未来不断增长的需要等等。
2.运维工程师该怎么发展
工作强度低不低是看各个公司的,在A公司运维的强度非常高,基本都是晚上回去还要加班做一些事情,主要原因是人比较少;而B公司的运维强度和人均的负荷成正比,这个我虽然为B服务过(以前我在一家B的供应商呆过,去过B做过一段时间),但是现在B怎么样我不太清楚;2.运维工程师工作的技术含量会不会低一些? 所以压力小一些?– 运维的工作性质主要还是维持运行的平稳和高效,工作主要有安装调试软硬件,根据不同开发项目配置服务器软件,监控等事情;相对开发来说更加偏向操作系统或数据库(这是两个方向,一般是分开招人的);而开发的偏向于开发软件和一些中间件,数据库和系统一般就由运维的人把关;我个人认为: a.IT运维工程师发展的方向。
DBA偏向软件,而OS管理员和network(比如cisco)管理员偏向软硬件结合,还有一种人就是纯粹玩硬件的(安装服务器硬件、机柜什么的); c. 相对开发,运维的经验学习成本是比较高的,就是说你不在一定的实用环境下是没法学会真本事的,而开发你坐在家里就可以摸索一个大概出来;而运维的知识更新的速度相对慢,10年前的DBA知识更新可能只有50%,而他本人会非常值钱,而2年前java的一些内容可能都没有发明出来;除非你在开发做到管理职位,否则纯技术开发学习更新的代价会非常高;反过来说:技术开发适合比较喜欢新鲜、喜欢创新的人,而运维适合循规蹈矩比较踏实的人;3.在B,运维工程师的薪水只有开发的2/3左右.你们公司也是一样吗? –我个人认为:公司给不同position的薪水肯定是和他预估这个职位重要性和工作强度成正比的,但和未来发展是否正比就不得而知了,这在B内部是有可比性的,至于A如何,我不太清楚,应该相差不大,毕竟A的运维已经是全球领先的,而且人数非常少;4.IT运维工程师发展前景怎么样,会不会以后的发展空间比较小?– 所谓IT运维工程师发展空间是要结合你个人的性格,资深DBA之类的人在地球上还是很稀缺的,我知道ebay china operating center的DBA有开宝马上班的,而且运维不是吃青春饭,越老越吃香,可以说是个平滑的上升直线,而开发如果你只是一个执行者和coder,恐怕就是一个开始猛涨后面猛跌的曲线,毕竟开发知识代谢成本太高,过了30就走下坡路; 【推荐阅读】◆外籍IT运维管理人员有何难处◆网络运维管理工程师四则故事解读◆系统运维工程师技能都应包含哪些◆优秀运维管理工程师成长手册 本文来自互联网,仅供参考。
3.运维工程师的工作内容
在软件产品的整个生命周期中运维工程师都需要适时地参与并发挥不同得作用,因此运维工程师的工作内容和方向非常多: 事件管理:目标是在服务出现异常时尽可能快速的恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因,推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障时可以高效的止损。在这方面主要工作内容有: 问题发现:设计并开发高效的监控平台和告警平台,使用机器学习、大数据分析等方法对系统中的大量监控数据进行汇总分析,以期在系统出现异常的时候可以快速的发现问题和判断故障的影响。 问题处理:设计并开发高效的问题处理平台和工具,在系统出现异常的时候可以快速/自动决策并触发相关止损预案,快速恢复服务。 问题跟踪:通过分析问题发生时系统的各种表现(日志、变更、监控)确定问题发生的根本原因,制定并开发预案工具。 变更管理:以可控的方式,尽可能高效的完成产品功能的迭代的变更工作。在这方面运主要工作内容有: 配置管理:通过配置管理平台(自研、开源)管理服务涉及到的多个模块、多个版本的关系以及配置的准确性。 发布管理:通过构建自动化的平台确保每一次版本变更可以安全可控地发布到生产环境。 容量管理:在服务运行维护阶段,为了确保服务架构部署的合理性同时掌握服务整体的冗余,需要不断评估系统的承载能力,并不断优化之。在这方面主要工作内容有: 容量评估:通过技术手段模拟实际的用户请求,测试整个系统所能承担的最大吞吐;通过建立容量评估模型分析压力测试过程中的数据以评估整个服务的容量。 容量优化:基于容量评估数据,判断系统的瓶颈并提供容量优化的解决方案。比如通过调整系统参数、优化服务部署架构等方法来高效的提升系统容量。 架构优化:为了支持产品的不断迭代,需要不断的进行架构优化调整。以确保整个产品能够在功能不断丰富和复杂的条件下,同时保持高可用性。
4.运维工程师,工作内容有哪些
一: 运维工程师要保证线上系统地稳定,这是运维人员的核心价值 ,围绕这个展开,是一个非常大的话题,后面细化 二:基础建设:安全,质量,效率,成本 是运维人员可以展开运维工作的四大方面。
围绕着这四个方面,我们需要制定规范,流程,建设对应的系统保证效率,标准化提升效率等等 质量: 立体化监控系统;测速,备份容灾等等 效率: 提升运维效率的系统建设,标准化机器初始化,软件安装标准化,监控标准化等等,提升效率,批量部署脚本等等 安全:互联网安全,系统支持,cgi扫描等等 成本:预算制定等等,合理优化部署,平衡成本与体验 三:基础建设升华:一切以用户价值为依归 1:异地部署 ,异地容灾 2:柔性可用 ,柔性可损 3:全网调度 ,实现成本与 用户体验的平衡 4:优化用户体验:提升速度 四:从一个项目上看运维人员的工作分解 1:项目初期介入,提对应运维需求,需要运维工程师预计运营时可能需要的数据,可以从两个方向考虑:A监控;B评估系统好坏的运维指标,如接口调用数据,用户访问速度等等,提出对应需求,开发在设计时实现,方便上线后运维采集这些数据做系统评估。 这个阶段要了解系统架构,评估运维上是否合理。
是否方便部署,运维风险有哪些,从哪些层面可以避免,做好容灾,cache数据丢数,db down掉等的评估以及应对方案设计,全网调度方案等。 2:项目开发阶段,这个阶段运维也要参与其中,了解对应运维需求开发的完成情况 3:项目测试发布: 运维负责运营环境的搭建,发布上线,并监控线上系统稳定 4:项目发布后:保证对应监控,备份,容灾等对应工作完成 5:项目运营阶段:及时对告警进行处理,对系统发展趋势做好评估,扩容等,预估可能的运营风向,并做好对应的应对措施 6:相关演习 7:做好系统优化,提升用户体验 五:从运维人员面对的周边角色做 运维人员的工作分解 1:上游战略依从:理解公司发展方向,调整运营战略 2;开发 3:测试 4:QA 5:老板等。
5.如何做好高效IT运维
根据我10几年的经验,做好高效IT运维,应该从以下几方面着手: 转变思想观念,培养业务意识 业务意识是一个说起来容易、但做起来很难的事情,网络上流传的一个经典的不同薪水秘书的工作描述,就是业务意识的一个具体体现。
培养业务意识的一个基本方法是经常思考自己的工作如何对业务产生帮助,下图是一个标准的IT运维工程师每天面对的事情,不同的意识产生不同的工作效果。 IT工程师每天要处理大量的基础设施故障和性能问题,工作强度大,技术更新快,经常把自己搞的疲惫不堪。
工程师们需要从业务的角度来思考自己的工作,也需要从业务的角度来展现自己的工作。 如上图所示,IT工程师通过对基础设施的维护工作,看到的不是简单的CPU、内存和磁盘的使用率,而是IT对业务的影响,看到的是产品开发进度、订单流程、供应商的效率等等,IT工程师就获得了成长,完成了思想的转变,建立了业务的意识,具备了职业更上一层的条件。
2 时间优先,兼顾成本 时间和成本是做决策时需要考虑到的两个基本因素,生活中每天都要面对,比如要不要上新东方的英文培训班,要不要上达内的IT培训班等等,都会涉及到时间和成本的分配问题。很多人认为“成本”是其中需要第一考虑的要素,然而过多考虑成本的结果就是会失去很多的机会,无论个人还是企业都是如此。
所以IT工程师在考虑日常工作的时候,要积极参与企业的IT决策,更多的从时间的角度来考虑问题。 比如在考虑IT管理类产品的时候,就会面临开源产品和商业产品的考虑,开源的产品初始成本低,后续成本高,出了问题全靠自己摸索;商业产品初始成本高,后续成本固定,有原厂商的支持,可靠性好。
引入开源产品,短期内看起来好像帮助企业省了钱,长期来看,企业付出的成本更高。另外,当工程师沉溺于开源产品的学习和使用的时候,个人失去了培养业务意识的大量时间,即使把开源产品用的非常好,也不会给企业创造更多的业务价值。
3 多看行业报告,培养前瞻性思想行业内的一些公司,比如Gartner、IDC、Forrester等经常性的会发布对于行业前瞻性的预测报告,工作之余,多看看这些报告,就会保持对行业未来和新鲜知识的敏感性,敏感性又会培养对行业和工作的洞察力,而洞察力是领导者需要具备的基本特征,有了洞察力,就距离职业晋升又进了一步。4 多学习,多培训,多考证现在提倡终身学习的理念,尤其在快速变化的IT领域,不主动学习就会落伍,所以要多多参加培训和学习,在年轻的时候攒钱不是第一位的,培养个人能力,获得职业提升是更重要的。
IT工程师们在向金字塔顶端发展的过程中,需要学习的东西是非常多的,如:项目管理、ITIL管理实践、ITOM/APM/NPM/ITOA/DevOps/BSM/ITSM、各种层出不群的新技术等,各个细分领域存在大量的专业知识和技能需要掌握。5 提升职业贡献在转变思想观念,提升个人职业技能的同时,还要经常想办法来提升个人的职业贡献,获得职业晋升和薪水翻倍的最重要一点还是要看职业贡献。
职业贡献和岗位是紧密联系在一起的,转变了工作意识,提升了职业技能,一方面在同样的岗位上可以为公司做出更多的贡献,另一方面也会获得新的重要岗位工作的机会,为公司做出贡献的机会大大增加。
6.IT运维都包含什么工作内容
最低0.27元/天开通百度文库会员,可在文库查看完整内容> 原发布者:RT伽 运维架构层分类楼宇基础IDC基础设施层网络硬件设备服务器硬件设备设备管理网络基础知识二层设备三层设备冗余技术网关技术网络运维要点网络故障排查服务器系统安装系统基础服务器管理系统网络基础基础应用服务数据应用服务文件存储集群层集群层云技术管理运维管理运维实际工作内容楼宇系统:系统监控报警webapp等楼宇安全:视频监控系统楼宇安全:自动化检测系统楼宇安全:生物特征识别系统楼宇安全:物理安全门禁系统楼宇自动化:电梯照明空调系统楼宇自动化:烟雾火灾监测系统IDC选型:总出口带宽稳定性(ping)电力供应(双路)空调服务(7*24)网络设备选型:确认网络需求IP地址vlan虚网络路由防火墙安全管理等服务器硬件设备:Dell,HP,联想,浪潮等确认服务商的服务级别和400电话网络服务器 网络流量 监控报警设备的资产管理设备之间连接关系网络是否可用,网络问题定位接入层情况:从用户到接入层交换机路由协议定义,流量路由方向双机热备,排除单点故障划分安全区域,安全区域之间联通了解公司网络情况,网络配置管理,了解网络基础协议硬件服务器及虚拟服务器安装系统安装服务器管理系统 安装服务器监控系统IP地址管理人员IT认证管理邮件管理系统即时通讯系统代码管理系统软件包管理分布式缓存NoSQlDB单机存储单机存储扩展共享存储分布式缓存分布式消息队列SOA层Web层应用层。
7.IT运维的重要性、必要性
IT服务是大概念,可分为建设和运维(运行维护)两部分。
对项目建设来说,容易被大众接受。IT运维的重要性:就是通过结构化的综合布线系统和计算机网络技术,将各个分离的设备(如个人电脑)、功能和信息等集成到相互关联的、统一和协调的系统之中,使资源达到充分共享,实现集中、高效、便利的管理。
系统集成实现的关键在于解决系统之间的互连和互操作性问题,它是多厂商、多协议和面向各种应用的体系结构,需要解决各类设备、子系统间的接口、协议、系统平台、应用软件等与子系统、建筑环境、施工配合、组织管理和人员配备相关的面向集成的问题。IT运维的必要性:第一,所有的电子产品(硬件设备)都有寿命问题,而信息系统包含大量不同种类、不同功能、不同性能的设备,每种设备的寿命各不相同,长的5—10年、短的3—5年,对信息系统而言,几乎在项目建设完成后即需进入项目运维期,而对某些建设周期需要很多年的信息系统来说,在项目建设后期,便要对前期建设的项目进行运维。
这里还没有考虑设备发生故障的情况,而设备发生故障是一定的,只是发生的概率大小而已。对单台设备来说,也许几年不发生一次故障,但对包含数百、数千甚至数万台(套)设备的信息系统而言,故障发生的概率要高很多。
第二,硬件设备更换、升级导致被动运维。由于硬件寿命及技术进步(摩尔定律:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。
这一定律揭示了信息技术进步的速度),硬件产品会不断升级,导致原来使用的各种软件需被动升级,而系统软件升级也会导致应用软件必须进行升级改造以适应新环境。第三,系统软件、工具软件由于自身存在各种缺陷(业内称为Bug,现在各种软件都极为庞大、复杂,要在编程中完全杜绝Bug几乎不可能),需要主动修正和完善。
第四,除上面所说的由于运行环境改变而需要被动升级应用软件外,还有就是自己主动升级。主要是随着时间的推移,对系统功能有新要求,或者是政策变化,需要系统功能跟着改变,所有这些问题都需要对系统进行运维,或者说需要升级、改造,不断完善。
第五,应用软件同系统软件一样,其本身也存在各种缺陷需修正和完善,而且应用软件是直接目的用户,不像硬件和系统软件对用户是“透明”的,是在后台发挥作用,有时仅是使用人员因对使用界面不习惯,都需作修正、完善。
8.IT运维的工作内容是什么
IT运维是IT管理的核心和重点部分,也是内容最多、最繁杂的部分,该阶段主要用于IT部门内部日常运营管理,涉及的对象分成两大部分,即IT业务系统和运维人员,山东省软件评测中心根据多年运维经验将该阶段的管理内容细分为七个子系统:
■ 设备管理:对网络设备、服务器备、操作系统运行状况进行监控
应用/服务管理:对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理
■ 数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复
■ 业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理,主要关注该业务系统的CSF(关键成功因素Critical Success Factors)和KPI(关键绩效指标Key Performance Indicators)
■ 目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理
■ 资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互
■ 信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127中控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等
■ 日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段IT运行维护管理的每一个子系统中都包含着十分丰富的内容,实现完善的IT运维管理是企业提高经营水平和服务水平的关键。运行/维护阶段与服务/支持阶段的分界线为前者是面向IT部门内部的管理,而后者是面向业务部门、企业中的其它人员或直接面向客户。
9.运维工程师,学习方向
运维人员的要求特别严苛,因为运维人员针对不同的问题,需要不断的补充扩大自己的知识和研究范畴。
在初级阶段,优秀运维人员会体现出格外出众的主动性和责任心,面对陌生的业务会主动学习和拓展自己对业务对认识和相应的知识范畴,以能够足够的胜任业务的独立维护。在逐步的发展阶段中,注重总结反省的工程师会逐渐成长为高阶运维人员,通常他们会有比较体系化的服务运维理解。
也有一部分工程师由于出色的项目管理规划能力,逐渐成为项目经理。再进一步的发展,高阶的运维人员对于产品的理解将非常的透彻,因而在这种情况下,高阶运维人员甚至可以成为产品的产品经理、产品研发的咨询顾问,在产品功能的设计与开发中起到至关重要的角色。
运维所涉及的知识面、专业点非常广,对从业人员素质也要求非常高,运维工作在大型互联网公司也越来越重要。随着互联网的高速发展、网站规模越来越大、架构越来越复杂,对网站运维工程师的需求也会越来越急迫,特别是对有经验的运维人才需求量大,而且是越老越值钱。