还剩35页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
数据中心运维管理方案(说明本文为word格式,下载后可自由编辑)6)如发现机器故障应及时向主管及上级领导报告,并负责计算机及外设的日常维护与排除故障,处理不了的问题应立即向有关单位联系解决遇到紧急情况不要慌张,切忌手忙脚乱在遇到三包范围内的故障时,应及时催促公司上门或将机器送公司维修7)机房计算机只供机房工作人员使用未经组长同意,任何人不准随意删改和增加系统文件,不得将机房内资料、工具等物品带出机房8)机房内的一切公用物品(包括低值易耗品、软件及资料)未经许可一律不得私自挪用和外借外单位需借出设备及物品,应有单位证明和经手人签名的借条,经主管领导批准后,机房工作负责人才能开具放行条未经主管领导同意,不准自行复制系统内所有的软件和数据或将其赠送、转借给外单位人员9)经常检查网络和各设备运行情况,发现问题及时解决,并向主管领导报告10)其他人员需使用机房内设备应征得管理人员许可,并报经主管同意后方可进入机房11)对机房内网络与设备的运行、应用、维护、查看等情况,建立档案,做好系统日志要对发生的故障(隐患)以及排除故障情况做好详细记录;值班人员必须认真、如实、详细填写《机房日志》等各种登记簿,详细记录来人、事件、处理经过等,以备后查定时做好中心服务器的日志和存档工作,任何人不得删除运行记录的文档,否则追究责任如机房发现意外和紧急情况要及时报告,对重大事故要注意保护好现场12)要统一管理机房内的设备,计算机及其相关设备的驱动程序、保修卡等随机文件与资料要保存完整要明确专人负责计算机文档、信息化等资料的保管,要做到资料齐全,存放安全13)机房内的交换机和服务器是公司办公自动化的关键设备,任何人不得自行配置或更改系统参数14)各客户机应及时做好自身数据的保存工作,不得擅自更改系统及网络设置如确有工作需要应报至办公室,由办公室指派专人进行,并记录在案15)要做好机房的安全工作,对服务器的各种账号、密码严格保密对网络运行做好监控、做好记录16)票及时做好各服务器系统的补丁修正与升级工作17)管理人员要有较强的病毒防范意识,要定期对病毒库进行检测,并做好病毒库系统的定时升级工作发现病毒应及时处理,并做好记录18)未经许可,不得在各服务器上安装新软件如确实工作需要安装,要经过有关领导批准19)应及时做好数据的备份工作,保证在系统发生故障时,数据能够快速、安全地恢复所有备份数据不得更改,并要求做到本地和异地双备份保存20)机房内所有设备应妥善保管,任何人不得擅自开关、移动或者使用机房中的任何设备,如有此方面的需要,需有主管领导的批示
1.
2.3大、中型机房的日常安全管理的内容大、中型机房的日常安全管理,要重点注意如下10点内容.出入机房管理的内容D严禁非机房工作人员进入机房,特殊情况需经中心负责人批准,并认真填写登记表后方可进入严禁非工作人员上机操作进入机房人员应遵守机房管理制度2)进入机房人员不得携带任何易燃、易爆、腐蚀性、强电磁、辐射性、流体物质等对设备正常运行构成威胁的物品严禁将其他与机房工作无关的物品带入机房3)若管理人员申请调走,报告经单位批准前,重大的管理工作提前交接,把密码、钥匙、注意的问题等交接给单位指定人员.机房防火管理的内容机房是重点防火单位,应做好防火工作机房工作人员必须严格遵守各项操作规程拆装设备时必需断电,不允许带电作业;维修设备时必须先切断设备电源,再行维修;禁止使用汽油、酒精等易燃易爆品清洗带电设备;严禁在机房内吸烟和使用加热器具防火管理的重点是气体灭火系统能否发挥正常作用对气体灭火系统维护管理要注意如下4点内容1)气体灭火系统应由经过专门培训,并经考核合格的人负责定期检查和维护2)应做好对气体灭火系统的定期检查,并做好记录检查中发现的问题应及时处理3)每月应对系统进行一次检查,发现问题应及时处置,检查内容及要求如下对全部系统组件进行外观检查,系统组件应无碰撞变形及其他机械性损伤,表面应无锈蚀,保护漆层应完好,铭牌应清晰,手动操作装置的保护罩、铅封和安全标志应完整全部系统组件的安装位置不得有其他物件阻挡或妨碍其正常工作驱动控制盘面板上的指示灯应正常,各开关位置应正确,各接线应无松动现象火灾探测器表面应保持清洁,应无任何会干扰或影响火灾探测器探测性能的擦伤、油渍及油漆储存容器上的压力表,其指针应在正常的范围内设备可否移位设备工作是否正常4)每年应对系统进行两次全面检查,检查内容和要求除按月检查的内容外还应符合如下要求
①防护区的开口情况、防护区的用途及可燃物的种类、数量、分布情况,应符合设计规定防护区外的疏散通道应保持畅通
②储存容器的固定支架,应无松动现象
③灭火剂输送管路与喷嘴的连接、灭火剂输送管路本身的连接应安装牢固
④灭火剂输送管路及电气管路的固定支架应无松动现象
⑤高压软管应无变形、裂纹及老化
⑥各喷嘴孔口,应无杂物堵塞
⑦对每个防护区进行一次模拟自动启动试验
⑧手动控制、手动/自动切换、紧急停止操作、备用灭火剂储存容器切换操作应正常
⑨探测设备运行情况检查主要检查连接线路及探测器灵敏性⑩控制设备运行情况检查控制器接受火灾信号情况(包括探测、急启、急停、反馈)•控制器接受故障信号情况(包括探测、急启、急停、反馈、主备电、阀线)控制器联动性能及各个被联动器件的性能记录并分析控制器储存信息
[11]建立灭火系统使用档案,对使用、检查、维修与试验做详细记录.机房用电安全管理的内容1)机房人员应学习常规的用电安全操作和知识,了解机房内部的供电、用电设施的操作规程,注意用电安全,无触电隐患,注意节约用电2)机房应安排有专业资质的电工定期检查供电、用电设备、设施3)机房内不得乱拉乱接电线、电源,应选用安全、有保证的供电、用电器材4)在真正接通设备电源之前必须先检查线路、接头是否安全连接以及设备是否已经就绪、人员是否已经具备安全保护5)严禁随意对设备断电、更改设备供电线路;严禁随意串接、并接、搭接各种供电线路6)如发现用电安全隐患,应立即采取措施解决,不能解决的必须及时向相关负责人员提出解决7)禁止在无人看管下在机房中使用高温、炽热、产生火花的用电设备8)在使用功率超过特定瓦数的用电设备前,必须得到机房管理人员批准,并在保证线路保险的基础上使用9)在外部供电系统停电时,机房工作人员应全力配合完成停电应急工作.设备安全管理的内容机房设备要保持清洁、卫生,定期打扫,不定期对机房内设备进行检查,发现故障及时检修,并要登记、报告因违章作业造成事故损失的,要按责任事故处理设备安全管理的具体内容如下1)机房人员必须熟知机房内设备的基本安全操作和规则2)定期检查、整理硬件物理连接线路,定期检查硬件运作状态(如设备指示灯、仪表),从而及时了解硬件运作状态3)禁止随意搬动设备、随意在设备上进行安装、拆卸硬件或随意更改设备连线,禁止随意进行硬件复位4)路由器、交换机和服务器以及通信设备是网络的关键设备,不得自行配置或更换,更不能挪作他用要定期检查是否规范,经有关领导同意后再变更5)网管人员应做好网络安全工作,服务器、各种核心设备等的各种重要账号严格保密,规范管理监控网络上的数据流,从中检测出攻击的行为并给予响应和处理做好操作系统的补丁修正工作6)禁止在正式运行的服务器上进行试验性质的配置操作,需要对服务器进行配置,应在其他可进行试验的机器上调试通过并确认可行后,才能对服务器进行准确的配置7)不允许任何人在服务器、交换设备等核心设备上进行与工作范围无关的任何操作未经机房管理人员允许,更不允许他人操作机房内部的设备,对于核心服务器和设备的调整配置,更需要小组人员的共同同意后才能进行8)对会影响到全局的硬件设备的更改、调试等操作应预先发布通知,并且应有充分的时间、方案、人员准备,才能进行硬件设备的更改9)对重大设备配置的更改,必须首先形成方案文件,经过讨论确认可行后由具备资格的技术人员进行更改和调整,并应做好详细的更改和操作记录对设备进行更改、升级、配置等操作之前,应对更改、升级、配置所带来的负面后果做好充分的准备,必要时需要先准备好后备配件和应急措施10)网管人员统一管理计算机及其相关设备,完整保存计算机及其相关设备的驱动程序、保修卡及重要随机文件11)值班人员必须密切监视中心设备运行状况以及各网点运行情况,确保安全、高效运行12)未经负责人批准,不得在中心机房设备上编写、修改、更换各类软件系统及更改设备参数配置各类软件系统的维护、增删、配置的更改,各类硬件设备的添加、更换必须经负责人书面批准后方可进行;必须按规定进行详细登记和记录,对各类软件、现场资料、档案整理存档13)健全中心全部设备固定资产账目,机房内所有设备、仪器、仪表等物品要妥善保管管理人员每学期核对一次,做到账、物相符14)机房内的一切公用物品(包括低值易耗品、软件及资料)未经许可一律不得私自挪用和外借外单位需借出设备及物品,应有单位证明和经手人签名的借条,经主管领导批准后,机房工作负责人才能开具放行条.计算机病毒防范管理的内容1)对新购进的计算机及设备,为防止原始计算机病毒的侵害,要组织专业人员检查后方可安装运行;软盘、光盘等移动媒体,以及外来的系统和软件、下载软件等要先进行计算机病毒检查,确认无计算机病毒后才可以使用;严禁使用未经清查的、来历不明的软盘、光盘等2)要定期进行计算机病毒检查,系统中的程序要定期进行比较测试和检查要安装防计算机病毒软件,并定期或及时(随时)更新(升级)计算机病毒防范产品的版本;要使用国家规定的、具有计算机使用系统安全专用产品销售许可证的防计算机病毒产品3)跟踪计算机病毒发展的最新动态,及时了解计算机病毒,特别是有严重破坏力的计算机病毒的爆发日期或爆发条件,在一些破坏性较大的计算机病毒发作日期前,要及时在网上发布通知4)禁止任何人利用本单位计算机下载、复制、观看和传播各类与工作无关的视频文件5)禁止任何人利用本单位计算机查看、复制互联网上与工作无关的信息6)严禁使用盗版软件,特别是盗版的杀毒软件,严禁在工作计算机上安装、运行各类游戏软件7)外来人员携带来的各种可以在计算机上运行的文件及软件等数字信息,未经同意,禁止复制到本单位计算机内如遇特殊情况,必须由相应的信息管理部门人员使用最新版本的反病毒软件检测通过后,方可使用,检测人员及时做好来访和检测记录,以备查看8)服务器要尽量做到专机专用,特别是具有读写权限、身份确认功能的认证服务器一定要专用;对共享的网络文件服务器,应特别加以维护,控制读写权限,不在服务器上运行无关软件和程序9)随时注意计算机的各种异常现象,一旦发现,应立即用查毒软件仔细检查10)服务器要定期进行计算机病毒检查,系统中的程序要定期进行比较测试和分析;特别是邮件服务器发现病毒立即处理并通知上级管理人员11)一旦发现中心服务器有被侵入及恶意攻击的记录,应及时采取措施遏止并向主管领导报告;一旦发生计算机病毒疫情,要启动应急计划,采取应急措施,将损失降到最小12)发现或受到“计算机病毒”攻击后的管理措施当出现计算机病毒传染迹象时,立即隔离被感染的系统和网络,并进行处理,不应带毒继续运行;发现计算机病毒后,一般应利用防杀计算机病毒软件清除文件中的计算机病毒;杀毒完成后,重启计算机,再次用防杀计算机病毒软件检查系统中是否还存在计算机病毒,并确定被感染破坏的数据是否确实完全恢复;如果破坏程度比较严重,或感染的是重要数据文件,则自己不要盲目修复,而要请计算机病毒防范的专业人员处理,即使是计算机专业人员也要慎重;对于杀毒软件无法杀除的计算机病毒,应将计算机病毒样本送交有关部门,以供详细分析若发现网上有色情及政治敏感内容,及时报告有关部门处理13)单位应定期与不定期对制度的执行情况进行检查,督促各项制度的落实,并作为人员考核的依据.防雷管理的内容1)防雷装置应当每年检测一次,对爆炸和火灾危险环境场所的防雷装置应当每半年检测一次2)防雷装置投入使用后,应建立管理制度,指定专人负责,做好防雷装置的日常维护工作发现防雷装置存在隐患时,应当及时采取措施进行处理对防雷装置的设计、安装、隐蔽工程图纸资料、年检测试记录等,均应及时归档妥善保管3)每年雷雨季节前应对接地系统进行检查和维护主要检查连接处是否紧固、接触是否良好、接地引下线有无锈蚀、接地体附近地面有无异常,如果发现问题应及时处理4)接地网的接地电阻宜每年采用数字式接地电阻测量仪进行一次测量5)每年雷雨季节前应对运行中的防雷元器件进行一次检测,雷雨季节中要加强外观巡视,发现异常应及时处理6)当发生雷击事故后,应及时调查分析原因和雷害损失,提出改进防护措施设备遭受雷击后应对损坏情况进行调查分析,调查分析内容主要包括各种电气绝缘部分有无击穿闪络的痕迹,有无烧焦气味,设备元件损坏部位,设备的电气参数变化情况;各种防雷元件损坏情况,参数变化情况安装了雷电测量装置的,应记录测量数据,计算出雷电流幅值了解雷害事故地点附近的情况,分析附近地质、地形和周围环境特点及当时的气象情况保留雷击损坏部件,必要时对现场进行拍照或录像,做好各种记录根据上述调查情况,组织有关专家分析,写出调查分析报告及改进措施.软件安全管理的内容1)必须定期检查软件的运行状况,进行数据和软件日志备份2)禁止在正式运行的服务器上进行试验性质的软件调试,禁止在服务器上随意安装软件需要对服务器进行配置,必须在其他可进行试验的机器上调试通过并确认可行后,才能对服务器进行准确的配置3)对会影响到全局的软件更改、调试等操作应先发布通知,并且应有充分的时间、方案、人员准备,才能进行软件配置的更改目录第1章机房工程的管理技术制度与要求3机房管理科长和管理人员的岗位职责3机房管理科长岗位职责3机房管理科长的“三心”5管理人员岗位职责7机房内管理的内容8制定机房管理的规章制度8大、中型机房的日常维护工作管理的内容9大、中型机房的日常安全管理的内容11机房巡检的要求26机房巡检的具体内容27供配电巡检的具体内容27给排水巡检的具体内容29空调系统巡检的具体内容30消防巡检的具体内容31网络设备巡检的具体内容32机房环境巡检的具体内容35照明巡检的具体内容36防雷巡检的具体内容36机房巡检的台账内容37机房参观管理374)对重大软件配置的更改,应先形成方案文件,经过讨论确认可行后,由具备资格的技术人员进行更改,并应做好详细的更改和操作记录对软件进行更改、升级、配置等操作之前,应对更改、升级、配置所带来的负面后果做好充分的准备,必要时需要先备份原有软件系统和落实好应急措施
①制定周详的事前预防策略,具体如下对信息传递途径进行控制,实现通信设备和存储设备的控制;通过网络接入保护,实现外来计算机的接入局域网限制;安装严密的报警系统,对非法接入进行及时报警提示;制定周详的互联网信息传递阻断策略,对非法信息传递进行阻断
②对泄密行为进行事中记录和控制,具体如下对泄密行为及时启动控制和报警系统;对泄密过程进行屏幕记录,方便现场查看,事后录像回放;详尽的电子文档操作痕迹记录,包括访问、创建、复制、改名、删除、打印等操作;集中审查终端共享,防止共享泄密行为
③详尽的日志信息,提高事后追查的准确率,具体如下进行电子文档操作及屏幕记录,便于信息泄密事后追查;对互联网信息传递进行记录,便于信息泄密事后追查;对系统用户进行日志审计,实现系统安全管理5)不允许任何人员在服务器等核心设备上进行与工作范围无关的软件调试和操作未经机房管理人员允许,不能带领、指示他人进入机房和对网络及软件环境进行更改和操作6)系统管理员对业务系统进行数据整理、故障恢复等操作,必须有其上级授权7)系统管理员不得使用他人操作代码进行业务操作8)系统管理员调离岗位,上级管理员(或相关负责人)应及时注销其代码并生成新的系统管理员代码9)对数据实施严格的安全与保密管理,防止系统数据的非法生成、变更等严格按照专业备份要求管理机房管理人员应恪守保密制度,不得擅自泄露中心各种信息资料与数据,也要注意与外方合作工作时各种信息资料与数据的保密10)为确保数据的安全保密,对单位及内部人员送交的数据及处理后的数据都必须按有关规定履行交接登记手续.机房资料、文档和数据安全管理的内容1)资料、文档、数据等必须有效组织、整理和归档备案2)禁止任何人员将机房内的资料、文档、数据、配置参数等信息擅自以任何形式提供给其他无关人员或向外随意传播3)对于牵涉网络安全、数据安全的重要信息、密码、资料、文档等必须妥善存放外来工作人员的确需要翻阅文档、资料或者查询相关数据的,应由机房相关负责人代为查阅,并只能向其提供与其当前工作内容相关的数据或资料4)重要资料、文档、数据应采取对应的技术手段进行加密、存储和备份对于加密的数据应保证其可还原性,防止遗失重要数据5)服务器、路由器等重要设备的超级用户密码由指定专人(不参与系统开发和维护的人员)设置和管理,并由密码设置人员将密码装入密码信封,在驹•缝处加盖个人名章或签字后交给密码管理人员存档并登记如遇特殊情况需要启用封存的密码,必须经过相关部门负责人同意,由密码使用人员向密码管理人员索取,使用完毕后,须立即更改并封存,同时在“密码管理登记簿”中登记6)系统维护用户的密码应至少由两人共同设置、保管和使用密码应定期修改,间隔时间不得超过一个月,如发现或怀疑密码遗失或泄漏应立即修改,并在相应登记簿记录用户名、修改时间、修改人等内容7)机房内使用的文献、书籍和文具不允许私自带出8)存放备份数据的介质必须具有明确的标识备份数据必须异地存放,并明确落实异地备份数据的管理职责9)注意计算机重要信息资料和数据存储介质的存放、运输安全和保密管理保证存储介质的物理安全10)任何非应用性业务数据的使用及存放数据的设备或介质的调拨、转让、废弃或销毁必须严格按照程序进行逐级审批,以保证备份数据安全完整11)数据恢复前,必须对原环境的数据进行备份,防止有用数据的丢失数据恢复过程中要严格按照数据恢复手册执行,出现问题时由技术部门进行现场技术支持数据恢复后,必须进行验证、确认,确保数据恢复的完整性和可用性12)数据清理前必须对数据进行备份,在确认备份正确后方可进行清理操作13)需要长期保存的数据,数据管理部门需与相关部门制定转存方案,根据转存方案和查询使用方法要在介质有效期内进行转存,防止存储介质过期失效,通过有效的查询、使用方法保证数据的完整性和可用性转存的数据必须有详细的文档记录14)管理部门应对报废设备中存有的程序、数据资料进行备份后清除,并妥善处理废弃无用的资料和介质,防止泄密15)重要文件资料既要建立、保存文字资料,同时还要建立保存磁盘文件资料.电源及UPS管理的内容1)机房内的电源开关、电源插座要明确标出控制的设备2)在电源配电盘附近张贴电源系统图3)不得随便改变线路和变动开关4)保持适宜的环境温度影响蓄电池寿命的重要因素是环境温度,一般电池生产厂家要求的最佳环境温度是在20〜25℃之间虽然温度的升高对电池放电能力有所提高,但付出的代价却是电池的寿命大大缩短据试验测定,环境温度一旦超过25℃每升高10℃电池的寿命就要缩短一半UPS电源在正常使用的情况下,主机的维护工作很少,主要是防尘和定期除尘大量灰尘会造成器件散热不好一般每季度应彻底清洁一次其次就是在除尘时,检查各连接件和插接件有无松动和接触不牢的情况6)熟悉UPS的工作原理和操作规程7)需经常检查的项目有清洁并检测电池两端电压、温度;连接处有无松动,腐蚀现象;电池外观是否完好,有无壳变形和渗漏;极柱、安全阀周围是否有酸雾逸出;主机设备是否正常8)对UPS的工作异常情况要做好记录,并及时联系有关单位进行处理UPS应妥善保养,除了电池自动检测外,每3个月放电一次
10.空调管理的内容1)本着正确使用、安全管理、专人负责、中低运行、节约用电的原则,切实保障空调的有效使用和管理网络中心机房为保证设备良好的工作环境,应保持合适的机房温度和湿度,机房温度应保持在23℃~26℃机房湿度应低于70%o2)巡视监控当值管理员每隔2小时巡视一次中央空调机组,巡视部位包括中央空调主机、冷却塔、控制柜(箱)及管路、闸阀等附件巡视监控的主要内容如下检查线电压(正常380V不能超额定值的±10%)检查三相电流(三相是否平衡,是否超额定值)检查气压(正常500mmH20)o检查高压(<12kgf/cm2)o检查低压(>
2.5kgf/cm2)o冷却水进水温度(正常V32℃)冷冻水出水温度(正常6℃~8℃)o检查中央空调主机运转是否有异常振动或噪音检查冷却塔风机运转是否平稳、冷却塔水位是否正常•检查管道、闸阀是否有渗漏,冷冻保温层是否完好检查控制柜(箱)鉴别元器件运作是否正常,有无异常噪音或气味巡视过程中如发现上述情况有不正常时,当值管理员应及时采取措施予以解决,处理不了的问题应及时详细地向上级汇报整改时,应严格遵守《中央空调维修保养标准作业规程》3)中央空调机房管理具体内容如下非值班人员不准进入中央空调机房,若需要进入,须经工程部主管同意并在值班人员的陪同下方可进入中央空调机房中央空调机房内严禁存放易燃、易爆等危险品中央空调机房内应备齐消防器材、防毒用品,并应放置在方便、显眼处中央空调机房内严禁吸烟每班打扫一次中央空调机房的卫生,每周清洁一次中央空调机房内的设备设施,做到地面、天花板、门窗、墙壁、设备设施表面无积尘、无油溃、无锈蚀、无污物,表面油漆完好,整洁光亮中央空调机房内应当通风良好,光线足够,门窗开启灵活中央空调机房应当做到随时上锁,钥匙由当值班管理员保管,当值管理员不得私自配钥匙接班人员应准时接班,接班人员应认真听取交班人员交代,并查看《中央空调运行日记》,检查工具、物品是否齐全,确认无误后在《中央空调运行日记》表上签名对于中央空调的运行情况,当值管理员应及时、完整、规范、清晰地记录在《中央空调运行日记》表内,并于每月的2日之前把上一个月的记录整理成册后存档,并报一份到后勤管理处,保存期为2年4)定期进行日常巡视,确保空调系统的正常运行5)定期进行一次室外机的清理,防止因散热不良造成空调的工作异常6)每年进行一次全面检修机房巡检的要求机房巡检是机房管理的重要组成部分机房巡检人员在系统巡检计划的指导下完成巡检作业巡检对象主要是针对机房中比较重要、比较关键的设备目的是及时查找、发现信息系统设备隐患,排除故障机房巡检的设备不同、使用环境不同、季节不同,巡检的周期和频次也有所不同,如表8-1所示表8-1机房各系统设备巡检周期和频次巡检时需带巡检内容的常备工具,做到眼见、耳听、鼻闻、手摸、工具检查,加强对巡检设备关键内容的巡检力度,防患于未然机房巡检必须要有记录,巡检记录直接关联到巡检的效果管理人员利用巡检能够掌握机房运行情况,能更好地对数据进行客观的统计、研究,为领导作出迅速、准确的判断和决策提供科学依据巡检记录的覆盖面要全面,操作性要强巡检记录应在巡检期间填写,以记录时间为准,不得事后补填或超前记录巡检记录及时填写电子版以供做周汇报时附加;纸介质的巡检记录表必须妥善归档保存机房巡检的具体内容供配电巡检的具体内容供配电巡检具体内容如表8-2所示表8・2供配电巡检具体内容给排水巡检的具体内容给排水巡检具体内容如表8-3所示表8・3给排水巡检具体内容第1章机房工程的管理技术制度与栗求管理是为了实现预期的目标进行的协调活动为确保机房安全运转、工作有序开展、设备正常使用,机房需要制定管理规章制度机房管理就是对制定的规章制度执行、检查和改进执行就是按照制定的规章制度去实施;检查就是将执行的过程或结果与规章制度进行对比,总结出经验,找出差距;改进是通过检查总结出的经验,将经验转变为长效机制或新的规定,针对检查发现的问题进行纠正,制定纠正、预防措施随着云计算的发展,机房规模急剧扩大(大、中型机房通常是指面积数千至数万平方米)、机房数量不断增加,由小规模、封闭式、单一功能向大规模、开放式、多功能方向发展,机房管理更为重要机房管理水平的高低也直接影响着机房的使用率和使用寿命,机房管理应引起机房管理人员的高度重视机房管理科长和管理人员的岗位职责机房管理科长岗位职责机房管理科长(组长、主管领导或经理)是中心领导管理好机房日常运维工作的得力助手和参谋机房管理是管理科长日常工作的全职岗位,对于机房管理科长来说,机房管理是为了使机房设备正常运转,保障机房有良好的运行环境和工作环境机房管理科长的岗位职责要重点注意如下内容1)严格制度机房管理是一项看得见、摸得着的实际工作,面对诸多因素和关系,必须“严”字当头机房日常管理应根据实际需要,抓常规管理建立、健全计算机机房的各项规章制度是机房管理工作的前提制定相应的机房管理制度,使日常管理工作做到有章可循,有据可依2)严格管理作为部门领导一定要有从严管理的指导思想,要严格管理、严格要求,并使这种严格思想贯彻落实到管理工作的全过程,在实际工作中要
1.
4.3空调系统巡检的具体内容空调系统巡检具体内容如表8-4所示o表8-4空调系统巡检具体内容消防巡检具体内容如表8-5所示表8・5消防巡检具体内容网络设备巡检分工作状态巡查和网络设备具体内容的巡检.网络主要设备工作状态巡查为保证网络正常运行,需要每日分三次定期进行网络主要设备服务器、路由器、交换机、防火墙、磁盘阵列的工作状态巡查做好每日网络设备主要巡查和巡查记录网络主要设备工作状态巡查记录如表8-6所示表8-6网络主要设备工作状态巡查记录表.网络设备巡检具体内容每日分三次定期进行网络主要设备服务器、路由器、交换机、防火墙、磁盘阵列的具体内容巡检巡检具体内容如表8-7所a8-7网络设备巡检具体内容
1.
4.6机房环境巡检的具体内容机房环境巡检具体内容如表8-8所示表8・8机房环境巡检具体内容照明巡检具体内容如表8-9所示表8・9照明巡检具体内容
1.
4.8防雷巡检的具体内容防雷巡检具体内容如表8-10所示表8・10防雷巡检具体内容机房巡检的台账内容台账原是指摆放在台上供人翻阅的账簿,故名台账台账是明细记录表,为了加强某方面的管理、更加详细地了解某方面的信息而设置的一种辅助账簿没有固定的格式,没有固定的账页,可根据实际需要自行设计,尽量详细,以全面反映某方面的信息机房巡检台账如表8-11所示表8-11机房巡检台账表机房参观管理新一代的机房,普通人很难进入,为了让更多的人了解新一代的机房,同时也进一步提高员工的爱岗敬业意识,更好地宣传公司形象、发展公司新业务机房安排外来人员参观机房安排外来人员参观要注意如下7点1)外来人员参观机房,须有公司指定人员陪同2)计算机处理秘密事务时,不得接待参观人员或靠近观看3)操作人员按公司陪同人员要求可以在计算机演示、咨询;对参观人员不合理要求,陪同人员应婉拒,操作人员不得擅自操作4)经同意,参观人员可以实地操作计算机,但须有公司人员的认可,不得调阅公司机密文件5)参观人员不得拥挤、喧哗,应听从陪同人员安排6)参观结束后,操作人员应整理如常7)参观机房要填写登记审批表,机房维护人员负责登记、监督工作,确认无误后方可进入参观机房登记审批表如表8-12所示表8・12机房参观登记审批表注参观人员请勿携带物品进入机房,谢谢合作!常讲、常查,要不怕得罪人,必要时还要制定各种奖惩措施3)做好日常运维和巡检工作,包括配电、空调、消防等设施的检查工作4)不断学习机房管理牵涉面广,事务又多,是一项专业性强、“繁”、“杂”、“难”、“累”的工作,具有一定的不可预见性,且不同程度地存在技术难度目前国内许多报刊杂志包括互联网络中,有关机房管理的介绍层出不穷,机房管理科长需要有责任心和不断学习的进取心机房管理科长除了要掌握丰富的计算机软硬件知识和具有较强的动手能力外,还需要掌握一定的设备管理技巧学习各种设备如配电系统、地线系统、空调、防火设备、UPS等的正确操作方法从而杜绝因操作不当造成的人为事故不断学习,总结经验,取长补短,才能做好机房管理工作5)做好机房的防火、防盗及供电系统、空调系统、通风系统的安全和日常养护工作,提高安全意识定期检查安全设施情况,并做好记录,发现问题立即整改6)定期检修,重视完善机房以及有关设备也有老化、更新、修复等问题除进行日常的检修外,还应对机房建设时存在的缺陷,机件的磨损、老化,紧固件的松动,装修变形等问题定期检修、更改或完善坚持每年定期对机房整修一次,即检测安全防火设备、检修空调设备、除尘、玻璃隔断调整加固、照明设备检修、安全防盗、协调相关设备维修人员进行维修,安排好相关维修工作7)对于发生的故障与事故及时逐级上报,并做协调工作,做好故障与事故的记录工作,做好问题的分析和跟进处理工作8)完善电气系统设备技术档案和资料,建立相关管理制度、操作规程、应急预案等9)在制度化管理上下功夫,组织、指导、制定年度工作计划和各种操作规程、管理规定、岗位职责和安全责任制等,并监督落实,以实现科学、有序、安全的管理10)机房不能出现事故,加强巡视巡检要管理好机房不是一件容易的事情在条件许可的情况下,应建立经济合理的易损件、易耗件的备用库,保证及时更换,定期更换对设备的运行情况进行分析,制定预防和常用解决方案,从而保证机房的正常运转11)严格机房钥匙管理,机房钥匙只允许管理人员配带
1.
1.2机房管理科长的“三心”机房管理科长的三心即责任心、学习心、宽容心.责任心责任心主要有如下内容(D安全管理机房安全是第一位的,可以说是机房管理体系的灵魂威胁机房安全的因素主要有火灾、设备故障、病毒机房安全管理就是告诉人们,在进行机房管理的同时,通过采用计划、组织、技术等手段,依据机房、环境因素的运动规律,采取控制措施,预防事故的发生
(2)六个坚持六个坚持是指1)坚持管机房同时管安全;2)坚持按操作规程管理机房;3)坚持预防为主;4)坚持全员管理;5)坚持设备维护;6)坚持日常巡检工作
(3)四不放过四不放过是指在调查处理机房事故时1)必须坚持事故原因分析不清不放过;2)员工及事故责任人受不到教育不放过;3)事故隐患不整改不放过;4)事故责任人不处理不放过
(4)文明管理文明管理是指在管理时1)具有文明的措施(机房的各项规章制度);2)建立管理组织,明确岗位职责,健全管理制度(培训教育、检查、奖惩、卫生等专项管理制度);3)进行现场管理.学习心科长的大部分时间是做机房管理的实际工作他要不断地学习各种设备的正确操作方法和管理方法,管理的思维方式与知识结构要紧跟时代的步伐,并在技术上与项目一起成长只有这样才能让科长提高领导能力,在管理工作中伸展自如、张弛有度.宽容心科长要有宽容的心态,特别是对比较年轻的员工现在的员工都比较年轻没有社会的阅历,自我为中心的意识强、自尊心强,有时候会做出一些过分的行为当员工做了错事或工作中出现差错时,不要谴责,不要去追究责任作为科长,应该多花一些精力去关心员工,多给予理解,做到“宰相肚里能撑船”了解事情的起因,避免将来再犯错年轻员工有自己的长处和短处,要经常表扬他的长处,求同存异,具有一颗宽容的心.
1.3管理人员岗位职责机房日常运行、维护是管理人员的全取工作岗位管理人员的岗位职责需要重点注意如下内容D负责机房电气系统的运行、维护、保养、管理工作2)认真贯彻落实岗位责任制,遵守各项规章制度,严格执行操作规程和员工守则严格执行机房值班制度,做好值班记录;严格执行机房设备使用登记制度,做好设备登记工作3)熟悉设备操作规程,熟悉仪器仪表使用方法熟悉、掌握设备的原理、布置、控制、设备性能、使用状况及运维操作维护工作应遵循设备故障与维修的操作步骤、基本原则和维修方法进行机房应备有设备所用的各种零配件供维修使用4)服从领导的调度和工作安排,按时、按质、按量地完成任务,不擅自离岗和串岗,禁止在上班时间炒股、浏览无关新闻、网上游戏、看在线电影、听音乐等5)努力学习,不断提高思想素质和业务技术水平,全面熟悉管辖范围内的各种操作规程,提高工作效率、质量6)认真填写原始记录,分析设备运行情况,并掌握其规律,发现问题及时解决,准确无误地填制各种报表和表格7)勤巡查,发现问题及时向管理科长汇报,听取指示8)参与并协助设备的维护和保养工作设备发生故障及时组织检修,发现隐患及时组织处理,做好技术把关工作,保证所管辖系统设备处于优良的技术状态做到“三干净”(设备干净、机房干净、工作场地干净)、“四不漏”(不漏电、不漏油、不漏气、不漏水)、“五良好”(使用性能良好、密封良好、润滑良好、紧固良好、调整良好)9)发扬主人翁精神,开动脑筋,大胆提出合理化建议10)做好本班设备的年月检修保养计划和备品备件计划,报主管审核
1.2机房内管理的内容制定机房管理的规章制度建立健全计算机机房各项规章制度是做好机房管理的关键在机房日常管理工作中应根据系统的具体情况、工作性质,制定出一套完善的机房管理规章制度,以保证机房正常运行规章制度用来规范机房的管理,是机房管理的标准规章制度要通过日常工作中对它的执行来体现和完善机房管理制度一般包括管理科长岗位负责制、技术管理岗位职责、中心机房管理制度、安全运行管理制度、计算机病毒防范管理制度、安全管理制度、故障机维修登记制度、机房违章处理制度、机房巡检制度等有了章法,机房管理就有了依据,严格管理的指导思想也能落在实处大、中型机房的日常维护工作管理的内容大、中型机房的日常维护工作的管理要重点注意如下内容D保持机房整洁卫生,管理人员负责日常维护及机房卫生工作,做到一天一小扫,一周一大扫,保持机房清洁干净,防尘防潮,防止鼠虫进入2)不准在机房内会客,谢绝外单位人员进入机房,禁止聊天、喧哗、吃零食、抽烟、乱扔杂物等,保持机房整洁安静3)严禁携带易燃、易爆及强磁性物品进入机房4)设备一般不得用于私事,严禁在设备的计算机终端上玩游戏,禁止装入其他无关的软件或将计算机挪作他用5)日常检测,包括对设备运作情况及系统应用情况的检测
①设备运行情况检测每日分8次(每3小时)定时进行主要网络设备的检测做好每日网络巡查与服务器运行情况记录每日对外网服务器日志进行分析,对长时间扫描的IP做好记录,并采取跟踪,一旦发现问题及时处理,把隐患消灭在萌芽状态定期运用系统的网络监视器、网管软件,对网络漏洞进行自我扫描检测,进行分析,做好相应记录
②系统应用情况检测对应用软件要每天进行检测,及时升级,特别是防毒软件的升级各种应用功能配置参数进行修改时必须与值班人员一同进行,并登记记录新增加功能必须经过主管领导签字同意系统机房巡检周期和频次巡检人员供配电主机房1次/天管理人员和值班人员楼层分机房1次/天管理人员和值班人员给排水泵房1次/天管理人员和值班人员中央空调主机房1次/天管理人员和值班人员楼层分机房I次/天管理人员和值班人员通风主机房1次/天(运行期)管理人员和值班人员网络服务器运行状况8〜12次/天值班人员交换机运行状况8〜12次/天值班人员防火墙运行状况8〜12次/天值班人员环境主机房、分机房1次/天管理人员和值班人员照明主机房、分机房1次/天管理人员和值班人员防雷主机房、分机房2次/年(周期性维护)管理人员和值班人员主机房、分机房随时(雷雨季节)管理人员和值班人员巡检项巡检情况巡检情况摘要巡检人隐患是否要处理日期/时间两路市电切换醉七用路市电名称备用路市电名称当前的工作线路主用()备用()有无异常噪声无()有()倒换功能测试正常()不正常()是否有快相无()行()指示灯、指小表正常()不正常()保险丝接触器外观正常()不正常()巡检项巡检情况巡检情况摘要巡检人隐患是否要处理日期/时间交流稳压器交流输入电压(V)「山1交流输出电压(V)”K IlJ负载电流(A)1L L过压保护是否正常正常()不正常()错缺相保护是否正常正常()不正常()限位保护是否正常正常()不正常()手动自动开关是否正常正常()不正常()面板指示灯是否完好正常()不正常()电机、传动条润滑情况正常()不正常()各接线端子、空气开关是否良好正常()不正常()交流稳压器各相的电刷是否完好正常()不正常()机器门锁和外观正常()不正常()工作接地是否牢固正常()不正常()稳压精度设置是否1E确正常()不正常()交流配电屏工作电压(V)£1」工作电流(A)L LL接触吸合器是否正常1E常()不正常()延时继电器是否正常正常()不正常()避雷器是否完好正常()不正常()闪电告警是否正常正常()不正常()各保险丝是否完好正常()不正常()开关标签是否齐全完好正常()不正常()零地电压是否正常正常()不正常()空气开关是否过载正常()不正常()保护接地是否良好正常()不正常()延时和限压等范闱是否正确正常()不正常()巡检项巡检情况巡检情况摘要巡检人隐患是否要处理日期/时间变压器变压器三相温度是否在正常值内正常()不正常()是否有异味或者异声无()有()母排示温蜡片是否熔化是()否()接头处是否松动变色是()否()电流表、电压表、功率因索表等表计是否正常正常()不正常()柜内外是否整洁,电器元件是否异常正常()不正常()电容器是否有膨胀或漏油现象是()否()导线绝缘层是否有老化现象无()有()接地线是否松动或脱落是()否()模拟屏显示是否正常是()否()其他市电告警是否正常正常()不正常()电力引入线是否有破损过载发热、开关过载等现象无()有()电力线走线槽孔是否密封良好正常()不正常()走线盒是否良好接地无漏电正常()不正常()巡检项巡检情况巡检情况摘要巡检人隐患是否要处理日期/时间泵房泵房环境整洁度整洁()不整洁()手动试备泵是否正常正常()不正常()泵运转方向是否正确正确()不正确()家运行时盘根处滴水速度是否在正常范围内正常()不正常()有无异味、异声元()[()控制柜控制柜内外整洁度整洁()不整洁()控制柜仪表、指示灯等元器件是否完好正常正常()不正常()柜内导线是否老化松动£()有()管道是否有堵塞、泄漏现象X()有()闸门是否处于正常工作状态正常()不正常()状态牌是否挂好并与闸门的工作状态一致一致()不一致()巡检项巡检情况巡检情况摘要巡检人隐患是否要处理日期/时间管道管道橡胶软接头是否有龟裂现象无()有()止同阀是否完好是()否()排水速度是否正常正常()不正常()压力表是否完好是()否()水箱(池)检修出入口是否关门上锁是()杏()溢水口是否有水溢出是()否()管口防小动物网罩是否完好是()否()集水井案水井防护盖有无缺损无()有()井内是否有垃圾是()否()巡检项巡检情况巡检情况摘要巡检人隐患是否要处理日期/时间空调运转机号匚作电压(V)U.b正常()不正常()匚作电压(V)U.正常()不正常()匚作电压(V)u.r正常()不正常()工作电流(A)Ia正常()不正常()匚作电流(A)Ib正常()不正常()工作电流(A)Ic正常()不正常()空调是否结冰是()否()空谢的固定是否良好是()否()空气开关是否正常正常()不正常()机房温度(t)正常()不正常()排气压力(Mpa)正常()不正常()吸气压力(Mpa)正常()不正常()滤网是否清洁是()否()电路是否正常是()否()自动启动是否正常正常()不正常()空调主机运转是否有异常振动或噪声无()有()标签和外观是否齐好是()否()冷却塔冷却塔水位是否正常正常()不正常()冷却塔风机运行是令平稳平稳()不平稳()冷冻油油压、油位、油色是否正常正常()不正常()冷却水、冷冻水进出水压力、温度是否正常正常()不正常()冷却水泵、冷冻水泵运转是否正常正常()不正常()管道、阀门是否有渗漏现象是()否()冷冻保温层是否有破损是()否()阀门是否处于正常的工作状态是()否()控制柜(箱)控制柜(箱)指示灯及各电气元件是否正常正常()不正常()接线是否有松动脱落是()否()有无异味、异声无()有()火火器是否介格是()否()巡检项巡检情况巡检情况摘要巡检人隐患是否要处理日期/时间自动报警灭火控制部分气体灭火控制器功能是否完好是()否()设备有无积灰、锈蚀现象无()有()四是否有松动、脱落现象是()否()灭火器是否合格是()否()探测设备部分火灾探测器功能是否完好是()否()感烟探测器功能是否完好是()否()定温火灾探测器功能是否完好是()否()探测器连接线路是否完好是()否()探测器灵敏性是否完好是()否()控制器部分控制器接受火灾信号情况(包括探测、急启、急停、反愦)是否完好是()杏()控制器接受故障信号情况(包括探测、急后、急停,反愦、主备电、阀线)是否完好是()否()控制器联动性能及各个被联动器件的性能是否完好是()否()灭火装置灭火装置的喷口止前方
1.0m内是否有器具或其他阻碍物是()否()灭火装置是否受到雨淋、水浇、水淹等不利条件影响是()否()连接灭火装置的紧固件或支架的固定是否牢固.无松动现象是()否()灭火装置的线路连接和控制显示是否正常是()杏()灭火装置是否保持清洁.标牌、安全标志完好是()否()灭火装置的使用年限是否应符合产品说明规定到期应及时报废、更新是()否()报警手动报警按钮功能是否完好是()否()声光报警器功能是否完好是()否()警铃功能是否完好是()否()放气指示灯功能是否完好是()否()紧急启动/停止按钮功能是否完好是()否()设备匚作温度工作湿度工作电压电源状态PowerLED网络状态灯NICLED系统状态灯SYSLED服务器路由器交换机防火墙磁盘阵列巡检项巡检情况巡检情况摘要巡检人隐患是否要处理日期/时间防火墙网络通信状况正常)异常()网络流北大于0%小于80%正常:)异常()指小灯状况正常:)异常()交换机数据指示灯瞰正常:)异常()网络通信状况正常:)异常()交换机端俅况正.常)洋常()网线状况正常)片常()服务器检查主机后端电源模块状态灯(PowerLED)电赧块状态灯为电源当前的状态显示,接通电源并在关机状态时为绿色闪烁接通电源并在开机状态时为绿色常空1E常:)异常()前面板电源指示灯绿色常典表示机器处于开机状态;绿色闪烁表示机器处于休眠状态;总灭表示机器处于关机状态正常:)异常()巡检项巡检情况巡检情况摘要巡检人隐患是否要处理日期/时间服务器检查网络状态灯(NICLED)前面板带有板载网卜状态灯能够显示出主板自带网k的连接状态绿色闪烁表示有数据传输;绿色常亮表示此网k已连通网k接口的状态灯能够表现出网k当前的工作状态,在每个网口上会有一个状态灯(左边)和一个通信指示灯(右边)状态灯熄灭表示此时网络未连通或网口在系统中被屏蔽;状态灯绿色常亮表示网络已连通;状态灯绿色闪烁表示有数据传输,通信指示灯爆灭(同时左边的灯为绿色常亮或闪烁)表示网络为10Mbps;绿色常亮表示为100Mbps;橙色常亮表示为1000Mbps以上均为正常状态正常()异常()检筏系统状态灯(SYSLED)前面板系统状态指示灯绿色常亮表示机器系统正常;绿色闪烁表示机器处于degraded状态(例如CPUdisable)为非正常状态;橙色常亮、闪烁表示机器可能存在风扇、电压、温度的故障为非正常状态;POST时状态指示灯熄、灭去示机器有故障:POST报错为非正常状态后面板状态指示灯.与前面的状态指示灯功能相对应,正常状态为绿色常亮如有其他的状态(如:绿色闪烁、橙色常亮、橙色闪烁)表明机器为非正常状态正常()异常()检杳服务器硬柢的状态硬盘工作状态灯绿色闪烁表示硬盘在读写数据;烟灭表示硬盘空闲硬盘支架自带状态灯显示硬盘工作时的状态绿色状态灯闪烁表示硬盘在读取数据如果有硬盘损坏或掉线,那么此块硬盘的状态灯可能为橙色常亮(有时橙色闪烁)也可能状态灯不亮.这种现象出现时表示硬盘有问题.阵列已降级,为非正常状态正常()异常()巡检项巡检情况巡检情况摘要巡检人隐患是否要处理日期/时间服务器服务器其他状态指示灯光驱状态灯光驱在工作时光驱状态灯会闪烁.通常情况下此灯不亮某些赛扬的服务器光驱已经被禁用表现为在Win-dows的设备管理器中光驱被禁用,有感叹号的图标此为正常现象LAB和PDC中某些机器随着应用的不同可能还会配有光纤卡光纤卡的状态与网R状态类似,光纤R的连通状态灯为绿色,通信灯为橙色.有数据通信时通信灯会闪烁正常()异常()系统事件:无错误事件与不明登录事件正常()异常()日志文件设置以及运行正常数据量正常正常()异常()磁盘卷组无处于失效状态的逻辑卷正常()异常()功能机房内是否能正常登录;通过远程是否能正常访问;文件功能是否正常正常()异常()数据备份最近备份时间年月日正常()异常()日志检直检杳系统日志文件有无错误信息有()无()路由器数据指示灯状况正常()异常()网络通信状况正常()异常()路由器端口状况正常()异常()网线状况正常()异常()磁盘阵列数据指示灯状况正常()异常()网络通信状况正常()异常()磁fit阵列端口状况正常()异常()网线状况正常()异常(巡检项巡检情况巡检情况摘要巡检人隐患是否要处理日期/时间机房环境温度是否正常是()否()湿度是否正常是()否()机房是否清洁是()否()机房是否异晌是()否()机房是否异味是()否()机房门窗开启、关闭是否正常是()否()天花板、地面、墙壁是否清洁是()否()窣内照明亮度和灯管是否正常是()否()插座及开关是否正常是()否()稳压器设备是否清洁是()否()周围有无渗水现象是()否()门禁告警是否正常是()否()巡检项巡检情况巡检情况摘要巡检人隐患是否要处理日期/时间正常照明分区控制是否正常完好是()否()分路控制是否正常完好是()否()分组控制是否正常完好是()否()应急照明疏散照明是否正常完好是()否()安全照明是否正常完好是()否()备用照明是否正常完好是()否()应急灯是否完好是()否()巡检项巡检情况巡检情况摘要巡检人隐患是否要处理日期/时间防雷装置外部防雷装置是否发现有脱焊、松动和锈蚀避雷针、避雷带(网、线)、杆塔和引下线是否有腐蚀情况避雷针、避雷带(网、线)、杆塔和引下线是否有机械损伤内部防雷装置和设备(金属外壳、机架)等电位连接连接处是否有松动或断路浪涌保护器浪涌保护器是否有接触不良浪涌保护器漏电流是否过大、发热浪涌保护器绝缘是否良好浪涌保护器积尘是否过多接地接地是否发现有脱焊、松动和锈蚀、接触不良接地绝缘导线的绝缘层是否有老化、色裂现象巡检项目巡检内容隐患内容排查结果巡检人日期/时间隐患处理人供配电给排水空调系统消防网络设备机房环境照明防雷••••••参观人员单位参观时间自年月日时分至年月日时分参观人数参观内容参观人员名单陪同人员姓名/部门运维负责人签字(盖章)/日期。