还剩1页未读,继续阅读
文本内容:
运维巡检工作内容运维巡检作为一项重要的自动审核活动,一般包括计算机系统、网络及其他信息系统的相关任务,运维巡检的目的是以确保系统可用性、安全性和可靠性为前提,定期进行系统巡检,发现系统的存在的问题,以便及时发现和修复问题本文基于常见的运维巡检框架,介绍了运维巡检的常见内容,以期帮助运维人员更好地做好系统巡检工作
一、硬件部分硬件巡检主要是针对物理系统,例如服务器、网络设备、存储设备等,硬件巡检主要涉及服务器、硬盘、内存、网络通讯、内置备份设备等,巡检项目包括但不限于
1、硬件状态检查检查服务器、硬盘、内存等硬件是否正常运行;
2、机箱温度检查监控服务器机箱内部温度,以确保服务器处于正常环境;
3、硬件运行状态检查检查网络通讯、内置备份设备、磁带库等硬件的运行状态;
4、服务器电源检查监控服务器电源的状态,并检查是否有故障等情况发生;
二、软件部分软件巡检主要是针对系统软件、中间件、应用软件等,主要巡检项目包括:
1、系统软件版本检查检查系统软件的版本是否是最新的,以便及时更新系统软件;
2、中间件及应用软件版本检查检查集群中间件及应用软件的版本是否是最新的,以便及时更新中间件及应用软件;
3、日志检查检查服务器及中间件日志是否有异常,并进行分析;
4、软件许可证检查检查软件许可证是否有效,以及是否比现在使用的软件版本更新;
5、软件安全检查检查系统和中间件安全配置,以确保安全正常运行;
三、其他系统检查除了以上提到的硬件及软件巡检外,还有一些其他系统需要巡检,例如
1、网络检查检查节点之间的网络状态,以及网络安全状况;
2、备份检查检查备份系统是否正常,以及是否有备份数据丢失等情况;
3、监控检查检查监控系统是否正常,是否有系统报警发生;
4、日历计划检查检查日历计划是否正常执行,以及是否有计划任务未能正常执行的情况;
5、容量管理检查检查系统是否运行正常,以及容量管理磁盘是否不足;运维巡检作为日常运维工作的重要组成部分,主要是定期审计和检查系统、网络及其他信息系统,对系统的可用性、安全性及可靠性起到重要作用正确理解运维巡检所涉及到的内容,以及合理安排巡检内容和巡检项,这样才能确保系统可以安全、可靠、稳定地运行,为企业的正常运营提供可靠的保障。