搞定后原以为万事大吉了,发觉一启动还是回到了gub报错状态,呵呵,看来还要想心思;不选择"克隆结束后重启计算机",这样才能回到Dos界面下,选择一款MBR修补软件,diskgen或spfdisk即可;或直接fdisk/mbr;也许还有个办法也可行:在“grub>”提示符后输入:“rootnoverify(hd0,0)”回车将第一块硬碟(hd0)的第一个分区(0)设为根分区/root设备,但不加载文件系统;在“grub>”提示符后输入:“chainloader+1”回车,将启动引导权转交给当前分区的首磁道(Windows系统所在分区的首磁道)。
虽然,这只是一个很简单的、常遇到的grub错误,只要有dos引导盘即可,但关键是我的工作机比较老,即无硬盘、软驱,连U盘引导也不支持,假如网路引导也不支持的话,可以用第二种办法尝试(或则强悍的Linux命令dd)。修补后重启,故障排除;将以上步骤记录下,便捷上次错事时能迅速排障和重温习下网路Ghost。
故障四、
有台同学在处理Linux服务器时,他移走了一块硬碟,之后就直接启动红帽RHEL5,发觉进了Emergency模式,急切中他急忙跑过来找我;我第一句就是问他:你改动了硬件没,他说他移走了硬碟后就直接启动了,不是跟windows2003一样嘛,有哪些问题?我都无语了,没办法,耐心跟他讲解linux下/etc/fatab的作用及句型安装linux后风扇不转动,最后告诉他可以在Emergency模式下输入root密码步入此模式,之后用mount–oremount,rw/将/分区设置成可读写,编辑/etc/fatab,将移除的硬碟用#号屏蔽掉后重启服务器,故障解除。
故障五、
FreeBSD下的某台jail虚拟机,可能发生了程序错误产生了死循环安装linux后风扇不转动,在不停的写某个文件,引起/usr占满,此时Nagios狂报案;这时侯须要快速将其抓取下来,这时侯可以先新建一个测试文件touchtest,之后用命令find/-newertest,为了证明其通用性,我特的选择了FreeBSD服务器
……
以上仅仅只是我遇见的形形色色的各类Linux/unix服务器故障之一二而已,我总结了下平常Linux/unix应当注意的事项:
①服务器中最容易坏掉的是吊扇,倘若是联通机房要注意检测;假如是自己外网服务器机房,平常注意将体温控制在19度以下即可;
②DELL的机器的RAID卡放电和充电都是正常现象,假如有Nagios报案也是正常的;
③有时间就多巡视下机房,检测下服务器的硬碟灯指示情况;
④注意网线不要松脱了,不然你使用Heartbeat的服务器就很麻烦了;
⑤平时假如有时间和机会,可以作一些关于Keepalived和Heartbeat的模拟故障实验,保证其高可用性。
⑥虚心学习网路相关方面的知识和疑难问题,有时绝大多数的问题是网路方面造成来的;另外,联通通常会封掉80端口的,就不要在这种问题上苦恼了。
遇见服务器故障时,一定要胆大心细,慎重操作,由于有时是线带环境,稍有不慎就灰飞烟灭了,多总结多思索,这样就能成长得更快。
相关链接:
明明白白你的Linux服务器——技巧篇
摘要:在Linux/unix服务器的维护过程中,遇见各类各样的问题;在本文中主要为你们介绍了五个常见故障以及故障的解决方案,有的严重,有的挺好解决,有的解决过程我就记录出来与你们分享下,希望能给你们带来帮助。
故障一、
明天早晨来的第一件事,就是检测明天早上刚才重新安装的一台64位的CentOS5.5服务器,那台服务器是四块硬碟作的二个RAID1,一个专用于OS,一个用于data,
在安装系统的过程中,为了不损失数据,data分区我碰也碰过,明天用root进系统后,我用mount/dev/mapper/ddf1_datap1/data进行挂载,很顺利的挂载起来了,结果进去用ll命令一看,我靠,文件全出错了,都不正常了,吓我一跳,data分区里有的数据很重要,非常是mysql数据库,我问了下同学,同学也不是太清楚哪些回事,我忽然想起,这个是不是没正确挂载的缘由,所以将其写进/etc/fstab里,如
/dev/mapper/ddf1_datap1/dataext3defaults00
你们别小看defaults选项,这个默认会作许多事情的,reboot后一切正常,虚惊一场,特此记录心得,希望也给你们带来帮助;最后是将所有的数据备份后再仔细的fsck一遍,确认无误再进行挂载。
故障二、
故障描述:我们的jail母机192.168.21.36,因root的设置成的bash,而其依赖的库文件libintl.so.8发生遗失,造成了root不能登入,具体报障如下:
/libexec/ld-elf.so.1:Sharedobject"libintl.so.8"notfound,requiredby"bash"
Connectionto192.168.21.36closed.
解决方式如下:
1.用单用户模式步入系统;
2.扫描c盘(此步非做不可,并且是安全的)
fsck-y
3.将文件系统重新挂载
mount-a
4.将root的默认shell切换到sh
chsh-ssh
重启后一切正常
故障三、
在某台工作机上,不留神删掉了GRUB所在的分区如何办?明天闲来无事,不留神删掉了grub所在的分区/dev/hdb8,由于装的是windows2003和Centos5.3双系统,搞得连windows也进不了,想想看这早已是第二次错事了。由于我的工作机上没有硬盘和光驱(原先本着经济的原则配置的),先前是借他人的硬盘,莫非此次又要借,不行,我一定要自己想办法搞定了。花了不少时间把我的台电酷闪8G的硬盘量产成了USB-CDROM+USB-HDD双启动的硬盘linux site:infoq.cn,工作机竟然不支持,晕。天寒地冻的,莫非真要出门,突然想起了,工作站支持网路引导linux运维面试题,呵呵,那就应当有办法了。请出心爱的网刻软件MaxDOS_71PXE_G115.exe,以下为实验步骤截图: