在H80安装AIX5L 5.3导致E443故障

一台H80(p660 7026-6H1),之前运行AIX 5.1,客户要求重新安装AIX5.3后装Oracle和WebSphere。但是之前不知道H80不支持AIX 5.3,于是导致读安装介质后服务器挂起(可能是介质里的信息和微码有冲突),LED代码为E443,手动重启,按reset,断电再加电后再重启都无济于事(SMS没试),冒汗。上网一查才知道,H80必须要升级Firmware才可以支持AIX5.3(以前确实不知道,手里的十几台H80跑的都是5.1),而且版本必须是CM040712(Added support for AIX 5.3)或更高的才行。没办法,必须先让机器启动到先前的5.1下才好升级Firmware。又搜了一下,跟我一样的衰人还真不少,原来要解决E443问题除了断掉电源之外还得把电池也拿掉。赶快查H80的文档(SA38-0566-02),436页,电池在I/O柜的PCI板上。机柜上没装一条滑轨,还码得密密实实的,开了盖也没办法下手,费了半天劲儿才在同事的帮助下把那台H80的I/O柜子抽出来一半,刚好能看到电池(钮扣电池),下手把它扣了下来,然后两个人站在那冒汗。等了几分钟,再把电池扣上。都拾掇好后加电重起,果然OK,系统终于能够正常启动到旧的5.1下了。(放电后日期需要重设)

升级微码:

1. 先登录到服务器查一下目前的Firmware版本。
web-pub-01[/]#lscfg -vp|grep -F .CM
ROM Level.(alterable).......CM020916
或者:
web-pub-01[/]#lscfg -vp | grep -p alterable
10/100 Mbps Ethernet PCI Adapter II:
Part Number.................09P5023
FRU Number..................09P5023
EC Level....................H10971A
Manufacture ID..............YL1021
Network Address.............000255AFB2BC
ROM Level.(alterable).......SCU004
Product Specific.(Z0).......A5204206
Device Specific.(YL)........U0.1-P1-I2/E1

System Firmware:
ROM Level.(alterable).......M2P020910
Version.....................RS6K
System Info Specific.(YL)...U0.1-P1/Y1
Physical Location: U0.1-P1/Y1

SPCN firmware:
ROM Level.(alterable).......0000CMD02252
Version.....................RS6K
System Info Specific.(YL)...U0.1-P1/Y3
Physical Location: U0.1-P1/Y3

Platform Firmware:
ROM Level.(alterable).......CM020916
Version.....................RS6K
System Info Specific.(YL)...U0.1-P1/Y2
Physical Location: U0.1-P1/Y2

2. 到http://www-912.ibm.com/eserver/support/fixes/ 下7026-6H1的Firmware,最新的是CM060505,建议下AIX的,不要下DOS的。下完后FTP到服务器上。

3. 释放文件。
web-pub-01[/]#ls -l 7026HM80.BIN
-rw-r----- 1 root system 4475976 Jan 01 08:23 7026HM80.BIN
web-pub-01[/]#chmod u+x 7026HM80.BIN
web-pub-01[/]#./7026HM80.BIN
UnZipSFX 5.51 of 22 May 2004, by Info-ZIP (
http://www.info-zip.org).
inflating: CM_MM_060505.img
web-pub-01[/]#ls -l CM_MM_060505.img
-r-xr-xr-x 1 root system 5104410 Jun 24 2006 CM_MM_060505.img

4. 下面的一步至关重要,一定要做,否则哭都来不及。
web-pub-01[/]#sum CM_MM_060505.img
28838 4985 CM_MM_060505.img

将sum的结果(28838)和网站上这个版本Firmware的说明页中“Firmware Levels, File Sizes and Checksums Table”的File Sizes和Checksums仔细核对,确认无误后再做下面的事情,切记,切记!

5. 确认无误后执行下面的命令。 web-pub-01[/]#cd /usr/lpp/diagnostics/bin
web-pub-01[/usr/lpp/diagnostics/bin]#./update_flash -f /CM_MM_060505.img

***** WARNING: Continuing will reboot the system! *****

Do you wish to continue?
Enter 1=Yes or 2=No

(焚香沐浴后....)回车,系统会自动重启。

6. 等一会,如果成功,系统会正常启动。(还好,到目前为止,刷的十台机器还没失手过,感觉只要严格地执行第4步的校验,应该不会有什么问题。)

7. 机器重启后登录系统,检查Firmware是否已经更新。
web-pub-01[/]#lscfg -vp|grep -F .CM
ROM Level.(alterable).......CM060505
或者:
web-pub-01[/]#lscfg -vp | grep -p alterable
10/100 Mbps Ethernet PCI Adapter II:
Part Number.................09P5023
FRU Number..................09P5023
EC Level....................H10971A
Manufacture ID..............YL1021
Network Address.............000255AFB2BC
ROM Level.(alterable).......SCU004
Product Specific.(Z0).......A5204206
Device Specific.(YL)........U0.1-P1-I2/E1

System Firmware:
ROM Level.(alterable).......M2P060505_condor_
Version.....................RS6K
System Info Specific.(YL)...U0.1-P1/Y1
Physical Location: U0.1-P1/Y1

SPCN firmware:
ROM Level.(alterable).......0000CMD02252
Version.....................RS6K
System Info Specific.(YL)...U0.1-P1/Y3
Physical Location: U0.1-P1/Y3

Platform Firmware:
ROM Level.(alterable).......CM060505
Version.....................RS6K
System Info Specific.(YL)...U0.1-P1/Y2
Physical Location: U0.1-P1/Y2

8. 再次安装AIX 5.3,一切正常了。

经验总结:
1. 其实从网上找到的都是F85出现的这种问题,估计老型号的RS/6000都可能存在类似的问题,毕竟他们横行的时候AIX还没有到5.3。
2. 如果用FTP命令上传Firmware文件时一定要使用Binary模式(BIN),多数升级Firmware失败都是忽略了这个问题。使用FTP客户端应该可以自动识别文件类型,不过还是千万不要忘了sum校验这一步。
3. 升级Firmware的确可以解决系统(特别是硬件)的一些莫名其妙的问题。
4. 遇到问题千万要冷静,上网查查,不但可以少走弯路,还能节约大量的时间。
5. 不管是做系统、还是做数据库的,虽然总感觉机器里几十G的文档是鸡肋,但是最好还是留着吧,不一定什么时候就能用到,到时候现找又是麻烦事。
 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章