一次硬件故障处理后的总结

背景:

       主库切换到备库机房后,数据读写和业务处理都比主库机房慢很多,结合之前几个月备库机房的这6台主机经常出现重启现象,因此怀疑是硬件问题

过程:

       忽略,总之是测试过很多次,测试过光交,换过模块,修改过多路径配置等等,最后是替换了一个光交,问题解决

总结:

       1.一定是要做好分析,列出所有可能存在的故障点,再决定怎么去测试,不能闭着眼就去测试去了

       2.测试时一定要做好记录,测试的是什么场景,预期会出现什么结果,实际会出现什么结果,不记下来只靠脑子记,两天之后就记不清了

       3.如果是长时间的现场操作最好是两人一起,一人操作一人review,之前有次就是信心满满,结果到最后稀里糊涂的就插错了一次线

       4.测试还是要充分考虑概率因素对结果的影响,有条件的话最好是多次测试确认,不能是测试一次结果是自己想要的,就“失去理性”了

       5.相信科学,反对迷信

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章