AIX操作系統下應用系統的維護與性能優化

應用維護是一項細緻的工作，在工作中除了要求技術人員工作嚴謹、認真負責外，還要求技術人員必須具備在各種突發事件中較高的處理能力和工作經驗。隨着工商銀行兩大數據中心的建立，工行核心業務數據集中到數據中心，各一級分行的工作重點轉移到櫃面業務系統、綜合前置系統和歷史數據查詢系統等外圍系統的維護工作方面，其中ＡＩＸ操作系統在工行的使用比較廣泛。在應用維護方面，工行使用ＡＩＸ操作系統的應用主要有：綜合前置系統、跨行支付系統、客戶對賬系統、歷史數據查詢系統、國際業務結算系統５個應用系統。通過幾年來的工作實踐，我們積累了一些ＡＩＸ操作系統環境下應用系統的維護及性能優化的經驗，歸納爲５個方面，供同行借鑑。

　　
　　一、ＡＩＸ系統數據安全措施
　　在ＩＢＭ小型機硬件配置期間，就應該考慮數據的安全性，系統資源的配置要滿足容錯處理的要求。主要應考慮以下幾點：

　　①生產主機發生硬件故障後，備機可以馬上自動接管應用系統；
　　②提高操作系統的硬件冗餘，儘量減少單點故障對系統的影響；
　　③加強系統備份，減少系統版本升級造成的影響。
　　針對以上要求，可以採取一些安全措施，主要是硬件資源的冗餘備份、系統軟件和應用軟件的合理分佈以及高可靠性集羣軟件的使用。我們的經驗是：把ＡＩＸ操作系統和ＨＡＣＭＰ（ＨｉｇｈＡｖａｉｌａｂｉｌｉｔｙＣｌｕｓｔｅｒＭｕｌｔｉ－Ｐｒｏｃｅｓｓｉｎｇ）軟件安裝在ｒｏｏｔｖｇ上，因爲ｒｏｏｔｖｇ損壞，系統將無法運行，即使通過備份磁帶恢復，也會造成系統停機。因此在磁盤空間充裕的情況下，可考慮對ｒｏｏｔｖｇ作鏡像。具體做法是將主機的兩塊內置硬盤做ｒｏｏｔｖｇ鏡像，這樣可提高系統的安全性，防止單塊硬盤損壞對系統的影響，即使內置硬盤壞了一塊，系統仍可正常運行。在建立ｒｏｏｔｖｇ鏡像時，應儘量使用連接在不同ＳＣＳＩ上的硬盤，以做到負載均衡。另外，爲提高系統的容錯能力，可對磁盤陣列上的硬盤進行鏡像配置（ＲＡＩＤ０）或ＲＡＩＤ５冗餘配置，配置爲ｄａｔａｖｇ，在上面安裝數據庫和應用程序。爲提高節點可靠性，可搭建ＨＡＣＭＰ集羣環境，做到雙機熱備，即在２臺互爲備份的主機上配置ＨＡＣＭＰ參數，滿足系統熱備要求。在日常操作方面，要做好系統備份工作，定期對生產機做兩個或兩個以上的介質備份。
　　
　　１．ｒｏｏｔｖｇ的配置
　　將ｈｄｉｓｋ０和ｈｄｉｓｋ１做成ｍｉｒｒｏｒ，配置爲ｒｏｏｔｖｇ。
　　①把ｈｄｉｓｋ０、ｈｄｉｓｋ１加到ｒｏｏｔｖｇ：ｓｍｉｔｔｙｅｘｔｅｎｔｖｇｈｄｉｓｋ１、ｈｄｉｓｋ０ →ｒｏｏｔｖｇ。
　　②做ｍｉｒｒｏｒ：ｍｉｒｒｏｒｖｇ－ｃ２ｒｏｏｔｖｇ。
　　③在ｈｄｉｓｋ０、ｈｄｉｓｋ１上創建ｂｏｏｔＩＭＡＧＥ：ｂｏｓｂｏｏｔ－ａｄｈｄｉｓｋ０，ｂｏｓｂｏｏｔ－ａｄｈｄｉｓｋ１。
　　④改變啓動設備的順序：ｂｏｏｔｌｉｓｔ－ｍｎｏｒｍａｌｈｄｉｓｋ０，ｈｄｉｓｋ１ｃｄ０
　　
　　２．ＨＡＣＭＰ工作原理
　　ＨＡＣＭＰ主要是對羣集（ｃｌｕｓｔｅｒ）資源的管理，根據應用複雜程度和配置的不同，其羣集資源的接管時間在３０秒到３００秒不等，完全不需要人工干預。一個羣集中的資源通常包括：應用程序、硬盤、卷組（ＶＧ）、文件系統、ＮＦＳ文件系統、ＩＰ地址等。資源分屬三類資源組（ＲｅｓｏｕｒｃｅＧｒｏｕｐ）：層遞式（Ｃａｓｃａｄｉｎｇ）、替換式（Ｒｏｔａｔｉｎｇ）、同時存取式（Ｃｏｎｃｕｒｒｅｎｔ）。不同類型的資源組對應不同的接管方式。一個羣集中可以有幾個資源組，它們可以分別是不同類型，因此，資源接管的方式可以多種多樣，配置十分靈活。
　　我們一般採用的是層遞式方式，即熱備份工作方式，其工作原理是：ＮｏｄｅＡ和ＮｏｄｅＢ都是資源組ａ的成員，該資源組ａ被設置成層遞式方式，ＮｏｄｅＡ對其擁有最高優先級。因此ＮｏｄｅＡ在羣集中處於ａｃｔｉｖｅ狀態時，它會控制資源組ａ中的所有資源，此時ＮｏｄｅＢ處於閒置（ｉｄｌｅ）狀態，僅當ＮｏｄｅＡｄｏｗｎ掉時，ＮｏｄｅＢ纔會接管資源組ａ，一旦ＮｏｄｅＡ重新加入羣集，ＮｏｄｅＢ將釋放資源組ａＮｏｄｅＡ重新取得控制權。ＮｏｄｅＢ發生任何故障，不會造成任何影響。

　　
　　二、ＡＩＸ系統維護經驗
　　
　　１．故障信息的收集
　　收集故障信息對於判斷、診斷故障原因，修復系統非常重要。我們通過檢查系統錯誤報告ｅｒｒｏｒｌｏｇ、發給ｒｏｏｔ用戶的錯誤報告ｍａｉｌ和檢查ｈａｃｍｐ．ｏｕｔｓｍｉｔ．ｌｏｇｂｏｏｔ．ｌｏｇ等內容來判斷系統是否發生故障，根據故障信息進行相應的處理。
　　（１）系統故障記錄
　　ｅｒｒｄｅｍｏｎ進程在系統啓動時自動運行，記錄包括硬件、軟件及其他操作信息，故障記錄文件爲/ｖａｒ/ａｄｍ/ｒａｓ/ｅｒｒｌｏｇ，可備份下來或拷貝到別的機器上分析，使用ｅｒｒｐｔ命令（普通用戶權限也可使用）。
　　＃ｅｒｒｐｔ｜ｍｏｒｅ列出簡短出錯信息
　　＃ｅｒｒｐｔ－ｄＨ列出所有硬件出錯信息
　　＃ｅｒｒｐｔ－ｄＳ列出所有軟件出錯信息
　　＃ｅｒｒｐｔ－ａｊＥＲＲＯＲ＿ＩＤ列出詳細出錯信息
　　（２）控制面板上的ＬＥＤ代碼
　　（３）ＳＭＳ（ＳｙｓｔｅｍＭａｎａｇｅｍｅｎｔＳｅｒｖｉｃｅ）故障記錄
　　當主控臺出現鍵盤圖標後（ＬＥＤ顯示“Ｅ１Ｆ１時”）按１鍵。選擇“Ｕｔｉｌｉｔｉｅｓ”，選擇“ＥｒｒｏｒＬｏｇ”，抄下８位故障代碼。
　　（４）Ｍａｉｌ檢查
　　系統出現故障後會向ｒｏｏｔ用戶發ｍａｉｌ，報告出錯信息。通常系統出現故障後沒有進行檢查修復，系統還會定時以ｍａｉｌ方式提醒ｒｏｏｔ用戶。
　　（５）運行故障診斷程序
　　對系統硬件進行檢查和診斷，當發現有硬件故障時應立即使用ｄｉａｇ。
　　＃ｄｉａｇ
　　＞選高級診斷（ＡｄｖａｎｃｅｄＤｉａｇｎｏｓｔｉｃ）
　　＞選問題診斷（ＰｒｏｂｌｅｍＤｅｔｅｒｍｉｎａｔｉｏｎ）或選系統檢查（ＳｙｓｔｅｍＶｅｒｉｆｉｃａｔｉｏｎ）
　　ｄｉａｇ運行後會給出ＳＲＮ代碼、故障設備名稱及百分比數、地址代碼等。
　　（６）其他用於收集系統信息的命令
　　ｌｓｄｅｖ－Ｃ系統設備信息
　　ｌｓｐｖ查看物理卷信息
　　ｌｓｖｇ查看卷組信息
　　ｌｓｌｐｐ查看文件組信息
　　ｌｓａｔｔｒ查看設備參數設置
　　ｌｓｃｆｇ查看ＶＰＤ（ＶｉｒｔｕａｌＰｒｏｄｕｃｔＤａｔａ）信息
　　
　　２．系統硬件故障定位
　　    ＩＢＭ小型機硬件故障定位方法包括小型機機櫃上的顯示面板上的Ｃｈｅｃｋｐｏｉｎｔｓ信息，ＥｒｒｏｒＣｏｄｅ和ＳＲＮｓ。Ｃｈｅｃｋｐｏｉｎｔｓ檢查點是系統加電ＣＭＯＳ初始化程序   （ＩＰＬ，ＩｎｉｔｉａｌＰｒｏｇｒａｍＬｏａｄ）運行後顯示在機櫃的顯示面板上一系列信息。
　　    ＩＰＬ流程如下：當系統加電後，自動進入ＩＰＬ流程，ＩＰＬ流程包括４個步驟，
　　①ＳｅｒｖｉｃｅＰｒｏｃｅｓｓｏｒ的初始化，始於系統加電，直到ＯＫ顯示在機櫃上的顯示面板上爲止。這個步驟會顯示８ｘｘｘ或９ｘｘｘｃｈｅｃｋｐｏｉｎｔｓ代碼。
　　②由ＳｅｒｖｉｃｅＰｒｏｃｅｓｓｏｒ引導的硬件初始化，始於按下機櫃上的白色電源開關。這個步驟會顯示９ｘｘｘｃｈｅｃｋｐｏｉｎｔｓ。“９１ＦＦ”是最後的代碼，標誌着第３步的開始。
　　③系統固件的初始化，一個系統處理器接管控制並繼續初始化系統資源，這個步驟會顯示Ｅｘｘｘ。“Ｅ１０５”是最後的代碼，標誌着第４步驟ＡＩＸ啓動的開始。在這個過程中還會顯示各種位置碼（位置碼代表着系統的每一個部分）。
　　④ＡＩＸ啓動，當ＡＩＸ開始啓動時，顯示面板上的代碼爲０ｘｘｘ，同時位置碼會出現在第二行。當ＡＩＸ的登錄窗口出現在控制檯上時，第４步驟結束，同時顯示面板上再無任何信息顯示。
　　    當系統運行發現錯誤時，ＳＲＮｓ碼（Ｓｅｒｖｉｃｅｒｅｑｕｅｓｔｎｕｍｂｅｒｓ，服務請求碼）會以ｘｘｘ－ｘｘｘ的形式顯示在顯示面板上，同時在ＡＩＸ的ｅｒｒｏｒｌｏｇ中也會進行登記；當ＳＳＡ磁盤櫃出現故障時，在磁盤櫃前面板的液晶顯示屏上會顯示相應的ＳＲＮｓ，同時黃色的顯示燈會閃動，在ＡＩＸ的ｅｒｒｏｒｌｏｇ中會登記相應錯誤信息，在出現問題後記錄下代碼，並告之ＩＢＭ公司解決。
　　
　　３．軟件問題處理
　　軟件故障情況錯綜複雜，下面列舉幾個常見的故障處理方法。
　　（１）文件系統空間不夠
　　查看有沒有“滿”的文件系統。特別是/、/ｖａｒ、/ｔｍｐ，不要超過９０％。文件系統滿可導致系統不能正常工作，尤其是ＡＩＸ的基本文件系統。如/ 根文件系統滿則會導致用戶不能登錄。用ｄｆ－ｋ查看。
　　＃ｄｆ－ｋ查看ＡＩＸ的基本文件系統
　　除/ｕｓｒ文件系統，其他文件系統都不應太滿，一般不超過８０％。
　　處理方法１：刪除垃圾文件
　　＃ｄｕ－ｓｋ  ｜ｓｏｒｔ－ｒｎ｜ｈｅａｄ
　　查找出當前目錄下佔空間最大的子目錄，逐層往下直到找出佔空間最大的文件（要區分哪些目錄是文件系統的ｍｏｕｎｔｐｏｉｎｔ，哪些是文件系統的子目錄）。刪除文件，釋放空間。有時刪除文件後空間並不馬上釋放，這是由於刪除的文件正被某個程序打開。只有當這個程序停止後，空間才釋放，有時甚至需要重啓系統。
　　處理方法２：增加文件系統大小
　　＃ｓｍｉｔｔｙｃｈｊｆｓ
　　只要卷組ＶＧ中有剩餘空間，文件系統可以在任何時候加大。
　　（２）檢查文件系統的完整性
　　＃ｕｍｏｕｎｔｆｉｌｅｓｙｓｔｅｍ＿ｎａｍｅ
　　＃ｆｓｃｋ－ｙｆｉｌｅｓｙｓｔｅｍ＿ｎａｍｅ
　　注意：文件系統必須先ｕｍｏｕｎｔ，再做檢查和修復，否則將導致未知的後果。
　　（３）查看卷組信息
　　查看是否有“ｓｔａｌｅ”狀態的邏輯卷。若有，用ｓｙｎｃｖｇ命令修復。
　　（４）檢查內存交換區使用率
　　檢查使用率是否超過７０％，若超過則用ｃｈｐｓ－ｓＸｐｇｎａｍｅ增加Ｘ個ＰＰ或用ｍｋｐｓ－ａ－ｎ－ｓＸｍｙｖｇ在ｍｙｖｇ上增加一個ＰＰ數爲Ｘ的內存交換區。
　　（５）小型機內存泄漏問題
　　小型機出現內存泄漏，即系統或應用進程無法將使用過的內存釋放，使可用內存的容量逐漸減少。如果可用內存降到某最小值將造成系統或應用程序無法ＦＯＲＫ子進程，就會造成系統癱瘓。通常我們可以用ｐｓ和ｓａｒ命令來查看小型機內存和ＣＰＵ佔用率的大概情況以及各進程的內存和ＣＰＵ佔用率的發展趨勢。使用ｐｓ命令，可查看內存和ＣＰＵ佔用率的基本情況。找出其中佔用內存數不斷變大的進程，這個進程可能就已經發生了內存泄漏。
　　
　　４．ＩＢＭＨＡＣＭＰ雙機熱備系統的管理和維護
　　（１）ＨＡＣＭＰ雙機系統的啓動
　　以ｒｏｏｔ用戶身份分別進入系統各節點，執行＃ｓｍｉｔｃｌｓｔａｒｔ命令。
　　（２）ＨＡＣＭＰ雙機系統的關閉
　　以ｒｏｏｔ用戶身份分別進入系統各節點，執行＃ｓｍｉｔｃｌｓｔｏｐ命令。
　　（３）查詢ＨＡＣＭＰ雙機系統的狀態
　　在雙機系統的運行中，操作員只有知道雙機系統的當前狀態，纔有可能對雙機系統出現的異常情況進行恢復處理，保證雙機系統的高可用性和高容錯性。查詢ＨＡＣＭＰ雙機系統的狀態，以ｒｏｏｔ用戶身份進入需要查詢的節點，用＃ｌｓｓｒｃ－ｇｃｌｕｓｔｅｒ命令檢查ＨＡＣＭＰ雙機軟件在該節點是否已啓動，系統顯示３個ａｃｔｉｖｅ的信息，則說明ＨＡＣＭＰ雙機軟件已正常啓動。
　　在確認雙機軟件ＨＡＣＭＰ正常啓動的情況下，在命令行執行＃ /ｕｓｒ/ｓｂｉｎ/ｃｌｕｓｔｅｒ/ｃｌｓｔａｔ－ａ命令查看雙機系統的當前狀態。
　　
　　５．網絡故障處理
　　（１）網絡不通的診斷過程
　　ｉｆｃｏｎｆｉｇ查看網卡是否啓動（ｕｐ）；ｎｅｔｓｔａｔ－ｉ查看網卡狀態；Ｉｅｒｒｓ/Ｉｐｋｔｓ和Ｏｅｒｒｓ/Ｏｐｋｔｓ是否＞１％；ｐｉｎｇ本機網卡地址；ｐｉｎｇ其他機器地址，如不通，在其機器上用ｄｉａｇ檢測網卡是否有問題。
　　在同一網中，子網掩碼應一致。
　　（２）網絡配置的基本方法
　　 ①如需修改網絡地址、主機名等，一定要用ｃｈｄｅｖ命令。
　　＃ｃｈｄｅｖ－ｌｉｎｅｔ０－ａｈｏｓｔｎａｍｅ＝ｍｙｈｏｓｔ
　　＃ｃｈｄｅｖ－ｌｅｎ０－ａｎｅｔａｄｄｒ＝＇１１２．０．１５．１＇－ａｎｅｔｍａｓｋ＝２５５．２５５．２５５．０＇
　　 ②查看網卡狀態：＃ｌｓｄｅｖ－Ｃｃ－ｉｆ
　　 ③確認網絡地址：＃ｉｆｃｏｎｆｉｇｅｎ０
　　 ④啓動網卡：＃ｉｆｃｏｎｆｉｇｅｎ０ｕｐ
　　 ⑤配置路由，有兩種方式加入路由：
　　ａ．永久路由
　　＃ｃｈｄｅｖ－ｌｉｎｅｔ０－ａｒｏｕｔｅ＝＇１１２．１．１５．２＇，＇１１２．０．１５．２５４＇
　　ｂ．臨時路由
　　＃ｒｏｕｔｅａｄｄ１１２．１．１５．２１１２．０．１５．２５４
　　用命令ｎｅｔｓｔａｔ－ｒｎ查看路由表
　　
　　６．ＩＢＭ公司的巡檢流程
　　ＩＢＭ公司的巡檢流程，對我們日常維護應重點關注的事項有所幫助，大家可以借鑑一下。
　　（１）檢查系統硬件情況：設備故障燈是否亮。
　　（２）系統錯誤報告。
　　（３）檢查是否有發給ｒｏｏｔ用戶的錯誤報告。
　　（４）檢查ｈａｃｍｐ．ｏｕｔ，ｓｍｉｔ．ｌｏｇ，ｂｏｏｔ．ｌｏｇ。
　　（５）關鍵系統的文件使用率不大於８０％。
　　（６）邏輯卷有否ｓｔａｌｅ。
　　（７）內存交換區使用率是否超過７０％。
　　（８）內存交換區的大小是否爲物理內存的１．５倍。
　　（９）檢查備份情況（是否有系統備份、用戶數據備份，磁帶機是否需要清洗）。
　　（１０）檢查通信設置（網卡、ＩＰ、路由表、ｐｉｎｇ、/ｅｔｃ/ｈｏｓｔｓ、ＤＮＳ設置等）。
　　（１１）是否有數據保護方式如ＲＡＩＤ１０/ＲＡＩＤ５是否有ＨｏｔＳｐａｒｅ。
　　（１２）系統ＤＵＭＰ設置是否正確。
　　（１３）檢查系統參數是否正確。
　　（１４）檢查ｒｏｏｔｖｇ是否鏡像。
　　（１５）檢查ｅｒｒｄｅｍｏｎｓｒｃｍｓｔｒ是否正常運行。
　　（１６）檢查機房環境（電壓、溼度）。
　　（１７）檢查系統性能：是否存在性能瓶頸ｔｏｐａｓｖｍｓｔａｔ。
　　（１８）檢查補丁程序（ＰＴＦ）、微碼（是否需要升級）。
　　（１９）進行ＨＡＣＭＰ測試：ＣｌｕｓｔｅｒＶｅｒｉｆｉｃａｔｉｏｎ。
　　（２０）進行系統硬件診斷：運行故障診斷程序（Ｄｉａｇｎｏｓｔｉｃ）。

　　 三、ＡＩＸ系統參數優化
　　ＡＩＸ內核屬於動態內核，核心參數基本上可以自動調整，因此當系統安裝完畢後應考慮修改的參數一般包括以下內容。
　　
　　１．系統用戶的最大登錄數ｍａｘｌｏｇｉｎ
　　ｍａｘｌｏｇｉｎ的具體大小可根據用戶數設定，可以通過ｓｍｉｔｔｙｃｈｌｉｃｅｎｓｅ命令修改，該參數記錄在/ｅｔｃ/ｓｅｃｕｒｉｔｙ/ｌｏｇｉｎ．ｃｆｇ文件中，修改在系統重新啓動後生效。
　　
　　２．系統用戶的ｌｉｍｉｔｓ參數
　　這些參數位於/ｅｔｃ/ｓｅｃｕｒｉｔｙ/ｌｉｍｉｔｓ文件中，可以把這些參數設爲－１即無限制，可以用ｖｉ修改/ｅｔｃ/ｓｅｃｕｒｉｔｙ/ｌｉｍｉｔｓ文件，所有修改在用戶重新登錄後生效。
　　
　　３．ＰａｇｉｎｇＳｐａｃｅ
　　檢查ＰａｇｉｎｇＳｐａｃｅ的大小，在物理內存＜２Ｇ時，應至少設定爲物理內存的１．５倍，若物理內存＞２Ｇ，可作適當調整。同時在創建ＰａｇｉｎｇＳｐａｃｅ時 應儘量分配在不同的硬盤上，提高其性能。利用ｓｍｉｔｔｙｃｈｐｓ修改原有ＰａｇｉｎｇＳｐａｃｅ的大小或利用ｓｍｉｔｔｙｍｋｐｓ增加一塊ＰａｇｉｎｇＳｐａｃｅ。
　　
　　４．系統核心參數配置
　　利用ｌｓａｔｔｒ－Ｅｌｓｙｓ０檢查ｍａｘｕｐｒｏｃ，ｍｉｎｐｏｕｔ，ｍａｘｐｏｕｔ等參數的大小。ｍａｘｕｐｒｏｃ爲每個用戶的最大進程數通常如果系統運行Ｏｒａｃｌｅ應調整ｍａｘｕｐｒｏｃ，將Ｄｅｆａｕｌｔ：１２８調整到５００，ｍａｘｕｐｒｏｃ增加可以馬上生效。當應用涉及大量的順序讀寫而影響前臺程序響應時間時，可考慮將ｍａｘｐｏｕｔ設爲３３ｍｉｎｐｏｕｔ設爲１６，用ｓｍｉｔｔｙｃｈｇｓｙｓ命令設置。
　　
　　５．文件系統空間的設定
　　一般來說，文件系統/、/ｕｓｒ、/ｖａｒ、/ｔｍｐ的使用率不應超過８０％，/ｔｍｐ建議至少爲３００Ｍ，文件系統滿將導致系統不能正常工作，尤其是ＡＩＸ的基本文件系統，如/根文件系統滿則會導致用戶不能登錄。用ｄｆ查看：＃ｄｆ－ｋ（查看ＡＩＸ的基本文件系統），利用ｓｍｉｔｔｙｃｈｆｓ擴展文件系統的空間。
　　
　　６．激活ＳＳＡＦａｓｔ－ＷｒｉｔｅＣａｃｈｅ
　　利用ｓｍｉｔｔｙｓｓａｆａｓｔｗ激活每一個邏輯盤ｈｄｉｓｋｎ的Ｆａｓｔ－ＷｒｉｔｅＣａｃｈｅ：選擇硬盤後，把ＥｎａｂｌｅＦａｓｔ－Ｗｒｉｔｅ改爲Ｙｅｓ後，回車即可。
　　
　　７．ＨｉｇｈｗａｔｅｒｍａｒｋｆｏｒｐｅｎｄｉｎｇｗｒｉｔｅＩ/Ｏｓｐｅｒｆｉｌｅｍａｘｐｏｕｔ和ＬｏｗｗａｔｅｒｍａｒｋｆｏｒｐｅｎｄｉｎｇｗｒｉｔｅＩ/Ｏｓｐｅｒｆｉｌｅ配置
　　其缺省值爲０，在雙機環境中一般應將Ｈｉｇｈｗａｔｅｒｍａｒｋ設爲３３Ｌｏｗｗａｔｅｒｍａｒｋ設爲２４，這兩個參數可用ｓｍｉｔｔｙｃｈｇｓｙｓ來設置。
　　
　　８．ｓｙｎｃｄｄａｅｍｏｎ的數據刷新頻率
　　該值表示刷新內存數據到硬盤的頻率，缺省值爲６０，一般可改爲２０，也可根據實際情況更改。該參數通過/ｓｂｉｎ/ｒｃ．ｂｏｏｔ配置，將ｎｏｈｕｐ/ｕｓｒ/ｓｂｉｎ/ｓｙｎｃｄ６０＞/ｄｅｖ/ｎｕｌｌ２＞＆１＆參數中的６０改爲２０即可。

　　
　　四、ＡＩＸ系統備份和恢復
　　備份和恢復是系統管理員經常要做的事情，主要包括ｒｏｏｔｖｇ備份和用戶數據備份。
　　
　　１．操作系統和系統程序的備份
　　＃ｔｃｔｌ－ｆ／ｄｅｖ／ｒｍｔ０ｒｅｗｉｎｄ
　　＃ｓｍｉｔｍｋｓｙｓｂ
　　在“備份設備或文件”中添入“/ｄｅｖ/ｒｍｔ０”後回車，系統會運行很長時間，等到屏幕顯示ＯＫ後拿出磁帶。這時候，系統備份完成。ｍｋｓｙｓｂ僅備份ｒｏｏｔｖｇ中已安裝的文件系統。
　　
　　２．用戶數據備份
　　（１）常用磁帶機選項
　　 /ｄｅｖ/ｒｍｔ０ 若選擇/ｄｅｖ/ｒｍｔ０，在插入磁帶和寫完一次磁帶時，磁帶機都將磁帶反繞到頭。因此下一次備份文件將覆蓋本次備份。
　　 /ｄｅｖ/ｒｍｔ０．１若選擇/ｄｅｖ/ｒｍｔ０．１則插入磁帶和寫完一次磁帶時，磁帶機均不反繞磁帶。因此，一盤磁帶可以連續備份幾個文件或文件系統。
　　（２）＃ｓｍｉｔｆｓ
　　　　選擇“備份文件系統”，輸入要備份的“文件系統名稱”，輸入“/ｄｅｖ/ｒｍｔ０．１”，重複上述操作即可在同一盤磁帶上備份多個文件系統。
　　
　　３．ｒｏｏｔｖｇ的恢復
　　啓動機器進入維護模式，當出現“ＷｅｌｃｏｍｅｔｏＢａｓｅＯｐｅｒａｔｉｎｇＳｙｓｔｅｍＩｎｓｔａｌｌａｔｉｏｎａｎｄＭａｉｎｔａｎｅｎｃｅ”時，選３ “ＳｔａｒｔＭａｉｎｔｅｎａｎｃｅＭｏｄｅｆｏｒＳｙｓｔｅｍＲｅｃｏｖｅｒｙ”，要恢復系統，繼續選４“ＩｎｓｔａｌｌｆｒｏｍａＳｙｓｔｅｍＢａｃｋｕｐ”，出現“ＣｈｏｏｓｅｍｋｓｙｓｂＤｅｖｉｃｅ”畫面，選“/ｄｅｖ/ｒｍｔ０”並插入磁帶後回車，系統自動恢復操作系統。
　　
　　４．用戶數據恢復
　　　　＃ｔｃｔｌ－ｆ／ｄｅｖ／ｒｍｔ０ｒｅｗｉｎｄ
　　　　＃ｓｍｉｔｆｓ
　　　　選擇“恢復文件系統”，添入“設備名稱”和“目標目錄”，系統會自動恢復相應目錄。

　　
　　五、ＡＩＸ系統日常檢查
　　ＡＩＸ系統日常檢查工作是應用維護非常重要的部分，可以把系統故障排除在萌芽階段，以下日常檢查很有參考價值。
　　（１）硬件檢查
　　檢查各指示燈狀態和各物理設備的可用情況。
　　（２）進程檢查
　　檢查是否有死進程，使用ｐｓ－ｅｆ命令列出正在運行的所有進程的各種信息。
　　（３）文件系統是否滿
　　適用ｄｆ－ｋ命令可以以ｋ爲單位檢查文件系統的使用率。
　　（４）檢查系統出錯日誌
　　使用ｅｒｒｐｔ｜ｍｏｒｅ命令檢查，清除現有的ｌｏｇＥｒｒｃｌｅａｒ０。
　　（５）檢查系統合法/非法登錄情況
　　使用Ｌａｓｔ命令檢查登錄地點。
　　（６）檢查系統是否有巨大的Ｃｏｒｅ文件生成
　　使用ｆｉｎｄ / －ｎａｍｅｃｏｒｅ－ｐｒｉｎｔ命令檢查。對Ｃｏｒｅ文件，一般直接刪除即可。
　　（７）系統性能檢查
　　 ①ＣＰＵ性能：使用Ｖｍｓｔａｔ ｔｏｐａｓ命令檢查。
　　 ②內存使用情況：使用ｔｏｐａｓ，ｖｍｓｔａｔ命令檢查。
　　 ③檢查ＩＯ平衡使用情況：使用ｉｏｓｔａｔ命令檢查。
　　 ④交換空間使用情況：使用ｌｓｐｓ－ａ命令檢查。
　　（８）Ｍａｉｌ檢查

Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=1527490

站內首發文章

xiangyyy

發佈了46 篇原創文章 · 獲贊 13 · 訪問量 8萬+

私信關注

AIX操作系統下應用系統的維護與性能優化

AIX操作系統下應用系統的維護與性能優化

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

【2024-05-21】以茶會友

ASP對Excel的基本操作

rundll32.exe進程詳述

EXCEL的53個技巧

如何從開發人員走向架構師

將人民幣的數字轉化成大寫表示

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結