系統上線後,總會慢慢反映出系統登陸,連接,請求等狀況下出現系統延時的現象,
各種各樣的條件或者情況下,如何調查,需要整理一個思路
首先,不要着急進行技術上的調查,很容易陷入反覆調查以至疲憊不堪的狀況。
理論上的思路
-
沒制定調查計劃之前不要動手
所有的行動啓動前,必須要有計劃。
-
不要帶有先入觀
-
考慮所有的可能性
昨天升級了OS,會不會是這個的影響?
最近更換了通信模塊,會不會是這個的影響?
等等考慮所有可能性 -
分清事實和推測
調查進行中,總會有確認過的事實,以及還沒有確認的推測,一定分開考慮 -
調查過程中不要忘了自己的目的
調查中很有可能會發現其他的bug等問題,一定要先放一放。 -
誰的問題,怎麼出的問題,如何避免問題
行動上的考慮
1. 明確問題
點擊後反應遲緩?DB檢索反應慢?服務器上傳文件慢?等等
以檢索信息過慢爲例
提出了問題,有些是主觀的現象,就要召集相關方進行
- Who 解決誰的問題
解決問題是爲了誰?客戶?內部使用人員?公司管理層?
瞭解這個的目的是;確定問題調查的優先順序,先調查response時間,還是先調查處理慢的問題 - What 什麼問題
問題的具體化,詳盡化,最好能達到可測量標準的程度 - Why 爲什麼是一個問題
考察問題的優先重要度 - When 什麼時候開始的
容易考察前後做過的那些活動 - Where 問題的影響是什麼
最終決定問題解決的優先順序「影響度:大/中/小」 - Which 主要的問題對象系統是哪一個
是運用系統還是開發系統
通過上述的簡單整理,就可以篩除掉一些原因等。
以例子來說就是,
1.客服反應 2.檢索一條信息太慢 3.導致讓用戶在電話中等待過長時間,因此出現了大量的用戶抱怨 4. 客服(推測)大約從八月份開始,SE部門在8月份(事實)更新過一次DB版本 5. 影響了服務的質量,導致客戶流失,影響度大 6. 只在1號機上發現了該現象
2. 明確要解決的課題
有了上面的問題整理,提出課題就很容易了
【縮短客服檢索系統的檢索結果返回時間,減少客戶的抱怨】
3. 明確解決目標值,期限
以解決該課題作爲目標,設定具體的定量化目標值和期限。
例如;
目標;檢索結果返回時間控制在3s之內,客戶抱怨率控制在2000個電話1件
期限;12月底
前提條件;1分鐘最大的檢索件數爲 1000件
4. 調查計劃作成
●調查流程的作成
行動前制定調查的大體流程圖
- 考察可能的原因
改善措施行動前,需要大量數據的支撐,因此,需要調查實際發生的數據,各種瓶頸的數據的準備,先從最有可能的原因入手,拿到最有效的數據作支撐。
比如,系統性能的最有可能瓶頸因素
CPU佔有率,內存使用率,磁盤空間使用率,網絡帶寬,OS各種資源(參數設定),應用資源,鎖的使用狀況,排他處理以及其他邏輯處理問題
根據上面的可能因素,作成-問題調查實施計劃書(需要考慮到,人員,工具,設備的選定和工數,費用的預估) - 從最可能的原因開始測定
測定過程中,花費大量的人力,物力,財力都要提前在計劃書中反映到。 - 分析測定結果數據
選擇哪些工具進行分析,也儘可能提前在計劃書中反映。 - 根據分析結果制定具體的改善案
利用專家判斷等工具進行方案的制定,如果達到目標值 - 實行改善案
例如,修改程序的實裝問題或者增強CPU的性能等
在實施過程中經常產生新的問題,時刻記住最初的目的,新的問題先列表,之後作爲新課題再對應。 - 效果測定
已接近生產環境進行效果的測定,注意排除改善案之外的外部因素影響 - 結果判定
通過上面的改善,是否達到了目標值的要求等進行分析,沒達到,重新制定計劃書,重新測定 - 結果完成
達到目標,最終向依賴者報告結果,開慶功會感謝成員的努力等。