運維的核心競爭力是什麼

前陣子有句話一直很流行,叫“知道了很多道理,卻依然過不好這一生”,我們也經常拿這句話來打趣自己和身邊的運維朋友。那你有沒有想過,我們每天學那麼多幹貨,看那麼多書,學那麼多知識,卻依然解決不了實際問題呢?

這歸根結底,是處理問題能力的問題!

什麼是能力? 我覺得包含了對待問題的態度,以及處理問題的思路和方法。

首先說態度,運維工作中我們可能經常會遇到一些警告信息,比如偶爾的501錯誤,504錯誤等,但是,很多運維並沒有在意,沒錯,是很多,假裝看不見,不在乎,或者歸咎於人品問題。 這就是態度問題。

偶爾的錯誤視而不見,經過長時間的積累,各種錯誤就會頻發,比如自己運維的網站每天頻繁出現500,501等錯誤,此時由於影響到正常使用了,所以不得不去處理解決,而處理的方法簡單粗暴,直接重啓服務,或者重啓服務器,於是,問題暫時得到解決了,這種遇到問題不去深究原因,只靠重啓解決的工作方式太多了,更有甚者,當出現問題的時候,不從自身找原因,而是抱怨網絡狀態不好,服務器配置不好,操作系統不好,數據庫不好等等,將問題歸咎於其它外在因素,或者極度推責者,也屢見不鮮。

這就是態度,如果能對問題有敏感性,能對任何小的,輕微的問題有足夠的敏銳度,你就有了一個快速成長的基礎。對問題的敏銳度是非常重要的。很多性能或程序邏輯上非致命的問題,在不夠敏銳的時候是發現不了的,但是一旦進入特殊場景就會驟然爆發,你多一點敏銳度,就會減少這種危機的風險。同時,這種工作態度完全阻止了你的成長,如果以這種態度工作,即使你有十年工作經驗,可能你僅有一年的實際能力。

優秀的運維人員和平庸的運維人員,不是看敲打鍵盤的速度來區分的,在遇到問題後,平庸的運維人員的解決效率,和優秀運維老鳥相比就會有天壤之別。 所謂解決效率,不外乎對故障的分析、定位,以及思考。

要分析、定位問題,那麼查看日誌是個起碼的手段,你可能需要查看web server的日誌,數據庫的日誌,慢查詢日誌,binlog日誌,php的錯誤日誌等等,看似簡單不過的處理問題手段,真正能夠靜心下來查看的人真的不多,線上出問題瞎猜的,壓根連日誌都不看的大有人在。看日誌不仔細不完整的也大有人在,而你能去認真研究日誌,其實已經超越很多人了。

發現問題之後,自然要去解決問題,問題千差萬別,多種多樣,誰都不可能處理過所有可能發生的問題,那麼怎麼去快速解決這些問題呢,我們說,搜索引擎是最好的處理問題輔助工具,你所遇到的錯誤信息和錯誤提示,通常95%都能在網上搜索到,當然,搜索到後要結合你的場景認真思考,並理解透徹,而不是照貓畫虎的去處理,否則可能這次運氣好就蒙對了,下次運氣不好可能就會出現誤刪庫要跑路的事情了。

說到這裏,很久之前遇到過一個哭笑不得的事情,公司新入職一個運維(不知道是誰招聘進來的),某天被派到了客戶那裏處理問題,然後就QQ發信息給我,問怎麼重啓linux系統,我看到後,就回復了一句“百度一下吧”,我認爲這種問題,他肯定可以自己解決,誰知道,第二天來到公司,我問他問題怎麼解決的,他說自己不太懂,沒找到關機的方法,所以就拔電源暴力關機了。我聽到這裏,默默的嘆了口氣,讓HR請他離開了。

爲什麼請他離開,因爲我知道他不適合這個職位,同時即使他堅守這個職位,也不會有大的職業前景。

這是個真實的事情,沒有半點誇張成分,通過這個事情,我只是想說,要提高自己的能力,就要主動嘗試獨立解決問題,過度的依賴別人,出現任何問題都不假思索的問別人,並不能提高自己任何能力。

最後,要提高自己處理問題的能力,還要有知識的總結、梳理和歸納,你今天從網上買了一套學習視頻,明天從網盤下載了40Gb的一套python課程視頻,你可能下載的時候欣喜若狂,這種方式獲取的僅僅是資料,這一堆冷冰冰的數據,除了能極大的滿足你內心想要學習的虛榮感,別的真的毫無價值。

要讓知識變熱、變成自己的,是需要動手實踐的,對一個問題,一類問題,以及不同類型的問題,要善於歸納整理,不斷反思,儘量把每個遇到過的問題都記錄下來,記錄的要儘量詳細,這樣你經過一段時間去回頭看,可能會發現不一樣的處理方法和思路。如果你感覺到了這一點,那麼恭喜你,你的能力又提升了一步!

我們日常遇到的問題就類似打怪升級一樣,你解決的問題越多你的能力就會越強,經驗自然也會越來越豐富。但人的腦袋不可能記住所有事情,將自己遇到的問題沉澱下來對以後自己查閱也有很大的幫助,就不必每次都要去查資料,自己也能夠有一個索引庫。

經常自己總結是提高能力的最好方式。

知識的積累,不是你處理過的就一定有積累,而是整理過的才有價值。

說了這麼多,那麼問題來了,怎麼獲取經驗和能力呢,我將多年來工作經驗進行了總結和提煉,寫成了專欄《Linux運維大牛實戰心法》,15個案例打通運維任通二脈,讓案例說話:

運維的核心競爭力是什麼

專欄目錄詳情

本專欄從系統運維、安全運維、性能調優、應用運維四個方面,通過15個具體的案例分析、歸納日常運維工作中經常出現的問題,通過每個問題出現的現象、原因以及解決的思路,來帶領大家學習解決問題的思路和能力,通過現象看本質,根據問題的現象,結合所學的知識,一步步抽絲剝繭,找出解決問題的思路和方法,讓大家迅速提高解決問題的實戰能力。提高運維職場競爭力。

第一部分:故障排查

1.Linux系統故障問題案例彙總(無法啓動、忘記密碼、丟失文件等)
2.偶遇"Too many open files"錯誤分析與處理實錄
3.Linux遭遇"Read-only file system"錯誤分析與處理實錄
4.不聽話的Crontab,記一次Crontab計劃任務失敗案例
5.因OpenStack物理機故障引起的Linux系統無法啓動案例
6.Linux系統內存又被吃光了,它去哪裏了,記一次內存佔用問題調查記

第二部分:系統安全

7.回顧與總結:服務器遭受攻 擊後的處理措施
8.IDC服務器遭遇黑 客侵入後的解決方法與原因分析案例
9.Linux後門入 侵檢測工具chkrootkit、RKHunter應用案例
10.雲服務器被植入挖礦病毒的處理與原因分析案例

第三部分:性能調優

11.菜鳥運維初成長,記一次上線Linux服務器基礎優化案例
12.對某電商平臺動、靜態網站的優化分析案例

第四部分:運維案例

13.遠離MySQL的MyISAM,記一次MySQL數據庫故障的處理與原因分析
14.一次Java應用OutOfMemoryError故障的處理與原因分析
15.一次Java進程佔用CPU過高問題的排查方法與案例分析

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章