Linux運維打怪升級:必備知識點+面試精華

Linux運維打怪升級:必備知識點+面試精華
初級篇:
linux運維人員常用工具拓撲詳見:

Linux運維打怪升級:必備知識點+面試精華
1.rsync工具

很多地方經常會用到rsync工具,實施幾臺服務器的同步效果。我們公司就是使用這個工具完成服務器的youxi的服務端和客戶端同步,有幾個文章例子:

rsync 強化技術(手動修改端口開啓防火牆的情況下)並且通過腳本只同步需要的服務器
inotify+rsync+mutt+msmtp 實現linux文件或者目錄自動更新並且實現發郵件給管理員
2.網絡服務

服務有很多種,每間公司都會用到不同的,但基礎的服務肯定要掌握,如FTP、DNS、SAMBA、郵件, 這幾個大概學一下就行,LAMP和LNMP是必須要熟練,我所指的不是光會搭建,而是要很熟悉裏面的相當配置才行,因爲公司最關鍵的絕對是Web服務器,所以Nginx和Apache要熟悉,特別是Nginx一定要很熟悉才行,至少有些公司還會用Tomcat,這個也最好學一下。

其實網絡服務方面不用太擔心,一般公司的環境都已經搭建好,就算有新服務器或讓你整改,公司會有相應的文檔讓你參照來弄,不會讓你亂來的,但至少相關的配置一定要學熟,而且肯定是編譯安裝多,那些模塊要熟悉一下他的作用,特別是PHP那些模塊。

這面2點只是基礎,也是必要條件,不能說是工具,以下才是真正的要掌握的工具。

Samba文件共享服務(共享腳本 讓你工作更輕鬆)
Linux web服務安裝apache 思路 (源碼編譯,自己定義服務)
FTP(持虛擬用戶,並且每個虛擬用戶可以具有獨立的屬性配置)
linux 下構建DHCP服務器
3.腳本語言

Shell腳本和另一個腳本語言,Shell是運維人員必須具備的,不懂這個連入職都不行,至少也要寫出一些系統管理腳本,最簡單也得寫個監控CPU,內存比率的腳本吧,這是最最最基本了,別以爲會寫那些猜數字和計算什麼數的,這些沒什麼作用,只作學習意義,寫系統腳本纔是最有意義,而另一個腳本語言是可選的,一般是3P,即Python、Perl和PHP,PHP就不需要考慮了,除非你要做開發,我個人建議學Python會比較好,難實現自動化運維,Perl是文本處理很強大,反正這兩個學一個就行了。

Shell(一) 入門到複雜 自己做的各種腳本實例與解釋
Shell(二)入門到複雜 腳本實例(計算器)
4.sed和awk工具

這兩個工具必須要掌握,同時還要掌握正則表達式,這個就痛苦了,正則是最難學的表達式,但結合到sed和awk中會很強大,在處理文本內容和過濾Web內容時十分有用,不過在學Shell的同時一般會經常結合用到的,所以學第3點就會順便學第4點。

sed 簡明教程https://coolshell.cn/articles/9104.html
5.文本處理命令

sort 、tr、cut、paste、uniq、tee等必學,也是結合第3點腳本語言時一併學習的。

6.數據庫

首選MySQL,別問我爲什麼不學SQL Server和Oracle,因爲Linux用得最多絕對是MySQL,增刪改查必學,特別要學熟查,其它方面可能不太需要,因爲運維人員使用最多還是查,哪些優化和開發語句不會讓你弄的。

MySQL(手動編譯詳細思路,以及增刪改查、授權、備份還原)
7.防火牆

防火牆也算是個難點,說難不難,說易不易,最重要弄懂規則,如果學過CCNA的朋友可能會比較好學,因爲iptables也有NAT表,原理是一樣的,而FILTER表用得最多,反正不學就肯定不合格。

防火牆(一)主機型防火牆
防火牆(二)SNAT和DNAT
8.監控工具

我個人建議,最好學這3個:Cacti,Nagios,Zabbix,企業用得最多應該是Nagios和 Zabbix,反正都學吧,但Nagios會有點難,因爲會涉及到用腳本寫自動監控,那個地方很難。

CentOS 6.2+Nginx+Nagios,手機短信和QQ郵箱提醒
服務器集中檢測Cacti
9.集羣和熱備

這個很重要,肯定要懂的,但到了公司就不會讓你去弄,因爲新手基本不讓你碰,集羣工具有很多,最好學是LVS,這是必學,最好也學Nginx集羣、反向代理,還有熱備,這個就更多工具能實現了,像我公司是自己開發熱備工具的。MySQL熱備也要學,就是主從複製,這個要學懂整個流程一點也不容易,只照着做根本沒意思。

MySQL主從同步,雙主同步,如果服務器意外掛機,不同步怎麼辦
MySQL高性能壓力測試(總結了好久)
Nginx 緩存配置及報錯解決
10.數據備份

工具有很多,但至少要把RAID的原理弄懂,特別是企業最常用的1+0或0+1,自己做實驗也要弄出來,備份工具有很多,如tar、dump,最好多瞭解一下。

學會以上10點,應該可以入門了,有些技術會比較難學,例如Apache和Nginx中還有些很重要的技術,如系統調優、服務優化、程序優化,這些在沒接觸工作前很難學習到的,所以先把這10點學了吧,估計要學熟至少3個月不止,腳本部分會交很吃力了,我建議是先學熟shell,等工作後再學另一門腳本語言,這樣會比較好。

以上就是踏入linux運維工程師需要掌握的工具,還有很多工具要掌握的,但在學習環境中是很難學到,最後我再提醒一下,這裏所指的工具相當於技能,而不是像Windows或Ubuntu的圖形化工具,還有學linux就別裝圖形界面,這樣虛擬機就不用吃太多內存,而且絕對不建議在真機上裝Linux,根本達不到學習效果。

中級篇
這部分來自我自己的面試經歷和麪試別人的經歷總結。先附上運維思路拓撲圖:

Linux運維打怪升級:必備知識點+面試精華
有些人認爲,其實運維就是部署某個軟件,設置些基礎功能,就算會運維了。

舉個例子:安裝LAMP,LNMP,就感覺部署方法我都掌握了。其實網上大多數都有一鍵安裝腳本啥的根本沒有啥技術含量,在面試官眼裏,這些都不是你的亮點。基本到了公司一般環境架構都是部署好的,很少需要你去變動環境架構。就算你安裝好 LNMP 架構你熟悉裏面的原理嗎?熟悉 Nginx 優化嗎?熟悉 MySQL 優化嗎?

再舉個例子:我面試遇到的問題,面試官問你既然熟悉 LNMP 架構,那麼 Nginx 反向代理的作用。

你應該不是說出懂這個軟件和配置,你儘可能的說怎麼優化,怎麼深入提高網站性能。

使用反向代理可以理解爲7層應用層的負載均衡,使用負載均衡之後可以非常便捷的橫向擴展服務器集羣,實現集羣整體併發能力、抗壓能力的提高。
通常反向代理服務器會帶有本地 Cache 功能,通過靜態資源的 Cache,有效的減少後端服務器所承載的壓力,從而提高性能。
下面說說運維在工作中需要掌握的核心技術。注意,這是在工作中掌握的,在學習中很難掌握。

1.第一條最主要的排錯

分析部分程序不能運行或沒有按預想結果運行的原因,對程序運行跟蹤,查看系統調用的過程。
較深入的系統瓶頸點分析。
查看剩餘內存:

ree -m

#-/+ buffers/cache: 6458 1649

#6458M爲真實使用內存 1649M爲真實剩餘內存(剩餘內存+緩存+緩衝器)

#linux會利用所有的剩餘內存作爲緩存,所以要保證linux運行速度,就需要保證內存的緩存大小

系統信息:

Linux運維打怪升級:必備知識點+面試精華
硬件信息:

Linux運維打怪升級:必備知識點+面試精華
使用分析系統分析web日誌(如逆火軟件)
分析系統性能瓶頸點(IO/Memory/CPU,常用工具,top命令中shift組合鍵的特殊用Sar/vmstat/iostat/ipcs)
日誌管理常用命令:
Linux運維打怪升級:必備知識點+面試精華
2.優化

優化可以說是運維最吃香的技能,基本會優化的運維普遍工資很高,而且優化是要承擔風險的,並不是網上搜個文章改一下配置文件或者參數就叫優化了,這樣很容易造成宕機。

優化是根據實際的現場環境硬件各個參數進行部分優化,提高軟件性能和網站性能。這個我只能講半知半解,當時優化MySQL和Tomcat參數也是根據網上文章和官網文檔查找參數在虛擬機上測試然後查看性能。

成本優化,性能優化。這裏我給出 Tomcat 優化JVM參數(做過相應測試才放到現場環境的):(記住無監控不調優)

-標準參數,所有jvm都應該支持

-X 非標,每個jvm實現都不同

-XX 不穩定參數,下一版本可能會取消

serial collector 單線程 序列化

parallel collector 多線程

啓動 jvisualvm.exe 監控 dump 內存溢出

-Xms:初始堆大小

-Xmx:最大堆大小

-Xss:線程棧大小

-XX:NewSize=n:設置年輕代大小

-XX:NewRatio=n:設置年輕代和年老代的比值,如3, 標示年輕代:年老代比值1:3,年輕代佔整個年輕代年老代和的1/4

-XX:SurvivorRatio=n:年輕代中的eden區與2個Survivor區的比值。

-XX:MaxPermSize=n:設置持久代大小

收集器設置

-XX:+UseSerialGC:設置串行收集器

-XX:+UseParallelGC:設置並行收集器

-XX:+UseConcMarkSweepGC:設置併發收集器

回收統計信息

-XX:+PrintGC

-XX:+PrintGCDetails

-Xloggc:filename

Tocmat 優化,確認有幾個JVM虛擬機

set JAVA_OPTS=

-Xms4g

-Xmx4g

-Xss512k

-XX:+AggressiveOpts 進攻型的優化選項,所有優化項都加上

-XX:+UseBiasedLocking 優化鎖,基本都要選上,偏執鎖

-XX:permSize=64m 原始區大小,最大300m 類多就設置大一點

-XX:MaxPermSize=300m

-XX:+DisableExplicitGC //System.gc() 不顯示調用gc

-XX:+UseConcMarkSweepGC 使用cms縮短相應時間,併發收集,低停頓

-XX:+UseParNewGC 並行收集新生代的垃圾

-XX:+CMSParallelRemarkEnabled 在使用UseParNewGC的情況下,儘量減少mark的時間

-XX:+UseCMSCompactAtFullCollection 使用併發收集器時,開啓對年老代的壓縮,使碎片減少

-XX:LargePageSizelnBytes=128m 內存分頁大小對性能的提升

-XX:+UseFastAccessorMethods get/set方法轉成本地代碼

-Djava awt headless=true 修復linux下tomcat處理圖標時可能產生的bug

內存調優:
Linux運維打怪升級:必備知識點+面試精華
Linux運維打怪升級:必備知識點+面試精華
Tomcat 前任何參數沒參加大概每秒605,調優後大概每秒435,接近3倍的結果。

Linux運維打怪升級:必備知識點+面試精華
3.開發技能

優選 Shell 和 Python,現在 Shell 無法滿足你的需求或者效率很低,那麼選擇自動化 Python 是最好的選擇。現在普遍招聘需求要求,會寫 Shell 或者 Python、Perl 腳本,個人選擇還是選 Python。

Python 這門語言上手比較快,容易理解。在服務器管理工具上非常豐富,配置管理(Saltstack) 批量執行(Fabric、Saltstack) 監控(Zenoss、Nagios 插件) 虛擬化管理( python-libvirt) 進程管理 (Supervisor) 雲計算(OpenStack) …… 還有大部分系統 C 庫都有 Python 綁定。

對於流程確定的事情,最終一定是納入系統管理的體系,寫成程序,成爲系統的一部分。而不是無法複用遊離與整體的各種腳本。

隨着雲計算時代的來臨,中小型公司不需要運維了,大型公司沒有工程開發能力的運維,是沒有競爭力的。

最重要的學好 Python 可以漲工資,可以漲工資,可以漲工資。(重要的事情說三遍~)目前本人也是在學 Python,正在把以前 Shell 腳本的實例轉換成 Python 腳本。

意識篇

1.安全意識

運維人員的權限很大,所以一定要保證帳號/私鑰的安全。

最好使用加密工具存儲。比如Truecrypt、lpassword。
基於本地存儲。切勿用網盤,也不建議用lastpass等
SSH私鑰添加密碼
2.磨刀意識

關於任何操作配置,最好先搞明白操作或配置的原理,然後再去操作。應一句話叫做“磨刀不誤砍柴功”,而且對於類似的操作可以舉一反三。

3.計劃意識

複雜的變更操作比如多臺主機以及牽涉到san存儲,最好先作 操作計劃,寫計劃文檔,詳細緻每條命令,然後請高手幫忙審覈。 這樣能最大程度使整個操作過程安全。如果是重要的客戶業務系統,操作最好有回退方案,而一旦變更失敗,客戶可以在短時間內將業務回退。

4.記錄分享意識

遇到自己認爲較特殊的案例時,記得要寫案例過程及分析的文檔。也方便自己以後翻看,或者和其他兄弟分享,作知識的傳播以便於大家以後都能少走彎路。

5.監控意識

運維來說,監控是非常重要的,監控是發現系統各種異常的眼睛,所以運維應該和監控緊密配合。

6.業務意識

儘量瞭解維護的各主機上業務類型,以及各主機業務之間的關聯性。因爲任何維護工作都是爲主機能提供業務服務的,當某業務中斷,能最快的知道與此業務相關的主機羣,從而縮小故障排查範圍,最快定位故障。並不是你技術很牛,學的技術很多很熟,就不代表你不需要運維意識,其實領導很看重運維意識的,例如有沒有做好備份、權限分配問題、平臺測試情況、故障響應時間等,這些都是意識,而不是你學了很多技術自認大牛了,平臺發現故障你又沒什麼大不子,以爲很簡單的問題喜歡處理就處理,不需要向其它部門反饋等,領導不是看你的技術如何,而是看你的運維意識如何,你沒運維意識,技術再牛也沒用,只會讓其它部門的人跟你不協調。要知道做IT這行是苦逼的,需要無盡的學習,不學習只會被淘汰,不想被年輕的淘汰,就只能不斷增值自己,不然不是你工資無法提升,而是你無法再從事這行。這個世界,在悄悄懲罰不改變的人……

面試篇
1、什麼是運維?什麼是youxi運維?

2、在工作中,運維人員經常需要跟運營人員打交道,請問運營人員是做什麼工作的?

3、現在給你三百臺服務器,你怎麼對他們進行管理?

4、簡述raid0 raid1 raid5 三種工作模式的工作原理及特點。

5、LVS、Nginx、HAproxy有什麼區別?工作中你怎麼選擇?

6、Squid、Varinsh和Nginx有什麼區別,工作中你怎麼選擇?

7、Tomcat和Resin有什麼區別,工作中你怎麼選擇?

8、什麼是中間件?什麼是jdk?

9、講述一下Tomcat8005、8009、8080三個端口的含義?

10、什麼叫CDN?

11、什麼叫網站灰度發佈?

12、簡述DNS進行域名解析的過程?

13、RabbitMQ是什麼東西?

14、講一下Keepalived的工作原理?

15、講述一下LVS三種模式的工作過程?

16、mysql的innodb如何定位鎖問題,mysql如何減少主從複製延遲?

17、如何重置mysql root密碼?

18、lvs/nginx/haproxy優缺點

19、mysql數據備份工具

20、keepalived的工作原理和如何做到健康檢查

21、統計ip訪問情況,要求分析nginx訪問日誌,找出訪問頁面數量在前十位的ip

22、使用tcpdump監聽主機爲192.168.1.1,tcp端口爲80的數據,同時將輸出結果保存輸出到tcpdump.log

23、如何將本地80 端口的請求轉發到8080 端口,當前主機IP 爲192.168.2.1

24、簡述raid0 raid1 raid5 三種工作模式的工作原理及特點

25、你對現在運維工程師的理解和以及對其工作的認識

26、實時抓取並顯示當前系統中tcp 80端口的網絡數據信息,請寫出完整操作命令
27、Linux系統中病毒怎麼解決?

28、發現一個病毒文件你刪了他又自動創建怎麼解決?

29、說說TCP/IP的七層模型

30、你常用的Nginx模塊,用來做什麼

31、請列出你瞭解的web服務器負載架構

32、查看http的併發請求數與其TCP連接狀態

33、用tcpdump嗅探80端口的訪問看看誰最高

34、寫一個腳本,實現判斷192.168.1.0/24網絡裏,當前在線的IP有哪些,能ping通則認爲在線

35、已知 apache 服務的訪問日誌按天記錄在服務器本地目錄/app/logs 下,由於磁盤空間緊張

現在要求只能保留最近 7 天的訪問日誌!請問如何解決? 請給出解決辦法或配置或處理命令

創建文件腳本:

36、如何優化 Linux系統(可以不說太具體)?

37、請執行命令取出 linux 中 eth0 的 IP 地址(請用 cut,有能力者也可分別用 awk,sed 命令答)

38、請寫出下面 linux SecureCRT 命令行快捷鍵命令的功能?

39、每天晚上 12 點,打包站點目錄/var/www/html 備份到/data 目錄下(最好每次備份按時間生成不同的備份包)
40.常見的Linux發行版本都有什麼?你最擅長哪一個?它的官網網站是什麼?說明你擅長哪一塊?

41.Linux開機啓動流程詳細步驟是什麼?系統安裝完,忘記密碼如何破解?

42.企業中Linux服務器系統分區標準是什麼?(硬盤爲300G,內存16G)

43.某一天突然發現Linux系統文件只讀,該怎麼辦呢?完整操作步驟。

44.安裝一臺系統使用DVD光盤安裝,如何安裝50臺Linux系統如何安裝呢?思考一下。

45.用虛擬機安裝了一臺Linux系統,突然想克隆一臺服務器,克隆後發現無法上網,如何解決?

46.Linux網卡配置文件路徑是什麼?要使服務器上外網,必須滿足的條件有哪些?需要配置什麼?

47.一般可以使用什麼軟件遠程linux服務器?通過什麼上傳文件和下載文件?

48./mnt目錄主要用於什麼?/root目錄跟root用戶有什麼關係?/根目錄與/boot目錄有什麼聯繫?

49.某一天誤操作,執行了rm-rf*,會有哪些情況發生?請舉例。

50.在/tmp/目錄下創建test.txt文件,內容爲:Hello,World!,用一個命令寫出來。

51.給test.txt文件除所有者之外增加執行權限,最終以數字寫出文件的權限。

52.用vi命令編輯test.txt,如何跳轉到末行,首行,行首、行末,如何在光標行下一行插入

如何複製5行,刪除10行,查找jingfeng的字符、把jingfeng替換爲jfedu.net

53.查找linux系統下以txt結尾,30天沒有修改的文件大小大於20K同時具有執行權限的文件並備份到/data/backup/目錄下。

54.當前test.txt所屬的用戶爲root,組爲abc,請將test.txt使擁有者爲abc,組爲root,寫出命令。

55.如何修改Linux啓動級別爲字符模式並永久生效,如何臨時、永久關閉selinux及防火牆,請分別寫出操作方法。

56.每次開機在/tmp目錄下創建一個當天的日期文件夾(提示:當前日期表示的方法爲:date+%Y%m%d)

57.如何查看文件內容,命令有哪些?查看文件第1行到3行,查看文件最後一行。

58.查看linux服務器IP的命令,同時只顯示包含ip所在的行打印出來。

59.將普通用戶test加入root組的命令是?

由於篇幅影響閱讀質量,需要答案的小夥伴可以添加微信13272413561備註“答案”免費獲取哦!!!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章