二本畢業三年，憑什麼拿到騰訊T8offer？——Linux內核面試題整理（含答案）

1.Linux 中主要有哪幾種內核鎖？

Linux 的同步機制從 2.0 到 2.6 以來不斷髮展完善。從最初的原子操作，到後來的信號量，從大內核鎖到今天的自旋鎖。這些同步機制的發展伴隨 Linux 從單處理器到對稱多處理器的過渡；伴隨着從非搶佔內核到搶佔內核的過度。Linux 的鎖機制越來越有效，也越來越複雜。

自旋鎖最多隻能被一個可執行線程持有，如果一個執行線程試圖請求一個已被爭用已經被持有）的自旋鎖，那麼這個線程就會一直進行忙循環——旋轉——等待鎖重新可用。要是鎖未被爭用，請求它的執行線程便能立刻得到它並且繼續進行。自旋鎖可以在任何時刻防止多於一個的執行線程同時進入臨界區。

信號量的睡眠特性，使得信號量適用於鎖會被長時間持有的情況；只能在進程上下文中使用，因爲中斷上下文中是不能被調度的；另外當代碼持有信號量時，不可以再持有自旋鎖。

Linux 內核中的同步機制：原子操作、信號量、讀寫信號量和自旋鎖的 API，另外一些同步機制，包括大內核鎖、讀寫鎖、大讀者鎖、RCU (Read-Copy Update，顧名思義就是讀-拷貝修改)，和順序鎖。

2.Linux 中的用戶模式和內核模式是什麼含意？

MS-DOS 等操作系統在單一的 CPU 模式下運行，但是一些類 Unix 的操作系統則使用了雙模式，可以有效地實現時間共享。在 Linux 機器上，CPU 要麼處於受信任的內核模式，要麼處於受限制的用戶模式。除了內核本身處於內核模式以外，所有的用戶進程都運行在用戶模式之中。

內核模式的代碼可以無限制地訪問所有處理器指令集以及全部內存和 I/O 空間。如果用戶模式的進程要享有此特權，它必須通過系統調用向設備驅動程序或其他內核模式的代碼發出請求。另外，用戶模式的代碼允許發生缺頁，而內核模式的代碼則不允許。

在更早的內核中，僅僅用戶模式的進程可以被上下文切換出局，由其他進程搶佔。除非發生以下兩種情況，否則內核模式代碼可以一直獨佔 CPU：
(1) 它自願放棄 CPU；
(2) 發生中斷或異常。
內核引入了內核搶佔，大多數內核模式的代碼也可以被搶佔。

3.怎樣申請大塊內核內存？

在 Linux 內核環境下，申請大塊內存的成功率隨着系統運行時間的增加而減少，雖然可以通過 vmalloc 系列調用申請物理不連續但虛擬地址連續的內存，但畢竟其使用效率不高且在 32 位系統上 vmalloc 的內存地址空間有限。所以，一般的建議是在系統啓動階段申請大塊內存，但是其成功的概率也只是比較高而已，而不是 100%。如果程序真的比較在意這個申請的成功與否，只能退用“啓動內存”Boot Memory）。下面就是申請並導出啓動內存的一段示例代碼：

void* x_bootmem = NULL; EXPORT_SYMBOL(x_bootmem); 
unsigned long x_bootmem_size = 0; EXPORT_SYMBOL(x_bootmem_size); 
static int init x_bootmem_setup(char *str) 
{ 
x_bootmem_size = memparse(str, &str); x_bootmem = alloc_bootmem(x_bootmem_size); 
printk("Reserved %lu bytes from %p for x\n", x_bootmem_size, x_bootmem); return 1; 
} 
  setup("x-bootmem=", x_bootmem_setup);

可見其應用還是比較簡單的，不過利弊總是共生的，它不可避免也有其自身的限制：
內存申請代碼只能連接進內核，不能在模塊中使用。被申請的內存不會被頁分配器和 slab 分配器所使用和統計，也就是說它處於系統的可見內存之外，即使在將來的某個地方你釋放了它。
一般用戶只會申請一大塊內存，如果需要在其上實現複雜的內存管理則需要自己實現。在不允許內存分配失敗的場合，通過啓動內存預留內存空間將是我們唯一的選擇。

4.用戶進程間通信主要哪幾種方式？

1）管道 Pipe）：管道可用於具有親緣關係進程間的通信，允許一個進程和另一個與它有共同祖先的進程之間進行通信
2）命名管道 named pipe）：命名管道克服了管道沒有名字的限制，因此，除具有管道所具有的功能外，它還允許無親緣關係進程間的通信。命名管道在文件系統中有對應的文件名。命名管道通過命令 mkfifo 或系統調用 mkfifo 來創建。
3）信號 Signal）：信號是比較複雜的通信方式，用於通知接受進程有某種事件發生，除了用於進程間通信外，進程還可以發送信號給進程本身；linux 除了支持
Unix 早期信號語義函數 sigal 外，還支持語義符合 Posix.1 標準的信號函數
sigaction 實際上，該函數是基於 BSD 的，BSD 爲了實現可靠信號機制，又能夠統一對外接口，用 sigaction 函數重新實現了 signal 函數）。
4）消息 Message）隊列：消息隊列是消息的鏈接表，包括 Posix 消息隊列 system
5）消息隊列。有足夠權限的進程可以向隊列中添加消息，被賦予讀權限的進程則可以讀走隊列中的消息。消息隊列克服了信號承載信息量少，管道只能承載無格式字節流以及緩衝區大小受限等缺
6）信號量 semaphore）：主要作爲進程間以及同一進程不同線程之間的同步手段。
7）套接字 Socket）：更爲一般的進程間通信機制，可用於不同機器之間的進程間通信。起初是由 Unix 系統的 BSD 分支開發出來的，但現在一般可以移植到其它類 Unix 系統上：Linux 和 System V 的變種都支持套接字。

5.通過夥伴系統申請內核內存的函數有哪些？

在物理頁面管理上實現了基於區的夥伴系統 zone based buddy system）。對不同區的內存使用單獨的夥伴系統(buddy system)管理,而且獨立地監控空閒頁。相應接口 alloc_pages(gfp_mask, order) ， _ _get_free_pages(gfp_mask,
order)等。補充知識：
1.原理說明

頁全局目錄(Page Global Directory)
頁中間目錄(Page Middle Directory)
頁全局目錄包含若干頁上級目錄的地址，頁上級目錄又依次包含若干頁中間目錄的地址，而頁中間目錄又包含若干頁表的地址，每一個頁表項指向一個頁框。
Linux 中採用 4KB 大小的頁框作爲標準的內存分配單元。

5.1.夥伴系統算法
爲了避免出現這種情況，Linux 內核中引入了夥伴系統算法(buddy system)。把所有的空閒頁框分組爲 11 個塊鏈表，每個塊鏈表分別包含大小爲 1，2，4，8，16，32，64，128，256，512 和 1024 個連續頁框的頁框塊。最大可以申請 1024 個連續頁框，對應 4MB 大小的連續內存。每個頁框塊的第一個頁框的物理地址是該塊大小的整數倍。
頁框塊在釋放時，會主動將兩個連續的頁框塊合併爲一個較大的頁框塊。
slab 分配器源於 Solaris 2.4 的分配算法，工作於物理內存頁框分配器之上，管理特定大小對象的緩存，進行快速而高效的內存分配。

5.2.常用內存分配函數
unsigned long get_free_pages(gfp_t gfp_mask, unsigned int order)
get_free_pages 函數是最原始的內存分配方式，直接從夥伴系統中獲取原始頁框，返回值爲第一個頁框的起始地址。 get_free_pages 在實現上只是封裝了 alloc_pages 函數，從代碼分析，alloc_pages 函數會分配長度爲 1< struct kmem_cache *kmem_cache_create(const char *name, size_t size void (ctor)(void, struct kmem_cache *, unsigned long),
void *kmem_cache_alloc(struct kmem_cache *c, gfp_t flags) kmem_cache_create/ kmem_cache_alloc 是基於 slab 分配器的一種內存分配方式，適用於反覆分配釋放同一大小內存塊的場合。首先用 kmem_cache_create 創建一個高速緩存區域，然後用 kmem_cache_alloc 從該高速緩存區域中獲取新的內存塊。kmem_cache_alloc 一次能分配的最大內存由 mm/slab.c 文件中的
MAX_OBJ_ORDER 宏定義，在默認的 2.6.18 內核版本中，該宏定義爲 5，於是一次

最多能申請 1<<5 * 4KB 也就是 128KB 的連續物理內存。分析內核源碼發現，
kmem_cache_create 函數的 size 參數大於 128KB 時會調用 BUG()。測試結果驗證了分析結果，用 kmem_cache_create 分配超過 128KB 的內存時使內核崩潰。void *kmalloc(size_t size, gfp_t flags)

5.3.vmalloc
前面幾種內存分配方式都是物理連續的，能保證較低的平均訪問時間。但是在某些場合中，對內存區的請求不是很頻繁，較高的內存訪問時間也可以接受，這是就可以分配一段線性連續，物理不連續的地址，帶來的好處是一次可以分配較大塊的內存。圖 3-1 表示的是 vmalloc 分配的內存使用的地址範圍。vmalloc 對一次能分配的內存大小沒有明確限制。出於性能考慮，應謹慎使用 vmalloc 函數。在測試過程中，最大能一次分配 1GB 的空間。

5.4.dma_alloc_coherent
ma_addr_t *dma_handle, gfp_t gfp)

5.5.ioremap
ioremap 是一種更直接的內存“分配”方式，使用時直接指定物理起始地址和需要分配內存的大小，然後將該段物理地址映射到內核地址空間。ioremap 用到的物理地址空間都是事先確定的，和上面的幾種內存分配方式並不太一樣，並不是分配一段新的物理內存。ioremap 多用於設備驅動，可以讓 CPU 直接訪問外部設備的 IO 空間。ioremap 能映射的內存由原有的物理內存空間決定，所以沒有進行測試。
如果要分配大量的連續物理內存，上述的分配函數都不能滿足，就只能用比較特殊的方式，在 Linux 內核引導階段來預留部分內存。
void* alloc_bootmem(unsigned long size)

5.6通過內核引導參數預留頂部內存

3.幾種分配函數的比較
get_free_pages 直接對頁框進行操作 4MB 適用於分配較大量的連續物理內存
kmalloc 基於 kmem_cache_alloc 實現 128KB 最常見的分配方式，需要小於頁框大小的內存時可以使用 dma_alloc_coherent 基於 alloc_pages 實現 4MB 適用於 DMA 操作alloc_bootmem 在啓動 kernel 時，預留一段內存，內核看不見小於物理內存大小，內存管理要求較高

6.Linux 虛擬文件系統的關鍵數據結構有哪些？（至少寫出四個）

struct super_block, struct inode, struct file, struct dentry;

7.對文件或設備的操作函數保存在那個數據結構中？

struct file_operations

8.Linux 中的文件包括哪些？

執行文件，普通文件，目錄文件，鏈接文件和設備文件，管道文件。

9.創建進程的系統調用有那些？

clone(),fork(),vfork();系統調用服務例程：sys_clone,sys_fork,sys_vfork;

10.調用 schedule()進行進程切換的方式有幾種？

1.系統調用 do_fork();
2.定時中斷 do_timer();
3.喚醒進程 wake_up_process
4.改變進程的調度策略 setscheduler();
5.系統調用禮讓 sys_sched_yield();

11.Linux 調度程序是根據進程的動態優先級還是靜態優先級來調度進程的？

Liunx 調度程序是根據根據進程的動態優先級來調度進程的，但是動態優先級又是根據靜態優先級根據算法計算出來的，兩者是兩個相關聯的值。因爲高優先級的進程總是比低優先級的進程先被調度，爲防止多個高優先級的進程佔用 CPU 資源，導致其他進程不能佔有 CPU，所以引用動態優先級概念

12.進程調度的核心數據結構是哪個？

struct runqueue， struct task_struct, struct sched_struct

13.如何加載、卸載一個模塊？

insmod 加載，rmmod 卸載

14.模塊和應用程序分別運行在什麼空間？

模塊運行在內核空間，應用程序運行在用戶空間

15.Linux 中的浮點運算由應用程序實現還是內核實現？

應用程序實現，Linux 中的浮點運算是利用數學庫函數實現的，庫函數能夠被應用程序鏈接後調用，不能被內核鏈接調用。這些運算是在應用程序中運行的，然後再把結果反饋給系統。Linux 內核如果一定要進行浮點運算，需要在建立內核時選上 math-emu,使用軟件模擬計算浮點運算，據說這樣做的代價有兩個：用戶在安裝驅動時需要重建內核，可能會影響到其他的應用程序，使得這些應用程序在做浮點運算的時候也使用 math-emu，大大的降低了效率。

16.模塊程序能否使用可鏈接的庫函數？

模塊程序運行在內核空間，不能鏈接庫函數。

17.TLB 中緩存的是什麼內容？

TLB，頁表緩存，當線性地址被第一次轉換成物理地址的時候，將線性地址和物理地址的對應放到 TLB 中，用於下次訪問這個線性地址時，加快轉換速度。

18.Linux 中有哪幾種設備？

字符設備和塊設備。網卡是例外，他不直接與設備文件對應，mknod 系統調用用來創建設備文件。

19.字符設備驅動程序的關鍵數據結構是哪個？

字符設備描述符 struct cdev,cdev_alloc()用於動態的分配 cdev 描述符，
cdev_add()用於註冊一個 cdev 描述符，cdev 包含一個 struct kobject 類型的

數據結構它是核心的數據結構

20.設備驅動程序包括哪些功能函數？

open(),read(),write(),llseek(),realse();

21.如何唯一標識一個設備？

Linux 使用一個設備編號來唯一的標示一個設備，設備編號分爲：主設備號和次設備號，一般主設備號標示設備對應的驅動程序，次設備號對應設備文件指向的設備，在內核中使用 dev_t 來表示設備編號，一般它是 32 位長度，其中 12 位用於表示主設備號，20 位用於表示次設備號，利用 MKDEV（int major，int minor）；用於生成一個 dev_t 類型的對象。

22.Linux 通過什麼方式實現系統調用？

靠軟件中斷實現的，首先，用戶程序爲系統調用設置參數，其中一個編號是系統調用編號，參數設置完成後，程序執行系統調用指令，x86 上的軟中斷是有 int 產生的，這個指令會導致一個異常，產生一個事件，這個事件會導致處理器跳轉到內核態並跳轉到一個新的地址。並開始處理那裏的異常處理程序，此時的異常處理就是系統調用程序。

23.Linux 軟中斷和工作隊列的作用是什麼？

Linux 中的軟中斷和工作隊列是中斷處理。

1.軟中斷一般是“可延遲函數”的總稱，它不能睡眠，不能阻塞，它處於中斷上下文，不能進城切換，軟中斷不能被自己打斷，只能被硬件中斷打斷（上半部），可以併發的運行在多個 CPU 上。所以軟中斷必須設計成可重入的函數，因此也需要自旋鎖來保護其數據結構。
2.工作隊列中的函數處在進程上下文中，它可以睡眠，也能被阻塞，能夠在不同的進程間切換。已完成不同的工作。

可延遲函數和工作隊列都不能訪問用戶的進程空間，可延時函數在執行時不可能有任何正在運行的進程，工作隊列的函數有內核進程執行，他不能訪問用戶空間地址。

最近準備總結關於面試的一個系列。感興趣的朋友可以小關注一波。感謝！
對技術、面試，求職有興趣需求的朋友，歡迎加入我的技術交流羣，後面會升級成付費羣，大家一起交流技術~（202432010）及時提前加入哦（羣內有我整理的一些面試題、電子書，技術視頻教程等，歡迎自取）

二本畢業三年，憑什麼拿到騰訊T8offer？——Linux內核面試題整理（含答案）

1.Linux 中主要有哪幾種內核鎖？

2.Linux 中的用戶模式和內核模式是什麼含意？

3.怎樣申請大塊內核內存？

4.用戶進程間通信主要哪幾種方式？

5.通過夥伴系統申請內核內存的函數有哪些？

6.Linux 虛擬文件系統的關鍵數據結構有哪些？（至少寫出四個）

7.對文件或設備的操作函數保存在那個數據結構中？

8.Linux 中的文件包括哪些？

9.創建進程的系統調用有那些？

10.調用 schedule()進行進程切換的方式有幾種？

11.Linux 調度程序是根據進程的動態優先級還是靜態優先級來調度進程的？

12.進程調度的核心數據結構是哪個？

13.如何加載、卸載一個模塊？

14.模塊和應用程序分別運行在什麼空間？

15.Linux 中的浮點運算由應用程序實現還是內核實現？

16.模塊程序能否使用可鏈接的庫函數？

17.TLB 中緩存的是什麼內容？

18.Linux 中有哪幾種設備？

19.字符設備驅動程序的關鍵數據結構是哪個？

20.設備驅動程序包括哪些功能函數？

21.如何唯一標識一個設備？

22.Linux 通過什麼方式實現系統調用？

23.Linux 軟中斷和工作隊列的作用是什麼？

.Net 8.0 下的新RPC，IceRPC之試試的新玩法"打洞"

完美替代postman的軟件

Vue mockjs mock.js

關於遊戲付費的一點想法

我通過CKA和CKS啦！

安裝chromadb注意事項

《最新出爐》系列入門篇-Python+Playwright自動化測試-42-強大的可視化追蹤利器Trace Viewer

大數據怎麼學？對大數據開發領域及崗位的詳細解讀，完整理解大數據開發領域技術體系

安裝chromadb注意事項

前端面試題 - null是原始類型，但爲什麼typeof null的結果是object？

前端面試題 - 如何實現promise？

Java中的List

有遇到過嗎？同樣的規則 Excel 中比Python 結果大

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結