系統調用(System Call)是操作系統爲在用戶運行的進程與硬件設備(如CPU,磁盤,打印機等)進行交互提供的一組接口。當進程需要發生系統調用時,CPU通過軟中斷切換到內核態開始執行內核系統調用函數。
1. 通過 glibc 提供的庫函數
glibc 是 Linux 下使用的開源的標準 C 庫,它是 GNU 發佈的 libc 庫,即運行時庫。glibc 爲程序員提供豐富的 API(Application Programming Interface),除了例如字符串處理、數學運算等用戶態服務之外,最重要的是封裝了操作系統提供的系統服務,即系統調用的封裝。那麼glibc提供的系統調用API與內核特定的系統調用之間的關係是什麼呢?
- 通常情況,每個特定的系統調用對應了至少一個 glibc 封裝的庫函數,如系統提供的打開文件系統調用 sys_open 對應的是 glibc 中的 open 函數;
- 其次,glibc 一個單獨的 API 可能調用多個系統調用,如 glibc 提供的 printf 函數就會調用如 sys_open、sys_mmap、sys_write、sys_close 等等系統調用;
- 另外,多個 API 也可能只對應同一個系統調用,如glibc 下實現的 malloc、calloc、free 等函數用來分配和釋放內存,都利用了內核的 sys_brk 的系統調用。
舉例來說,我們通過 glibc 提供的chmod 函數來改變文件 etc/passwd
的屬性爲 444:
#include <sys/types.h>
#include <sys/stat.h>
#include <errno.h>
#include <stdio.h>
int main()
{
int rc;
rc = chmod("/etc/passwd", 0444);
if (rc == -1)
fprintf(stderr, "chmod failed, errno = %d\n", errno);
else
printf("chmod success!\n");
return 0;
}
在普通用戶下編譯運用,輸出結果爲:
chmod failed, errno = 1
上面系統調用返回的值爲-1,說明系統調用失敗,錯誤碼爲1,在 /usr/include/asm-generic/errno-base.h
文件中有如下錯誤代碼說明:
#define EPERM 1 /* Operation not permitted */
即無權限進行該操作,我們以普通用戶權限是無法修改 /etc/passwd
文件的屬性的,結果正確。
2. 使用 syscall 直接調用
使用上面的方法有很多好處,首先你無須知道更多的細節,如 chmod 系統調用號,你只需瞭解 glibc 提供的 API 的原型;其次,該方法具有更好的移植性,你可以很輕鬆將該程序移植到其他平臺,或者將 glibc 庫換成其它庫,程序只需做少量改動。
但有點不足是,如果 glibc 沒有封裝某個內核提供的系統調用時,我就沒辦法通過上面的方法來調用該系統調用。如我自己通過編譯內核增加了一個系統調用,這時 glibc 不可能有你新增系統調用的封裝 API,此時我們可以利用 glibc 提供的syscall 函數直接調用。該函數定義在 unistd.h 頭文件中,函數原型如下:
long int syscall (long int sysno, ...)
sysno 是系統調用號,每個系統調用都有唯一的系統調用號來標識。在 sys/syscall.h
中有所有可能的系統調用號的宏定義。
… 爲剩餘可變長的參數,爲系統調用所帶的參數,根據系統調用的不同,可帶0~5個不等的參數,如果超過特定系統調用能帶的參數,多餘的參數被忽略。
返回值 該函數返回值爲特定系統調用的返回值,在系統調用成功之後你可以將該返回值轉化爲特定的類型,如果系統調用失敗則返回 -1,錯誤代碼存放在 errno 中。
還以上面修改 /etc/passwd
文件的屬性爲例,這次使用 syscall 直接調用:
#include <stdio.h>
#include <unistd.h>
#include <sys/syscall.h>
#include <errno.h>
int main()
{
int rc;
rc = syscall(SYS_chmod, "/etc/passwd", 0444);
if (rc == -1)
fprintf(stderr, "chmod failed, errno = %d\n", errno);
else
printf("chmod succeess!\n");
return 0;
}
在普通用戶下編譯執行,輸出的結果與上例相同。
3. 通過 int 指令陷入
如果我們知道系統調用的整個過程的話,應該就能知道用戶態程序通過軟中斷指令int 0x80
來陷入內核態(在Intel Pentium II 又引入了sysenter指令),參數的傳遞是通過寄存器,eax 傳遞的是系統調用號,ebx、ecx、edx、esi和edi 來依次傳遞最多五個參數,當系統調用返回時,返回值存放在 eax 中。
仍然以上面的修改文件屬性爲例,將調用系統調用那段寫成內聯彙編代碼:
#include <stdio.h>
#include <sys/types.h>
#include <sys/syscall.h>
#include <errno.h>
int main()
{
long rc;
char *file_name = "/etc/passwd";
unsigned short mode = 0444;
asm(
"int $0x80"
: "=a" (rc)
: "0" (SYS_chmod), "b" ((long)file_name), "c" ((long)mode)
);
if ((unsigned long)rc >= (unsigned long)-132) {
errno = -rc;
rc = -1;
}
if (rc == -1)
fprintf(stderr, "chmode failed, errno = %d\n", errno);
else
printf("success!\n");
return 0;
}
如果 eax
寄存器存放的返回值(存放在變量 rc 中)在 -1~-132 之間,就必須要解釋爲出錯碼(在/usr/include/asm-generic/errno.h
文件中定義的最大出錯碼爲 132),這時,將錯誤碼寫入 errno 中,置系統調用返回值爲 -1;否則返回的是 eax 中的值。
上面程序在 32位Linux下以普通用戶權限編譯運行結果與前面兩個相同!