Linux下C程序的鏈接過程

   今天看到一個很有意思的小程序,它讓我對Linux下C程序的編譯鏈接有了一個全新的認識!

   這個程序的就是寫一個簡單的輸出“hello World!”:

  要求:1.不使用C運行庫,寫一個獨立於任何庫的程序。(也就是說我們不能#include<stdio>)。

      2.不適用main函數爲程序的入口(大家都知道一般使用了庫的程序都是使用main函數作爲程序的入口,在這裏我們使用自己寫的函數nomain作爲程序的入口)。

      3.使用連接器ld把程序的所有段合爲一個“Tinytext”段。

  顯然要符合要求我們就只能用匯編去寫,源代碼如下:

char *str="Hello world!\n";

void print()
{
    asm("movq $13,%%rdx \n\t"
        "movq %0,%%rcx \n\t"
        "movq $0,%%rbx \n\t"
        "movq $4,%%rax \n\t"
        "int $0x80     \n\t"
        ::"r"(str):"edx","ecx","ebx");
}

void exit()
{
   asm("movq $42,%rbx   \n\t"
       "movq $1,%rax    \n\t"
       "int $0x80       \n\t");
}

void nomain()
{
   print();
   exit();
}

   我們vi一個TinyHelloWorld.c。裏面寫上如上代碼。

wKiom1c6gDzi1qGOAAAqkVw4NJs385.png

   本人的環境是64位的,如果是32爲環境的朋友只要把,movq改爲movl,rdx改爲edx,rax改爲eax,rbx改爲ebx。

  由於操作系統的系統結構發生了變化,在x86-64中,所有通用寄存器(GPRs)都從32位擴充到了64位,名字也發生了變化。8個通用寄存器(eax, ebx, ecx, edx, ebp, esp, esi, edi)在新的結構中被命名爲rax, rbx, rcx, rdx, rbp, rsp, rsi, rdi。movl命令也需相應改成movq

  首先程序的入口時nomain函數,它調用print函數打印HelloWorld,然後調用exit函數退出。print函數使用了Linux的WRITE系統調用,exit函數使用了EXIT系統調用

  定義一個字符串,它是放在只讀代碼段的。

  print函數和exit函數中,WRITE系統調用和EXIT系統調用都是通過0x80中斷實現的。其中eax爲調用號rbx,rcx,rdx是一些寄存器用來傳遞參數的。比如WRITE系統調用是往一個文件句柄寫入數據,如果用C語言來表示WRITE系統調用的話他的函數原型是:

int write(int filedesc,char* buffer,int size)
  • WRITE的調用號爲4,則rax爲0。

  • filedesc表示被寫入的句柄文件,我們默認輸出爲默認終端,他的句柄爲0,所以rbx爲0。

  • buffer表示要寫入的緩衝區地址使用rcx寄存器傳送,我們要輸出str字符串,所以rcx=str。

  • size表示要寫入的字節數,這裏str的長度爲13字節,所以rdx=13。



 代碼寫好以後我們使用普通的命令行來編譯鏈接TinyHelloWorld.c

gcc -c -fno-builtin TinyHelloWorld.c  //生成TinyHelloWorld.o
  • -c參數是表示編譯。

  • -fno-builtin參數關閉GCC內置函數的功能(GCC中有很多內置的函數,它你會把C庫的一些函數替換成內置的函數,以達到優化的功能)


    然後鏈接TinyHelloWorld.o文件生成可執行文件TinyHelloWorld.

ld -static -e nomain -o TinyHelloWorld TinyHelloWorld.o
  • -static參數指在這裏使用靜態鏈接方式。

  • -e nomai參數表示程序的入口爲nomain函數

  • -o 表示鏈接


    wKiom1c6gs2jXuoYAAAuU3aOtZg830.png

    運行可以輸出Hello World!


wKiom1c6gyKAPVsiAAALJh-VQTw145.png

至此,一個HelloWorld程序寫好了。

  我們使用objdump指令來查看TinyHelloWorld這個文件可以看出來他又4個段:.data .rodata .text .commond 段。這幾個段的屬性都是隻讀的,按理來說我們可以把他們合圍一個段。這就需要藉助ld鏈接器來實現。

objdump -h TinyHelloWorld

wKioL1c6iHSz_u_eAABPiBff344286.png


使用-verbose查看默認的鏈接腳本信息:

ld -verbose TinyHelloWorld

然後編寫TinyHelloWorld.lds腳本

ENTRY(nomain)

SECTIONS
{
  .= 0x08048000 + SIZEOF_HEADERS;
  tinytext : { *(.text) *(.data) *(.rodata)}
  /DISCARD/ :{ *(.comment) }
}

然後使用自己編寫的腳本鏈接目標文件

gcc -c -fno-builtin TinyHelloWorld.
ld -static -T TinyHelloWorld.lds -o TinyHello TinyHelloWorld.o

  -static -T TinyHelloWorld.lds參數是使用靜態鏈接,並且使用自己編寫的TinyHelloWorld.lds腳本鏈接。

   它會生成一個588個字節的可執行文件TinyHelloWorld。執行可以打印Hello World!。如果你使用objdump查看TinyHelloWorld的段,你會發現我們達到了將最後一個只有一個段的要求。

本文出自 “稻草陽光” 博客,請務必保留此出處http://helloleex.blog.51cto.com/10728491/1774383

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章