Qemu中生成針對具體體系結構的純淨代碼的方法---利用GCC的-E選項

實驗室正在研究一個叫做Qemu的項目,外國人寫的初始代碼。裏面很多內容是我們不需要的,但是卻參雜在我們關注的代碼中。突然想到了一個編譯命令-E ,它能夠一下子就把那些不需要的代碼過濾掉。

以前幾次開會大家都抱怨這個東西干擾信息太多,導致代碼分析的連貫性總是被打斷,進度特別慢。現在用我發現的那個命令處理下後,代碼量只有原來的1/5,並且過濾了所有無關信息。--這個世界清淨了。
 

gcc -E -C -DTARGET_I386 cpu-exec.c >new_cpu-exec.c

-E表示只進行預處理

-C表示不刪除註釋信息

-D表示定義一個宏 -Dmymacro等價於在程序中添加了 #define mymacro

上面個命令的作用就是保留 #ifdef TARGET_I386 和 #endif之間的386代碼,而去掉爲sparc、arm等編寫的代碼。

這裏需要提到一個小技巧。讀者不妨寫一個hello.c小程序:

#include <stdio.h>
void main()
{
    int i =0;
    return;
}

用gcc -E  -C hello.c >output_hello.c來對其進行預處理,你會發現output_hello.c中不僅包含了你原來的代碼(在最後面),而且前面還包含了 stdio.h整個頭文件內部的內容,以及stdio.h這個文件中include的其他頭文件的內容(整個include的過程是遞歸的)。

爲了避免頭文件的干擾,我們不妨先將源碼中的頭文件用////註釋掉,等進行預處理後,再將////都刪除掉。具體做法可以利用replace命令來替換。 #include 先替換成 ////#include,預處理後再////#include 替換成 #include。

在執行Qemu的預處理之前請務必弄清楚哪些宏是需要用-D進行預定義的,否則可能造成代碼遺失。
具體如何做可以看看Qemu的Makefile,在我們選定一種結構的時候(比如爲I386的機器生成可執行文件)肯定會有一系列的宏被激活。

 

最後,附上gcc的編譯選項:

==================================================================

GCC中文手冊

GCC現在是GNU中最主要和最流行的c & c++編譯器. gcc/g++在執行編譯工作的時候,總共需要以下幾步:
1.預處理,生成.i的文件[預處理器cpp]
2.將預處理後的文件不轉換成彙編語言,生成文件.s[編譯器egcs]
3.有彙編變爲目標代碼(機器代碼)生成.o的文件[彙編器as]
4.連接目標代碼,生成可執行程序[鏈接器ld]

GCC能夠處理的後綴有:
a:*.c  *.C   (C語言)
b:*.cxx   *.cc  (C++語言)
c:*.m         (面向對象的C)
d:*.i           (預處理後的C語言源文件)
e:*.ii          (預處理後的C++語言源文件)
f:*.s  *.S    (彙編語言)
h:*.h         (頭文件)

目標文件可以是:
a. *.o     編譯連接後的目標文件
b. *.a     庫文件


[參數詳解]
-x language filename
  設定文件所使用的語言,使後綴名無效,對以後的多個有效.也就是根據約定C語言的後
綴名稱是.c的,而C++的後綴名是.C或者.cpp,如果你很個性,決定你的C代碼文件的後綴
名是.pig 哈哈,那你就要用這個參數,這個參數對他後面的文件名都起作用,除非到了
下一個參數的使用。
  可以使用的參數有下面的這些
  `c', `objective-c', `c-header', `c++', `cpp-output', `assembler', and `assembler-with-cpp'.
  看到英文,應該可以理解的。
  例子用法:
  gcc -x c hello.pig
-x none filename
  關掉上一個選項,也就是讓gcc根據文件名後綴,自動識別文件類型
  例子用法:
  gcc -x c hello.pig -x none hello2.c 
-c
  只激活預處理,編譯,和彙編,也就是他只把程序做成obj文件
  例子用法:
  gcc -c hello.c
  他將生成.o的obj文件
-S
  只激活預處理和編譯,就是指把文件編譯成爲彙編代碼。
  例子用法
  gcc -S hello.c
  他將生成.s的彙編代碼,你可以用文本編輯器察看
-E
  只激活預處理,這個不生成文件,你需要把它重定向到一個輸出文件裏面.
  例子用法:
  gcc -E hello.c > pianoapan.txt
  gcc -E hello.c | more
  慢慢看吧,一個hello word 也要與處理成800行的代碼
-o
  制定目標名稱,缺省的時候,gcc 編譯出來的文件是a.out,很難聽,如果你和我有同感,改掉它,哈哈
  例子用法
  gcc -o hello.exe hello.c (哦,windows用習慣了)
  gcc -o hello.asm -S hello.c
-pipe
  使用管道代替編譯中臨時文件,在使用非gnu彙編工具的時候,可能有些問題
  gcc -pipe -o hello.exe hello.c
-ansi
  關閉gnu c中與ansi c不兼容的特性,激活ansi c的專有特性(包括禁止一些asm inline typeof關鍵字,以及UNIX,vax等預處理宏,
-fno-asm
  此選項實現ansi選項的功能的一部分,它禁止將asm,inline和typeof用作關鍵字。 
-fno-strict-prototype
  只對g++起作用,使用這個選項,g++將對不帶參數的函數,都認爲是沒有顯式的對參數
的個數和類型說明,而不是沒有參數.
  而gcc無論是否使用這個參數,都將對沒有帶參數的函數,認爲城沒有顯式說明的類型

-fthis-is-varialble
  就是向傳統c++看齊,可以使用this當一般變量使用.
-fcond-mismatch
  允許條件表達式的第二和第三參數類型不匹配,表達式的值將爲void類型 
-funsigned-char
-fno-signed-char
-fsigned-char
-fno-unsigned-char

  這四個參數是對char類型進行設置,決定將char類型設置成unsigned char(前兩個參
數)或者 signed char(後兩個參數) 
-include file
  包含某個代碼,簡單來說,就是便以某個文件,需要另一個文件的時候,就可以用它設
定,功能就相當於在代碼中使用#include<filename>
  例子用法:
  gcc hello.c -include /root/pianopan.h 
-imacros file
  將file文件的宏,擴展到gcc/g++的輸入文件,宏定義本身並不出現在輸入文件中 
-Dmacro
  相當於C語言中的#define macro 
-Dmacro=defn
  相當於C語言中的#define macro=defn 
-Umacro
  相當於C語言中的#undef macro
-undef
  取消對任何非標準宏的定義 
-Idir
  在你是用#include"file"的時候,gcc/g++會先在當前目錄查找你所制定的頭文件,如
果沒有找到,他回到缺省的頭文件目錄找,如果使用-I制定了目錄,它會先在你所制定的目錄查找,然後再按常規的順序去找.
  對於#include<file>,gcc/g++會到-I制定的目錄查找,查找不到,然後將到系統的缺省的頭文件目錄查找
-I-
  就是取消前一個參數的功能,所以一般在-Idir之後使用 
-idirafter dir
  在-I的目錄裏面查找失敗,講到這個目錄裏面查找. 
-iprefix prefix
-iwithprefix dir

  一般一起使用,當-I的目錄查找失敗,會到prefix+dir下查找   
-nostdinc
  使編譯器不再系統缺省的頭文件目錄裏面找頭文件,一般和-I聯合使用,明確限定頭文件的位置   
-nostdin C++
  規定不在g++指定的標準路經中搜索,但仍在其他路徑中搜索,.此選項在創libg++庫
使用 
-C
  在預處理的時候,不刪除註釋信息,一般和-E使用,有時候分析程序,用這個很方便的 
-M
  生成文件關聯的信息。包含目標文件所依賴的所有源代碼你可以用gcc -M hello.c 來測試一下,很簡單。
-MM
  和上面的那個一樣,但是它將忽略由#include<file>造成的依賴關係。 
-MD
  和-M相同,但是輸出將導入到.d的文件裏面 
-MMD
  和-MM相同,但是輸出將導入到.d的文件裏面 
-Wa,option
  此選項傳遞option給彙編程序;如果option中間有逗號,就將option分成多個選項,然
後傳遞給會彙編程序 
-Wl.option
  此選項傳遞option給連接程序;如果option中間有逗號,就將option分成多個選項,然
後傳遞給會連接程序. 
-llibrary
  制定編譯的時候使用的庫
  例子用法
  gcc -lcurses hello.c
  使用ncurses庫編譯程序
-Ldir
  制定編譯的時候,搜索庫的路徑。比如你自己的庫,可以用它制定目錄,不然
  編譯器將只在標準庫的目錄找。這個dir就是目錄的名稱。 
-O0
-O1
-O2
-O3
  編譯器的優化選項的4個級別,-O0表示沒有優化,-O1爲缺省值,-O3優化級別最高    
-g
  只是編譯器,在編譯的時候,產生調試信息。 
-gstabs
  此選項以stabs格式聲稱調試信息,但是不包括gdb調試信息. 
-gstabs+
  此選項以stabs格式聲稱調試信息,並且包含僅供gdb使用的額外調試信息. 
-ggdb
  此選項將儘可能的生成gdb的可以使用的調試信息.
-static
  此選項將禁止使用動態庫,所以,編譯出來的東西,一般都很大,也不需要什麼
動態連接庫,就可以運行.
-share
  此選項將盡量使用動態庫,所以生成文件比較小,但是需要系統由動態庫.
-traditional
  試圖讓編譯器支持傳統的C語言特性


運行 gcc/egcs
*****************************************運行 gcc/egcs*****************************************************
  GCC 是 GNU 的 C 和 C++ 編譯器。實際上,GCC 能夠編譯三種語言:C、C++ 和 Object C(C 語言的一種面向對象擴展)。利用 gcc 命令可同時編譯並連接 C 和 C++ 源程序。
  如果你有兩個或少數幾個 C 源文件,也可以方便地利用 GCC 編譯、連接並生成可執行文件。例如,假設你有兩個源文件 main.c 和 factorial.c 兩個源文件,現在要編譯生成一個計算階乘的程序。
代碼:
-----------------------
清單 factorial.c
-----------------------
int factorial (int n)
{
  if (n <= 1)
   return 1;
  else
   return factorial (n - 1) * n;
}
-----------------------
清單 main.c
-----------------------
#include <stdio.h>
#include <unistd.h>
int factorial (int n);
int main (int argc, char **argv)
{
  int n;
  if (argc < 2)
  {
    printf ("Usage: %s n/n", argv [0]);
    return -1;
  }
  else
  {
   n = atoi (argv[1]);
   printf ("Factorial of %d is %d./n", n, factorial (n));
   }
  return 0;
}
-----------------------
利用如下的命令可編譯生成可執行文件,並執行程序:
$ gcc -o factorial main.c factorial.c
$ ./factorial 5
Factorial of 5 is 120.
GCC 可同時用來編譯 C 程序和 C++ 程序。一般來說,C 編譯器通過源文件的後綴名來判斷是 C 程序還是 C++ 程序。在 Linux 中,C 源文件的後綴名爲 .c,而 C++ 源文件的後綴名爲 .C 或 .cpp。但是,gcc 命令只能編譯 C++ 源文件,而不能自動和 C++ 程序使用的庫連接。因此,通常使用 g++ 命令來完成 C++ 程序的編譯和連接,該程序會自動調用 gcc 實現編譯。假設我們有一個如下的 C++ 源文件(hello.C):
#include <iostream>
void main (void)
{
  cout << "Hello, world!" << endl;
}
則可以如下調用 g++ 命令編譯、連接並生成可執行文件:
$ g++ -o hello hello.C
$ ./hello
Hello, world!

 

gcc 常用命令

**********************gcc/egcs 的主要選項*************************************************************** 
選項 解釋
-ansi 只支持 ANSI 標準的 C 語法。這一選項將禁止 GNU C 的某些特色,例如 asm 或 typeof 關鍵詞。
-c 只編譯並生成目標文件。
-DMACRO 以字符串“1”定義 MACRO 宏。
-DMACRO=DEFN 以字符串“DEFN”定義 MACRO 宏。
-E 只運行C 預編譯器。
-g 生成調試信息。GNU 調試器可利用該信息。
-IDIRECTORY 指定額外的頭文件搜索路徑DIRECTORY。
-LDIRECTORY 指定額外的函數庫搜索路徑DIRECTORY。
-lLIBRARY 連接時搜索指定的函數庫LIBRARY。
-m486 針對 486 進行代碼優化。
-o FILE 生成指定的輸出文件。用在生成可執行文件時。
-O0 不進行優化處理。
-O 或 -O1 優化生成代碼。
-O2 進一步優化。
-O3 比 -O2 更進一步優化,包括 inline 函數。
-shared 生成共享目標文件。通常用在建立共享庫時。
-static 禁止使用共享連接。
-UMACRO 取消對 MACRO 宏的定義。
-w 不生成任何警告信息。
-Wall 生成所有警告信息。

 

【手 冊 來  源】:http://blog.chinaunix.net/article.php?articleId=42935&blogId=8800

補充一些新內容。剛纔(2008.3.1 02:35)將Qemu的makefile和configure分析執行了一下,執行config後得到的Makefile文件展開如下:
# Makefile for QEMU.
   # comment this, and expand it in the following added code.
#include config-host.mak


# add by raywill
# Automatically generated by configure - do not modify
# Configured with: ./configure --target-list=i386 --disable-gfx-check
prefix
=/usr/local
bindir
=/usr/local/bin
mandir
=/usr/local/share/man
datadir
=/usr/local/share/qemu
docdir
=/usr/local/share/doc/qemu
MAKE
=make
INSTALL
=install
CC
=gcc
HAVE_GCC3_OPTIONS
=yes
HOST_CC
=gcc
AR
=ar
STRIP
=strip -s -R .comment -R .note
OS_CFLAGS
=
CFLAGS
= -Wall -O2 -g -fno-strict-aliasing
LDFLAGS
= -g
EXESUF
=
ARCH
=i386
CONFIG_GDBSTUB
=yes
CONFIG_SLIRP
=yes
CONFIG_OSS
=yes
VERSION
=0.9.0
SRC_PATH
=/mnt/hgfs/LinuxShare/qemu-0.9.0
TARGET_DIRS
=i386
#end add 





.PHONY: all clean distclean dvi info install install-doc tar tarbin 
    speed test test2 html dvi info

BASE_CFLAGS
=
BASE_LDFLAGS
=

BASE_CFLAGS 
+= $(OS_CFLAGS)
ifeq 
($(ARCH),sparc)
BASE_CFLAGS 
+= -mcpu=ultrasparc
endif
CPPFLAGS 
+= -I. -D_GNU_SOURCE -D_FILE_OFFSET_BITS=64 -D_LARGEFILE_SOURCE
LIBS
=
TOOLS
=qemu-img$(EXESUF)
ifdef CONFIG_STATIC
BASE_LDFLAGS 
+= -static
endif
ifdef BUILD_DOCS
DOCS
=qemu-doc.html qemu-tech.html qemu.1 qemu-img.1
else
DOCS
=
endif

ifndef CONFIG_DARWIN
ifndef CONFIG_WIN32
ifndef CONFIG_SOLARIS
LIBS
+=-lrt
endif
endif
endif

all: 
$(TOOLS) $(DOCS) recurse-all

subdir-%: dyngen
$(EXESUF)
    
$(MAKE) -C $(subst subdir-,,$@) all

recurse-all: 
$(patsubst %,subdir-%, $(TARGET_DIRS))

qemu-img
$(EXESUF): qemu-img.c cutils.c block.c block-raw.c block-cow.c block-qcow.c aes.c block-vmdk.c block-cloop.c block-dmg.c block-bochs.c block-vpc.c block-vvfat.c block-qcow2.c
    
$(CC) -DQEMU_TOOL $(CFLAGS) $(CPPFLAGS) $(BASE_CFLAGS) $(LDFLAGS) $(BASE_LDFLAGS) -o $$^ -lz $(LIBS)

dyngen
$(EXESUF): dyngen.c
    
$(HOST_CC) $(CFLAGS) $(CPPFLAGS) $(BASE_CFLAGS) -o $$^

clean:
# avoid old build problems by removing potentially incorrect old files
    rm -f config
.mak config.h op-i386.h opc-i386.h gen-op-i386.h op-arm.h opc-arm.h gen-op-arm.
    rm -f *
.o *.$(TOOLS) dyngen$(EXESUF) TAGS *.pod *~ */*~
    
$(MAKE) -C tests clean
    
for d in $(TARGET_DIRS); do 
    
$(MAKE) -C $$$@ || exit 1 ; 
        done

distclean: clean
    rm -f config-host
.mak config-host.$(DOCS)
    rm -f qemu-{doc
,tech}.{info,aux,cp,dvi,fn,info,ky,log,pg,toc,tp,vr}
    
for d in $(TARGET_DIRS); do 
    rm -rf 
$$d || exit 1 ; 
        done

KEYMAPS
=da     en-gb  et  fr     fr-ch  is  lt  modifiers  no  pt-br  sv 
ar      de     en-us  fi  fr-be  hr     it  lv  nl         pl  ru     th 

common  de-ch  es     fo  fr-ca  hu     ja  mk  nl-be      pt  sl     tr

install-doc: 
$(DOCS)
    
mkdir -p "$(DESTDIR)$(docdir)"
    
$(INSTALL) -m 644 qemu-doc.html  qemu-tech.html "$(DESTDIR)$(docdir)"
ifndef CONFIG_WIN32
    
mkdir -p "$(DESTDIR)$(mandir)/man1"
    
$(INSTALL) qemu.1 qemu-img.1 "$(DESTDIR)$(mandir)/man1"
endif

install: all 
$(if $(BUILD_DOCS),install-doc)
    
mkdir -p "$(DESTDIR)$(bindir)"
    
$(INSTALL) -m 755 -s $(TOOLS) "$(DESTDIR)$(bindir)"
    
mkdir -p "$(DESTDIR)$(datadir)"
    
for x in bios.bin vgabios.bin vgabios-cirrus.bin ppc_rom.bin 
        video
.x openbios-sparc32 linux_boot.bin pxe-ne2k_pci.bin 
        pxe-rtl8139
.bin pxe-pcnet.bin; do 
        
$(INSTALL) -m 644 $(SRC_PATH)/pc-bios/$$"$(DESTDIR)$(datadir)"; 
    done
ifndef CONFIG_WIN32
    
mkdir -p "$(DESTDIR)$(datadir)/keymaps"
    
for x in $(KEYMAPS); do 
        
$(INSTALL) -m 644 $(SRC_PATH)/keymaps/$$"$(DESTDIR)$(datadir)/keymaps"; 
    done
endif
    
for d in $(TARGET_DIRS); do 
    
$(MAKE) -C $$$@ || exit 1 ; 
        done

# various test targets
test speed test2: all
    
$(MAKE) -C tests $@

TAGS: 
    etags *
.[ch] tests/*.[ch]

cscope:
    rm -f 
./cscope.*
    
find . -name "*.[ch]" -print > ./cscope.files
    cscope -b

# documentation
%
.html: %.texi
    texi2html -monolithic -number 
$<

%
.info: %.texi
    makeinfo 
$< -o $@

%
.dvi: %.texi
    texi2dvi 
$<

qemu
.1: qemu-doc.texi
    
$(SRC_PATH)/texi2pod.pl $< qemu.pod
    pod2man --section
=1 --center=" " --release=" " qemu.pod > $@

qemu-img
.1: qemu-img.texi
    
$(SRC_PATH)/texi2pod.pl $< qemu-img.pod
    pod2man --section
=1 --center=" " --release=" " qemu-img.pod > $@

info: qemu-doc
.info qemu-tech.info

dvi: qemu-doc
.dvi qemu-tech.dvi

html: qemu-doc
.html qemu-tech.html

VERSION ?
= $(shell cat VERSION)
FILE 
= qemu-$(VERSION)

# tar release (use 'make -k tar' on a checkouted tree)
tar:
    rm -rf 
/tmp/$(FILE)
    cp -r 
. /tmp/$(FILE)
    
( cd /tmp ; tar zcvf ~/$(FILE).tar.gz $(FILE) --exclude CVS )
    rm -rf 
/tmp/$(FILE)

# generate a binary distribution
tarbin:
    
( cd / ; tar zcvf ~/qemu-$(VERSION)-i386.tar.gz 
    
$(bindir)/qemu 
    
$(bindir)/qemu-system-ppc 
    
$(bindir)/qemu-system-sparc 
    
$(bindir)/qemu-system-x86_64 
    
$(bindir)/qemu-system-mips 
    
$(bindir)/qemu-system-mipsel 
    
$(bindir)/qemu-system-arm 
    
$(bindir)/qemu-i386 
        
$(bindir)/qemu-arm 
        
$(bindir)/qemu-armeb 
        
$(bindir)/qemu-sparc 
        
$(bindir)/qemu-ppc 
        
$(bindir)/qemu-mips 
        
$(bindir)/qemu-mipsel 
        
$(bindir)/qemu-img 
    
$(datadir)/bios.bin 
    
$(datadir)/vgabios.bin 
    
$(datadir)/vgabios-cirrus.bin 
    
$(datadir)/ppc_rom.bin 
    
$(datadir)/video.
    
$(datadir)/openbios-sparc32 
    
$(datadir)/linux_boot.bin 
        
$(datadir)/pxe-ne2k_pci.bin 
    
$(datadir)/pxe-rtl8139.bin 
        
$(datadir)/pxe-pcnet.bin 
    
$(docdir)/qemu-doc.html 
    
$(docdir)/qemu-tech.html 
    
$(mandir)/man1/qemu.1 $(mandir)/man1/qemu-img.1 )

ifneq 
($(wildcard .depend),)
include 
.depend
endif

 上面的代碼如果還看不出什麼端倪,下面的代碼則說明問題了:

/*
Config.h
 Automatically generated by configure - do not modify 
*/
#include "../config-host.h"
#define CONFIG_QEMU_PREFIX "/usr/gnemul/qemu-i386"
#define TARGET_ARCH "i386"
#define TARGET_I386 1
/*
Config-host.h
 Automatically generated by configure - do not modify 
*/
#define CONFIG_QEMU_SHAREDIR "/usr/local/share/qemu"
#define HOST_I386 1
#define HOST_LONG_BITS 32
#define HAVE_BYTESWAP_H 1
#define CONFIG_GDBSTUB 1
#define CONFIG_SLIRP 1
#define CONFIG_OSS 1
#define QEMU_VERSION "0.9.0"
#define CONFIG_UNAME_RELEASE ""

這端代碼是通過./configure命令生成的,它將TARGET相關的編譯參數都定義了。也就是說……哈哈~~Good Luck~~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章