不定參數應用2

出處不詳。。額。。

 

我們在C語言編程中會遇到一些參數個數可變的函數,例如printf() 
這個函數,它的定義是這樣的: 
int printf( const char* format, ...); 
它除了有一個參數format固定以外,後面跟的參數的個數和類型是 
可變的,例如我們可以有以下不同的調用方法: 
printf("%d",i); 
printf("%s",s); 
printf("the number is %d ,string is:%s", i, s); 
究竟如何寫可變參數的C函數以及這些可變參數的函數編譯器是如何實 
現的呢?本文就這個問題進行一些探討,希望能對大家有些幫助.C++ 
網友知道這些問題在C++裏不存在,因爲C++具有多態性.C++C的一個 
超集,以下的技術也可以用於C++的程序中.限於本人的水平,文中如果有 
不當之處,請大家指正. 

(
)寫一個簡單的可變參數的C函數 

下面我們來探討如何寫一個簡單的可變參數的C函數.寫可變參數的 
C
函數要在程序中用到以下這些宏: 
void va_start( va_list arg_ptr, prev_param ); 

type va_arg( va_list arg_ptr, type ); 

void va_end( va_list arg_ptr ); 
va
在這裏是variable-argument(可變參數)的意思. 
這些宏定義在stdarg.h,所以用到可變參數的程序應該包含這個 
頭文件.下面我們寫一個簡單的可變參數的函數,改函數至少有一個整數 
參數,第二個參數也是整數,是可選的.函數只是打印這兩個參數的值. 
void simple_va_fun(int i, ...) 
{ 
va_list arg_ptr; 
int j=0; 

va_start(arg_ptr, i); 
j=va_arg(arg_ptr, int); 
va_end(arg_ptr); 
printf("%d %d/n", i, j); 
return; 
} 
我們可以在我們的頭文件中這樣聲明我們的函數: 
extern void simple_va_fun(int i, ...); 
我們在程序中可以這樣調用: 
simple_va_fun(100); 
simple_va_fun(100,200); 
從這個函數的實現可以看到,我們使用可變參數應該有以下步驟: 
1)
首先在函數裏定義一個va_list型的變量,這裏是arg_ptr,這個變 
量是指向參數的指針. 
2)
然後用va_start宏初始化變量arg_ptr,這個宏的第二個參數是第 
一個可變參數的前一個參數,是一個固定的參數. 
3)
然後用va_arg返回可變的參數,並賦值給整數j. va_arg的第二個 
參數是你要返回的參數的類型,這裏是int. 
4)
最後用va_end宏結束可變參數的獲取.然後你就可以在函數裏使 
用第二個參數了.如果函數有多個可變參數的,依次調用va_arg 
取各個參數. 
如果我們用下面三種方法調用的話,都是合法的,但結果卻不一樣: 
1)simple_va_fun(100); 
結果是:100 -123456789(會變的值) 
2)simple_va_fun(100,200); 
結果是:100 200 
3)simple_va_fun(100,200,300); 
結果是:100 200 
我們看到第一種調用有錯誤,第二種調用正確,第三種調用盡管結果 
正確,但和我們函數最初的設計有衝突.下面一節我們探討出現這些結果 
的原因和可變參數在編譯器中是如何處理的. 

(
)可變參數在編譯器中的處理 

我們知道va_start,va_arg,va_end是在stdarg.h中被定義成宏的, 
由於1)硬件平臺的不同 2)編譯器的不同,所以定義的宏也有所不同, 
面以VC++stdarg.hx86平臺的宏定義摘錄如下(’/’號表示折行): 

typedef char * va_list; 

#define _INTSIZEOF(n) / 
((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) ) 

#define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) ) 

#define va_arg(ap,t) / 
( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) ) 

#define va_end(ap) ( ap = (va_list)0 ) 

定義_INTSIZEOF(n)主要是爲了某些需要內存的對齊的系統.C語言的函 
數是從右向左壓入堆棧的,(1)是函數的參數在堆棧中的分佈位置. 
們看到va_list被定義成char*,有一些平臺或操作系統定義爲void*. 
va_start的定義,定義爲&v+_INTSIZEOF(v),&v是固定參數在堆棧的 
地址,所以我們運行va_start(ap, v)以後,ap指向第一個可變參數在堆 
棧的地址,如圖: 

高地址|-----------------------------| 
|
函數返回地址 | 
|-----------------------------| 
|....... | 
|-----------------------------| 
|
n個參數(第一個可變參數) | 
|-----------------------------|<--va_start
ap指向 
|
n-1個參數(最後一個固定參數)| 
低地址|-----------------------------|<-- &v 
( 1 ) 

然後,我們用va_arg()取得類型t的可變參數值,以上例爲int型爲例, 
們看一下va_argint型的返回值: 
j= ( *(int*)((ap += _INTSIZEOF(int))-_INTSIZEOF(int)) ); 
首先ap+=sizeof(int),已經指向下一個參數的地址了.然後返回 
ap-sizeof(int)
int*指針,這正是第一個可變參數在堆棧裏的地址 
(
2).然後用*取得這個地址的內容(參數值)賦給j. 

高地址|-----------------------------| 
|
函數返回地址 | 
|-----------------------------| 
|....... | 
|-----------------------------|<--va_arg
ap指向 
|
n個參數(第一個可變參數) | 
|-----------------------------|<--va_start
ap指向 
|
n-1個參數(最後一個固定參數)| 
低地址|-----------------------------|<-- &v 
( 2 ) 

最後要說的是va_end宏的意思,x86平臺定義爲ap=(char*)0;使ap不再 
指向堆棧,而是跟NULL一樣.有些直接定義爲((void*)0),這樣編譯器不 
會爲va_end產生代碼,例如gcclinuxx86平臺就是這樣定義的. 
在這裏大家要注意一個問題:由於參數的地址用於va_start, 
以參數不能聲明爲寄存器變量或作爲函數或數組類型. 
關於va_start, va_arg, va_end的描述就是這些了,我們要注意的 
是不同的操作系統和硬件平臺的定義有些不同,但原理卻是相似的. 

(
)可變參數在編程中要注意的問題 

因爲va_start, va_arg, va_end等定義成宏,所以它顯得很愚蠢, 
可變參數的類型和個數完全在該函數中由程序代碼控制,它並不能智能 
地識別不同參數的個數和類型. 
有人會問:那麼printf中不是實現了智能識別參數嗎?那是因爲函數 
printf
是從固定參數format字符串來分析出參數的類型,再調用va_arg 
的來獲取可變參數的.也就是說,你想實現智能識別可變參數的話是要通 
過在自己的程序裏作判斷來實現的. 
另外有一個問題,因爲編譯器對可變參數的函數的原型檢查不夠嚴 
,對編程查錯不利.如果simple_va_fun()改爲: 
void simple_va_fun(int i, ...) 
{ 
va_list arg_ptr; 
char *s=NULL; 

va_start(arg_ptr, i); 
s=va_arg(arg_ptr, char*); 
va_end(arg_ptr); 
printf("%d %s/n", i, s); 
return; 
} 
可變參數爲char*,當我們忘記用兩個參數來調用該函數時,就會出現 
core dump(Unix)
或者頁面非法的錯誤(window平臺).但也有可能不出 
,但錯誤卻是難以發現,不利於我們寫出高質量的程序. 
以下提一下va系列宏的兼容性. 
System V Unix
va_start定義爲只有一個參數的宏: 
va_start(va_list arg_ptr); 
ANSI C則定義爲: 
va_start(va_list arg_ptr, prev_param); 
如果我們要用system V的定義,應該用vararg.h頭文件中所定義的 
,ANSI C的宏跟system V的宏是不兼容的,我們一般都用ANSI C,所以 
ANSI C的定義就夠了,也便於程序的移植. 


小結: 
可變參數的函數原理其實很簡單,va系列是以宏定義來定義的, 
現跟堆棧相關.我們寫一個可變函數的C函數時,有利也有弊,所以在不必 
要的場合,我們無需用到可變參數.如果在C++,我們應該利用C++的多 
態性來實現可變參數的功能,儘量避免用C語言的方式來實現. 

寫這篇文章時,適逢感冒,多得有她的關懷,謹把這篇文章獻給她... 

發佈了10 篇原創文章 · 獲贊 1 · 訪問量 7萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章