C語言的那些小祕密之volatile

volatile的重要性對於搞嵌入式的程序員來說是不言而喻的,對於volatile的瞭解程度常常被不少公司在招聘嵌入式編程人員面試的時候作爲衡量一個應聘者是否合格的參考標準之一,爲什麼volatile如此的重要呢?這是因爲嵌入式的編程人員要經常同中斷、底層硬件等打交道,而這些都用到volatile,所以說嵌入式程序員必須要掌握好volatile的使用。

其實就象讀者所熟悉的const一樣,volatile是一個類型修飾符。在開始講解volatile之前我們先來講解下接下來要用到的一個函數,知道如何使用該函數的讀者可以跳過該函數的講解部分。

原型:int gettimeofday ( struct timeval * tv , struct timezone * tz );

頭文件:#include <sys/time.h>

功能:獲取當前時間

返回值:如果成功返回0,失敗返回-1,錯誤代碼存於errno中。

gettimeofday()會把目前的時間用tv所指的結構返回,當地時區的信息則放到tz所指的結構中。

[cpp] view plain copy
  1. timeval結構定義爲:  
  2. struct timeval{  
  3.     long tv_sec;   
  4.     long tv_usec;   
  5. };  
  6. timezone 結構定義爲:  
  7. struct timezone{  
  8.     int tz_minuteswest;   
  9.     int tz_dsttime;   
  10. };  

先來說說timeval結構體,其中的tv_sec存放的是秒,而tv_usec存放的是微秒。其中的timezone成員變量我們很少使用,在此簡單的說說它在gettimeofday()函數中的作用是把當地時區的信息則放到tz所指的結構中,在其中tz_minuteswest變量裏存放的是和Greenwich 時間差了多少分鐘,tz_dsttime日光節約時間的狀態。我們在此主要的是關注前一個成員變量timeval,後一個我們在此不使用,所以使用gettimeofday()函數的時候我們把有一個參數設定爲NULL,下面先來看看一段簡單的代碼。

[cpp] view plain copy
  1. #include <stdio.h>  
  2. #include <sys/time.h>  
  3.   
  4. int main(int argc, char * argv[])  
  5. {  
  6.     struct timeval start,end;  
  7.     gettimeofday( &start, NULL );  /*測試起始時間*/  
  8.     double timeuse;  
  9.     int j;  
  10.     for(j=0;j<1000000;j++)  
  11.         ;  
  12.     gettimeofday( &end, NULL );   /*測試終止時間*/  
  13.     timeuse = 1000000 * ( end.tv_sec - start.tv_sec ) + end.tv_sec - start.tv_sec ;  
  14.     timeuse /= 1000000;  
  15. printf("運行時間爲:%f\n",timeuse);  
  16.   
  17.     return 0;  
  18.   
  19. }  

運行結果爲:

[cpp] view plain copy
  1. root@ubuntu:/home# ./p  
  2. 運行時間爲:0.002736  

現在來簡單的分析下代碼,通過end.tv_sec - start.tv_sec 我們得到了終止時間跟起始時間以秒爲單位的時間間隔,然後使用end.tv_sec - start.tv_sec 得到終止時間跟起始時間以微妙爲單位的時間間隔。因爲時間單位的原因,所以我們在此對於( end.tv_sec - start.tv_sec ) 得到的結果乘以1000000轉換爲微秒進行計算,之後再使用timeuse /= 1000000;將其轉換爲秒。現在瞭解瞭如何通過gettimeofday()函數來測試start到end代碼之間的運行時間,那麼我們現在接下來看看volatile修飾符。

通常在代碼中我們爲了防止一個變量在意想不到的情況下被改變,我們會將變量定義爲volatile,這從而就使得編譯器就不會自作主張的去“動”這個變量的值了。準確點說就是每次在用到這個變量時必須每次都重新從內存中直接讀取這個變量的值,而不是使用保存在寄存器裏的備份。

在舉例之前我們先大概的說下Debug和Release 模式下編譯方式的區別,Debug 通常稱爲調試版本,它包含調試信息,並且不作任何優化,便於程序員調試程序。Release 稱爲發佈版本,它往往是進行了各種優化,使得程序在代碼大小和運行速度上都是最優的,以便用戶很好地使用。大致的知道了Debug和Release的區別之後,我們下面來看看一段代碼。

[cpp] view plain copy
  1. #include <stdio.h>  
  2.   
  3. void main()  
  4. {  
  5. int a=12;  
  6. printf("a的值爲:%d\n",a);  
  7. __asm {mov dword ptr [ebp-4], 0h}  
  8. int b = a;  
  9. printf("b的值爲:%d\n",b);  
  10. }  

先分析下上面的代碼,我們使用了一句__asm {mov dword ptr [ebp-4], 0h}來修改變量a在內存中的值,如果有對這句代碼功能不清楚的讀者可以參考我之前的一篇《C語言的那些小祕密之堆棧》,在此就不做過多的講解了。前面已經講解了Debug和Release 編譯方式的區別,那麼我們現在來對比看下結果。注:使用vc6編譯運行,如無特殊說明,均在linux環境下編譯運行。讀者自己在編譯的時候別忘了選擇編譯運行的模式。

使用Debug模式的結果爲:

[cpp] view plain copy
  1. a的值爲:12  
  2. b的值爲:0  
  3. Press any key to continue  

使用Release模式的結果爲:

[cpp] view plain copy
  1. a的值爲:12  
  2. b的值爲:12  
  3. Press any key to continue  

看看上面的運行結果我們發現在Release模式進行了優化之後b的值爲了12,但是使用Debug模式的時候b的值爲0。爲什麼會出現這樣的情況呢?我們先不說答案,再來看看下面一段代碼。注:使用vc6編譯運行

[cpp] view plain copy
  1. #include <stdio.h>  
  2.   
  3. void main()  
  4. {  
  5. int volatile a=12;  
  6. printf("a的值爲:%d\n",a);  
  7. __asm {mov dword ptr [ebp-4], 0h}  
  8. int b = a;  
  9. printf("b的值爲:%d\n",b);  
  10. }  

使用Debug模式的結果爲:

[cpp] view plain copy
  1. a的值爲:12  
  2. b的值爲:0  
  3. Press any key to continue  

使用Release模式的結果爲:

[cpp] view plain copy
  1. a的值爲:12  
  2. b的值爲:0  
  3. Press any key to continue  

我們發現這種情況下不管使用Debug模式還是Release模式都是一樣的結果。現在我們就來分析下,在此之前我們先說了Debug和Release 模式下編譯方式的區別。

先分析上一段代碼,由於在Debug模式下我們並沒有對代碼進行優化,所以對於在代碼中每次使用a值得時候都是從它的內存地址直接讀取的,所以在我們使用了__asm {mov dword ptr [ebp-4], 0h}語句改變了a的值之後,接下來使用a值的時候從內存中直接讀取,所以得到的是更新後的a值;但是當我們在Release模式下運行的時候,發現b的值爲a之前的值,而不是我們更新後的a值,這是由於編譯器在優化的過程中做了優化處理。編譯器發現在對a賦值之後沒有再次改變a的值,所以編譯器把a的值備份在了一個寄存器中,在之後的操作中我們再次使用a值的時候就直接操作這個寄存器,而不去讀取a的內存地址,因爲讀取寄存器的速度要快於直接讀取內存的速度。這就使得了讀到的a值爲之前的12。而不是更新後的0。

第二段代碼中我們使用了一個volatile修飾符,這種情況下不管在什麼模式下都得到的是更新後的a的值,因爲volatile修飾符的作用就是告訴編譯器不要對它所修飾的變量進行任何的優化,每次取值都要直接從內存地址得到。從這兒我們可以看出,對於我們代碼中的那些易變量,我們最好使用volatile修飾,以此來得到每次對其進行更新後的值。爲了加深下大家的印象我們再來看看下面一段代碼。

[cpp] view plain copy
  1. #include <stdio.h>  
  2. #include <sys/time.h>  
  3.   
  4. int main(int argc, char * argv[])  
  5. {  
  6.     struct timeval start,end;  
  7.     gettimeofday( &start, NULL );  /*測試起始時間*/  
  8.     double timeuse;  
  9.     int j;  
  10.     for(j=0;j<10000000;j++)  
  11.         ;  
  12.     gettimeofday( &end, NULL );   /*測試終止時間*/  
  13.     timeuse = 1000000 * ( end.tv_sec - start.tv_sec ) + end.tv_usec -start.tv_usec;  
  14.     timeuse /= 1000000;  
  15. printf("運行時間爲:%f\n",timeuse);  
  16.   
  17.     return 0;  
  18.   
  19. }  

與之前我們測試時間的代碼一樣,我們只是增大了for()循環的次數。

先來看看我們不使用優化的結果:

[cpp] view plain copy
  1. root@ubuntu:/home# gcc time.c -o p  
  2. root@ubuntu:/home# ./p  
  3. 運行時間爲:0.028260  

使用了優化的運行結果:

[cpp] view plain copy
  1. root@ubuntu:/home# gcc -o p time.c -O2  
  2. root@ubuntu:/home# ./p  
  3. 運行時間爲:0.000001  

從結果顯然可以看出差距如此之大,但是如果我們在上面的代碼中修改一下int j爲int  volatile j之後再來看看如下代碼:

[cpp] view plain copy
  1. #include <stdio.h>  
  2. #include <sys/time.h>  
  3.   
  4. int main(int argc, char * argv[])  
  5. {  
  6.     struct timeval start,end;  
  7.     gettimeofday( &start, NULL );  /*測試起始時間*/  
  8.     double timeuse;  
  9.     int volatile j;  
  10.     for(j=0;j<10000000;j++)  
  11.         ;  
  12.     gettimeofday( &end, NULL );   /*測試終止時間*/  
  13.     timeuse = 1000000 * ( end.tv_sec - start.tv_sec ) + end.tv_usec -start.tv_usec;  
  14.     timeuse /= 1000000;  
  15. printf("運行時間爲:%f\n",timeuse);  
  16.   
  17.     return 0;  
  18.   
  19. }  

先來看看我們不使用優化的運行結果爲:

[cpp] view plain copy
  1. root@ubuntu:/home# gcc time.c -o p  
  2. root@ubuntu:/home# ./p  
  3. 運行時間爲:0.027647  

使用了優化的運行結果爲:

[cpp] view plain copy
  1. root@ubuntu:/home# gcc -o p time.c -O2  
  2. root@ubuntu:/home# ./p  
  3. 運行時間爲:0.027390  

我們發現此時此刻不管是否使用優化語句運行,時間幾乎沒有變化,只是有微小的差異,這微小的差異是由於計算機本身所導致的。所以我們通過對於上面一個沒有使用volatile和下面一個使用了volatile的對比結果可知,使用了volatile的變量在使用優化語句是for()循環並沒有得到優化,因爲for()循環執行的是一個空操作,那麼通常情況下使用了優化語句使得這個for()循環被優化掉,根本就不執行。就好比編譯器在編譯的過程中將i的值設置爲大於或者等於10000000的一個數,使得for()循環語句不會執行。但是由於我們使用了volatile,使得編譯器就不會自作主張的去動我們的i值,所以循環體得到了執行。舉這個例子的原因是要讓讀者牢記,如果我們定義了volatile變量,那麼它就不會被編譯器所優化。

當然volatile還有那些值得注意的地方呢?由於訪問寄存器的速度要快過直接訪問內存的速度,所以編譯器一般都會作減少對於內存的訪問,但是如果將變量加上volatile修飾,則編譯器保證對此變量的讀寫操作都不會被優化。這樣說可能有些抽象了,再看看下面的代碼,在此就簡要的寫出幾步了。

main()

{

        int i=o;

        while(i==0)

        {

                 ……

        }

}

分析以上代碼,如果我們沒有在while循環體結構裏面改變i的值,編譯器在編譯的過程中就會將i的值備份到一個寄存器中,每次執行判斷語句時就從該寄存器取值,那麼這將是一個死循環,但是如果我們做如下的修改:

main()

{

        int volatile i=o;

        while(i==0)

        {

                 ……

        }

}

我們在i的前面加上了一個volatile,假設while()循環體裏面執行的是跟上一個完全一樣的操作,但是這個時候就不能說是一個死循環了,因爲編譯器不會再對我們的i值進行"備份"操作了,每次執行判斷的時候都會直接從i的內存地址中讀取,一旦其值發生變化就退出循環體。

最後給出一點就是在實際使用中volatile的使用的場合大致有以下幾點:

1、中斷服務程序中修改的供其它程序檢測的變量需要加volatile;

2、多任務環境下各任務間共享的標誌應該加volatile;

3、存儲器映射的硬件寄存器通常也要加volatile說明,因爲每次對它的讀寫都可能有不同意義。

對於volatile的講解我們到此就結束了。由於本人水平有限,博客中的不妥或錯誤之處在所難免,殷切希望讀者批評指正。同時也歡迎讀者共同探討相關的內容,如果樂意交流的話請留下你寶貴的意見。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章