【嵌入式】C語言高級編程-嵌入式C語言簡介(01)

00. 目錄

01. C 語言標準

什麼是 C 語言標準呢?我們生活的現實世界,就是由各種標準構成的,正是這些標準,我們的社會纔會有條不紊的運行。比如我們過馬路,遵循的交通規則就是一個標準:紅燈停,綠燈行,黃燈亮了等一等。當行人和司機都遵循這個默認的標準時,我們的交通系統纔會順暢運行。電腦中的 USB 接口也是一種標準,當大家生產的 USB 產品都遵循 USB 協議這種通信標準時,我們的手機、U 盤、USB 攝像頭、USB 網卡纔可以在各種電腦設備上互插互拔。2G、3G、4G 也是一種標準,當不同廠家生產的基帶芯片都遵循這種通信標準,我們所用的不同品牌、不同操作系統的手機纔可能互相打電話、互相發微信、互相給對方點贊。

同樣,C 語言也有它自己的標準。我們知道,C 語言程序需要通過編譯器,編譯生成二進制指令,才能在我們的電腦上運行。在 C 語言剛發佈的早期,各大編譯器廠商開發自己的編譯器時,各自開發,各自維護,時間久了,就會變得比較混亂。這就會造成這樣一種局面:程序員寫的程序,在一個編譯器上編譯通過,在另一個編譯器編譯通不過。大家按各自的習慣來,誰也不服誰,就像春秋戰國時代:不同的貨幣、不同的度量衡,不同的文字,都是中國人,因爲標準不統一,所以交流起來很麻煩,這樣下去也不是辦法啊。

後來 **ANSI(AMERICAN NATIONAL STANDARDS INSTITUTE: 美國國家標準協會,簡稱 ANSI)**出山了,聯合 ISO(國際化標準組織)召集各個編譯器廠商大佬,各種技術團體,一起喝個茶、開個碰頭會,開始啓動 C 語言的標準化工作。期間各種大佬之間也是矛盾重重,充滿各種爭議,但功夫不負有心人,經過艱難的磋商,終於在1989年達成一致,發佈了 C 語言標準,後來第二年又做了一些改進。於是,就像秦始皇統一六國、統一文字和度量衡一樣,C 語言標準終於問世了!因爲是在 1989 年發佈的,所以人們一般稱其爲 C89 或 C90 標準,或者叫做 ANSI C

02. C 標準內容

C 標準英文文檔幾百頁,講了很多東西,但總體歸納起來,主要就是 C 語言編程的一些語法慣例,比如:

  • 定義各種關鍵字、數據類型

  • 定義各種運算規則

  • 各種運算符的優先級和結合性

  • 數據類型轉換

  • 變量的作用域

  • 函數原型

  • 函數嵌套層數

  • 函數參數個數限制

  • 標準庫函數

C 標準發佈後,大家都遵守這個標準:程序員開發程序時,按照這種標準寫;編譯器廠商開發編譯器時,也按照這種標準去解析、翻譯程序。不同的編譯器廠商支持統一的標準,這樣大家寫的程序,使用不同的編譯器,都可以正確編譯、運行,大大提高程序的開發效率,推動了 IT 行業的發展。

03. C 標準的發展歷程

C 標準並不是永遠不變的,就跟移動通信一樣,也是從 2G、3G、4G 到 5G 不斷髮展變化的。C 標準也經歷了下面四個階段:

  • K&R C

  • ANSI C

  • C99

  • C11

K&R C

K&R C 一般也稱爲傳統 C。在 C 標準沒有統一之前,C 語言的作者 Dennis Ritchie 和 Brian Kernighan 合作寫了一本書《C 程序設計語言》。早期程序員編程,這本書可以說是絕對權威。這本書很薄,內容精煉,主要介紹了 C 語言的基本使用方法。後來《C 程序設計語言》第二版問世,做了一些修改:比如新增 unsigned int、long int、struct 等數據類型;把運算符 =+/=- 修改爲 +=/-=,避免運算符帶來的一些歧義和 Bug。這本書可以看作是 ANSI 標準的雛形。但早期的 C 語言還是很簡單的,比如還沒有定義標準庫函數、沒有預處理命令等。

ANSI C

ANSI C 是 ANSI(美國國家標準協會)在 K&R C 的基礎上,統一了各大編譯器廠商的不同標準,並對 C 語言語法和特性做了一些擴展,而發佈的一個標準。這個標準一般也叫做 C89/C90,也是目前各種編譯器默認支持的 C 語言標準。ANSI C 主要新增了以下特性:

  • 增加 signed、volatile、const 關鍵字
  • 增加 void* 數據類型
  • 增加預處理器命令
  • 增加寬字符、寬字符串
  • 定義了 C 標準庫
  • ……

C99 標準

C99 標準是 ANSI 1999 年在 C89 標準的基礎上新發布的一個標準,該標準對 ANSI C 標準做了一些擴充,比如新增一些關鍵字,支持新的數據類型:

  • 布爾型:Bool
  • 複數:_Complex
  • 虛數:_Imaginary
  • 內聯:inline
  • 指針修飾符:restrict
  • 支持long long、long double數據類型
  • 支持變長數組
  • 允許對結構體特定成員賦值
  • 支持16進制浮點數、float _Complex等數據類型
  • ……

除此之外,C99 標準也借鑑其它語言的一些優點,對語法和函數做了一系列改進,大大方便了程序員開發程序,比如:

  • 變量聲明可以放代碼塊的任何地方。ANSI C 規定變量的聲明要全部寫在函數語句的最前面,否則就會報編譯錯誤。現在不需要這樣寫了,哪裏需要使用變量,在哪裏直接聲明使用即可;
  • 源程序每行最大支持4095個字節。這個貌似足夠用了,沒有什麼程序能複雜到一行程序有4KB個字符;
  • 支持//單行註釋。ANSI C使用/**/沒有C++的//註釋方便,所以 C99 新標準借鑑過來了,也開始支持這種註釋方式;
  • 標準庫新增了一些頭文件:如 stdbool.h、complex.h、stdarg.h、fenv.h 等。大家在 C 語言中經常返回的 true、false,其實這也是 C++ 裏面定義的 bool 類型。那爲什麼我們經常這樣寫,而編器編譯程序時沒有報錯呢,這是因爲早期大家編程使用的都是 VC++6.0 系列,是 C++ 編譯器。還有一種可能就是有些 IDE 對這個數據類型的數據做了封裝。

C11 新標準

C11 標準是2011年發佈的最新 C 語言標準,修改了 C 語言標準的一些 Bug、新增了一些特性:

  • 增加 Noreturn,聲明函數無返回值;

  • 增加Generic:支持泛型編程;

  • 修改了標準庫函數的一些 Bug:如 gets( )函數被 gets_s() 函數代替;

  • 新增文件鎖功能;

  • 支持多線程;

  • ……

從 C11 標準的修改內容來看,也慢慢察覺到 C 語言未來的發展趨勢:C 語言現在也在借鑑現在編程語言的優點,不斷添加到自己的標準裏面。比如現代編程語言的多線程、字符串、泛型編程等,C 語言最新的標準都支持。但是這樣下去,C 語言是不是還能保持她“簡單就是美”的優雅特色呢,我們只能慢慢期待了。但至少目前我們不用擔心這些,因爲 C11 新發布的標準,目前絕大多數編譯器還不支持,所以我們暫時還用不到。

04. 編譯器對 C 標準的支持

標準是一回事,各種編譯器支不支持是另一回事,這一點,大家要搞清楚。這就跟手機一樣,不同時期發佈的手機對通信標準支持也不一樣。早期的手機可能只支持 2G 通信,後來支持 3G,現在發佈的新款手機基本上都支持 4G了,而且可以兼容 2G/3G。

現在 5G 標準正在研發,快發佈了,據說 2019 年發佈,2020 年商用。但是目前還沒有手機支持 5G 通信,就跟現在沒有編譯器支持 C11 標準一樣。

不同編譯器,甚至對 C 標準的支持也不一樣。有的編譯器只支持 ANSI C,這是目前默認的 C 標準。有的編譯器可以支持 C99,或者支持 C99 標準的部分特性。目前對 C99 標準支持最好的是 GNU C 編譯器,據說可以支持 C99標準99%的新增特性。

05. 編譯器對 C 標準的擴展

不同編譯器,出於開發環境、硬件平臺、性能優化的需要,除了支持 C 標準外,還會自己做一些擴展。

在51單片機上用 C 語言開發程序,我們經常使用 Keil for C51 集成開發環境。你會發現 Keil for C51 或其他 IDE 裏的 C 編譯器會對 C 語言標準作很多擴展。比如增加各種關鍵字:

  • data:RAM 的低128B空間,單週期直接尋址;
  • code:表示程序存儲區;
  • bit:位變量,常用來定義單片機的 P0~P3 管腳;
  • sbit:特殊功能位變量;
  • sfr:特殊功能寄存器;
  • reentrant:重入函數聲明。

如果你在程序中使用以上這些關鍵字,那麼你的程序就只能使用51編譯器來編譯運行,你使用其它的編譯器,比如 VC++6.0,是編譯通不過的。

同樣的道理,GCC 編譯器,也對 C 標準做了很多擴展:

  • 零長度數組
  • 語句表達式
  • 內建函數
  • __attribute__特殊屬性聲明
  • 標號元素
  • case 範圍

比如支持零長度數組。這些新增的特性,C 標準目前是不支持的,其它編譯器也不支持。如果你在程序中定義一個零長度數組:

#include <stdio.h>

int main(void)
{
    int a[0];

    return 0;
}

編譯如下:

deng@itcast:~/tmp$ gcc 1test.c -Wall -o test
deng@itcast:~/tmp$ ./test  
a = 0x7ffc8235f974
deng@itcast:~/tmp$ 

只能使用 GCC 編譯器才能正確編譯,使用 VC++ 6.0編譯器編譯可能就通不過,因爲微軟的 C++ 編譯器不支持這個特性。

06. Linux內核C語言示例

大家在看一些 GNU 開源軟件,或者閱讀 Linux 內核、驅動源碼時會發現,在 Linux 內核源碼中,有大量的 C 程序看起來“怪怪的”。甚至有些都看不懂。

宏定義

linux-headers-5.4.0-33/include/linux/kernel.h

/*
 * The double __builtin_constant_p is because gcc will give us an error
 * if we try to allocate the static variable to fmt if it is not a
 * constant. Even with the outer if statement.
 */
#define ftrace_vprintk(fmt, vargs)                  \
do {                                    \
    if (__builtin_constant_p(fmt)) {                \
        static const char *trace_printk_fmt __used      \
          __attribute__((section("__trace_printk_fmt"))) =  \
            __builtin_constant_p(fmt) ? fmt : NULL;     \
                                    \
        __ftrace_vbprintk(_THIS_IP_, trace_printk_fmt, vargs);  \
    } else                              \
        __ftrace_vprintk(_THIS_IP_, fmt, vargs);        \
} while (0)

內核中實現打印功能的宏定義

/*
 * Like KERN_CONT, pr_cont() should only be used when continuing
 * a line with no newline ('\n') enclosed. Otherwise it defaults
 * back to KERN_DEFAULT.
 */
#define pr_cont(fmt, ...) \
    printk(KERN_CONT fmt, ##__VA_ARGS__)

結構體初始化

linux-4.16.12/net/bluetooth/6lowpan.c

static const struct file_operations lowpan_control_fops = {
    .open       = lowpan_control_open,
    .read       = seq_read,
    .write      = lowpan_control_write,
    .llseek     = seq_lseek,
    .release    = single_release,
};

這些其實也是 C 語言,但並不是標準的 C 語言語法,而是我們 Linux 內核使用的 GNU C 編譯器擴展的一些 C 語言語法。這些語法在 C 語言教材或資料中一般不會提及,所以你纔會似曾相識而又感到陌生,看起來感覺“怪怪的”。我們在做 Linux 驅動開發,或者閱讀 Linux 內核源碼過程中,會經常遇到這些“稀奇古怪”的用法,如果不去了解這些特殊語法的具體含義,可能就對代碼的理解造成一定障礙。

接下來就是帶領大家一起去了解 Linux 內核或者 GNU 開源軟件中,常用的一些 C 語言特殊語法擴展,掃除閱讀 Linux 內核或 GNU 開源軟件時,這些擴展特性帶給我們的語法閱讀障礙和困惑。

07. 附錄

7.1 Linux內核官方

網址:https://www.kernel.org/

7.2 參考資料
C語言嵌入式Linux高級編程

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章