一行註釋也能影響代碼運行?別不信!

​來源:公衆號【編程珠璣】

作者:守望先生

ID:shouwangxiansheng

 

沒想到吧,一行註釋也能影響運行結果

也許你在某個段子裏聽說過,某行註釋刪掉後,程序竟然不能預期執行?真的會這樣麼?你還別不信。

見證“奇蹟”

 1//來源:公衆號【編程珠璣】
 2//作者:守望先生
 3#include <stdio.h>
 4#include <math.h>
 5int main(void)
 6{
 7    int a = (int)sqrt(30);
 8    //is sqrt(30) + 1 > 5 ??/
 9    //故意讓a++,你別管爲什麼
10    a++;
11    if(a > 5)
12        printf("sqrt(30) +1 > 5 \n");
13    else
14    {
15        printf("sqrt(30) +1 <= 5 \n");
16    }
17    return 0;
18}

編譯運行:

1$ gcc -o main main.c -trigraphs
2$ ./main
3sqrt(30) +1 > 5 

作爲受過九年義務教育的我們,一看就知道結果是對的,畢竟 5 * 5 < 30 < 6 * 6。

但是刪掉第九行,再運行:

1$ ./main
2sqrt(30) +1 <= 5 

結果竟然變了!!
 

看到這裏,細心的讀者可能已經發現了其中的端倪,我也就不賣關子了。接下來就說說我們本次要提到的主角-三字符組(trigraph sequences)。

三字符組

我們都知道C語言裏面有很多轉義符號,例如:

1\n 換行符(LF)
2\r 回車符(CR)
3\t 水平製表符(HT)
4\b 退格符(BS)
5\’ 單引號
6\” 雙引號
7\\ 反斜槓
8......

當然還有很多,我就不一一列舉了。這些符號在代碼中都有特別的作用,或者無法直接輸入,因此用轉移符+其他字符組合來代替。

同樣的,早期的一些鍵盤可能沒法輸入一些特殊的符號,如:

1# $ @ [ \ ] ^ ` { | } ~ 

於是,爲了解決這個問題C語言標準規定預處理器(C preprocessor)在掃描處理C語言源文件時,替換下述的3字符出現爲1個字符:

三字符組 替換爲
??= #
??/ \
??' ^
??( [
??) ]
??! |
??< {
??> }
??- ~

也就是說,??/會被替換爲\,如果刪掉原先的第九行,就變成了:

1    //is sqrt(30) + 1 > 5 \
2    a++;

我們都知道,\的存在(通常一行代碼太長,可以通過該符號來換行),使得上面看似兩行,實則是一行。即變成了:

1    //is sqrt(30) + 1 > 5 a++;

也就是說,a++根本不會執行了,當然會導致最終結果不符合預期。

當然了,很多現代編譯器可能並不會做這樣的替換,所以這樣的問題也基本無需擔心,老實用原本的符號即可。
實際上,細心的讀者可能觀察到了,我在前面例子代碼中加了編譯選項-trigraphs,否則的話,編譯是有警告的:

1$ gcc -o main main.c
2main.c: In function ‘main’:
3main.c:6:27: warning: trigraph ??/ ignored, use -trigraphs to enable [-Wtrigraphs]
4     //is sqrt(30) + 1 > 5 ??/

雙字符組

除了三字符組,還有雙字符組。

雙字符組 替換爲
<: [
:> ]
<% {
%> }
%: #

總結

今天的你不知道很難踩坑,知道了也沒啥用的內容就介紹到這裏了。

但是留個問題:

爲什麼例子中我們使用了sqrt函數,但在編譯時卻不需要鏈接math庫?答案在這裏一個奇怪的鏈接問題

 

關注公衆號【編程珠璣】,獲取更多Linux/C/C++/數據結構與算法/計算機基礎/工具等原創技術文章。後臺免費獲取經典電子書和視頻資源

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章