C++裏也有菱形運算符?

最近在翻《c++函數式編程》的時候看到有一小節在說c++14新增了“菱形運算符”。我尋思c++裏好像沒什麼運算符叫這名字啊,而且c++14新增的功能很少,我也不記得有添加這種語法特性。一瞬間我有些懷疑我的記憶了,所以爲了查漏補缺,我寫了這篇文章。

什麼是菱形運算符

這個概念在Java裏比較多見:

List<String> myList = new ArrayList<>();

這東西在Java裏的學名是diamond operator,表示使用泛型類並且類型參數在左側的表達式已給出因此在右側可以省略。

簡單的說就是讓你少寫幾次重複的類型參數。因爲看起來像個菱形所以得名菱形運算符。

然後我們偶爾會在c++裏看到形狀上很相似的東西:

std::sort(vec.begin(), vec.end(), std::greater<>());

<>出現在模板的特化中是我們所熟悉的,但這個std::greater<>()是什麼呢?

c++沒有菱形運算符

先說結論,從語言標準來說,c++裏沒有什麼菱形運算符。

c++20裏雖然新增了一個運算符operator<=>,但這個和所謂的菱形運算符沒有任何關係。

那問題來了,std::greater<>()是什麼以及爲什麼書裏說是c++14新增的特性呢?難道書裏瞎說的嗎?但事實是這樣的示例代碼在c++14以及之後的標準下可以正常編譯運行,而且這本書的質量尚可,雖然會在措辭上犯些小錯(比如c++沒有菱形運算符)但不至於花大篇幅去胡說八道。

當然,要想回答這個問題我們得先複習點基礎知識。

<>在c++裏的作用

先說結論,在c++裏看到<>,絕大多數都是在爲模板提供類型參數,當然這種東西我們不討論:(a<1, 2>b),這裏<>是在兩個不同的表達式裏。

那既然用來提供類型參數,那爲什麼可以啥都不提供呢?答案是有兩類情況確實可以。

第一類是在函數模板上,類型參數可以自動推導時:

template <typename T>
void f(const T&)
{
    std::cout << "f<T>\n";
}
template <>
void f(const int&)
{
    std::cout << "f<int>\n";
}

void f(const int&)
{
    std::cout << "f\n";
}

int main()
{
    f(1);    // f
    f<>(1);  // f<int>
    f(1.2);  // f<T>
}

非模板函數在重載決議中的優先級總是高於模板的,因此f(1)這樣的表達式總是會用到最下面定義的那個非模板函數f。這時候我們可以用f<int>(1)來直接調用函數模板f,而函數模板的類型參數如果能從參數推導出來的話,可以不明確給出(也就是後面的f(1.2)那樣的),而在我們現在這句表達式裏,我們既要明確使用函數模板,又想讓類型參數被自動推導,就得使用f<>(1)

另一種情況不分類模板還是函數模板,當模板的類型參數有默認值時,可以靠<>來使用這些默認值:

template <typename T = void>
struct Wrapper
{
    using wrappered = T;
};

// Wrapper<> 等於 Wrapper<void>
static_assert(std::is_same_v<Wrapper<>::wrappered, Wrapper<void>::wrappered>);

在第二種情況下,因爲沒顯示給出類型參數,且這裏沒法使用類型推導,因此編譯器使用了類型參數的默認值,這裏是void。

觀察比較仔細的話其實會發現上面兩種情況其實是一件事,<>相當於沒有顯示給出任何類型參數,於是對這些沒有顯示指定的類型參數,編譯器會先嚐試類型推導,如果沒法推導則會檢查這些類型參數是否有默認值,有就利用默認值。如果上面這兩步都沒法得到能正常使用的類型參數,模板會被SFINAE淘汰或者報出編譯錯誤。

這並不是什麼新語法,是從有模板開始就一直存在的規則。

現在我們可以看看std::greater<>()是什麼了,首先std::greater是個類模板,然後它接受一個類型參數,這個參數在c++14之後有了默認值void,因此std::greater<>()std::greater<void>()

c++14中究竟添加了什麼

既然c++14並沒有添加“菱形運算符”,那究竟新增了什麼呢?

在已經知道了std::greater<>()的真身後,找起來就很容易了,所以我很快找到了對應的新特性:n3421

這個特性是這樣的:原先我們要用標準庫提供的謂詞模板,需要自己指明參數類型,這樣寫起來很麻煩而且對於那種嵌套的或者元素類型複雜的容器來說寫明參數類型不僅費時而且費力,更要命的是對於map,一不小心是會有性能問題的:

for_each(map.begin(), map.end(), std::pred<std::pair<std::string, int64_t>>());

上述代碼的問題在於正確的參數類型應該是std::pair<const std::string, int64_t>,我們漏掉了const,這會導致pair整個被複制一遍,性能是無比底下的。要徹底避免這種錯誤,就得利用自動類型推導。

然而前面說了,標準庫提供的謂詞基本全是類模板,類模板的模板參數要麼依賴默認值要麼得顯示指定,怎麼才能依賴自動推導呢。

於是這個新特性最精彩的地方來了:原先的模板的調用運算符不是模板參數也是定死的,但我們可以新加一個默認參數,然後針對這個默認參數的類型進行完全特化,在特化裏提供一個泛型的operator(),這樣就能利用函數模板來自動推導參數類型了,而且以前的代碼不受影響。

默認參數的設置也是有講究的,需要用一個謂詞用不到的且不會影響老代碼的類型,運氣不錯,void正好符合條件(void上幾乎沒法做什麼操作,因此也不會被指定給這些謂詞做類型參數),因此現在的greater的代碼是下面這樣的:

// 注意默認值是void
template <typename T = void> struct greater {
    constexpr bool operator()(const T& lhs, const T& rhs) const 
    {
        return lhs > rhs;
    }
};

// 針對greater<void>的完全特化
template <> struct greater<void> {
    template <class T, class U> auto operator()(T&& t, U&& u) const
    -> decltype(std::forward<T>(t) > std::forward<U>(u))
    { return std::forward<T>(t) > std::forward<U>(u); }
};

當使用std::greater<T>()的時候,代碼的邏輯和原來一樣,當使用std::greater<void>()的時候,返回的Functor的函數調用運算符是個模板,可以自己推導參數類型和返回值類型。至於爲啥greater<void>的內部構造可以和其他情況實例化的greater區別這麼大,這個是c++的特性:模板的不同實例之間是可以異構的。

而且因爲類型參數的默認值就是void,因此可以簡寫成std::greater<>()

所以c++14只是給標準庫裏可以代替運算符的模板們增加了默認類型參數和一個泛型的調用運算符,利用這些可以簡化代碼並確保類型安全。

真相是其實沒啥菱形運算符,只是利用了以前就存在的模板的特性簡化了標準庫的使用,讓人少寫點字。達成的效果倒是和Java的菱形運算符差不多。

總結

顯然書裏有誇大成分,老話說盡信書不如無書,還得小心檢驗纔是。

順便我們複習了現代c++的重要原則:能依賴自動類型推導的地方,沒必要自己手寫。

因此應該多寫這樣的代碼:std::sort(vec.begin(), vec.end(), std::greater<>());

不過還有最後一個問題,爲啥不直接用lambda呢?那是因爲能指定類型參數的泛型lambda要在c++20纔出現,在這之前想要讓lambda完全做到類型安全得費點功夫,而且lambda整體上也不如直接用標準庫提供的std::greater<>()std::less<>()之類的簡潔易懂。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章