http://www.congci.com/item/cpp-right-value-lambda
C++ 11中引入的一個非常重要的概念就是右值引用。理解右值引用是學習“移動語義”(move semantics)的基礎。而要理解右值引用,就必須先區分左值與右值。
對左值和右值的一個最常見的誤解是:等號左邊的就是左值,等號右邊的就是右值。左值和右值都是針對表達式而言的,左值是指表達式結束後依然存在的持久對象,右值是指表達式結束時就不再存在的臨時對象。一個區分左值與右值的便捷方法是:看能不能對表達式取地址,如果能,則爲左值,否則爲右值。下面給出一些例子來進行說明。
int b = 20;
int *pFlag = &a;
vector<int> vctTemp;
vctTemp.push_back(1);
string str1 = "hello ";
string str2 = "world";
const int &m = 1;
請問,a,b, a+b, a++, ++a, pFlag, *pFlag, vctTemp[0], 100, string("hello"), str1, str1+str2, m分別是左值還是右值?
a和b都是持久對象(可以對其取地址),是左值;
a+b是臨時對象(不可以對其取地址),是右值;
a++是先取出持久對象a的一份拷貝,再使持久對象a的值加1,最後返回那份拷貝,而那份拷貝是臨時對象(不可以對其取地址),故其是右值;
++a則是使持久對象a的值加1,並返回那個持久對象a本身(可以對其取地址),故其是左值;
pFlag和*pFlag都是持久對象(可以對其取地址),是左值;
vctTemp[0]調用了重載的[]操作符,而[]操作符返回的是一個int &,爲持久對象(可以對其取地址),是左值;
100和string("hello")是臨時對象(不可以對其取地址),是右值;
str1是持久對象(可以對其取地址),是左值;
str1+str2是調用了+操作符,而+操作符返回的是一個string(不可以對其取地址),故其爲右值;
m是一個常量引用,引用到一個右值,但引用本身是一個持久對象(可以對其取地址),爲左值。
區分清楚了左值與右值,我們再來看看左值引用。左值引用根據其修飾符的不同,可以分爲非常量左值引用和常量左值引用。
非常量左值引用只能綁定到非常量左值,不能綁定到常量左值、非常量右值和常量右值。如果允許綁定到常量左值和常量右值,則非常量左值引用可以用於修改常量左值和常量右值,這明顯違反了其常量的含義。如果允許綁定到非常量右值,則會導致非常危險的情況出現,因爲非常量右值是一個臨時對象,非常量左值引用可能會使用一個已經被銷燬了的臨時對象。
常量左值引用可以綁定到所有類型的值,包括非常量左值、常量左值、非常量右值和常量右值。
可以看出,使用左值引用時,我們無法區分出綁定的是否是非常量右值的情況。那麼,爲什麼要對非常量右值進行區分呢,區分出來了又有什麼好處呢?這就牽涉到C++中一個著名的性能問題——拷貝臨時對象。考慮下面的代碼:
{
vector<int> vctTemp;
vctTemp.push_back(90);
vctTemp.push_back(95);
return vctTemp;
}
當使用vector<int> vctScore = GetAllScores()進行初始化時,實際上調用了三次構造函數。儘管有些編譯器可以採用RVO(Return Value Optimization)來進行優化,但優化工作只在某些特定條件下才能進行。可以看到,上面很普通的一個函數調用,由於存在臨時對象的拷貝,導致了額外的兩次拷貝構造函數和析構函數的開銷。當然,我們也可以修改函數的形式爲void GetAllScores(vector<int> &vctScore),但這並不一定就是我們需要的形式。另外,考慮下面字符串的連接操作:
string s = s1 + "a" + "b" + "c" + "d" + "e";
在對s進行初始化時,會產生大量的臨時對象,並涉及到大量字符串的拷貝操作,這顯然會影響程序的效率和性能。怎麼解決這個問題呢?如果我們能確定某個值是一個非常量右值(或者是一個以後不會再使用的左值),則我們在進行臨時對象的拷貝時,可以不用拷貝實際的數據,而只是“竊取”指向實際數據的指針(類似於STL中的auto_ptr,會轉移所有權)。C++ 11中引入的右值引用正好可用於標識一個非常量右值。C++ 11中用&表示左值引用,用&&表示右值引用,如:
右值引用根據其修飾符的不同,也可以分爲非常量右值引用和常量右值引用。
非常量右值引用只能綁定到非常量右值,不能綁定到非常量左值、常量左值和常量右值(VS2010 beta版中可以綁定到非常量左值和常量左值,但正式版中爲了安全起見,已不允許)。如果允許綁定到非常量左值,則可能會錯誤地竊取一個持久對象的數據,而這是非常危險的;如果允許綁定到常量左值和常量右值,則非常量右值引用可以用於修改常量左值和常量右值,這明顯違反了其常量的含義。
常量右值引用可以綁定到非常量右值和常量右值,不能綁定到非常量左值和常量左值(理由同上)。
有了右值引用的概念,我們就可以用它來實現下面的CMyString類。
{
public:
// 構造函數
CMyString(const char *pszSrc = NULL)
{
cout << "CMyString(const char *pszSrc = NULL)" << endl;
if (pszSrc == NULL)
{
m_pData = new char[1];
*m_pData = '\0';
}
else
{
m_pData = new char[strlen(pszSrc)+1];
strcpy(m_pData, pszSrc);
}
}
// 拷貝構造函數
CMyString(const CMyString &s)
{
cout << "CMyString(const CMyString &s)" << endl;
m_pData = new char[strlen(s.m_pData)+1];
strcpy(m_pData, s.m_pData);
}
// move構造函數
CMyString(CMyString &&s)
{
cout << "CMyString(CMyString &&s)" << endl;
m_pData = s.m_pData;
s.m_pData = NULL;
}
// 析構函數
~CMyString()
{
cout << "~CMyString()" << endl;
delete [] m_pData;
m_pData = NULL;
}
// 拷貝賦值函數
CMyString &operator =(const CMyString &s)
{
cout << "CMyString &operator =(const CMyString &s)" << endl;
if (this != &s)
{
delete [] m_pData;
m_pData = new char[strlen(s.m_pData)+1];
strcpy(m_pData, s.m_pData);
}
return *this;
}
// move賦值函數
CMyString &operator =(CMyString &&s)
{
cout << "CMyString &operator =(CMyString &&s)" << endl;
if (this != &s)
{
delete [] m_pData;
m_pData = s.m_pData;
s.m_pData = NULL;
}
return *this;
}
private:
char *m_pData;
};
可以看到,上面我們添加了move版本的構造函數和賦值函數。那麼,添加了move版本後,對類的自動生成規則有什麼影響呢?唯一的影響就是,如果提供了move版本的構造函數,則不會生成默認的構造函數。另外,編譯器永遠不會自動生成move版本的構造函數和賦值函數,它們需要你手動顯式地添加。
當添加了move版本的構造函數和賦值函數的重載形式後,某一個函數調用應當使用哪一個重載版本呢?下面是按照判決的優先級列出的3條規則:
1、常量值只能綁定到常量引用上,不能綁定到非常量引用上。
2、左值優先綁定到左值引用上,右值優先綁定到右值引用上。
3、非常量值優先綁定到非常量引用上。
當給構造函數或賦值函數傳入一個非常量右值時,依據上面給出的判決規則,可以得出會調用move版本的構造函數或賦值函數。而在move版本的構造函數或賦值函數內部,都是直接“移動”了其內部數據的指針(因爲它是非常量右值,是一個臨時對象,移動了其內部數據的指針不會導致任何問題,它馬上就要被銷燬了,我們只是重複利用了其內存),這樣就省去了拷貝數據的大量開銷。
一個需要注意的地方是,拷貝構造函數可以通過直接調用*this = s來實現,但move構造函數卻不能。這是因爲在move構造函數中,s雖然是一個非常量右值引用,但其本身卻是一個左值(是持久對象,可以對其取地址),因此調用*this = s時,會使用拷貝賦值函數而不是move賦值函數,而這已與move構造函數的語義不相符。要使語義正確,我們需要將左值綁定到非常量右值引用上,C++ 11提供了move函數來實現這種轉換,因此我們可以修改爲*this = move(s),這樣move構造函數就會調用move賦值函數。
C++的Lambda表達式在WIN RT的異步編程中,佔有非常重要的作用。但C++的Lambda表達式又不同於其他語言,比如C#,javascript。本篇旨在討論C++ Lambda表達式的基本語法和概念,希望大家多多指正。
首先,我們看一下Lambda表達式的基本構成
1. 是捕獲值列表,2.是傳入參數列表,3.可修改標示符,4.錯誤拋出標示符,5.函數返回值,6.是函數體。
在.NET 中,我們認爲比較標準的Lambda表達式應該是這個樣子
#include <functional>
int main()
{
// Assign the lambda expression that adds two numbers to an auto variable.
auto f1 = [] (int x, int y) { return x + y; };
// Assign the same lambda expression to a function object.
function<int (int, int)> f2 = [] (int x, int y) { return x + y; };
f1(3,4);
}
f1是一個auto的值,也是function<>這個模板類型,我們可以理解成爲一個函數指針。然後我們用f1(3,4)去調用他。
如果我們想在函數聲明的時候就直接執行他,我們可以在Lambda表達式的最後加傳入參數,像這樣。
{
using namespace std;
int n = [] (int x, int y) { return x + y; }(5, 4);
//assign the return type
int n = [] (int x, int y) -> int{ return x + y;}(5, 4);
cout << n << endl;
}
第二個表達式中聲明的返回值必須跟隨->符號,並且兩個必須同時出現。如果返回值唯一的話,我們可以省略->+返回值類型。
Lambda表達式允許返回值不唯一的情況,但必須指定返回值類型。
在以上的例子當中,只是常規的Lambda表達式用法,下面我們要說一說捕獲值列表。
捕獲值列表,是允許我們在Lambda表達式的函數體中直接使用這些值,捕獲值列表能捕獲的值是所有在此作用域可以訪問的值,包括這個作用域裏面的臨時變量,類的可訪問成員,全局變量。捕獲值的方式分兩種,一種是按值捕獲,一種是按引用捕獲。顧名思義,按值捕獲是不改變原有變量的值,按引用捕獲是可以在Lambda表達式中改變原有變量的值。
[&] 所有的值都是按引用捕獲
[=] 所有的值都是按值捕獲
如果你不想某些值被按引用或者按值捕獲,但其他的值卻想那樣做的話
[ &, n ] 除了n 所有的值按引用捕獲
[ = , &n ]除了n所有的值按值捕獲
當然,我們也可以指定某幾個值的捕獲屬性
[ m, n ]m,n按引用捕獲
[ &m, &n ]m,n按值捕獲
int m = 0, n = 0;
[=] (int a) mutable { m = ++n + a; }(4);
[&] (int a) { m = ++n + a; }(4);
[=,&m] (int a) mutable { m = ++n + a; }(4);
[&,m] (int a) mutable { m = ++n + a; }(4);
[m,n] (int a) mutable { m = ++n + a; }(4);
[&m,&n] (int a) { m = ++n + a; }(4);
[=] (int a) mutable { m = ++n + a; }(4);
大家一定好奇爲什麼這裏有很多mutable。在按值引用的情況下,Lambda函數體內部是不能直接修改引用值的。如下面註釋代碼,是會報錯的。這種情況下,我們要在Lambda表達式前加mutable,但是結果m,n 依然沒有被修改,維持按值引用的特性。
{
int m = 0, n = 0;
// 不加mutable會報錯
//[=] (int a){ m = ++n + a; }(4);
//[m,n] (int a){ m = ++n + a; }(4);
[=] (int a) mutable { m = ++n + a; }(4);
//
// [=] (int m, int n, int a){m=++n+a; }(m, n, 4);
// 下面這個函數m,n的值依然會被修改,因爲m,n是按引用傳入的
// [=] (int &m, int &n, int a){m=++n+a; }(m, n, 4);
cout << m << endl << n << endl;
}
在這個例子中捕獲值列表[this]中的this是用來指向這個類的,但[this]只有在類的內部,或者是this指針存在的情況下才能使用。
{
public:
// The constructor.
explicit Scale(int scale)
: _scale(scale)
{
}
// Prints the product of each element in a vector object
// and the scale value to the console.
void ApplyScale(const vector<int>& v) const
{
for_each(v.begin(), v.end(),
[this](int n) { cout << n * _scale << endl; });
}
private:
int _scale;
};
關於異常:
我們可以通過try-catch去捕獲異常,而在Lambda表達式中聲明throw(),是指示編譯器這個函數不會拋異常,會引起編譯的警告。
然後,Lambda可以支持返回函數指針,或者說是嵌套一個Lambda表達式,比如:
{
using namespace std;
// The following lambda expression contains a nested lambda
// expression.
int m = [](int x)
{ return [](int y) { return y * 2; }(x) + 3; }(5);
// Print the result.
cout << m << endl;
}
我們可以把 return [](int y) { return y * 2; }(x) 抽象成 f(x) 所以原函數就是return f(5)+3 就是2*5+3=13
加入函數指針之後,我們來看一看一個Lambda表達式可以寫的多複雜,這是來自於MSDN的官方的例子。
// compile with: /EHsc
#include <iostream>
#include <functional>
int main()
{
using namespace std;
// The following code declares a lambda expression that returns
// another lambda expression that adds two numbers.
// The returned lambda expression captures parameter x by value.
auto g = [](int x) -> function<int (int)>
{ return [=](int y) { return x + y; }; };
// The following code declares a lambda expression that takes another
// lambda expression as its argument.
// The lambda expression applies the argument z to the function f
// and adds 1.
auto h = [](const function<int (int)>& f, int z)
{ return f(z) + 1; };
// Call the lambda expression that is bound to h.
auto a = h(g(7), 8);
// Print the result.
cout << a << endl;
}
結果很簡單就是7+8+1=16 我通過代碼幫大家展開一下:
{ return [=](int y) { return x + y; }; };
auto h = [](const function<int (int)>& f, int z)
{ return f(z) + 1; };
auto a = h(g(7), 8);
// 解:
// 我們先看看g(7) 等於什麼
// 我們把g的返回值 return [=](int y) { return x + y; }; 抽象成一個函數t(y)
// 那麼g(x)返回的就t(y)
// 也就是g(7)=t(y) 這裏g的參數和t的參數無關
// 那麼 h(g(7), 8)=h(t(y), 8))
// 代入h的表達式,我們發現t(y)就是f(z)
// 代入的結果就是 return t(8)+1,再把g(7)代入就是7+8+1=16
cout << a << endl;
最後,有人會很好奇foe_each爲什麼可以傳入Lambda表達式
首先,我們看看for_each的展開
Function for_each(InputIterator first, InputIterator last, Function f)
{
for ( ; first!=last; ++first ) f(*first);
return f;
}
//From: http://www.cplusplus.com/reference/algorithm/for_each/
當然這不是實際的代碼,但是我們可以看到,調用的只是f()再傳入迭代器的值,所以,我們在寫for_each的Lambda表達式的時候,傳入參數一定是和迭代器的類型是匹配的。
在沒有Lambda表達式的時候,只要是能寫成 f(*first)這樣的東西傳進來的都行,所以就會出現結構體重載()操作符,這樣的奇葩
cout << " " << i;
}
struct myclass {
void operator() (int i) {cout << " " << i;}
} myobject;
int main () {
vector<int> myvector;
myvector.push_back(10);
myvector.push_back(20);
myvector.push_back(30);
cout << "myvector contains:";
for_each (myvector.begin(), myvector.end(), myfunction);
// or:
cout << "\nmyvector contains:";
for_each (myvector.begin(), myvector.end(), myobject);
cout << endl;
return 0;
}
在C++中Lambda表達式被設計的相對複雜,但我相信,這也是C++這門語言的魅力所在,功能很強大,但是很難學。