C++11 lambda表達式

http://www.congci.com/item/cpp-right-value-lambda 

C++ 11中引入的一個非常重要的概念就是右值引用。理解右值引用是學習“移動語義”(move semantics)的基礎。而要理解右值引用,就必須先區分左值與右值。
       對左值和右值的一個最常見的誤解是:等號左邊的就是左值,等號右邊的就是右值。左值和右值都是針對表達式而言的,左值是指表達式結束後依然存在的持久對象,右值是指表達式結束時就不再存在的臨時對象。一個區分左值與右值的便捷方法是:看能不能對表達式取地址,如果能,則爲左值,否則爲右值。下面給出一些例子來進行說明。

 int a = 10;
 int b = 20;
 int *pFlag = &a;
 vector<int> vctTemp;
 vctTemp.push_back(1);
 string str1 = "hello ";
 string str2 = "world";
 const int &m = 1;

       請問,a,b, a+b, a++, ++a, pFlag, *pFlag, vctTemp[0], 100, string("hello"), str1, str1+str2, m分別是左值還是右值?
           a和b都是持久對象(可以對其取地址),是左值;
           a+b是臨時對象(不可以對其取地址),是右值;
           a++是先取出持久對象a的一份拷貝,再使持久對象a的值加1,最後返回那份拷貝,而那份拷貝是臨時對象(不可以對其取地址),故其是右值;
           ++a則是使持久對象a的值加1,並返回那個持久對象a本身(可以對其取地址),故其是左值;
           pFlag和*pFlag都是持久對象(可以對其取地址),是左值;
           vctTemp[0]調用了重載的[]操作符,而[]操作符返回的是一個int &,爲持久對象(可以對其取地址),是左值;
           100和string("hello")是臨時對象(不可以對其取地址),是右值;
           str1是持久對象(可以對其取地址),是左值;
           str1+str2是調用了+操作符,而+操作符返回的是一個string(不可以對其取地址),故其爲右值;
           m是一個常量引用,引用到一個右值,但引用本身是一個持久對象(可以對其取地址),爲左值。
      區分清楚了左值與右值,我們再來看看左值引用。左值引用根據其修飾符的不同,可以分爲非常量左值引用和常量左值引用。
      非常量左值引用只能綁定到非常量左值,不能綁定到常量左值、非常量右值和常量右值。如果允許綁定到常量左值和常量右值,則非常量左值引用可以用於修改常量左值和常量右值,這明顯違反了其常量的含義。如果允許綁定到非常量右值,則會導致非常危險的情況出現,因爲非常量右值是一個臨時對象,非常量左值引用可能會使用一個已經被銷燬了的臨時對象。
      常量左值引用可以綁定到所有類型的值,包括非常量左值、常量左值、非常量右值和常量右值。
      可以看出,使用左值引用時,我們無法區分出綁定的是否是非常量右值的情況。那麼,爲什麼要對非常量右值進行區分呢,區分出來了又有什麼好處呢?這就牽涉到C++中一個著名的性能問題——拷貝臨時對象。考慮下面的代碼:

vector<int> GetAllScores()
{
 vector<int> vctTemp;
 vctTemp.push_back(90);
 vctTemp.push_back(95);
 return vctTemp;
}

       當使用vector<int> vctScore = GetAllScores()進行初始化時,實際上調用了三次構造函數。儘管有些編譯器可以採用RVO(Return Value Optimization)來進行優化,但優化工作只在某些特定條件下才能進行。可以看到,上面很普通的一個函數調用,由於存在臨時對象的拷貝,導致了額外的兩次拷貝構造函數和析構函數的開銷。當然,我們也可以修改函數的形式爲void GetAllScores(vector<int> &vctScore),但這並不一定就是我們需要的形式。另外,考慮下面字符串的連接操作:

 string s1("hello");
 string s = s1 + "a" + "b" + "c" + "d" + "e";

       在對s進行初始化時,會產生大量的臨時對象,並涉及到大量字符串的拷貝操作,這顯然會影響程序的效率和性能。怎麼解決這個問題呢?如果我們能確定某個值是一個非常量右值(或者是一個以後不會再使用的左值),則我們在進行臨時對象的拷貝時,可以不用拷貝實際的數據,而只是“竊取”指向實際數據的指針(類似於STL中的auto_ptr,會轉移所有權)。C++ 11中引入的右值引用正好可用於標識一個非常量右值。C++ 11中用&表示左值引用,用&&表示右值引用,如:

 int &&a = 10

       右值引用根據其修飾符的不同,也可以分爲非常量右值引用和常量右值引用。
       非常量右值引用只能綁定到非常量右值,不能綁定到非常量左值、常量左值和常量右值(VS2010 beta版中可以綁定到非常量左值和常量左值,但正式版中爲了安全起見,已不允許)。如果允許綁定到非常量左值,則可能會錯誤地竊取一個持久對象的數據,而這是非常危險的;如果允許綁定到常量左值和常量右值,則非常量右值引用可以用於修改常量左值和常量右值,這明顯違反了其常量的含義。
       常量右值引用可以綁定到非常量右值和常量右值,不能綁定到非常量左值和常量左值(理由同上)。
       有了右值引用的概念,我們就可以用它來實現下面的CMyString類。

class CMyString
{
public:
    // 構造函數
 CMyString(const char *pszSrc = NULL)
 {
  cout << "CMyString(const char *pszSrc = NULL)" << endl;
  if (pszSrc == NULL)
  {
   m_pData = new char[1];
   *m_pData = '\0';
  }
  else
  {
   m_pData = new char[strlen(pszSrc)+1];
   strcpy(m_pData, pszSrc);
  }
 }

    // 拷貝構造函數
 CMyString(const CMyString &s)
 {
  cout << "CMyString(const CMyString &s)" << endl;
  m_pData = new char[strlen(s.m_pData)+1];
  strcpy(m_pData, s.m_pData);
 }

    // move構造函數
 CMyString(CMyString &&s)
 {
  cout << "CMyString(CMyString &&s)" << endl;
  m_pData = s.m_pData;
  s.m_pData = NULL;
 }

    // 析構函數
 ~CMyString()
 {
  cout << "~CMyString()" << endl;
  delete [] m_pData;
  m_pData = NULL;
 }

    // 拷貝賦值函數
 CMyString &operator =(const CMyString &s)
 {
  cout << "CMyString &operator =(const CMyString &s)" << endl;
  if (this != &s)
  {
   delete [] m_pData;
   m_pData = new char[strlen(s.m_pData)+1];
   strcpy(m_pData, s.m_pData);
  }
  return *this;
 }

    // move賦值函數
 CMyString &operator =(CMyString &&s)
 {
  cout << "CMyString &operator =(CMyString &&s)" << endl;
  if (this != &s)
  {
   delete [] m_pData;
   m_pData = s.m_pData;
   s.m_pData = NULL;
  }
  return *this;
 }

private:
 char *m_pData;
};

        可以看到,上面我們添加了move版本的構造函數和賦值函數。那麼,添加了move版本後,對類的自動生成規則有什麼影響呢?唯一的影響就是,如果提供了move版本的構造函數,則不會生成默認的構造函數。另外,編譯器永遠不會自動生成move版本的構造函數和賦值函數,它們需要你手動顯式地添加。
        當添加了move版本的構造函數和賦值函數的重載形式後,某一個函數調用應當使用哪一個重載版本呢?下面是按照判決的優先級列出的3條規則:
             1、常量值只能綁定到常量引用上,不能綁定到非常量引用上。
             2、左值優先綁定到左值引用上,右值優先綁定到右值引用上。
             3、非常量值優先綁定到非常量引用上。
        當給構造函數或賦值函數傳入一個非常量右值時,依據上面給出的判決規則,可以得出會調用move版本的構造函數或賦值函數。而在move版本的構造函數或賦值函數內部,都是直接“移動”了其內部數據的指針(因爲它是非常量右值,是一個臨時對象,移動了其內部數據的指針不會導致任何問題,它馬上就要被銷燬了,我們只是重複利用了其內存),這樣就省去了拷貝數據的大量開銷。
        一個需要注意的地方是,拷貝構造函數可以通過直接調用*this = s來實現,但move構造函數卻不能。這是因爲在move構造函數中,s雖然是一個非常量右值引用,但其本身卻是一個左值(是持久對象,可以對其取地址),因此調用*this = s時,會使用拷貝賦值函數而不是move賦值函數,而這已與move構造函數的語義不相符。要使語義正確,我們需要將左值綁定到非常量右值引用上,C++ 11提供了move函數來實現這種轉換,因此我們可以修改爲*this = move(s),這樣move構造函數就會調用move賦值函數。

C++的Lambda表達式在WIN RT的異步編程中,佔有非常重要的作用。但C++的Lambda表達式又不同於其他語言,比如C#,javascript。本篇旨在討論C++ Lambda表達式的基本語法和概念,希望大家多多指正。

 

 首先,我們看一下Lambda表達式的基本構成

 

1. 是捕獲值列表,2.是傳入參數列表,3.可修改標示符,4.錯誤拋出標示符,5.函數返回值,6.是函數體。

 

在.NET 中,我們認爲比較標準的Lambda表達式應該是這個樣子

// declaring_lambda_expressions1.cpp
#include <functional>

int main()
{
   // Assign the lambda expression that adds two numbers to an auto variable.
   auto f1 = [] (int x, int y) { return x + y; }; 

   // Assign the same lambda expression to a function object.
   function<int (intint)> f2 = [] (int x, int y) { return x + y; };

   f1(3,4); 

}

f1是一個auto的值,也是function<>這個模板類型,我們可以理解成爲一個函數指針。然後我們用f1(3,4)去調用他。

 

如果我們想在函數聲明的時候就直接執行他,我們可以在Lambda表達式的最後加傳入參數,像這樣。

int main()
{
   using namespace std;
   int n = [] (int x, int y) { return x + y; }(54);

   //assign the return type
   int n = [] (int x, int y) -> intreturn x + y;}(54);
   cout << n << endl;

}

第二個表達式中聲明的返回值必須跟隨->符號,並且兩個必須同時出現。如果返回值唯一的話,我們可以省略->+返回值類型。

Lambda表達式允許返回值不唯一的情況,但必須指定返回值類型。

在以上的例子當中,只是常規的Lambda表達式用法,下面我們要說一說捕獲值列表。

 

捕獲值列表,是允許我們在Lambda表達式的函數體中直接使用這些值,捕獲值列表能捕獲的值是所有在此作用域可以訪問的值,包括這個作用域裏面的臨時變量,類的可訪問成員,全局變量。捕獲值的方式分兩種,一種是按值捕獲,一種是按引用捕獲。顧名思義,按值捕獲是不改變原有變量的值,按引用捕獲是可以在Lambda表達式中改變原有變量的值。

[&] 所有的值都是按引用捕獲

[=] 所有的值都是按值捕獲

如果你不想某些值被按引用或者按值捕獲,但其他的值卻想那樣做的話

[ &, n ] 除了n 所有的值按引用捕獲

[ = , &n ]除了n所有的值按值捕獲

當然,我們也可以指定某幾個值的捕獲屬性

[ m, n ]m,n按引用捕獲

[ &m, &n ]m,n按值捕獲

 

       int m = 0, n = 0;

    
      [=] (int a) mutable { m = ++n + a; }(4);
      [&] (int a) { m = ++n + a; }(4);

      [=,&m] (int a) mutable { m = ++n + a; }(4);
      [&,m] (int a) mutable { m = ++n + a; }(4);

      [m,n] (int a) mutable { m = ++n + a; }(4);
      [&m,&n] (int a) { m = ++n + a; }(4);

      [=] (int a) mutable { m = ++n + a; }(4);

 

大家一定好奇爲什麼這裏有很多mutable。在按值引用的情況下,Lambda函數體內部是不能直接修改引用值的。如下面註釋代碼,是會報錯的。這種情況下,我們要在Lambda表達式前加mutable,但是結果m,n 依然沒有被修改,維持按值引用的特性。

int main()
{
      int m = 0, n = 0;
      // 不加mutable會報錯
      
//[=] (int a){ m = ++n + a; }(4);
      
//[m,n] (int a){ m = ++n + a; }(4);

      [=] (int a) mutable { m = ++n + a; }(4);
     //
     
// [=] (int m, int n, int a){m=++n+a; }(m, n, 4);
     
// 下面這個函數m,n的值依然會被修改,因爲m,n是按引用傳入的
     
// [=] (int &m, int &n, int a){m=++n+a; }(m, n, 4);
      cout << m << endl << n << endl;

}

 

 在這個例子中捕獲值列表[this]中的this是用來指向這個類的,但[this]只有在類的內部,或者是this指針存在的情況下才能使用。

class Scale
{
public:
   // The constructor.
   explicit Scale(int scale)
      : _scale(scale)
   {
   }

   // Prints the product of each element in a vector object 
   
// and the scale value to the console.
   void ApplyScale(const vector<int>& v) const
   {
      for_each(v.begin(), v.end(), 
         [this](int n) { cout << n * _scale << endl; });
   }

private:
   int _scale;

};

 

關於異常:

我們可以通過try-catch去捕獲異常,而在Lambda表達式中聲明throw(),是指示編譯器這個函數不會拋異常,會引起編譯的警告。

 

然後,Lambda可以支持返回函數指針,或者說是嵌套一個Lambda表達式,比如:

int main()
{
   using namespace std;

   // The following lambda expression contains a nested lambda
   
// expression.
   int m = [](int x) 
      { return [](int y) { return y * 2; }(x) + 3; }(5);

   // Print the result.
   cout << m << endl;

}

我們可以把 return [](int y) { return y * 2; }(x) 抽象成 f(x) 所以原函數就是return f(5)+3 就是2*5+3=13

 

加入函數指針之後,我們來看一看一個Lambda表達式可以寫的多複雜,這是來自於MSDN的官方的例子。

// higher_order_lambda_expression.cpp
// compile with: /EHsc
#include <iostream>
#include <functional>

int main()
{
   using namespace std;

   // The following code declares a lambda expression that returns 
   
// another lambda expression that adds two numbers. 
   
// The returned lambda expression captures parameter x by value.
   auto g = [](int x) -> function<int (int)> 
      { return [=](int y) { return x + y; }; };

   // The following code declares a lambda expression that takes another
   
// lambda expression as its argument.
   
// The lambda expression applies the argument z to the function f
   
// and adds 1.
   auto h = [](const function<int (int)>& f, int z) 
      { return f(z) + 1; };

   // Call the lambda expression that is bound to h. 
   auto a = h(g(7), 8);

   // Print the result.
   cout << a << endl;

}

 

 

 

結果很簡單就是7+8+1=16 我通過代碼幫大家展開一下:

   auto g = [](int x) -> function<int (int)> 
      { return [=](int y) { return x + y; }; };

   auto h = [](const function<int (int)>& f, int z) 
      { return f(z) + 1; };

   auto a = h(g(7), 8);
   // 解:
   
// 我們先看看g(7) 等於什麼
   
// 我們把g的返回值 return [=](int y) { return x + y; }; 抽象成一個函數t(y)
   
// 那麼g(x)返回的就t(y)
   
// 也就是g(7)=t(y) 這裏g的參數和t的參數無關
   
// 那麼 h(g(7), 8)=h(t(y), 8))
   
// 代入h的表達式,我們發現t(y)就是f(z)
   
// 代入的結果就是 return t(8)+1,再把g(7)代入就是7+8+1=16
   

   cout << a << endl; 

 

最後,有人會很好奇foe_each爲什麼可以傳入Lambda表達式

首先,我們看看for_each的展開

template<class InputIterator, class Function>
  Function for_each(InputIterator first, InputIterator last, Function f)
  {
    for ( ; first!=last; ++first ) f(*first);
    return f;
  }

//From: http://www.cplusplus.com/reference/algorithm/for_each/ 

 當然這不是實際的代碼,但是我們可以看到,調用的只是f()再傳入迭代器的值,所以,我們在寫for_each的Lambda表達式的時候,傳入參數一定是和迭代器的類型是匹配的。

在沒有Lambda表達式的時候,只要是能寫成 f(*first)這樣的東西傳進來的都行,所以就會出現結構體重載()操作符,這樣的奇葩

void myfunction (int i) {
  cout << " " << i;
}

struct myclass {
  void operator() (int i) {cout << " " << i;}
} myobject;

int main () {
  vector<int> myvector;
  myvector.push_back(10);
  myvector.push_back(20);
  myvector.push_back(30);

  cout << "myvector contains:";
  for_each (myvector.begin(), myvector.end(), myfunction);

  // or:
  cout << "\nmyvector contains:";
  for_each (myvector.begin(), myvector.end(), myobject);

  cout << endl;

  return 0;

}

 

在C++中Lambda表達式被設計的相對複雜,但我相信,這也是C++這門語言的魅力所在,功能很強大,但是很難學。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章