LINQ 基本概念及相關資料分享

LINQ,語言級集成查詢(Language INtegrated Query)

      經過了最近 20 年,面向對象編程技術( object-oriented (OO) programming technologies )在工業領域的應用已經進入了一個穩定的發展階段。程序員現在都已經認同像 類(classes)、對象(objects)、方法(methods)這樣的語言特性。考察現在和下一代的技術,一個新的編程技術的重大挑戰開始呈現出來,即面向對象技術誕生以來並沒有解決降低訪問和整合信息數據( accessing and integrating information )的複雜度的問題。其中兩個最主要訪問的數據源與數據庫( database )和 XML 相關。

      LINQ 提供了一條更常規的途徑即給 .Net Framework 添加一些可以應用於所有信息源( all sources of information )的具有多種用途( general-purpose )的語法查詢特性( query facilities ),這是比向開發語言和運行時( runtime )添加一些關係數據( relational )特性或者類似 XML 特性( XML-specific )更好的方式。這些語法特性就叫做 .NET Language Integrated Query (LINQ) 。

      包含 DLinq 和 XLinq

      語法實例
      C#3.0 LINQ 查詢語法
      首先來看一個很簡單的LINQ查詢例子,查詢一個int 數組中小於5的數字,並按照大小順序排列:
 
      上述代碼除了LINQ查詢語法外,其他都是我們所熟悉的語法,而LINQ查詢語法跟SQL查詢語法很相識,除了先後順序。

      Q:爲何 LINQ 查詢語法是以 from 關鍵字開頭的,而不是以 select 關鍵字開頭的?select 開頭這種寫法跟SQL的寫法更接近,更易懂呀?
      A:簡單來說,爲了IDE的智能感知(Intelisence)這個功能,select 關鍵字放在後面了。
      編程語言以 select 開頭寫LINQ查詢語法不是沒出現過,你如果使用過2005年的VB9 CTP 版本,那時候VB9的LINQ查詢語法就是 select 關鍵字在前面,但是 select 關鍵字在前面,在做智能感知(Intelisence)時候就很頭大。經過微軟IDE組的權衡,確定了把 from 關鍵字放在最前面。
      比如:你看 http://blog.joycode.com/saucer/archive/2005/09/16/63513.aspx 這篇博客,那時候 VB9 LINQ的查詢語法還是 select 參數在最前面。不過後來 VB9 測試版改成了跟 C# 一樣的做法, from 關鍵字放在最前面了。
      更詳細的解釋:
      假設你要書寫這樣的代碼:Select p.Name, p.Age From p In persons Where xxx ,代碼是一個個字符輸入的。
      我們在寫到 p in persons 之前,p 的類型是無法推測的,所以寫 Select p. 的時候,Name之類的屬性不會彈出智能提示來。
      這樣就需要先去寫 From 這句,再回來寫 Select。
      微軟IDE組經過反覆考慮決定,還不如就把 Select 寫到後面了。於是編程語言中的寫法就確定這樣來寫了。
      VB9 的這個變化可以參看這篇博客:
      Select/From vs. From/Select revisited...


      我們再來看一個稍稍複雜的LINQ查詢:
      在我們羅列的語言字符串中,我們希望按照字符長短,分類羅列出來,實現代碼如下:
 
      其中的 into 關鍵字表示 將前一個查詢的結果視爲後續查詢的生成器,這裏是跟 group  by  一起使用的。
      LINQ中的Group by不要跟 SQL 中的Group by 混淆,SQL 由於是二維結構,Group by 的一些邏輯受二維結構的約束,無法象 LINQ 中的Group by 這麼靈活。

      Linq的內部執行原理淺析

      LINQ(Language Integrated Query)是Visual Studio 2008中的領軍人物。藉助於LINQ技術,我們可以使用一種類似SQL的語法來查詢任何形式的數據。目前爲止LINQ所支持的數據源有SQL Server、XML以及內存中的數據集合。開發人員也可以使用其提供的擴展框架添加更多的數據源,例如MySQL、Amazon甚至是Google Desktop。

      一般來講,這類查詢語句的一個重要特點就是可以並行化執行。雖然有些情況下並行可能會帶來一些問題,但這種情況非常少見。這樣也就水到渠成地引出了PLINQ這個並行處理的LINQ類庫。

      PLINQ原名爲Parallel LINQ,支持XML和內存中的數據集合。執行於遠程服務器上的查詢語句(例如LINQ to SQL)顯然無法實現這個功能。
      將LINQ語句轉換爲PLINQ語句極爲簡單——只需要在查詢語句中From子句所指定的數據源的最後添加.AsParallel()即可。隨後 Where、OrderBy和Select子句將自動改爲調用這個並行的LINQ版本。

      據MSDN Magazine介紹,PLINQ可以以三種方式執行。第一種是管道處理:一個線程用來讀取數據源,而其他的線程則用來處理查詢語句,二者同步進行——雖然這個單一的消費線程可能並不那麼容易與多個生產線程同步。不過若是能夠仔細配置好負載平衡的話,仍然會極大地減少內存佔用。

      第二種模式叫做“stop and go”,用於處理結果集需要被一次返回時(例如調用ToList、ToArray或對結果排序)的情況。在這種模式下,將依次完成各個處理過程,並將結果統一返回給消費線程。這個模式在性能上將優於第一種模式,因爲它省去了用來保持線程同步所花費的開銷。

      最後一種方法叫做“inverted enumeration”。該方法並不需要實現收集到所有的輸出,然後在單一的線程中處理,而是將最終調用的函數通過ForAll擴展傳遞到每個線程中。這是目前爲止最快的一種處理模式,不過這需要傳遞到ForAll中的函數是線程安全的,且最好不包含任何 lock之類的互斥語句。

      若是PLINQ中任意的一個線程拋出異常,那麼所有的其他線程將會被終止。若是拋出了多個異常,那麼這些異常將被組合成一個 MultipleFailuresException類型的異常,但每個異常的調用堆棧仍會被保留。

 

      以上文章來源:>>。由我整理於2010-2-20。

 

 

 

LINQ相關資料共享:

 

MSDN資料——LINQ 查詢表達式(C# 編程指南)

 

一步一步學Linq to sql

 

博客園LINQ to SQL知識庫

 

博客園LINQ專題

 

LINQ體驗系列文章

 

C#3.0之Linq to sql進階篇-ITPUB技術門戶 

 

微軟免費圖書Introducing to Microsoft LINQ翻譯預告及目錄結構

 

Linq動態查詢實例

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章