列存儲是從SQL 2012引入，並在後面發揮非常大性能提升的功能，因爲當前工作過程需要使用，並且已經出現了很多問題，所以這裏我打算把這兩個月的經驗總結和分享一下。
這個系列跟前面的有些類似，但是我希望能夠把零碎的知識點合在一個系列中，最起碼方便自己以後搜索。

環境準備

本文會使用SQL Server On Linux環境，不過這個問題不大，SQL Server 使用2019版本。
OS爲20G內存，4 core。CentOS 7.7。
演示數據庫使用ContosoRetailDW，由於後續會反覆使用這個庫，建議保留備份文件，每次操作完就還原。使用大概3千萬數據作爲測試。部分單獨測試會使用新建數據庫或者TempDB。
本系列使用Hyper-V的虛擬機做測試，所以I/O不會很高，它的值不能作爲什麼衡量標準，但是可以跟其他方式做橫向對比。

列存儲簡介

列存儲需要記住的一些關鍵點：

列存儲設計之初是爲了提升數據倉庫的性能。
從SQL 2012引入非聚集列存儲索引，但是不可更新，禁止修改底層schema，不可使用唯一約束，批執行模式受限等，都使得列存儲索引沒有很好地推廣起來。
從SQL 2014開始，引入了聚集列存儲索引。它主要有以下提升：

可更新。
可修改schema。
支持更多數據類型。
混合執行模式（批和行）。
支持更多批執行模式。
更好的壓縮效果。
支持seek操作
支持和提升bulk insert中的spill。

基本技術點是把數據拆分並存儲到不同的行組（row groups），也叫片段（segments），每個片段應該包含大概100萬行數據。
每一列都有自己的片段組，是基於列，而不是傳統行存儲那樣基於行。
行組的數據經過編碼和壓縮後，轉成Blobs（因此在SET STATISTICS IO中需要看lob logical reads和lob physical reads）然後存儲到SQL Server中。底層存儲大小依舊是8K的頁。如果一個Blob已經大於1個頁，會調用通用的Blobs存儲機制。
使用sys.column_store_segments 這個DMV可以查到相關的元數據信息。
Delete bitmap：一個非常重要的信息，在前兩個月就是因爲這個導致我公司的Azure SQL DB 不可用了。這是關於片段中被刪除的數據行的信息。後面有機會再講。
聚集列存儲索引的架構總的來說由兩部分組成：1. 行組/片段。2. Delta Stores（增量存儲）。增量存儲是一個常規的b-tree行存儲，所以不要以爲建了聚集列存儲索引之後就一定能用上它的優點。如果大量的數據都存儲在Delta Stores中，那麼還是跟傳統行存儲索引一樣。使用DMV：sys.column_store_row_groups 可以查看所有片段和增量存儲的信息。DMV中的值，片段的status=3，並且描述是Compressed，Delta Stores的status可能是1或者2，描述爲Open/Close。Open意味着增量存儲還能添加數據，Close爲正在準備轉換到片段。
列存儲術語：
Insert：添加數據到當前open的Delta Stores中。
Delete：如果刪除的數據是在片段中，那麼Deleted Bitmap會更新並帶有對應的row id。如果是在增量存儲中，那麼直接從B-tree結果中移除。
Update：實際過程就是先刪除再insert。

計劃進行的實驗

因爲準備可用性組，也就是alwayson，搭建讀寫分離比較耗時和耗機器，所以暫時不打算做這部分的測試。

（不分區）導入數據到堆表然後創建聚集列存儲索引。
（不分區）直接導入數據到聚集列存儲索引表。
（不分區）使用Bulk insert導入數據到聚集列存儲索引表。
（不分區）使用Bulk insert導入數據到堆表然後創建聚集列存儲索引。
（不分區）使用並行插入到堆表然後創建聚集列存儲索引。
（分區）導入數據到堆表然後創建聚集列存儲索引。
（分區）直接導入數據到聚集列存儲索引表。
（分區）使用Bulk insert導入數據到聚集列存儲索引表。
（分區）使用Bulk insert導入數據到堆表然後創建聚集列存儲索引。
（分區）使用並行插入到堆表然後創建聚集列存儲索引。
（不分區,in-memory）導入數據到堆表然後創建聚集列存儲索引。
（不分區,in-memory）直接導入數據到聚集列存儲索引表。
（不分區,in-memory）使用Bulk insert導入數據到聚集列存儲索引表。
（不分區,in-memory）使用Bulk insert導入數據到堆表然後創建聚集列存儲索引。
（不分區,in-memory）使用並行插入到堆表然後創建聚集列存儲索引。

下一篇：SQL Server 列存儲索引性能總結（2）——獲取元數據信息

SQL Server 列存儲索引性能總結（1）——環境準備及簡介

環境準備

列存儲簡介

相關知識

計劃進行的實驗

《日本蠟燭圖》讀書筆記 & 技術分析回測

Python多線程編程深度探索：從入門到實戰

《期貨-市場技術分析》讀書筆記

mongodb處理json數據很好

頂級 Javaer 都在用的 20 個類庫，真香！

[轉帖]cpupower

google瀏覽器插件開發

35K*14 薪，入職了！這公司只要不裁員，我能一直呆下去！

SQL Server導入性能對比（1）——WITH TABLOCK並行導入

SQL Azure 工作積累（1）——添加用戶到Azure SQL DB

SQL Server 列存儲索引性能總結（3）——列存儲的鎖

SQL Server 列存儲索引性能總結（9）——重建和重組聚集列存儲索引所需的內存

SQL Server 列存儲索引性能總結（7）——導入數據到列存儲索引的Delta Store

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結