首先,我們需要明白幾個索引的要點:
- 索引之後,按索引字段重複最少的來排序,會達到最優的效果。以我們的表來說,如果建立了No的聚集索引,把No放在where子句的第一位是最佳的,其次是Id,然後是MgrObjId,最後是時間,時間索引如果表是一個小時的,最好不要用
- where子句的順序決定了查詢分析器是否使用索引來查詢。比如建立了MgrObjId和Id的索引,那麼
where MgrObjId='' and Id='' and Dtime=''
就會採用索引查找,而where Dtime='' and MgrObjId='' and Id=''
則不一定會採用索引查找。 - 把非索引列的結果列放在包含列中。因爲我們條件是MgrObjId和Id以及Dtime,因此返回結果中只需包含Dtime和Value即可,因此把Dtime和Value放在包含列中,返回的索引結果就有這個值,不用再查物理表,可以達到最優的速度。
跟上述幾點原則,我們建立以下的索引:CREATE NONCLUSTERED INDEX Idx_His20141008 ON dbo.his20141008(MgrObjId,Id) INCLUDE(Value,Dtime)
總結
如何在SQLServer中處理億萬級別的數據(歷史數據),可以按以下方面進行:
- 去掉表的所有索引
- 用SqlBulkCopy進行插入
- 分表或者分區,減少每個表的數據總量
- 在某個表完全寫完之後再建立索引
- 正確的指定索引字段
- 把需要用到的字段放到包含索引中(在返回的索引中就包含了一切)
- 查詢的時候只返回所需的字段
轉自:https://www.cnblogs.com/linybo/p/10093735.html