C#實現Hash應用全解

1、引言

HASH是根據文件內容的數據通過邏輯運算得到的數值, 不同的文件(即使是相同的文件名)得到的HASH值是不同的。

通過一定的哈希算法(典型的有MD5,SHA-1等),將一段較長的數據映射爲較短小的數據,這段小數據就是大數據的哈希值。他最大的特點就是唯一性,一旦大數據發生了變化,哪怕是一個微小的變化,他的哈希值也會發生變化。類似於DNA,既然是DNA,那就保證了沒有兩個數據的哈希值是完全相同的。

哈希值的作用:哈希值,即HASH值,是通過對文件內容進行加密運算得到的一組二進制值,主要用途是用於文件校驗或簽名。正是因爲這樣的特點,它常常用來判斷兩個文件是否相同。

比如,從網絡上下載某個文件,只要把這個文件原來的哈希值同下載後得到的文件的哈希值進行對比,如果相同則表示兩個文件完全一致,下載過程沒有損壞文件。而如果不一致,則表明下載得到的文件跟原來的文件不同,文件在下載過程中受到了損壞。Hash的應用非常廣泛,主要應用於:

1.文件校驗

我們比較熟悉的校驗算法有奇偶校驗和CRC校驗,這2種校驗並沒有抗數據篡改的能力,它們一定程度上能檢測並糾正數據傳輸中的信道誤碼,但卻不能防止對數據的惡意破壞。
MD5Hash算法的”數字指紋”特性,使它成爲目前應用最廣泛的一種文件完整性校驗和(Checksum)算法,不少Unix系統有提供計算md5checksum的命令。

2. 唯一標識

現在有十萬個文件, 給你一個文件, 要你在這十萬個文件中查找是否存在. 一個很笨的辦法就是把每一文件都拿出來, 然後按照二進制串一一進行對比. 但是這個操作註定是比較費時的。可以用哈希算法對文件進行計算, 然後比較哈希值是否相同。 因爲存在哈希衝突的情況, 你可以在相同哈希值的文件再進行二進制串比較.

3. 數字簽名

Hash算法也是現代密碼體系中的一個重要組成部分。由於非對稱算法的運算速度較慢,所以在數字簽名協議中,單向散列函數扮演了一個重要的角色。對Hash值,又稱”數字摘要”進行數字簽名,在統計上可以認爲與對文件本身進行數字簽名是等效的。而且這樣的協議還有其他的優點。

4. 哈希表

在哈希表中使用哈希函數已經並不陌生了, 不再贅述。

5. 負載均衡

比如說, 現在又多臺服務器, 來了一個請求, 如何確定這個請求應該路由到哪個路由器呢?當然, 必須確保相同的請求經過路由到達同一個服務器. 一種辦法就是保存一張路由關係的表, 比如客戶端IP和服務器編號的映射, 但是如果客戶端很多, 勢必查找的時間會很長。 這時, 可以將客戶端的唯一標識信息(如:IP、username等)進行哈希計算, 然後與服務器個數取模, 得到的就是服務器的編號。

6. 分佈式存儲

當我們有大量數據時, 爲了提高讀取與寫入的速度, 一般會選擇將數據存儲到多個服務器。 決定將文件存儲到哪臺服務器, 就可以通過哈希算法取模的操作來得到。

但是, 如果數據多了, 要增加服務器了, 問題就來了, 比如原來是10臺服務器, 現在變成15臺了, 那麼原來哈希值爲16的文件被分配到編號6的服務器, 現在被分配到編號1的服務器, 也就意味着所有文件都要重新計算哈希值並重新非陪服務器進行存儲。 一致性哈希就是這個用途。
分佈式存儲

2、C#開發用於計算文件Hash的輔助類HashHelper

在C#中,數據的Hash以MD5或SHA1的方式實現,MD5與SHA1都是Hash算法,MD5輸出是128位的,SHA1輸出是160位的,MD5比SHA1快,SHA1比MD5強度高。

2.1、SHA-1和MD5的比較

因爲二者均由MD4導出,SHA-1和MD5彼此很相似。相應的,他們的強度和其他特性也是相似,但還有以下幾點不同:

1)對強行攻擊的安全性:最顯著和最重要的區別是SHA-1摘要比MD5摘要長32 位。使用強行技術,產生任何一個報文使其摘要等於給定報摘要的難度對MD5是2128數量級的操作,而對SHA-1則是2160數量級的操作。這樣,SHA-1對強行攻擊有更大的強度。

2)對密碼分析的安全性:由於MD5的設計,易受密碼分析的攻擊,SHA-1顯得不易受這樣的攻擊。

3)速度:在相同的硬件上,SHA-1的運行速度比MD5慢。

2.2、SHA-1和MD5在C#中的實現

/// <summary>
/// Hash輔助類
/// </summary>
public class HashHelper
{
    /// <summary>
    /// 計算文件的 MD5 值
    /// </summary>
    /// <param name="fileName">要計算 MD5 值的文件名和路徑</param>
    /// <returns>MD5 值16進制字符串</returns>
    public static string MD5File(string fileName)
    {
        return HashFile(fileName, "md5");
    }

    /// <summary>
    /// 計算文件的 sha1 值
    /// </summary>
    /// <param name="fileName">要計算 sha1 值的文件名和路徑</param>
    /// <returns>sha1 值16進制字符串</returns>
    public static string SHA1File(string fileName)
    {
        return HashFile(fileName, "sha1");
    }

    /// <summary>
    /// 計算文件的哈希值
    /// </summary>
    /// <param name="fileName">要計算哈希值的文件名和路徑</param>
    /// <param name="algName">算法:sha1,md5</param>
    /// <returns>哈希值16進制字符串</returns>
    private static string HashFile(string fileName, string algName)
    {
        if (!System.IO.File.Exists(fileName))
        {
            return string.Empty;
        }

        System.IO.FileStream fs = new System.IO.FileStream(fileName, System.IO.FileMode.Open, System.IO.FileAccess.Read);
        byte[] hashBytes = HashData(fs, algName);
        fs.Close();
        return ByteArrayToHexString(hashBytes);
    }

    /// <summary>
    /// 計算哈希值
    /// </summary>
    /// <param name="stream">要計算哈希值的 Stream</param>
    /// <param name="algName">算法:sha1,md5</param>
    /// <returns>哈希值字節數組</returns>
    private static byte[] HashData(System.IO.Stream stream, string algName)
    {
        System.Security.Cryptography.HashAlgorithm algorithm;
        if (algName == null)
        {
            throw new ArgumentNullException("algName 不能爲 null");
        }

        if (string.Compare(algName, "sha1", true) == 0)
        {
            algorithm = System.Security.Cryptography.SHA1.Create();
        }
        else
        {
            if (string.Compare(algName, "md5", true) != 0)
            {
                throw new Exception("algName 只能使用 sha1 或 md5");
            }
            algorithm = System.Security.Cryptography.MD5.Create();
        }

        return algorithm.ComputeHash(stream);
    }

    /// <summary>
    /// 字節數組轉換爲16進製表示的字符串
    /// </summary>
    private static string ByteArrayToHexString(byte[] buf)
    {
        return BitConverter.ToString(buf).Replace("-", "");
    }
}

2.2、SHA-1和MD5在C#中的實現的測試用例

[TestClass]
public class HashHelperUnitTest
{
    [TestMethod]
    public void TestMethod1()
    {
        string fileName = @"D:\TempTest\RDIFramework.BizLogic.dll";
        Assert.AreEqual(0, 0);

        //01.計算文件的 MD5 值
        Console.WriteLine(string.Format("計算文件的 MD5 值:{0}", HashHelper.MD5File(fileName)));

        //02.計算文件的 sha1 值
        Console.WriteLine(string.Format("計算文件的 sha1 值:{0}", HashHelper.SHA1File(fileName)));
    }
}

測試與輸出結果

參考文章

框架相關


一路走來數個年頭,感謝RDIFramework.NET框架的支持者與使用者,大家可以通過下面的地址瞭解詳情。

RDIFramework.NET官方網站:http://www.rdiframework.net/

RDIFramework.NET官方博客:http://blog.rdiframework.net/

同時需要說明的,以後的所有技術文章以官方網站爲準,歡迎大家收藏!

RDIFramework.NET框架由海南國思軟件科技有限公司專業團隊長期打造、一直在更新、一直在升級,請放心使用!

歡迎關注RDIFramework.net框架官方公衆微信(微信號:guosisoft),及時瞭解最新動態。

掃描二維碼立即關注
微信號:guosisoft

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章