C#中進行中英文字符截取(中文2個長度,英文1個)

前言

最近項目有個需求,就是截取文本,區分中英文字符,中文算2個長度,英文算1個長度,截取後增加…,佔3個長度(包括在限制長度內),需求不復雜,想要寫出較好的方法,得稍稍費點心思,下面是筆者寫的代碼,僅供參考。

代碼

/// <summary>
/// 截取文本,區分中英文字符,中文算兩個長度,英文算一個長度,截取後增加...,佔3個長度(包括在限制長度內)
/// </summary>
/// <param name="str"></param>
/// <param name="length">不小於3</param>
/// <returns></returns>
public string GetCnEnSubString(string str, int length)
{
    if (length < 3)
        length = 3;
    //記錄length一半的長度
    int i = length >> 1;
    int j, step;
    //定義編碼器,GB2312中文佔2個長度,英文佔1個長度      
    Encoding code = System.Text.Encoding.GetEncoding("GB2312");
    //逐漸增加i值,直至長度大於限制長度                    
    while (i <= str.Length)
    {
          j = code.GetByteCount(str.Substring(0, i));
          if (j <= length)
          {
              //計算增加的步長
              step = (length - j) >> 1;
              if (step > 0)
                  i += step;
              else
                  i++;
          }
          else
          {
               //回退,逐漸減小i值,直至加上3後,不大於限制長度           
               while (code.GetByteCount(str.Substring(0, i - 1)) > (length - 3))
                  i--;
               return str.Substring(0, i - 1) + "...";
          }
     }
     //如果將原字符串遍歷完後,仍不大於限制長度,返回原字符
     return str;
}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章