前言
最近項目有個需求,就是截取文本,區分中英文字符,中文算2個長度,英文算1個長度,截取後增加…,佔3個長度(包括在限制長度內),需求不復雜,想要寫出較好的方法,得稍稍費點心思,下面是筆者寫的代碼,僅供參考。
代碼
/// <summary>
/// 截取文本,區分中英文字符,中文算兩個長度,英文算一個長度,截取後增加...,佔3個長度(包括在限制長度內)
/// </summary>
/// <param name="str"></param>
/// <param name="length">不小於3</param>
/// <returns></returns>
public string GetCnEnSubString(string str, int length)
{
if (length < 3)
length = 3;
//記錄length一半的長度
int i = length >> 1;
int j, step;
//定義編碼器,GB2312中文佔2個長度,英文佔1個長度
Encoding code = System.Text.Encoding.GetEncoding("GB2312");
//逐漸增加i值,直至長度大於限制長度
while (i <= str.Length)
{
j = code.GetByteCount(str.Substring(0, i));
if (j <= length)
{
//計算增加的步長
step = (length - j) >> 1;
if (step > 0)
i += step;
else
i++;
}
else
{
//回退,逐漸減小i值,直至加上3後,不大於限制長度
while (code.GetByteCount(str.Substring(0, i - 1)) > (length - 3))
i--;
return str.Substring(0, i - 1) + "...";
}
}
//如果將原字符串遍歷完後,仍不大於限制長度,返回原字符
return str;
}