C# .net 漢字:字符串截取、補齊

在代碼中,一個漢字length=1,但是佔用2個字符。

若想截取或者補齊的話,字符串中包含漢字取length是不一定準確的,雖然大多數情況下沒有問題。

如下代碼可以解決問題,已驗證。

private string cutSubstring(string str, int length)
{
    if (str == null || str.Length == 0 || length < 0)
    { 
        return ""; 
    }

    byte[] bytes = System.Text.Encoding.Unicode.GetBytes(str);
    int n = 0;  //  表示當前的字節數
    int i = 0;  //  要截取的字節數
    for (; i < bytes.GetLength(0) && n < length; i++)
    {
        //  偶數位置,如0、2、4等,爲UCS2編碼中兩個字節的第一個字節
        if (i % 2 == 0)
        {
            n++;      //  在UCS2第一個字節時n加1
        }
        else
        {
            //  當UCS2編碼的第二個字節大於0時,該UCS2字符爲漢字,一個漢字算兩個字節
            if (bytes[i] > 0)
            {
                n++;
            }
        }
    }
    //  如果i爲奇數時,處理成偶數
    if (i % 2 == 1)
    {
        //  該UCS2字符是漢字時,去掉這個截一半的漢字
        if (bytes[i] > 0)
            i = i - 1;
        //  該UCS2字符是字母或數字,則保留該字符
        else
            i = i + 1;
    }
    return System.Text.Encoding.Unicode.GetString(bytes, 0, i);
}
private string retrunStr(string strvalue, int len)
{
	//string values=strvalue.PadLeft(len);
	//string values=strvalue.PadRight(len);
	
	string values="";
	int tmplen=System.Text.RegularExpressions.Regex.Replace(strvalue, @"[^\x00-\xff]", "aa").Length;//計算得到該字符串對應單字節字符串的長度
	if (tmplen<=len)
	{
		values=strvalue.PadRight(len - tmplen + strvalue.Length);
	}
	else
	{
		strvalue=cutSubstring(strvalue,len);
		values=strvalue.PadRight(len - tmplen + strvalue.Length);
	}
	
	return values;
}

調用 retrunStr(傳入字符串,長度) 即可。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章