在代碼中,一個漢字length=1,但是佔用2個字符。
若想截取或者補齊的話,字符串中包含漢字取length是不一定準確的,雖然大多數情況下沒有問題。
如下代碼可以解決問題,已驗證。
private string cutSubstring(string str, int length)
{
if (str == null || str.Length == 0 || length < 0)
{
return "";
}
byte[] bytes = System.Text.Encoding.Unicode.GetBytes(str);
int n = 0; // 表示當前的字節數
int i = 0; // 要截取的字節數
for (; i < bytes.GetLength(0) && n < length; i++)
{
// 偶數位置,如0、2、4等,爲UCS2編碼中兩個字節的第一個字節
if (i % 2 == 0)
{
n++; // 在UCS2第一個字節時n加1
}
else
{
// 當UCS2編碼的第二個字節大於0時,該UCS2字符爲漢字,一個漢字算兩個字節
if (bytes[i] > 0)
{
n++;
}
}
}
// 如果i爲奇數時,處理成偶數
if (i % 2 == 1)
{
// 該UCS2字符是漢字時,去掉這個截一半的漢字
if (bytes[i] > 0)
i = i - 1;
// 該UCS2字符是字母或數字,則保留該字符
else
i = i + 1;
}
return System.Text.Encoding.Unicode.GetString(bytes, 0, i);
}
private string retrunStr(string strvalue, int len)
{
//string values=strvalue.PadLeft(len);
//string values=strvalue.PadRight(len);
string values="";
int tmplen=System.Text.RegularExpressions.Regex.Replace(strvalue, @"[^\x00-\xff]", "aa").Length;//計算得到該字符串對應單字節字符串的長度
if (tmplen<=len)
{
values=strvalue.PadRight(len - tmplen + strvalue.Length);
}
else
{
strvalue=cutSubstring(strvalue,len);
values=strvalue.PadRight(len - tmplen + strvalue.Length);
}
return values;
}
調用 retrunStr(傳入字符串,長度) 即可。