C# .net 汉字:字符串截取、补齐

在代码中,一个汉字length=1,但是占用2个字符。

若想截取或者补齐的话,字符串中包含汉字取length是不一定准确的,虽然大多数情况下没有问题。

如下代码可以解决问题,已验证。

private string cutSubstring(string str, int length)
{
    if (str == null || str.Length == 0 || length < 0)
    { 
        return ""; 
    }

    byte[] bytes = System.Text.Encoding.Unicode.GetBytes(str);
    int n = 0;  //  表示当前的字节数
    int i = 0;  //  要截取的字节数
    for (; i < bytes.GetLength(0) && n < length; i++)
    {
        //  偶数位置,如0、2、4等,为UCS2编码中两个字节的第一个字节
        if (i % 2 == 0)
        {
            n++;      //  在UCS2第一个字节时n加1
        }
        else
        {
            //  当UCS2编码的第二个字节大于0时,该UCS2字符为汉字,一个汉字算两个字节
            if (bytes[i] > 0)
            {
                n++;
            }
        }
    }
    //  如果i为奇数时,处理成偶数
    if (i % 2 == 1)
    {
        //  该UCS2字符是汉字时,去掉这个截一半的汉字
        if (bytes[i] > 0)
            i = i - 1;
        //  该UCS2字符是字母或数字,则保留该字符
        else
            i = i + 1;
    }
    return System.Text.Encoding.Unicode.GetString(bytes, 0, i);
}
private string retrunStr(string strvalue, int len)
{
	//string values=strvalue.PadLeft(len);
	//string values=strvalue.PadRight(len);
	
	string values="";
	int tmplen=System.Text.RegularExpressions.Regex.Replace(strvalue, @"[^\x00-\xff]", "aa").Length;//计算得到该字符串对应单字节字符串的长度
	if (tmplen<=len)
	{
		values=strvalue.PadRight(len - tmplen + strvalue.Length);
	}
	else
	{
		strvalue=cutSubstring(strvalue,len);
		values=strvalue.PadRight(len - tmplen + strvalue.Length);
	}
	
	return values;
}

调用 retrunStr(传入字符串,长度) 即可。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章