string mb_strcut ( string $str , int $start [, int $length = NULL [, string $encoding = mb_internal_encoding() ]] ) – 獲取字符的一部分
1、(PHP 4 >= 4.0.6, PHP 5)
2、$str 要獲取字符串的目標字符串(字符串起始位置爲0)
3、$start,起始位置,以字節爲單位。(一定要注意是字節)
4、$length,字節長度(一定要注意是字節)
5、$encoding,可指定字符編碼(一般用於處理中文字符時使用,同時這個問題碰到的非常多)
6、特別注意:中文漢字在UTF-8編碼下佔3個字節,在GB2312編碼下佔2個字節,所以導致下面的實例中有亂碼
<?php mb_internal_encoding ("UTF-8"); //如果把UTF-8改爲編碼,下面針對於中文字符串處理的值會改變。 echo mb_internal_encoding().""; //獲取字符編碼爲ISO-8859-1 echo mb_strcut('abcdefghijk',0,9).""; //abcdefghi echo mb_strcut('abcdefghijk',1,5).""; //bcdef echo mb_strcut('我們都是中國人',0,9).""; //我們都是中國人 echo mb_strcut('我們都是中國人',0,9,'gb2312').""; //此處有亂碼了 echo mb_strcut('我們都是中國人',0,9,'utf-8'); //我們都是中國人 ?>
總結:
1、在處理英文字符串的時候,該函數的第四個參數($encoding)可以忽略。
2、在處理中文字符串的時候,就要小心了,一定要考慮編碼問題,編碼不同,中文的值也不同。
3、在中文字符串操作數據庫存取時,就顯得更爲重要了。
4、處理字符串或文本的編碼能力,是衡量程序員功力的一項標準。
與這個函數類似的mb_substr(),請直接參考。