php中常用的字符串獲取函數mb_strcut實例解釋

string mb_strcut ( string $str , int $start [, int $length = NULL [, string $encoding = mb_internal_encoding() ]] ) – 獲取字符的一部分
1、(PHP 4 >= 4.0.6, PHP 5)
2、$str 要獲取字符串的目標字符串(字符串起始位置爲0)
3、$start,起始位置,以字節爲單位。(一定要注意是字節)
4、$length,字節長度(一定要注意是字節)
5、$encoding,可指定字符編碼(一般用於處理中文字符時使用,同時這個問題碰到的非常多)
6、特別注意:中文漢字在UTF-8編碼下佔3個字節,在GB2312編碼下佔2個字節,所以導致下面的實例中有亂碼

<?php
    mb_internal_encoding ("UTF-8");	//如果把UTF-8改爲編碼,下面針對於中文字符串處理的值會改變。
    echo mb_internal_encoding()."";	//獲取字符編碼爲ISO-8859-1
    echo mb_strcut('abcdefghijk',0,9)."";	//abcdefghi
    echo mb_strcut('abcdefghijk',1,5)."";	//bcdef
    echo mb_strcut('我們都是中國人',0,9)."";	//我們都是中國人
    echo mb_strcut('我們都是中國人',0,9,'gb2312')."";	//此處有亂碼了
    echo mb_strcut('我們都是中國人',0,9,'utf-8');	//我們都是中國人
?>

總結:
1、在處理英文字符串的時候,該函數的第四個參數($encoding)可以忽略。
2、在處理中文字符串的時候,就要小心了,一定要考慮編碼問題,編碼不同,中文的值也不同。
3、在中文字符串操作數據庫存取時,就顯得更爲重要了。
4、處理字符串或文本的編碼能力,是衡量程序員功力的一項標準。

與這個函數類似的mb_substr(),請直接參考。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章