PHP字符串操作

PHP字符串操作
無論哪種語言,字符串操作都是一個重要的基礎,往往是簡單而重要。正像人說話一樣,一般有形體(圖形界面),有語言(print 字符串?),顯然字符串能解釋更多的東西。PHP提供了大量的字符串操作函數,功能強大,使用也比較簡單,詳細請參看 http://cn2.php.net/manual/zh/ref.strings.php . 以下將簡單的講述它的功能和特性。
弱類型
PHP是弱類型語言,所以其它類型的數據一般可以直接應用於字符串操作函數裏,而自動轉換成字符串類型,進行處理,如:

DE>echo substr("1234567"13);  DE>



DE>echo substr(123456,13);  DE>

是一樣的

定義
一般用雙引號或單引號標識一個字符串。比如

DE>$str "i love u"
$str 'i love u'
DE>


它者兩者是有一些區別的。後者將一切單引號的內容都會當作字符處理;前者則不然。比如

DE>$test "iwind"
$str "i love $test"
$str1 'i love $test'
echo 
$str//將得到 i love iwind 
echo $str1//將得到 i love $test 
DE>


同樣的以下兩個例子的行爲也不一樣的:

DE>echo "i love \test"// 將得到 i love est,已經將\t視爲轉義 
echo 'i love \test'// 將得到 i love \test 
DE>


從而可以簡單認爲雙引號裏的內容是經過“解釋”過的,單引號的是“所見即所得”的。顯而易見,雙引號形式的更爲靈活一些,當然單引號會適用於一些特殊的場合,這裏就不作闡述了。

輸出
PHP裏的輸出最常用的是echo,print.兩者都不是真正的函數,而是語言構造,所以調用時不必用雙括號(比如echo("test");print("test")).在輸出的時候兩者都可以實現賦值:

DE>echo $str="test"//一方面輸出test,一方面把"test"賦給字符串變量 $str 
print $str="test"
DE>


兩者除了名字不一樣外,還是有其它區別的。print具有返回值,一直返回1,而echo沒有,所以echo比print要快一些:

DE>$return = print "test"
echo 
$return// 輸出1 
DE>


也正因爲這個原因,print能應用於複合語句中,而echo不能:

DE>isset($str) or print "str 變量未定義"// 將輸出"str 變量未定義" 
isset($str) or echo "str 變量未定義";// 將提示分析錯誤 
DE>


echo一次可輸出多個字符串,而print則不可以:

DE>echo "i ","love ","iwind"// 將輸出 "i love iwind" 
print "i ","love ","iwind"// 將提示錯誤 
DE>


echo,print還可以輸出被稱作“文檔句法”的字符串,句法如:

DE>echo <<< 標籤名稱 
... 
字符串內容 
... 
標籤名稱
DE>


比如

DE>echo <<< test 
i love iwind 
test
DE>


要注意的是語句開始和結束的兩個標籤名稱是一樣的,且後一個標籤名稱前不能有空白,即要頂格寫。文檔句法輸出的內容識別變量名稱和常用符號,大致形同雙引號的作用。

輸出echo,print外,PHP還提供了一些格式化字符串的函數,比如printf,sprintf,vprintf,vsprintf,在這裏不作詳解。

連接
兩個以上的字符串連接用"."操作符,依字符串的順序形成新的字符串。

DE>$str "i " "love " "iwind"
這裏的$str 就是 "i love iwind";字符串。當然,還可以使用 .= 操作符
$str ""// 初始化 
$str .= "i love iwind"
DE>


這裏用到了初始化,是因爲未定義變量在使用時會產生一個notice錯誤,""或者null可以簡單地代表空字符串。

長度
PHP提供strlen函數來計算字符串的長度:

DE>$str "test"
echo 
strlen($str); // 將輸出 4 
DE>

有點奇怪的是strlen將中日等漢字以及全角字符都當作兩個或四個長度計算。好在mbstring或icon兩個函數可以幫助解決這個問題,比如:

DE>$len iconv_strlen($str"GBK"); 
$len mb_strlen($str"GBK"); 
DE>

注:mbstring模塊提供了大量的對含有多字節字符的字符串的處理函數,推薦多加應用,由於這篇文章講的是字符串入門,所以不打算詳細解說。

分隔與連接
PHP允許你把一個字符串按照一個分隔符進行分隔成一個數組,或者將一個數組組合成一個字符串。看下面的例子:

DE>$str "i love iwind"
$array explode(" "$str); 
DE>

上面的explode函數,就把$str字符串按空格字符進行分隔,結果返回一個數組 $array:array("i", "love", "iwind").與explode函數有類似功能的有:preg_split(), spliti(), split()等函數。

與此相反的,implode和join則能把一個數組結合成一個字符串,他們是具有完全相同功能的函數。

DE>$array = array("i""love""iwind"); 
$str implode(" "$array); 
例中的implode函數將數組$array的每個元素用空格字符進行連接,返回一個字符串 $str: "i love iwind"
DE>


裁剪
一個字符串首和尾,可能不是你想要的部分,就可以用trim,rtrim,ltrim等函數,分別去除一個字符串兩端空格,一個字符串尾部空格,一個字符串首部空格。

DE>echo trim(" i love iwind "); // 將得到 "i love iwind" 
echo rtrim(" i love iwind "); // 將得到 " i love iwind" 
echo ltrim(" i love iwind "); // 將得到 "i love iwind " 
DE>

其實這三個參數不僅可以去除字符串首尾的空格,還可以去除它們的第二個參數指定的字符,如:

DE>echo trim(",1,2,3,4,"","); // 將得到 1,2,3,4 兩端的","號被裁掉了。  DE>


有時還會看到有人使用chop這個函數,其實它是rtrim的同義函數。

大小寫
對於英文字母來說,可以用strtoupper,strtolower將其轉變成大寫或小寫。

DE>echo strtoupper("i love iwind"); // 將得到 I LOVE IWIND 
echo strtolower("I LOVE IWIND"); // 將得到 i love iwind 
DE>


比較
一般可以用 !=, == 比較兩個對象是否相等,只所以說是兩個對象,是因爲它們不一定全部爲字符串,也可以爲整型等等。比如

DE>$a "joe"
$b "jerry"
if (
$a != $b

echo 
"不相等"

else 

echo 
"相等"
DE>

如果用 !==,===(可以看到多了一個等號)比較的話,兩個對象的類型要嚴格相等才能返回true;否則用==,!=則會將字符串自動轉換成相應的類型,以便進行比較.

DE>22 == "22"// 返回 true 
22 === "22"// 返回false 
//正因爲這樣,所以我們的程序時常會發生一些想不到的"意外": 
== "我愛你"// 返回true 
== "1 我愛你";// 返回true 
DE>


PHP裏還有這樣一組用於字符串比較的函數:strcmp,strcasecmp,strncasecmp(), strncmp(),它們都是如果前者比後者大,則返回大於0的整數;如果前者比後者小,則返回小於0的整數;如果兩者相等,則返回0.它們比較的原理與其它語言的規則都是一樣的。
strcmp是用於區分大小寫(即大小寫敏感)的字符串比較:

DE>echo strcmp("abcdd""aBcde"); // 返回 1 (>0), 比較的是 "b"和"B"  DE>


strcasecmp用於不區分大小寫的字符串比較:

DE>echo strcasecmp("abcdd""aBcde"); // 返回 -1 (<0), 比較的是"d"和"e"  DE>


strncmp用於比較字符串的一部分,從字符串的開頭開始比較,第三個參數,爲要比較的長度:

DE>echo strncmp("abcdd""aBcde"3); // 返回 1 (>0), 比較了 abc 和 aBc  DE>


strncasecmp用於不區分大小寫的比較字符串的一部分,從字符串的開頭開始比較,第三個參數,爲要比較的長度:

DE>echo strncasecmp("abcdd""aBcde"3); // 返回 0, 比較了 abc 和 aBc,  DE>
由於不區分大小寫,所以兩者是相同的。

還有一種情況是單單比較字符串大小,達不到我們預定的要求,比如照常理 10.gif 會比 5.gif 大,但如果應用上面幾個函數,就會返回 -1,即表示 10.gif比5.gif,針對這種情況,PHP提供了兩個自然對比的函數strnatcmp,strnatcasecmp:

DE>echo strnatcmp("10.gif""5.gif"); // 返回 1 (>0) 
echo strnatcasecmp("10.GIF""5.gif"); // 返回 1 (>0) 
DE>


替換
替換的意義在於將一個字符串的一部分進行改變,使之成爲別外一個新的字符串,以滿足新的要求。PHP裏通常用str_replace("要替換的內容", "要取代原內容的字符串", "原字符串")進行替換。

DE>echo str_replace("iwind""kiki""i love iwind, iwind said"); // 將輸出 "i love kiki, kiki said"  DE>

即將 原字符串中的所有"iwind"都替換成了"kiki".

str_replace是大小寫敏感的,所以對你不能設想用 str_replace("IWIND", "kiki",...)替換原字符串中的"iwind".

str_replace還可以實現多對一,多對多的替換,但無法實現一對多的替換:

DE>echo str_replace(array("iwind""kiki"), "people""i love kiki, iwind said");  DE>

將會輸出
i love people, people said
第一個參數中的array("iwind", "kiki")都被替換成了"people"


DE>echo str_replace(array("iwind""kiki"), array("gentle man""ladies"), "i love kiki, iwind said");  DE>

輸出 i love ladies, gentle man said 。也就是說第一個數組中的元素被第二個數組中的相對應的元素替換掉了,如果有一個數組比另一個數組元素數要少,那麼不足的都會當作空來處理。

與此有些類似的是strtr,用法請參閱手冊,它們的比較請參閱 http://diary.4kiki.net/index.php?action=info&id=372 .

此外,PHP還提供了substr_replace,實現替換一部分的字符串。語法如下:
substr_replace (原字符串, 要替代的字符串, 開始替換的位置 [, 替換的長度])
其中,開始替換的位置從0開始計算,應該小於原字符串的長度。要替換的長度是可選的。

DE>echo substr_replace("abcdefgh""DEF"3); // 將輸出 "abcDEF" 
echo substr_replace("abcdefgh""DEF"32); // 將輸出 "abcDEFfgh" 
DE>

第一個例子中,從第三個位置(即"d")開始替換,從而把 "defgh"都替換成了“DEF”
第二個例子中,也是從第三個位置(即"d")開始替換,但只能替換2個長度,即到e,所以就把"de"替換成了"DEF".

PHP還提供了preg_replace,preg_replace_callback,ereg_replace,eregi_replace等函數應用正則表達式來完成字符串替換,用法請參考手冊。

查找與匹配
PHP裏用於查找或者匹配或者定位的函數非常多,它們都有不同的意義。這裏只講述用得比較多的strstr,stristr.後者與前者的功能,返回值都一樣,只是不區分大小寫。
strstr("母字符串", "子字符串")用來查找子字符串在母字符串中第一次出現的位置,並返回母字符串中從子字符串開始到母字符串結束的部分。比如
echo strstr("abcdefg", "e"); //將輸出 "efg"
如果找不到子字符串,則返回空。因爲可以用來判斷一個字符串中是否含有另外一個字符串:

DE>$needle "iwind"
$str "i love iwind"
if (
strstr($str$needle)) 

echo 
"裏面有 iwind"

else 

echo 
"裏面沒有 iwind"

將會輸出"裏面有 iwind" 
DE>


HTML相關
1,htmlspecialchars($string)
這是它的最簡單用法,將字符串中的一些特殊字符(顧名思義)&,',"<,>轉換成它們對應的HTML實體形式:

DE>$str "i love <font color=\"red\">kiki</font>, iwind said."
echo 
htmlspecialchars($str); 
DE>

將會輸出
i love &lt;font color=&quot;red&quot;&gt;kiki&lt;/font&gt;, iwind said.

2,htmlentities($string)
將所有能轉換成實體形式的字符都轉換成實體形式。

3,html_entity_decode($string);
PHP4.3.0以後加入的具有與htmlentities($string)相反的功能。

4,nl2br($string)
將字符串中所有換行符轉變成<br /> + 換行符。如:

DE>$str "i love kiki,\n iwind said."
echo 
nl2br($str); 
DE>

將會輸出
i love kiki,<br />
iwind said.


加密
加密字符串最常用的就是md5了,它將一個字符串轉換成一個長32位的唯一的字符串。

DE>echo md5("i love iwind"); // 將輸出 "2df89f86e194e66dc54b30c7c464c21c"  DE>


PHP5給md5加了第二個參數,從而使它可以輸出16位的加密後的字符串。


到這裏,這篇字符串操作入門教程就算結束了,但上面講的這些還只是它的冰山一角,特別是PHP5之後增加了大量的新功能,所以需要我們不斷的去學習它纔有可能很好的應用。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章