PHP中PCRE正則解析代碼詳解

在本篇文章裏小編給大家分享了關於PHP中PCRE正則解析的相關知識點內容,需要的朋友們學習下。

一、前言

前面的博客裏,有對字符集的解析。這裏就不是字符集的事兒了,在PHP中很多函數的處理默認是unicode中的UTF-8編碼格式。那麼廢話不多說,直接開始正題。

二、PHP函數mb_split解析

<?php
$preg_strings = '測、試、一、下';
$preg_str = mb_split('、', $preg_strings);
print_r($preg_str);

輸出效果

Array(

  [0] => 測

  [1] => 試

  [2] => 一

  [3] => 下)

此函數默認底層解析,以UTF-8的編碼格式解析。以分隔符(、)的UNICODE的16進制碼點分割字符$preg_strings。

三、PHP函數preg_split解析

分割字符串“測試一下”

<?php
$strings = '測試一下';
$mb_arr = preg_split('//u', $strings, -1, PREG_SPLIT_NO_EMPTY);
print_r($mb_arr);

打印結果如下:

Array(

  [0] => 測

  [1] => 試

  [2] => 一

  [3] => 下

)

四、PCRE中的/u解析

在PHP中,正則的定界符可以爲#、%、/等等。

在一個正則中有時後面會有些修飾符。那麼他們都是什麼意思呢?

比如:

%[\x{4e00}-\x{9fa5}]+%u

其中後面的修飾符u代碼表以正則匹配以utf-8的編碼格式匹配。

例子一:

 <?php
 $strings = '測試一下';
 $is_true = preg_match_all('%[\x{4e00}-\x{9fa5}]+%u', $strings, $match);
var_dump($is_true);

打印結果如下:

Array(

  [0] => Array

    (

      [0] => 測試一下

    )

)

這裏的[\x{4e00}-\x{9fa5}]是什麼意思呢?

在PHP正則中\x用來表示16進制。

中文的UNICODE碼點在4E00 - 9FFF (這裏說的都是16進制)

所以,正則匹配寫法就是區間[],[\x{4E00}-\x{9FFF}]

這兩個正則的效果都是一樣的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章