婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > PHP和正則表達(dá)式教程集合之二第1/2頁

PHP和正則表達(dá)式教程集合之二第1/2頁

熱門標(biāo)簽:銷售電銷機(jī)器人詐騙 地圖標(biāo)注與公司業(yè)務(wù)關(guān)系 外呼系統(tǒng)api對接 福建微碼電話機(jī)器人 大學(xué)校門地圖標(biāo)注 平?jīng)龈叩碌貓D標(biāo)注商戶要收費(fèi)嗎 提高電話機(jī)器人接通率 廣西智能外呼系統(tǒng)多少錢 荊州智能電銷機(jī)器人
正則表達(dá)式快速入門(二)
【導(dǎo)讀】在本文里,我們主要介紹子模式(subpatterns),逆向引用(Back references)和量詞(quantifiers)
在上篇文章里,我們介紹了正則表達(dá)式的模式修正符與元字符,細(xì)心的讀者也許會發(fā)現(xiàn),這部分介紹的非常簡略,而且很少有實(shí)際的例子的講解。這主要是因?yàn)榫W(wǎng)上現(xiàn)有的正則表達(dá)式資料都對這部分都有詳細(xì)的介紹和眾多的例子,如果覺得對前一部分缺乏了解可以參看這些資料。本文希望可以盡可能多涉及一些較高級的正則表達(dá)式特性。
  在本文里,我們主要介紹子模式(subpatterns),逆向引用(Back references)和量詞(quantifiers),其中重點(diǎn)介紹對這些概念的一些擴(kuò)展應(yīng)用,例如子模式中的非捕獲子模式,量詞匹配時(shí)的greedy與ungreedy。
  子模式(subpatterns)與逆向引用(Back references)
  正則表達(dá)式可以包含多個(gè)字模式,子模式由圓括號定界,可以嵌套。這也是兩個(gè)元字符“(”和“)”的作用。子模式可以有以下作用:
  1. 將多選一的分支局部化。
  例如,模式: cat(aract|erpillar|)匹配了 "cat","cataract" 或 "caterpillar" 之一,沒有圓括號的話將匹配 "cataract","erpillar" 或空字符串。
  2. 將子模式設(shè)定為捕獲子模式(例如上面這個(gè)例子)。當(dāng)整個(gè)模式匹配時(shí),目標(biāo)字符串中匹配了子模式的部分可以通過逆向引用進(jìn)行調(diào)用。左圓括號從左到右計(jì)數(shù)(從 1 開始)以取得捕獲子模式的數(shù)。
  注意,子模式是可以嵌套的,例如,如果將字符串 "the red king" 來和模式 /the ((red|white) (king|queen))/進(jìn)行匹配,捕獲的子串為 "red king","red" 以及 "king",并被計(jì)為 1,2 和 3 ,可以通過“1”,“2”,“3”來分別引用它們,“1”包含了“2”和“3”,它們的序號是由左括號的順序決定的。
  在一些老的linux/unux工具里,子模式使用的圓括號需要用反斜線轉(zhuǎn)義,向這種(subpattern),但現(xiàn)代的工具已經(jīng)不需要了,本文中使用的例子都不進(jìn)行轉(zhuǎn)義。
非捕獲子模式(non-capturing subpatterns)
  用一對括號同時(shí)完成上面提到的子模式的兩個(gè)功能有時(shí)會出現(xiàn)一些問題,例如,由于逆向引用的數(shù)目是有限的(通常最大不超過9),而且經(jīng)常會遇到無需捕獲的子模式定義。這時(shí),可以在開始的括號后加上問號和冒號來表示這個(gè)子模式無需捕獲,就向下面這樣(?:red|white) (king|queen))。
  如果將“the white queen”作為模式匹配的目標(biāo)字符串,則捕獲的字串有“white queen”和“queen”,分別作為“1”和“2”,white雖然符合子模式“(?:red|white)”,但并不被捕獲。
  我們前面已經(jīng)介紹過用括號與問號表示模式修正符的方法,為方便起見,如果需要在非捕獲子模式中插入模式修正符,可以把它直接放在問號和冒號之間,例如,下面兩個(gè)模式是等效的。
  /(?i:saturday|sunday)/和/(??i)saturday|sunday)/。
  逆向引用(Back references)
  前面介紹反斜線作用時(shí),已經(jīng)提到它的一個(gè)作用就是表示逆向引用,當(dāng)字符類之外的反斜線后跟一個(gè)大于0的十進(jìn)制數(shù)時(shí),它很有可能是一個(gè)逆向引用。它的含義正如它的名稱如言,它表示對它出現(xiàn)之前已經(jīng)捕獲的子模式的引用。這個(gè)數(shù)字代表了它引用的左括號在模式中出現(xiàn)的次序,我們在介紹子模式時(shí)已經(jīng)看到過逆向引用的一個(gè)例子,那里的過“1”,“2”,“3”分別表示所捕獲的第一,第二,和第三個(gè)小括號定義的子模式的內(nèi)容。
  值得注意的是,當(dāng)反斜線后的數(shù)字小于10時(shí),可以確定此為一個(gè)逆向引用,這樣,這個(gè)逆向引用就可以出現(xiàn)在之前有相應(yīng)數(shù)目的左圓括號被捕獲前而不會出現(xiàn)混淆,只有整個(gè)模式能提供那么多的捕獲子模式,就不會報(bào)錯(cuò)。說起來似乎很混亂,還是讓我們來看下面這個(gè)例子。把介紹子模子時(shí)舉的例子拿來修改一下,前面講過字符串 "the red king" 來和模式 /the ((red|white) (king|queen))/匹配,捕獲的子串為 "red king","red" 以及 "king",并被計(jì)為 1,2 和 3 ,現(xiàn)在把字符串,修改為" king,the red king",模式改為/3,the ((red|white) (king|queen))/,這個(gè)模式應(yīng)該也是可以匹配的。不過,并非所有的正則表達(dá)式工具都支持這種用法,安全的做法是在相應(yīng)序號的左括號之后使用與之相關(guān)的逆向引用。
  需要注意的另一點(diǎn)是逆向引用的值是在目標(biāo)字符串中實(shí)際捕獲的符合子模式的字符串片段而非該子模式本本身。例如/ (sens|respons)e and 1ibility/會匹配“sense and sensibility” 和 “response and responsibility”,但不會是 "sense and responsibility"。當(dāng)被逆向引用的子模式后面有量詞從而被重復(fù)匹配了多次,逆向引用的值會以最后一次匹配的值為準(zhǔn)。例如/([abc]){3}/匹配字符串“abc”時(shí),逆向引用“1”的值將是最后一次匹配的結(jié)果“c”。
  命名子模式(named subpattern)
  一些工具(例如Python)可以為逆向引用命名,從而定義出命名子模式。在Python中對正則表達(dá)式的使用是以函數(shù)或方法調(diào)用的格式,語法與這里舉的例子有較大差別。有興趣的朋友可以參看一下自己使用的工具來看看是否支持命名子模式。
非捕獲子模式(non-capturing subpatterns)
  用一對括號同時(shí)完成上面提到的子模式的兩個(gè)功能有時(shí)會出現(xiàn)一些問題,例如,由于逆向引用的數(shù)目是有限的(通常最大不超過9),而且經(jīng)常會遇到無需捕獲的子模式定義。這時(shí),可以在開始的括號后加上問號和冒號來表示這個(gè)子模式無需捕獲,就向下面這樣(?:red|white) (king|queen))。
  如果將“the white queen”作為模式匹配的目標(biāo)字符串,則捕獲的字串有“white queen”和“queen”,分別作為“1”和“2”,white雖然符合子模式“(?:red|white)”,但并不被捕獲。
  我們前面已經(jīng)介紹過用括號與問號表示模式修正符的方法,為方便起見,如果需要在非捕獲子模式中插入模式修正符,可以把它直接放在問號和冒號之間,例如,下面兩個(gè)模式是等效的。
  /(?i:saturday|sunday)/和/(?:(?i)saturday|sunday)/。
  逆向引用(Back references)
  前面介紹反斜線作用時(shí),已經(jīng)提到它的一個(gè)作用就是表示逆向引用,當(dāng)字符類之外的反斜線后跟一個(gè)大于0的十進(jìn)制數(shù)時(shí),它很有可能是一個(gè)逆向引用。它的含義正如它的名稱如言,它表示對它出現(xiàn)之前已經(jīng)捕獲的子模式的引用。這個(gè)數(shù)字代表了它引用的左括號在模式中出現(xiàn)的次序,我們在介紹子模式時(shí)已經(jīng)看到過逆向引用的一個(gè)例子,那里的過“1”,“2”,“3”分別表示所捕獲的第一,第二,和第三個(gè)小括號定義的子模式的內(nèi)容。
  值得注意的是,當(dāng)反斜線后的數(shù)字小于10時(shí),可以確定此為一個(gè)逆向引用,這樣,這個(gè)逆向引用就可以出現(xiàn)在之前有相應(yīng)數(shù)目的左圓括號被捕獲前而不會出現(xiàn)混淆,只有整個(gè)模式能提供那么多的捕獲子模式,就不會報(bào)錯(cuò)。說起來似乎很混亂,還是讓我們來看下面這個(gè)例子。把介紹子模子時(shí)舉的例子拿來修改一下,前面講過字符串 "the red king" 來和模式 /the ((red|white) (king|queen))/匹配,捕獲的子串為 "red king","red" 以及 "king",并被計(jì)為 1,2 和 3 ,現(xiàn)在把字符串,修改為" king,the red king",模式改為/3,the ((red|white) (king|queen))/,這個(gè)模式應(yīng)該也是可以匹配的。不過,并非所有的正則表達(dá)式工具都支持這種用法,安全的做法是在相應(yīng)序號的左括號之后使用與之相關(guān)的逆向引用。
  需要注意的另一點(diǎn)是逆向引用的值是在目標(biāo)字符串中實(shí)際捕獲的符合子模式的字符串片段而非該子模式本本身。例如/ (sens|respons)e and 1ibility/會匹配“sense and sensibility” 和 “response and responsibility”,但不會是 "sense and responsibility"。當(dāng)被逆向引用的子模式后面有量詞從而被重復(fù)匹配了多次,逆向引用的值會以最后一次匹配的值為準(zhǔn)。例如/([abc]){3}/匹配字符串“abc”時(shí),逆向引用“1”的值將是最后一次匹配的結(jié)果“c”。
  命名子模式(named subpattern)
  一些工具(例如Python)可以為逆向引用命名,從而定義出命名子模式。在Python中對正則表達(dá)式的使用是以函數(shù)或方法調(diào)用的格式,語法與這里舉的例子有較大差別。有興趣的朋友可以參看一下自己使用的工具來看看是否支持命名子模式。
重復(fù)(Repetition)和量詞(quantifiers)
  在前面介紹逆向引用的部分里我們已經(jīng)接觸到了量詞(quantifiers)的概念,例如前面的例子/([abc]){3}/表示三個(gè)連續(xù)的字符,每個(gè)字符都必然是 “abc”這三個(gè)字符中的一個(gè)。在這個(gè)模式里,{3}就屬于量詞。它表示一個(gè)模式需要重復(fù)匹配(repetition)的數(shù)目。
  量詞可以放在下面這些項(xiàng)目之后:
  ?●單個(gè)字符(有可能是被轉(zhuǎn)義的單個(gè)字符,如xhh)
  ?●“.”元字符
  ?● 由方括號表示的字符類
  ?● 逆向引用
  ?●由小括號定義的子模式(除非它是個(gè)斷言,我們會在以后介紹)
  最通用的量詞使用形式是用花括號括起的兩個(gè)由逗號分隔的數(shù)字,如這樣的格式{min,max},例如,/z{2,4}/ 可以匹配 "zz", "zzz", 或者 "zzzz",花括號中的最大值以及前面的逗號可以省略,例如/d{3,}/可以匹配三個(gè)以上的數(shù)字,數(shù)字的數(shù)目沒有上限,而/d{3}/(注意,沒有逗號)則精確的匹配3個(gè)數(shù)字。當(dāng)花括號出現(xiàn)在不允許量詞的位置或者語法與前面提到的不符時(shí),這里它僅僅代表花括號字符本身而不再具有特殊的含義。例如{,6}不是量詞,它僅僅代表這四個(gè)字符本身的含義。
  為了方便,三個(gè)最常用的量詞有它們的單字符縮寫形式,它們的的含義如下表:
* 相當(dāng)于 {0,} 
+ 相當(dāng)于 {1,} 
? 相當(dāng)于 {0,1} 
  這也是以上三個(gè)元字符做為量詞使用含義。
  在使用量詞特別是沒有上限限制的量詞時(shí),應(yīng)該特別注意不要構(gòu)成無限循環(huán),例如/(a?)*/,在有的正則表達(dá)式工具里。這會形成一個(gè)編譯錯(cuò),不過有的工具卻允許這種結(jié)構(gòu),但不能保證各種工具都可以很好的處理這種結(jié)構(gòu)。
重復(fù)(Repetition)和量詞(quantifiers)
  在前面介紹逆向引用的部分里我們已經(jīng)接觸到了量詞(quantifiers)的概念,例如前面的例子/([abc]){3}/表示三個(gè)連續(xù)的字符,每個(gè)字符都必然是 “abc”這三個(gè)字符中的一個(gè)。在這個(gè)模式里,{3}就屬于量詞。它表示一個(gè)模式需要重復(fù)匹配(repetition)的數(shù)目。
  量詞可以放在下面這些項(xiàng)目之后:
  ?●單個(gè)字符(有可能是被轉(zhuǎn)義的單個(gè)字符,如xhh)
  ?●“.”元字符
  ?● 由方括號表示的字符類
  ?● 逆向引用
  ?●由小括號定義的子模式(除非它是個(gè)斷言,我們會在以后介紹)
  最通用的量詞使用形式是用花括號括起的兩個(gè)由逗號分隔的數(shù)字,如這樣的格式{min,max},例如,/z{2,4}/ 可以匹配 "zz", "zzz", 或者 "zzzz",花括號中的最大值以及前面的逗號可以省略,例如/d{3,}/可以匹配三個(gè)以上的數(shù)字,數(shù)字的數(shù)目沒有上限,而/d{3}/(注意,沒有逗號)則精確的匹配3個(gè)數(shù)字。當(dāng)花括號出現(xiàn)在不允許量詞的位置或者語法與前面提到的不符時(shí),這里它僅僅代表花括號字符本身而不再具有特殊的含義。例如{,6}不是量詞,它僅僅代表這四個(gè)字符本身的含義。
  為了方便,三個(gè)最常用的量詞有它們的單字符縮寫形式,它們的的含義如下表:
* 相當(dāng)于 {0,} 
+ 相當(dāng)于 {1,} 
? 相當(dāng)于 {0,1} 
  這也是以上三個(gè)元字符做為量詞使用含義。
  在使用量詞特別是沒有上限限制的量詞時(shí),應(yīng)該特別注意不要構(gòu)成無限循環(huán),例如/(a?)*/,在有的正則表達(dá)式工具里。這會形成一個(gè)編譯錯(cuò),不過有的工具卻允許這種結(jié)構(gòu),但不能保證各種工具都可以很好的處理這種結(jié)構(gòu)。
量詞匹配的“greedy”與“ungreedy”
  在使用帶量詞的模式時(shí),我們常會發(fā)現(xiàn)對同一模式而言,同一個(gè)目標(biāo)字符串可以有多種匹配方式。例如/d{0,1}d/,可以匹配兩個(gè)或三個(gè)十進(jìn)制數(shù)字,如果目標(biāo)字符串是123,當(dāng)量詞取下限0里,它匹配“12”,當(dāng)量詞取上限1里,它匹配“123”整個(gè)字符。這兩種匹配結(jié)果都是正確的,如果我們?nèi)∷淖幽J?(d{0,1}d)/,則匹配的結(jié)果1到底是“12”還是“123”?
  實(shí)際的運(yùn)行結(jié)果一般會是后者,因?yàn)槟J(rèn)情況下,大多數(shù)正則表達(dá)式工具的匹配是按“greedy”原則匹配的?!癵reedy”單詞的中的含義是“貪吃的, 貪婪的”的意思,它的行為也如此單詞的含義,所謂greedy匹配意指在量詞限制范圍內(nèi),只要能保持后續(xù)模式的匹配,匹配總是盡可能的重復(fù)下去,直到不匹配的情況發(fā)生為止。為便于理解,我們看下面這個(gè)簡單的例子。
  /(d{1,5})d/匹配“12345”這個(gè)字符串,這個(gè)模式表示在1到5個(gè)數(shù)字后面跟上一個(gè)數(shù)字,量詞范圍從1到5,當(dāng)它的值在1-4時(shí),整個(gè)模式都是匹配的,1的值可以是“1”,“12”,“123”,“1234”,而在greedy匹配的情況下,它取匹配時(shí)的量詞最大值,因此最終匹配的結(jié)果是”1234”。
  在大多數(shù)情況下,這就是我們想要的結(jié)果,但情況并不總這樣。例如,我們希望用下面這個(gè)模式提取出c語言的注釋部分(在c語言中,注釋語句放在字符串/*和*/之間)。我們使用的正則表達(dá)式是/*.**/,但匹配的結(jié)果卻完全和需要的不同。當(dāng)正則表達(dá)式解析到“/*”這后的“.*”時(shí),因?yàn)椤?”可以代表任意字符,這也包含了其后需要匹配的“*/”,在量詞的作用下,這個(gè)匹配將一直進(jìn)行下去,超過下一個(gè)“*”/直到文本的結(jié)束,這顯然不是我們需要的結(jié)果。
  為了完成如上例我們想要的那種匹配,正則表達(dá)式引入了ungreedy匹配方法,與greedy匹配相反,在滿足整個(gè)模式匹配的前提下,它總是取最小的量詞數(shù)目結(jié)果。Ungreedy匹配用在量詞后面加上問號“?”來表示。例如在匹配C語言的注釋時(shí),我們把正則表達(dá)式寫成如下形式:/*.*?*/,在量詞“*”后加上問號就可以達(dá)成想要的結(jié)果。還有前面那個(gè)例子用/(d{1,5})d/匹配“12345”這個(gè)字符串,如果改寫為ungreedy模式向這樣/(d{1,5}?)d/,、1的值將為1。
  上面的解釋也許有些不準(zhǔn)確,量詞后的問號的作用實(shí)際上是反轉(zhuǎn)當(dāng)前的正則表達(dá)式的greedy與ungreedy行為。你可以通過模式修正符“U”將正則表達(dá)式設(shè)成ungreedy模式然后在模式中通過量詞后的問號將之反轉(zhuǎn)為greedy。
  一次性子模式(Once-only subpatterns)
  關(guān)于量詞的另一個(gè)有趣的話題是一次性子模式(Once-only subpatterns)。要理解它的概念需要先了解一下含有量詞的正則表達(dá)式的匹配過程。我們這里舉個(gè)例子。
  現(xiàn)在,讓我們用模式/d+foo/來匹配字符串“123456bar”,當(dāng)然,它的結(jié)果是沒有匹配。但正則表達(dá)式引擎是如何工作的呢?它先分析前面的d+,這代表一個(gè)以上的數(shù)字,然后檢查目標(biāo)字符串的對應(yīng)位置的第一個(gè)字符“1”,符合模式,然后根據(jù)量詞重復(fù)這個(gè)模式對字符串進(jìn)行匹配直到“123456”始終符合“d+”模式,接著它在目標(biāo)字符串中遇到字符“b”無法與“d+”匹配,于是查看“d+”的后續(xù)模式“foo”,與目標(biāo)字符串的后續(xù)部分“bar”無法匹配,這時(shí),有趣的事情出現(xiàn)了,解釋引擎會對前面已經(jīng)解析過的“d+”模式進(jìn)行回溯,將量詞數(shù)目減少一,看剩余部分能否匹配,此時(shí)“d+”的值改為“12345”,然后解釋引擎看目標(biāo)字符串剩余的部分“6bar”能否與剩余的模式“foo”相匹配,如果不行,就把量詞數(shù)再減一,直到達(dá)到最小的量詞限制,如果仍無法匹配,則表明目標(biāo)字符串無法匹配,返回?zé)o法匹配的結(jié)果。
  現(xiàn)在,我們就可以來接觸一次性子模式了。所謂一次性子模式就是定義在正則表達(dá)式解析時(shí)不需要上述回溯過程的子模式。它用左圓括號后面的問號和小于號來表示,向這樣(?>)。如果將上面提到的例子改為一次性子模式,可以這樣書寫:
  /(?>d)+foo/,這時(shí),當(dāng)解析器遇到后面不匹配的bar時(shí),會立即返回不匹配的結(jié)果,而不會進(jìn)行前面提到的回溯過程。
  需要了解的是,一次性子模式屬于非捕獲子模式,它的匹配結(jié)果不能被逆向引用。
  當(dāng)一個(gè)沒有設(shè)定重復(fù)上限的子模式中包含了同樣沒有設(shè)定重復(fù)上限的模式時(shí),使用一次性子模式是唯一可以避免讓你的程序陷入長時(shí)間等待的方法。例如你用“/(D+|d+>)*[!?]/”這個(gè)模式去匹配一長串的a字符,向這樣“aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa”,在返回最終無匹配的結(jié)果前,你會等待很長的一段時(shí)間。這個(gè)模式表示一串非數(shù)字字符或者用尖括號括著的一串?dāng)?shù)字后跟隨著嘆號或者問號,把這段字符串分成兩個(gè)重復(fù)的部分會有很多種分法,而無論是子模式本身還是子模式之內(nèi)的量詞的各可能值都要經(jīng)過逐一測試,這將使最終的運(yùn)算量達(dá)到一個(gè)很大的程度。這樣,你將在電腦前等待相當(dāng)長的時(shí)間才會看到結(jié)果。而如果用一次性子模式來改寫剛才的模式,改成這樣/ ((?>D+)|d+>)*[!?]/,你就可以很快得到運(yùn)算的結(jié)果。
正則表達(dá)式快速入門(三)
在上文里,我們介紹了正則表達(dá)式的子模式,逆向引用和量詞,在這篇文章里,我們將重點(diǎn)介紹正則表達(dá)式中的斷言(Assertions)。
  斷言(Assertions)
  斷言(Assertions)是在目標(biāo)字符串的當(dāng)前匹配位置進(jìn)行的一種測試但這種測試并不占用目標(biāo)字符串,也即不會移動模式在目標(biāo)字符串中的當(dāng)前匹配位置。
  讀起來似乎有點(diǎn)拗口,我們還是舉幾個(gè)簡單的例子。
  兩個(gè)最常見的斷言是元字符“^”和“$”,它們檢查匹配模式是否出現(xiàn)在行首或行尾。
  我們來看這個(gè)模式/^ddd$/,試著用它來匹配目標(biāo)字符串“123”。“ddd”表示三個(gè)數(shù)字字符,匹配了目標(biāo)字符串的三個(gè)字符,而模式中的^和$分別表示這三個(gè)字符同時(shí)出現(xiàn)在行首和行尾,而它們本身并不與目標(biāo)字符串中的任何字符相對應(yīng)。
  其它還有一些簡單的斷言b, B, A, Z, z,它們都以反斜線開頭,前面我們已經(jīng)介紹過反斜線的這個(gè)用法。這幾個(gè)斷言的含義如下表。
斷言 含義 
b 字分界線 
B 非字分界線 
A 目標(biāo)的開頭(獨(dú)立于多行模式) 
Z 目標(biāo)的結(jié)尾或位于結(jié)尾的換行符前(獨(dú)立于多行模式) 
z 目標(biāo)的結(jié)尾(獨(dú)立于多行模式) 
G 目標(biāo)中的第一個(gè)匹配位置 
  注意這些斷言不能出現(xiàn)在字符類中,如果出現(xiàn)了也是其它的含義,例如b在字符類中表示反斜線字符0x08。
  前面介紹的這些斷言的測試都是一些基于當(dāng)前位置的測試,斷言還支持更多復(fù)雜的測試條件。更復(fù)雜的斷言以子模式方式來表示,它包括前向斷言(Lookahead assertions)和后向斷言(Lookbehind assertions)。
  前向斷言(Lookahead assertions)
  前向斷言從目標(biāo)字符串的當(dāng)前位置向前測試斷言條件是否成立。前向斷言又可分為前向肯定斷言和前向否定斷言,分別用(?=和{?!表示。例如模式/ w+(?=;)/用來表示一串文本字符后面會有一個(gè)分號,但是這個(gè)分號并不包括在匹配結(jié)果中。一件有趣的事看起來差不多的模式/ (?=;)w+/并不是表示一串前面不是分號的alpha字符串,事實(shí)上,不論這串a(chǎn)lpha字符的前面是否是一個(gè)分號它總是匹配的,要完成這個(gè)功能需要我們下面提到的后向斷言(Lookbehind assertions)。
  后向斷言(Lookbehind assertions)
  后向斷言分別用(?=和(?!表示肯定的后向斷言與否定后向斷言。例如,/ (?!foo)bar/將尋找一個(gè)前面不是foo的bar字符串。一般而言,后向斷言使用的子模式需要有確定的長度值,否則會產(chǎn)生一個(gè)編譯錯(cuò)誤。 
  使用后向斷言與一次性子模式搭配使用可以有效的文本的結(jié)束部分進(jìn)行匹配,這里來看一下例子。
  考慮一下如果用/abcd$/這樣一個(gè)簡單的模式來匹配一長段以abcd結(jié)尾的文本,因?yàn)槟J降钠ヅ溥^程是從左向右進(jìn)行的,正則表達(dá)式引擎將在文本中尋找每一個(gè)a字符并嘗試匹配剩余的模式,如果在這長段文本里僅好有不少的a字符,這樣做明顯是非常低效的,而如果把以上模式換成為樣/^.*abcd$/,這時(shí)前面的“^.*”部分將匹配整個(gè)文本,然后它發(fā)現(xiàn)下一個(gè)模式a無法匹配,這時(shí)會發(fā)生前面提到過的回溯過程,解析器會逐次縮短“^.*”匹配的字符長度從右向左逐次查找剩余的子模式,也要產(chǎn)生多次的嘗試過程?,F(xiàn)在,我們用一次性子模式與后向斷言重寫所用的模式,改為/^(?>.*)(?=abcd)/,這時(shí),一次性子模式一次匹配了整段文本,然后用后向斷言檢查前面四個(gè)字符是否為abcd,只需要一次檢測就可以立刻確定整個(gè)模式是否匹配。在遇到需要匹配一個(gè)很長的文本時(shí),這種方法可以非常顯著的提高處理效率。
  一個(gè)模式中可以包含多個(gè)相繼的斷言,斷言也可以嵌套。另外,斷言使用的子模式也是非捕獲的,不能被逆向引用。
  斷言的一個(gè)重要應(yīng)用領(lǐng)域就是做為條件子模式的條件。那什么是條件子模式呢?
條件子模式(Conditional subpatterns)
  正則表達(dá)式允許在模式中根據(jù)不同的條件使用不同的匹配子模式。也就是條件子模式(Conditional subpatterns)。它的格式如下?(condition)yes-pattern)或者 (?(condition)yes-pattern|no-pattern)。如果條件滿足,采用yes-pattern,否則,采用no-pattern(如果在模式中提供了話)。
  條件子模式中的條件有兩種,一種是斷言結(jié)果,另一種是看是否捕獲一個(gè)前面提供的子模式。
  如果在表示條件的圓括號里的內(nèi)容是一個(gè)數(shù)字,它表示當(dāng)此數(shù)字代表的子模式被成功匹配時(shí)條件為真??纯聪旅孢@個(gè)例子,/( ( )? [^()]+ (?(1) ) )/x,(注意“x”模式修正符表示忽略字符類外的空白字符和#符號之后的內(nèi)容)。
  這個(gè)模式的第一部分“( ( )?”匹配了一個(gè)可選的左圖括號“(”,第二部分“[^()]+”匹配了一個(gè)以上的非圓括號字符,最后一部分“(?(1) ) )”是個(gè)條件子模式,表示如果捕獲到1也即那個(gè)可選的左圓括號,第三部分應(yīng)該會出現(xiàn)一個(gè)右圓括號“)”。
  如果在表示條件的圓括號內(nèi)是一個(gè)“R”字符,表示在這個(gè)模式或子模式被遞歸調(diào)用時(shí)條件為真,在遞歸調(diào)用的頂層,這個(gè)條件為假。關(guān)于正則表達(dá)式中的遞歸,我們會在后面的部分專題介紹。
  如果條件不是一個(gè)數(shù)字或R字符,則它必需是一個(gè)斷言。斷言可以是肯定或否定的前身或后向斷言。讓我們看下面這個(gè)例子。
  /(?(?=[^a-z]*[a-z])
  d{2}-[a-z]{3}-d{2} | d{2}-d{2}-d{2} )/x
  為了讓這個(gè)正則表達(dá)式更容易閱讀,我們特意采用了x模式修正符,這樣我們可以在用模式中加入空格對符式進(jìn)行格式上的分隔并分行表示而不影響模式的解析。
  第一行的條件子模式使用了一個(gè)肯定的前向斷言,表示一串可選的非小寫字母后面跟隨著一個(gè)小寫字母。換句話說,它查看目標(biāo)字符串是否至少包含一個(gè)小寫字母,如果是,它用“|”前的模式對目標(biāo)進(jìn)行匹配,看目標(biāo)是否為看目標(biāo)是否為兩個(gè)數(shù)字-三個(gè)小寫字母-兩個(gè)數(shù)字這種格式,否則,用“|”來匹配目標(biāo),看目標(biāo)字符串是否為由“-”分隔的三段二位十進(jìn)制數(shù)字。
  正則表達(dá)式中的注釋
  為了讓正則表達(dá)式更容易閱讀,可以在其中加入注釋語句。通常注釋由左圓括號和井號——“(#“開始,當(dāng)遇到下一個(gè)右圓括號”)“結(jié)束。注釋是禁止嵌套的。
  如果設(shè)定了“x”模式修正符,任何字符類之外(也即[]之外)的井號(#)和下一個(gè)新行標(biāo)記之間的部分也被作為注釋看待。
正則表達(dá)式快速入門(四)
在上一篇文章里,我們介紹了正則表達(dá)式中斷言相關(guān)的一些概念,在本文里,我們會介紹正則表達(dá)式中遞歸的運(yùn)用與利用正則表達(dá)式修改目標(biāo)字符串。
  正則表達(dá)式中的遞歸
  接觸過程序的朋友可能都遇到過成對的各種括號吧,這些括號常常相互嵌套,而且嵌套的層次數(shù)目無法確定。試想一下如果想提取一段程序里用括號括起的一段代碼,這里面很可能包含了層次數(shù)目不定的其它括號對,用正則表達(dá)式該如何完成?
12下一頁閱讀全文
您可能感興趣的文章:
  • PHP和正則表達(dá)式教程集合之一
  • php中常見的sql攻擊正則表達(dá)式匯總
  • PHP中一些可以替代正則表達(dá)式函數(shù)的字符串操作函數(shù)
  • 淺談php正則表達(dá)式中的非貪婪模式匹配的使用
  • php正則表達(dá)式取得內(nèi)容所有鏈接的方法
  • PHP 正則表達(dá)式小結(jié)
  • php正則表達(dá)式完全教程之精華篇

標(biāo)簽:德陽 婁底 黔東 衡陽 內(nèi)江 海南 邯鄲 樂山

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《PHP和正則表達(dá)式教程集合之二第1/2頁》,本文關(guān)鍵詞  PHP,和,正則,表達(dá)式,教程,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《PHP和正則表達(dá)式教程集合之二第1/2頁》相關(guān)的同類信息!
  • 本頁收集關(guān)于PHP和正則表達(dá)式教程集合之二第1/2頁的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    国产一区二区三区四区五区美女 | 高清不卡在线观看| 丝袜美腿亚洲综合| 亚洲一区二区三区视频在线播放| 国产精品系列在线| 中文字幕不卡在线播放| 久久亚洲影视婷婷| 久久精品亚洲国产奇米99| 久久精品一区二区三区不卡| 久久久久亚洲综合| 国产亚洲欧美一区在线观看| 国产日韩一级二级三级| 国产欧美一区二区精品秋霞影院| 中文av一区二区| 亚洲欧美电影一区二区| 亚洲一区二区欧美| 免费国产亚洲视频| 国产河南妇女毛片精品久久久 | 日本vs亚洲vs韩国一区三区| 免费在线观看视频一区| 国产精品白丝av| 粉嫩绯色av一区二区在线观看| www.亚洲免费av| 色综合色综合色综合色综合色综合| 91亚洲精品乱码久久久久久蜜桃| 色婷婷久久久久swag精品| 欧美久久高跟鞋激| 久久新电视剧免费观看| 国产精品国产三级国产aⅴ入口| 亚洲欧洲韩国日本视频| 天天色天天爱天天射综合| 久久精品国产网站| 99精品视频免费在线观看| 欧美三区免费完整视频在线观看| 精品日韩在线观看| 亚洲欧美日韩在线不卡| 久久精品国产第一区二区三区| 韩国av一区二区| 99re这里都是精品| 日韩视频免费直播| 国产精品女同一区二区三区| 成人免费一区二区三区视频 | 成人黄色a**站在线观看| 91玉足脚交白嫩脚丫在线播放| 欧美一区二区精品在线| 一区二区中文字幕在线| 久久精品国产精品亚洲精品| 欧美亚洲免费在线一区| 中文字幕巨乱亚洲| 免费高清成人在线| 欧美三级欧美一级| 亚洲欧美偷拍另类a∨色屁股| 麻豆成人综合网| 欧美日韩久久久久久| 中文字幕一区二区三区在线不卡| 美女视频黄a大片欧美| 91福利在线看| 中文字幕一区二区不卡| 国产盗摄一区二区三区| 欧美一区二区成人| 午夜在线电影亚洲一区| 日本高清免费不卡视频| 久久精品欧美一区二区三区麻豆| 日韩国产精品91| 欧美日韩中文另类| 一区二区在线观看免费| 国产98色在线|日韩| 精品日韩欧美一区二区| 日本中文字幕一区二区有限公司| 91美女精品福利| 1000精品久久久久久久久| 国产一区二区三区不卡在线观看| 欧美日韩国产在线播放网站| 亚洲一级二级三级| 欧洲一区二区三区免费视频| 亚洲视频一二三| 一本大道久久a久久综合| 亚洲欧美视频在线观看| 色综合天天综合网国产成人综合天| 国产精品成人一区二区三区夜夜夜| 狠狠色丁香九九婷婷综合五月| 日韩欧美久久一区| 蜜臀av一区二区在线观看| 欧美va亚洲va| 国产精品一二二区| 国产欧美精品区一区二区三区 | 精品国产污污免费网站入口 | 26uuu久久综合| 蜜桃视频在线观看一区二区| 91精品国产全国免费观看| 秋霞成人午夜伦在线观看| 欧美疯狂做受xxxx富婆| 麻豆freexxxx性91精品| 26uuu精品一区二区| 国产伦精一区二区三区| 国产精品视频九色porn| 国产精品99久| 椎名由奈av一区二区三区| 91国产视频在线观看| 天堂久久一区二区三区| 欧美精品一区二区在线观看| 成人91在线观看| 亚洲午夜一区二区| 久久久不卡影院| 欧美亚洲国产一区二区三区| 青草av.久久免费一区| 国产欧美日韩一区二区三区在线观看 | 精品国产乱码久久久久久牛牛| 成人一区二区在线观看| 一区二区三区日本| 日韩欧美激情四射| 国产成人精品1024| 天堂在线一区二区| 国产精品美女一区二区三区 | 久久蜜臀精品av| 色天使色偷偷av一区二区| 免费观看在线综合| 亚洲精品美腿丝袜| 久久久精品2019中文字幕之3| 欧美探花视频资源| 成人高清视频在线观看| 亚洲18女电影在线观看| 亚洲欧洲日韩在线| 日韩精品一区国产麻豆| 欧美自拍偷拍一区| 麻豆一区二区三| 欧美国产日韩精品免费观看| 51久久夜色精品国产麻豆| 91色视频在线| 激情综合色播激情啊| 亚洲成人av在线电影| 成人欧美一区二区三区小说| 久久亚洲精品国产精品紫薇| 欧美一区永久视频免费观看| 91福利精品视频| 成人av综合在线| 国产98色在线|日韩| 国产一区二区视频在线| 麻豆精品一区二区综合av| 亚洲观看高清完整版在线观看| 国产欧美一区二区精品性| 日韩视频在线永久播放| 91精品国产91久久综合桃花| 欧美日韩一区 二区 三区 久久精品| 91美女片黄在线| 欧美中文字幕一区二区三区亚洲 | 欧美日韩国产精选| 一本色道久久综合亚洲精品按摩| 成人黄页在线观看| 国产电影精品久久禁18| 国产91丝袜在线观看| 国产成人免费视频一区| 国产成人aaa| 成人精品电影在线观看| 99精品国产热久久91蜜凸| 91最新地址在线播放| 国产69精品久久99不卡| www.av亚洲| 91国偷自产一区二区开放时间 | 日本道在线观看一区二区| 日本精品裸体写真集在线观看| 91免费版pro下载短视频| 精品视频在线免费看| 欧美精品高清视频| 日韩一区二区免费视频| 欧美精品一区二区三| 国产精品日日摸夜夜摸av| 中文字幕亚洲一区二区va在线| 一区二区三区电影在线播| 天天爽夜夜爽夜夜爽精品视频| 老司机精品视频线观看86| 国产高清久久久久| 91麻豆免费看片| 欧美色图12p| 欧美日韩在线直播| 91精品中文字幕一区二区三区| 日韩久久精品一区| 中文字幕日韩一区| 亚洲国产裸拍裸体视频在线观看乱了| 亚洲不卡av一区二区三区| 国产在线国偷精品产拍免费yy| 国产a精品视频| 欧美性大战久久| 91精品国产丝袜白色高跟鞋| 久久精品日产第一区二区三区高清版 | 自拍偷拍亚洲激情| 蜜桃91丨九色丨蝌蚪91桃色| 成人一区二区三区视频在线观看 | 在线观看日韩av先锋影音电影院| 欧美高清视频一二三区| 欧美一区二区三区四区视频| 久久久久成人黄色影片| 一区二区三区欧美视频| 国产在线日韩欧美| 欧美一a一片一级一片| 91精品国产品国语在线不卡| 国产精品国产精品国产专区不片| 视频一区欧美日韩| 99国产精品久久久久久久久久久| 6080yy午夜一二三区久久|