1、正則僅僅就是用來(lái)處理字符串的:匹配、捕獲
匹配:驗(yàn)證當(dāng)前的字符串是否符合我們的規(guī)則(每一個(gè)正則都是一個(gè)規(guī)則)
捕獲:在整個(gè)字符串當(dāng)中,把符合規(guī)則的字符都依次的獲取到--->exec、match、replace
2、正則的組成:元字符、修飾符
元字符:
特殊意義的元字符:
\d匹配一個(gè)0-9的數(shù)字相當(dāng)于[0-9],和它相反的
\D匹配一個(gè)除了0-9的任意字符相當(dāng)于【】
\w匹配一個(gè)0-9、a-z、A-Z_ 的數(shù)字或字符,相當(dāng)于[0-9a-zA-Z_] 、
\s匹配一個(gè)空白字符(空格、制表符。。。)
\b匹配一個(gè)單詞的邊界 “w100 w000”
\t匹配一個(gè)制表符
\n匹配一個(gè)換行
. 匹配一個(gè)除了\n以外的任意字符
^ 以某一個(gè)元字符開頭
$ 以某一個(gè)元字符結(jié)尾
\ 轉(zhuǎn)譯字符
x|y x或者y的一個(gè)
[xyz] x、y、z、中的任意一個(gè)
[^xyz]除了x、y、z、中的任意一個(gè)
[a-z] -> 匹配a-z中的任意一個(gè)字符
[^a-z] -> 匹配除了a-z中的任意一個(gè)字符
() 正則中的分組
量詞:
* 0到多個(gè)
+ 1到多個(gè)
? 0到1個(gè)
?在正則中的意義比較多
放在一個(gè)非量詞元字符后面代表出現(xiàn)0-1次 例如/^\d?$/出現(xiàn)0-9直接的數(shù)0到1次
放在一個(gè)量詞元字符后面,取消捕獲時(shí)候的貪婪性 /^\d+?$/捕獲的時(shí)候只是把第一個(gè)捕獲的數(shù)字獲取 "2015"--->2
(?:)分組值匹配不捕獲
(?=)正向預(yù)查
(?!)負(fù)向預(yù)查
()的作用
1)改變默認(rèn)的優(yōu)先級(jí)
2)可以進(jìn)行分組捕獲
3)分組引用
{n}出現(xiàn)n次
{n,}出現(xiàn)n到多次
{n,m}出現(xiàn)n到m次
普通元字符
任何字符在正則中除了以上有特殊意義的,其他的都是代表本身意思的普通元字符
修飾符:
i:忽略字母的大小寫
m:multiline 多行匹配
g:global全局匹配
項(xiàng)目中經(jīng)常使用的正則
1)判斷是有效數(shù)字的正則
有效數(shù)字是指:正數(shù)、負(fù)數(shù)、零、小數(shù)
第一部分:可能出現(xiàn)加減或者沒有
第二部分:一位數(shù)可以是0,多位數(shù)不能以0開頭
第三部分:可以有小數(shù)也可以沒有小數(shù),但是一旦出現(xiàn)小數(shù)點(diǎn),后面至少跟一位數(shù)字
var reg =/^[+-]?(\d|[1-9]\d+)(\.\d+)?$/;
有效的正整數(shù)(包含0):/^[+]?(\d|[1-9]\d+)$/;
有效的負(fù)整數(shù)(包含0):/^-(\d|[1-9]\d+)$/;
判斷手機(jī)號(hào)(簡(jiǎn)單版):
var reg=/^1\d{10}$/;
判斷郵箱
第一部分:數(shù)字、字母、下劃線、- 一到多位
第二部分:@
第三部分:數(shù)字、字母、 一到多位
第四部分:(.兩到四位) .com .cn .net .. .com.cn
var reg =/^[0-9a-zA-Z_-]+@[0-9a-zA-Z-]+(\.[a-zA-Z]{2,4}){1,2}$/
判斷年齡在18到65之間的
18-19/20-59/60-65
var reg =/^((18|19)|([2-5]\d)|(6[0-5]))$/
真實(shí)有效的中華人民共和國(guó)姓名 2-4 位漢字
var reg = /^[\u4e00-\u9fa5]{2,4}$/;
身份證號(hào)碼
前六位是省->市->縣(區(qū))
四位年 兩位月 兩位日
簡(jiǎn)單版
var reg = /^\d{17}(\d|X)$/;
130828199012040617
復(fù)雜版
var reg = /^(\d{2})(\d{4})(\d{4})(\d{2})(\d{2})(?:\d{2})(\d)(?:\d|X)$/;
細(xì)節(jié)知識(shí)點(diǎn)
里面出現(xiàn)的任何字符都是代表本身意義的,例如:[.]中的”.“就是代表一個(gè)小數(shù)點(diǎn)而不是除了\n以外的任意字符
里面出現(xiàn)18不是數(shù)字18而是1或者8,例如[18-65]是1或者8-6或者5中任選一個(gè)
1、exec正則的捕獲方法--->先匹配,然后把匹配的內(nèi)容捕獲
如果字符串沒有匹配這個(gè)正則,捕獲的返結(jié)果是null
如果和正則匹配,返回的結(jié)果是一個(gè)數(shù)組
例子
var str ="2015zhufeng2016peixun"
var reg = /\d+/;
第一項(xiàng)是我們捕獲的內(nèi)容
index:捕獲的內(nèi)容在元字符串中開始的索引位置
input:捕獲的原始字符串
2、正則的捕獲是懶惰的
正則的每一次捕獲都從lastIndex值開始,第一次捕獲的時(shí)候,lastIndex=0,從原始字符串索引為0的位置開始查找捕獲,而默認(rèn)的情況下,第一次捕獲完成,lastIndex的值并沒有發(fā)生改變,還是0,所以第二次捕獲還是從原始字符串索引為0處開始查找,這樣找到的還是第一次捕獲的內(nèi)容
解決辦法:添加全局修飾符g--->加上g后,第一次捕獲完成后,lastIndex的值發(fā)生了改變,變?yōu)榈谝淮尾东@內(nèi)容后的第一個(gè)字符的開始索引,第二次捕獲是繼續(xù)向后查找的...
疑問(wèn):不用全局修飾符g每次捕獲完成后手動(dòng)修改lastIndex的值不可以么?
不可以,雖然手動(dòng)修改了lastIndex,確實(shí)把lastIndex的值進(jìn)行改變了,但是正則查找的時(shí)候還是從索引0開始的
var str = "zhufeng2015peixun2016";
var reg = /\d+/g;
例子
為了防止沒有加全局修飾符g導(dǎo)致的死循環(huán),我們?cè)谔幚碇?對(duì)于沒有添加g的手動(dòng)給添加一個(gè)g
RegExp.prototype.myExecAll = function myExecAll() {
var _this = this, str = arguments[0], ary = [], res = null;
!_this.global ? _this = eval(_this.toString() + "g") : null;
res = _this.exec(str);
while (res) {
ary[ary.length] = res[0];
res = _this.exec(str);
}
return ary;
};
var ary = reg.myExecAll(str);
console.log(ary);
console.log(reg.lastIndex);//->0
var res = reg.exec(str);
console.log(res);
console.log(reg.lastIndex);//->11
res = reg.exec(str);
console.log(res);
console.log(reg.lastIndex);//->21
res = reg.exec(str);
console.log(res);//->null
3、match:捕獲字符串中存在一個(gè)叫做match的方法也可以實(shí)現(xiàn)捕獲,而且只要我們?nèi)∠苏齽t的懶惰性,執(zhí)行一次match方法就可以捕獲到所有內(nèi)容了
var str = "zhufeng2015peixun2016";
var reg = /\d+/g;
console.log(str.match(reg));
疑問(wèn):那我們都用match來(lái)替換exec多好啊?
4、正則的分組捕獲
每一次捕獲的時(shí)候,不僅僅可以把大正則匹配的內(nèi)容捕獲到,而且還可以把每一個(gè)小分組(子正則)匹配的內(nèi)容單獨(dú)的捕獲到
var str = "zhufeng[2015]peixun[2016]";
var reg = /\[(\d)(\d+)\]/g;
var res = reg.exec(str);
console.log(res);
["[2015]", "2", "015", index: 7, input: "zhufeng[2015]peixun[2016]"]
第一項(xiàng)是大正則捕獲的內(nèi)容 res[0]
第二項(xiàng)是第一個(gè)分組捕獲的內(nèi)容 res[1]
第三項(xiàng)是第二個(gè)分組捕獲的內(nèi)容 rex[2]
。。。。。
分組的只匹配不捕獲:我們?nèi)绻麍?zhí)行把分組內(nèi)容進(jìn)行匹配但是不進(jìn)行捕獲的話,只需要在分組的前面加上?:即可
var str = "zhufeng[2015]peixun[2016]";
var reg = /\[(?:\d)(\d+)\]/g;
var res = reg.exec(str);
console.log(res);
["[2015]", "015"...]
數(shù)組中的第一項(xiàng)是大正則捕獲的內(nèi)容 res[0]
數(shù)組中的第二項(xiàng)是第二個(gè)分組捕獲的內(nèi)容 res[1]
第一個(gè)分組添加了?:,所以只匹配不捕獲
5、exec和match的區(qū)別
match只能捕獲大正則匹配的內(nèi)容,對(duì)于分組捕獲中,是無(wú)法獲取分組匹配的內(nèi)容的,所以如果捕獲的時(shí)候不需要捕獲分組的內(nèi)容,我們直接用match更方便,如果需要捕獲分組的內(nèi)容,我們只能使用exec來(lái)一個(gè)個(gè)捕獲
var str = "zhufeng[2015]peixun[2016]";
var reg = /\[(\d+)\]/g;
//console.log(str.match(reg));//->["[2015]", "[2016]"]
var ary = [];
var res = reg.exec(str);
while (res) {
//ary.push(res[1]);
ary.push(RegExp.$1);//RegExp.$1獲取當(dāng)前正則第一個(gè)分組捕獲的內(nèi)容,(可能在部分IE瀏覽器下捕獲不到值)
res = reg.exec(str);
}
console.log(ary);
6、正則的貪婪性:在每一次的捕獲的時(shí)候,總是按照正則匹配的最長(zhǎng)結(jié)果捕獲
var str = "zhufeng2015peixun2016";
var reg = /\d+/g;
console.log(reg.myExecAll(str));//-->["2015","2016"]
var str = "zhufeng2015peixun2016";
var reg = /\d+?/g;
console.log(reg.myExecAll(str));//-->["2", "0", "1", "5", "2", "0", "1", "6"]
7、分組引用
\2代表出現(xiàn)和第二個(gè)分組一模一樣的內(nèi)容
\1代表出現(xiàn)和第一個(gè)分組一模一樣的內(nèi)容
var reg=/^(\w)(\w)\2\1$/;
"woow"、"1221"...
8、字符串方法---->replace:把一個(gè)字符串中的某個(gè)字符替換成新的內(nèi)容
1)在不使用正則的情況下
執(zhí)行一次replace只能替換字符串中的一個(gè),需要替換多個(gè)同樣需要執(zhí)行多次
var str = "zhufeng2015 zhufeng2016";
"zhufeng" -> "珠峰"
str = str.replace("zhufeng", "珠峰").replace("zhufeng", "珠峰");
有些時(shí)候即使執(zhí)行多次,也實(shí)現(xiàn)不了替換
"zhufeng" -> "zhufengpeixun"
str = str.replace("zhufeng", "zhufengpeixun").replace("zhufeng", "zhufengpeixun");
[第一個(gè)參數(shù)可以是一個(gè)正則] 把所有和正則匹配的內(nèi)容進(jìn)行替換(但是和捕獲一樣默認(rèn)是懶惰的,只有加上全局修飾符g才可以)
var str = "zhufeng2015 zhufeng2016";
str = str.replace(/zhufeng/g, "zhufengpeixun");
console.log(str);
1)執(zhí)行和執(zhí)行次數(shù)問(wèn)題
其實(shí)和exec捕獲的原理是一模一樣的
例如:我們第二個(gè)參數(shù)如果傳遞的是一個(gè)函數(shù),每當(dāng)正則在字符串中捕獲一次當(dāng)前的這個(gè)函數(shù)就執(zhí)行一次 ->本題中一共捕獲了兩次,所以函數(shù)執(zhí)行了兩次
var str = "zhufeng2015 zhufeng2016";
str = str.replace(/zhufeng/g, function () {
2)參數(shù)問(wèn)題
console.dir(arguments);
不僅僅是執(zhí)行function,而且還給我們的函數(shù)傳遞了參數(shù),并且傳遞的參數(shù)和每一次exec捕獲的內(nèi)容是一模一樣的
如果是第一次exec捕獲->["zhufeng",index:0,input:"原始字符串"]
第一次執(zhí)行函數(shù)里面的參數(shù)
arguments[0] -> "zhufeng"/**/
arguments[1] -> 0 相當(dāng)于exec中的index 開始捕獲的索引位置
arguments[2] -> "原始字符串" 相當(dāng)于exec中的input
3)返回值問(wèn)題
return返回的是什么,就相當(dāng)于把當(dāng)前捕獲的內(nèi)容替換成什么
return "zhufengpeixun";
});
console.log(str);
您可能感興趣的文章:- 利用Java正則表達(dá)式校驗(yàn)郵箱與手機(jī)號(hào)
- java正則表達(dá)式表單驗(yàn)證類工具類(驗(yàn)證郵箱、手機(jī)號(hào)碼、qq號(hào)碼等)
- 一個(gè)好用的正則匹配電話號(hào)手機(jī)號(hào)郵箱網(wǎng)址的方法
- 正則表達(dá)式限制 賬號(hào) 密碼 郵箱 身份證 手機(jī)號(hào)的相關(guān)代碼