很有用PHP中正则表达式详细说明Word下载.docx
- 文档编号:22124242
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:10
- 大小:19.65KB
很有用PHP中正则表达式详细说明Word下载.docx
《很有用PHP中正则表达式详细说明Word下载.docx》由会员分享,可在线阅读,更多相关《很有用PHP中正则表达式详细说明Word下载.docx(10页珍藏版)》请在冰豆网上搜索。
ThereoncewasamanfromNewYork
Whokeptallofhiscashinabucket.
是匹配的。
在该模式中的字母(o-n-c-e)是字面的字符,也就是说,他们表示该字母本身,数字也是一样的。
其他一些稍微复杂的字符,如标点符号和白字符(空格、制表符等),要用到转义序列。
所有的转义序列都用反斜杠(\)打头。
制表符的转义序列是:
\t。
所以如果我们要检测一个字符串是否以制表符开头,可以用这个模式:
^\t
类似的,用\n表示“新行”,表示回车。
其他的特殊符号,可以用在前面加上反斜杠,如反斜杠本身用\表示,句号.用\.表示,以此类推。
字符簇
在INTERNET的程序中,正规表达式通常用来验证用户的输入。
当用户提交一个FORM以后,要判断输入的电话号码、地址、EMAIL地址、信用卡号码等是否有效,用普通的基于字面的字符是不够的。
所以要用一种更自由的描述我们要的模式的办法,它就是字符簇。
要建立一个表示所有元音字符的字符簇,就把所有的元音字符放在一个方括号里:
[AaEeIiOoUu]
这个模式与任何元音字符匹配,但只能表示一个字符。
用连字号可以表示一个字符的范围,如:
[a-z]//匹配所有的小写字母
[A-Z]//匹配所有的大写字母
[a-zA-Z]//匹配所有的字母
[0-9]//匹配所有的数字
[0-9\.\-]//匹配所有的数字,句号和减号
[\f\t\n]//匹配所有的白字符
()之间要加空格
同样的,这些也只表示一个字符,这是一个非常重要的。
如果要匹配一个由一个小写字母和一位数字组成的字符串,比如"
z2"
、"
t6"
或"
g7"
,但不是"
ab2"
r2d3"
或"
b52"
的话,用这个模式:
^[a-z][0-9]$
尽管[a-z]代表26个字母的范围,但在这里它只能与第一个字符是小写字母的字符串匹配。
前面曾经提到^表示字符串的开头,但它还有另外一个含义。
当在一组方括号里使用^是,它表示“非”或“排除”的意思,常常用来剔除某个字符。
还用前面的例子,我们要求第一个字符不能是数字:
^[^0-9][0-9]$
&
5"
及"
-2"
是匹配的,但与"
12"
66"
是不匹配的。
下面是几个排除特定字符的例子:
[^a-z]//除了小写字母以外的所有字符
[^\/\^]//除了(\)(/)(^)之外的所有字符
[^"
\'
]//除了双引号("
)和单引号('
)之外的所有字符
特殊字符"
."
(点,句号)在正规表达式中用来表示除了“新行”之外的所有字符。
所以模式"
^.5$"
与任何两个字符的、以数字5结尾和以其他非“新行”字符开头的字符串匹配。
模式"
可以匹配任何字符串,除了空串和只包括一个“新行”的字符串。
PHP的正规表达式有一些内置的通用字符簇,列表如下:
字符簇含义
[[:
alpha:
]]任何字母
digit:
]]任何数字
alnum:
]]任何字母和数字
space:
]]任何白字符
upper:
]]任何大写字母
lower:
]]任何小写字母
punct:
]]任何标点符号
xdigit:
]]任何16进制的数字,相当于[0-9a-fA-F]
到现在为止,你已经知道如何去匹配一个字母或数字,但更多的情况下,可能要匹配一个单词或一组数字。
一个单词有若干个字母组成,一组数字有若干个单数组成。
跟在字符或字符簇后面的花括号({})用来确定前面的内容的重复出现的次数。
^[a-zA-Z_]$所有的字母和下划线
^[[:
]]$所有的单个字母的单词
^a$字母a
^a{4,4}$aaaa
^a{2,4}$aa,aaa或aaaa
^a{1,3}$a,aa或aaa
^a{2,}$包含多于两个a的字符串
^a{2,}如:
aardvark和aaab,但apple不行
a{2,}如:
baad和aaa,但Nantucket不行
\t至少一个制表符
.至少一个字符
这些例子描述了花括号的三种不同的用法。
一个数字,的意思是“前面的字符或字符簇只出现x次”;
一个数字加逗号,{x,}的意思是“前面的内容出现x或更多的次数”;
两个用逗号分隔的数字,{x,y}表示“前面的内容至少出现x次,但不超过y次”。
我们可以把模式扩展到更多的单词或数字:
^[a-zA-Z0-9_]{1,}$//所有包含一个以上的字母、数字或下划线的字符串
^[0-9]{1,}$//所有的正数
^\-{0,1}[0-9]{1,}$//所有的整数
^\-{0,1}[0-9]{0,}\.{0,1}[0-9]{0,}$//所有的小数
最后一个例子不太好理解,是吗?
这么看吧:
与所有以一个可选的负号(\-{0,1})开头(^)、跟着0个或更多的数字([0-9]{0,})、和一个可选的小数点(\.{0,1})再跟上0个或多个数字([0-9]{0,}),并且没有其他任何东西($)。
下面你将知道能够使用的更为简单的方法。
?
"
与{0,1}是相等的,它们都代表着:
“0个或1个前面的内容”或“前面的内容是可选的”。
所以刚才的例子可以简化为:
^\-?
[0-9]{0,}\.?
[0-9]{0,}$
*"
与{0,}是相等的,它们都代表着“0个或多个前面的内容”。
最后,字符"
+"
与{1,}是相等的,表示“1个或多个前面的内容”,所以上面的4个例子可以写成:
^[a-zA-Z0-9_]+$//所有包含一个以上的字母、数字或下划线的字符串
^[0-9]+$//所有的正数
[0-9]+$//所有的整数
[0-9]*\.?
[0-9]*$//所有的小数
当然这并不能从技术上降低正规表达式的复杂性,但可以使它们更容易阅读。
正则表达式中的特殊字符
字符\
意义:
对于字符,通常表示按字面意义,指出接着的字符为特殊字符,不作解释。
例如:
/b/匹配字符’b’,通过在b前面加一个反斜杠,也就是/\b/,则该字符变成特殊字符,表示
匹配一个单词的分界线。
或者:
对于几个字符,通常说明是特殊的,指出紧接着的字符不是特殊的,而应该按字面解释。
*是一个特殊字符,匹配任意个字符(包括0个字符);
/a*/意味匹配0个或多个a。
为了匹配字面上的*,在a前面加一个反斜杠;
/a\*/匹配’a*’。
字符^
表示匹配的字符必须在最前边。
/^A/不匹配"
anA,"
中的’A’,但匹配"
AnA."
中最前面的’A’。
字符$
与^类似,匹配最末的字符。
/t$/不匹配"
eater"
中的’t’,但匹配"
eat"
中的’t’。
字符*
匹配*前面的字符0次或n次。
例如:
/bo*/匹配"
Aghostbooooed"
中的’boooo’或"
Abirdwarbled"
中的’b’,但不匹配"
Agoatg//要以b在o前面
runted"
中的任何字符。
字符+
匹配+号前面的字符1次或n次。
等价于{1,}。
/a+/匹配"
candy"
中的’a’和"
caaaaaaandy."
中的所有’a’。
字符?
匹配?
前面的字符0次或1次。
/e?
le?
/匹配"
angel"
中的’el’和"
angle."
中的’le’。
字符.
(小数点)匹配除换行符外的所有单个的字符。
/.n/匹配"
nay,anappleisonthetree"
中的’an’和’on’,但不匹配’nay’。
字符(x)
匹配’x’并记录匹配的值。
/(foo)/匹配和记录"
foobar."
中的’foo’。
匹配子串能被结果数组中的素[1],...,[n]返
回,或被RegExp对象的属性,...,返回。
字符x│y
匹配’x’或者’y’。
/green│red/匹配"
greenapple"
中的’green’和"
redapple."
中的’red’。
字符{n}
这里的n是一个正整数。
匹配前面的n个字符。
/a{2}/不匹配"
candy,"
中的’a’,但匹配"
caandy,"
中的所有’a’和"
caaandy."
中前面的两个’a’。
字符{n,}
匹配至少n个前面的字符。
/a{2,}不匹配"
caandy"
中的所有’a’和"
中的所有’a’
字符{n,m}
这里的n和m都是正整数。
匹配至少n个最多m个前面的字符。
/a{1,3}/不匹配"
cndy"
中的任何字符,但匹配"
中的’a’,"
中的前面两个
’a’和"
caaaaaaandy"
中前面的三个’a’,注意:
即使"
中有很多个’a’,但只匹配前面的三个’a’即"
aaa"
字符[xyz]
一字符列表,匹配列出中的任一字符。
你可以通过连字符-指出一个字符范围。
[abcd]跟[a-c]一样。
它们匹配"
brisket"
中的’b’和"
ache"
中的’c’。
字符[^xyz]
一字符补集,也就是说,它匹配除了列出的字符外的所有东西。
你可以使用连字符-指出一字符范围。
[^abc]和[^a-c]等价,它们最早匹配"
中的’r’和"
chop."
中的’h’。
字符
匹配一个空格(不要与b混淆)
字符b
匹配一个单词的分界线,比如一个空格(不要与混淆)
/bnw/匹配"
noonday"
中的’no’,/wyb/匹配"
possiblyyesterday."
中的’ly’。
字符B
匹配一个单词的非分界线
/wBn/匹配"
中的’on’,/yBw/匹配"
中的’ye’。
字符cX
这里的X是一个控制字符。
匹配一个字符串的控制字符。
/cM/匹配一个字符串中的control-M。
字符d
匹配一个数字,等价于[0-9]。
/d/或/[0-9]/匹配"
B2isthesuitenumber."
中的’2’。
字符D
匹配任何的非数字,等价于[^0-9]。
/D/或/[^0-9]/匹配"
中的’B’。
字符f
匹配一个表单符
字符n
匹配一个换行符
字符r
匹配一个回车符
字符s
匹配一个单个white空格符,包括空格,tab,formfeed,换行符,等价于[fnrtv]。
/sw*/匹配"
中的’bar’。
字符S
匹配除white空格符以外的一个单个的字符,等价于[^fnrtv]。
/S/w*匹配"
字符t
匹配一个制表符
字符v
匹配一个顶头制表符
字符w
匹配所有的数字和字母以及下划线,等价于[A-Za-z0-9_]。
/w/匹配"
apple,"
.28,"
中的’5’和"
3D."
中的’3’。
字符W
匹配除数字、字母外及下划线外的其它字符,等价于[^A-Za-z0-9_]。
/W/或者/[^$A-Za-z0-9_]/匹配"
50%."
中的’%’。
匹配一个正则表达式的最后一个子串的n的值(计数左圆括号)。
/apple(,)sorange1/匹配"
apple,orange,cherry,peach."
中的’apple,orange’,下面有一个更加完整的例子。
注意:
如果左圆括号中的数字比n指定的数字还小,则n取下一行的八进制escape作为描述。
字符ooctal和xhex
这里的ooctal是一个八进制的escape值,而xhex是一个十六进制的escape值,允许在一个正则表达式中嵌入ASCII码
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 有用 PHP 正则 表达式 详细 说明