正则表达式元字符的意义和用法
扫描二维码
随时随地手机看文章
1、正则表达式元字符的意义和用法
(1)“*”号:匹配*号前面的字符0次或多次的重复;
str*普通字符r,匹配0次或多次即string.stre,strg等;
(2)“.”匹配任意一个字
...76.前三个.任意字符,第6个任意字符,需要注意的是“.”符号只能匹配一个字符;
(3)“^”匹配行首字符,表示是以“^”后面字符开头的行;
^money表示匹配以money开头的行;
综合举例:^...x86*,表示:前三个字符为任意字符,4、5、6为x86,7个开始可以重复匹配6的字符串开头的行;
(4)"$"匹配行尾,$符号放在匹配符号之后,与^用法和功能相反;
money$表示以money结尾的所有行;
例子:①!^$表示以空开头的行首和以空结束的行尾,中间没有任何字符,即表示匹配空行;
②^.$表示匹配只有一个字符的行;
(5)“[]”匹配字符集合,该符号支持穷举法列出的字符集中所有的元素,也可以使用“-”符号表示字符集的范围;
例子:[0123456789]表示任意一个数据,[0-9]也表示任意一个数字;
[a-z]表示所有的小写字母;[A-Z] 表示所有的大写字母;
[]A-Za-z] []A-Za-z]*表示匹配任意引文单词;
特别注意:^符号匹配行首,但是在[^]表示取反;例如:[^b-d]表示不在b~d范围内的所有字符;
(6)“”转义字符,用来屏蔽一个字符元的特殊意义‘
例子:.中的“.”不在匹配任意字符,而就只是表示普通字符句号.的含义;
(7)
例子:
(8)"{}"系列符号与“*”符号类似,都是表示前一个字符的重复,但是"*"表示重复0次或任意次,而"{}"可以指定重复次数;系列符号有以下三种是哟个方法:
①{n}表示前面字符出现n次;
例子:MO{3}NEY只匹配MOOONEY,O出现3次;
②{n,}表示前面字符出现至少n次;
例子:MO{3,}表示匹配MOOONEY,MOOOONEY,MOOOOONEY,匹配O出现3次以上的;
③{n,m}表示匹配前面字符出现n~m次;
例子:MO{3,4}NEY表示匹配MOOONEY和MOOOONEY;
[A-Z]{5}精确匹配任意5个大写字母组成的字符,MONEY,HOUSE等;
(9)"?"符号,匹配该符号前面1次或0次;
例子:JO?B;匹配JOB或JOOB;
(10)"+"匹配符号前面的字符至少一次;与*的区别是"*"可以匹配0次;
例子:JO+B匹配JOOB,JOOOB,但是不匹配JOB;
(11)符号"()"和"|"通常结合使用,表示一组可选字符集;()符号很少使用,因为[]符号完全能够替代;
例子:re(a|e|o)d或re[aeo]d,(a|e|o)表达式表示在a/e/o中任选一个字符,即reed、read、reod可由该表达式匹配;
2、通配
bash shell本身不支持正则表达式,使用正则表达式的是shell命令和工具,如grep、awk和sed等;通配的情况下有些符号和正则表达式中的符号含义不是完全一致,例如:*符号不在表示匹配前面字符的重复次数,而是任意多个任意字符;^符号不在表示行首,而是代表取反;?不在表示匹配符号前面1次或者0次,而是任意一个字符;
例子: echo [a-h]*.awk,查找匹配以a~h字符开头并以.awk后缀结尾的文件并显示出来;通配种表达式{}符号中用","号隔开表示或的关系,例如
{[a-h]*.awk,0?.pem}表示匹配以a-h中字符开头并以.awk结尾的所有文件和以0开头,后面只跟一个任意字符.并以.pem结尾的文件;
3、grep命令
grep是一种强大的文本搜索工具,它能够使用正则表达式将搜素文本并将匹配的行打印出来;
grep [选项][模式][文件]
如下分别说明选项、模式都有哪些:
(1)选项:
-c只输出匹配行的数量
-i搜索时忽略大小写
-h查询多个文件是不显示文件名
-l只列出符合匹配的文件名,不列车具体哪一行;
-n列出所有的匹配行并显示行号
-s不显示不存在或无匹配文本的错误的信息
-v显示不包含匹配的所有行
-w匹配整个单词
-x匹配整行
-r递归搜索,不仅搜索当前工作目录而且还搜索子目录
-q不显示任何搜索结果,以退出状态表示搜索成功与否
-b打印匹配行距离文件头的偏移量,以字节为单位
-o与-b选项结合使用,打印匹配的词距离文件头部的偏移量,以字节为单位
-E支持扩展的正则表达式
-F不支持正则表达式,按照字符串的字面意思进行匹配
(2)模式:
grep的模式非常灵活,可以是字符串、变量、正则表达式,特别注意无论模式是何种形式,只要模式中间有空格必须使用“”双引号将其括起来,否则会误认为搜索的目标为文件名;
(3)grep和正则表达式结合使用:
例子:①搜索后缀名为.sh文件,以echo开头的所有行;grep -c ^echo *.sh
②搜索.sh文件结尾的文件中空白行:grep -c ^$ script.sh
③搜索script.sh中money不区分大小写,并将所有匹配的行打印出来包含行号:grep -n "[Mm][Oo][Nn][Ee][Yy]" script.sh
④搜索“-”开头的重复“-”任意次,然后是M字符的行:grep ^-*M filename
⑤搜索文件中以"/"开头,中间是任意四个字符,第六个字符仍然是“/”的行:grep -n ^/..../ filename
⑥搜索文件中包含sed.suf.frg字符串的行:grep -n sed.suf.frg filename
grep扩展egrep等价于grep -E;fgrep等价于gerp -F