grep及正则表达式
文本查找的需要:
grep,egrep,fgrep
grep:根据模式搜索文本,并将符合模式的文本行显示出来。
pattern(模式):文本字符和正则表达式的元字符组合而成匹配条件
grep [options] PATTERN [FILE...]
-i:忽略大小写
--colo[u]r:加颜色
-v:反向查找(显示没有被模式匹配到的行)
-o:只显示被模式匹配到的字符串
正则表达式:REGular EXPression, REGEXP
元字符:
. :匹配任意单个字符
[ ]:匹配指定范围内的任意单个字符
[^]:匹配指定范围外的任意单个字符
字[:space:]:空白字符
符[:punct:]:标点符号
集[:lower:]:小写字母
合[:upper:]:大写字母
[:alpha:]:大小写字母
[:digit:]:数字
[:alnum:]:数字和大小写字母
匹配次数(贪婪模式):
* :匹配其前面的字符任意次
.* :任意长度的任意字符
? :匹配其前面的字符1次或0次
\{m,n\}:匹配前面的字符至少m次,至多n次
位置锚定:
^ :锚定行首,此字符后面的任意内容必须出现在行首
$ :锚定行尾,此字符后面的任意内容必须出现在行尾
^$:空白行
\<或者\b:锚定词首,其后面的任意字符必须作为单词首部出现
\>或者\b:锚定词尾,其前面的任意字符必须作为单词尾部出现
\<root\> 以单词为root
分组:
\{ \}:
如 \{ab\}*
后向引用
\1:引用第一个左括号以及与之对应的右括号所包括的所有内容
\2:
\3:
正则表达式:
Basic REGEXP:基本正则表达式
Extended REGEXP:扩展正则表达式
扩展正则表达式:egrep=grep -E
字符匹配:
. :匹配任意单个字符
[ ]:匹配指定范围内的任意单个字符
[^]:匹配指定范围外的任意单个字符
字[:space:]:空白字符
符[:punct:]:标点符号
集[:lower:]:小写字母
合[:upper:]:大写字母
[:alpha:]:大小写字母
[:digit:]:数字
[:alnum:]:数字和大小写字母
次数匹配:
* :匹配其前字符任意次
? :匹配其前字符0次或1次
+ :匹配其前字符至少一次
{m,n}:匹配前面的字符至少m次,至多n次
位置锚定:
^ :锚定行首,此字符后面的任意内容必须出现在行首
$ :锚定行尾,此字符后面的任意内容必须出现在行尾
^$:空白行
\<或者\b:锚定词首,其后面的任意字符必须作为单词首部出现
\>或者\b:锚定词尾,其前面的任意字符必须作为单词尾部出现
\<root\> 以单词为root
分组:
( ):分组
\1, \2, \3, ... 向后引用
或者:
|:或者
C|(c)at
fgrep:快速grep --不支持正则表达式