1.正則表達(dá)式
目錄
1.正則表達(dá)式
1.什么是正則表達(dá)式 ?
2.正則表達(dá)式的使用場景
3.正則表達(dá)式字符表示
4.它們之間的區(qū)別
2.grep命令
作用:
語法:
說明:
選項(xiàng):options
重點(diǎn)
實(shí)例
3.后面的下次再更新。?
1.什么是正則表達(dá)式 ?
一個正則表達(dá)式就是描述了一個字符串集合的方式。正則表達(dá)式的表示就是一些特殊符號的組合,而每個符號代表著一些具體的意思。符合的組合就定義了一套規(guī)則和方法,其主要作用就是從大量文本從匹配出符合條件行。
2.正則表達(dá)式的使用場景
在Linux中,正則表達(dá)式的主要使用場景就是文本處理三劍客。grep,sed,awk .除此之外,vi指令也支持正則表達(dá)式。
3.正則表達(dá)式字符表示
在正則表達(dá)式中,又可以分為基本正則表達(dá)式和擴(kuò)展正則表達(dá)式 。其主要區(qū)別在于:
-
基本正則表達(dá)式只認(rèn)識元字符,其元字符主要包括:^ $ . [] * ,具體含義見下表格
-
擴(kuò)展正則表達(dá)式有添加了() {} ? + | 等符號
以下為各個元字符的含義
元字符 | 含義 | 實(shí)例 |
---|---|---|
^ | 匹配行首 | ^abc : 匹配以abc開頭的字符 |
$ | 匹配行尾 | abc$ : 匹配以abc結(jié)尾的字符 |
^$ | 空行 | 表示空行的意思 |
. | 匹配任意單個字符 | .a : 匹配任意和a結(jié)合的兩個字符,其中必須是在后面 |
* | 字符* 匹配0或多個此字符 | *.a : 匹配任意個一個或多個含有a的字符 |
.* | 代表任意多個字符 | 就是代表任意多個字符 |
\ | 屏蔽一個元字符的特殊含義 | 表示去掉有意義的元字符的含義 |
[] | 匹配中括號內(nèi)的字符 | [abc] : 代表匹配a或b或c |
[^abc] | 匹配不包含括號內(nèi)的任意字符 | [^abc] : 代表對abc的取反 ,這個^abc意義不同。 |
擴(kuò)展正則中支持的字符
字符 | 含義 | 實(shí)例 |
---|---|---|
+ | 重復(fù)前一個字符一次或多次 | a+ : 匹配包含一個a或多個a的字符 。 |
? | 重復(fù)前面一個字符0次或一次 | a? :匹配包含0個或一個a字符 |
| | 同時匹配|兩邊的字符 | "abc\|bcd " : 匹配包含abc或bcd 的字符 |
() | 可以和()的字符分組匹配 | “abc (d\|e\|f) ” :匹配abcd,abce,abcf 字符 |
{} | 匹配前面字符的次數(shù) | |
{n} | “abc{2} ” : 至少匹配abc 兩次 |
|
{n,m} | “abc{2,5} ” : 匹配abc 兩到五次 |
預(yù)定義字符類
正則表達(dá)式 | 描述 | 示例 |
---|---|---|
[:alnum:] | [a-zA-Z0-9]匹配任意一個字母或數(shù)字字符 | [[:alnum:]]+ |
[:alpha:] | 匹配任意一個字母字符(包括大小寫字母) | [[:alpha:]] |
[:blank:] | 空格與制表符(橫向縱向) | [[:blank:]] |
[:digit:] | 匹配任意一個數(shù)字字符 | [[:digit:]]+ |
[:lower:] | 匹配小寫字母 | [[:lower:]] |
[:upper:] | 匹配大寫字母 | [[:upper:]] |
[:punct:] | 匹配標(biāo)點(diǎn)符號 | [[:punct:]] |
[:space:] | 匹配一個包括換行符,回車等在內(nèi)的所有空白符 | [[:space:]]+ |
[:graph:] | 匹配任何一個可以看得見的且可以打印的字符 | [[:graph:]] |
[:xdigit:] | 任何一個十六進(jìn)制數(shù) | [[:xdigit:]]+ |
[:cntrl:] | 任何一個控制字符(ASCII字符集中的前32個字符) | [[:cntrl:]] |
[:print:] | 任何一個可以打印的字符 | [[:print:]] |
4.它們之間的區(qū)別
在上面我們提到正則包括基礎(chǔ)正則和擴(kuò)展正則,但是它們有什么區(qū)別呢?在什么地方使用呢 ? 接下來我們主要說明在Linux 三劍客中的不同(grep,sed,awk)
-
grep : 在grep中,如果只是使用grep ,那只能使用原字符的正則以及預(yù)定義字符類,而若想使用擴(kuò)展正則中包含的字符,就必須在grep后加參數(shù)-E 。
-
sed :若要使用而擴(kuò)展正則中包含的字符,就必須在sed后加參數(shù)-r。
2.grep命令
作用:
-
用于打印匹配給定模式的行
語法:
grep [options] PATTERN [FILE...] ? grep [options] [-e PATTERN | -f FILE] [FILE...]
說明:
grep指令用于搜索所給定的模式(PATTERN )的FILE 文件里的內(nèi)容 ,如果從文件內(nèi)容里找到了該模式的文件內(nèi)容,grep會把匹配的該行顯示出來。若不指定任何文件,或給的文件名為- , 則grep會從標(biāo)準(zhǔn)輸入讀取內(nèi)容。
?另外,也可以使用兩個變種程序 egrep 和 fgrep 。 Egrep 與 grep -E 相同。 Fgrep 與 grep -F 相同。
選項(xiàng):options
說明: 以下的NUM代表的是一個數(shù)字,代表的是行數(shù)
-A NUM 或者 --after-context=NUM
除了顯示符合條件的那一行之外,并顯示該行之后NUM行的內(nèi)容
-a 或者--text
將一個二進(jìn)制文件視為一個文本文件來處理;它與--binary-files=text 選項(xiàng)等價。
-B NUM 或者--before-context=NUM
除了顯示符合條件的那一行之外,并顯示該行之前NUM行的內(nèi)容。
-C NUM 或者--context=NUM
除了顯示符合條件的那一行之外,并顯示該行之前和之后的NUM行的內(nèi)容
-b 或者--byte-offset
在輸出的每行前面同時打印出當(dāng)前行在輸入文件中的字節(jié)偏移量。
--colour[=WHEN] 或者 --color[=WHEN]
在匹配的行中,已匹配到字符串進(jìn)行著色顯示。WHEN可以是never,always,或是auto。
-c 或者--count
計(jì)算符合條件的行數(shù)
-d ACTION 或者 --directories=ACTION
如果輸入文件是一個目錄,使用動作ACTION來處理它。
默認(rèn)情況下,動作ACTION是read,意味著目錄將視為普通文件那樣來讀。
如果動作 ACTION是skip ,將不處理而直接跳過目錄。
如果動作ACTION是recurse,grep 將遞歸地讀每一目錄下的所有文件。這樣做和-r選項(xiàng)等價。
-E 或者 --extended-regexp
將E后面的模式作為一個正則表達(dá)式來使用。
-e PATTERN 或者 --regexp=PATTERN
使用PATTERN作為查找文件內(nèi)容的模式(支持正則),但是在單條命令中可使用多個-e選項(xiàng)
-F 或者 --fixed-strings
將模式 PATTERN 視為一個固定的字符串的列表,用新行 (newlines) 分隔,只要匹配其中之一即可。
-f FILE 或者--file=FILE
從文件 FILE 中獲取模式,每行一個??瘴募?個模式,因此不匹配任何東西。
-G 或者--basic-regexp
將模式 PATTERN 作為一個基本的正則表達(dá)式這是默認(rèn)值。
-H 或者 --with-filename
為每個匹配打印文件名。
-h 或者 --no-filename
當(dāng)搜索多個文件時,禁止在輸出的前面加上文件名前綴。
-i 或者 --ignore-case
忽略大小寫的區(qū)別
-L 或者 --files-without-match
打印在文件內(nèi)容中無法找到匹配后的文件名稱
-l 或者 --files-with-matches
打印出在文件內(nèi)容中找到匹配后的文件名
-m NUM 或者 --max-count=NUM
在找到NUM個匹配的行之后,不再讀這個文件。
-n 或者 --line-number
在輸出的每行前面加上它所在的文件中它的行號。
-o 或者 --only-matching
只顯示匹配的行中與 PATTERN 相匹配的部分。
--label=LABEL
將來自標(biāo)準(zhǔn)輸入的匹配輸出視為來自輸入文件LABEL的值
--line-buffering
使用行緩沖,it can be a performance penality.
-q, --quiet, --silent
不顯示任何信息。
-R, -r, --recursive
遞歸地讀每一目錄下的所有文件。這樣做和 -d recurse選項(xiàng)等價。
--include=PATTERN
僅僅在搜索匹配 PATTERN 的文件時在目錄中遞歸搜索。
--exclude=PATTERN
在目錄中遞歸搜索,但是跳過匹配 PATTERN 的文件。
-s 或者 --no-messages
禁止輸出關(guān)于文件不存在或不可讀的錯誤信息。
-u 或者 --unix-byte-offsets
報(bào)告Unix風(fēng)格的字節(jié)偏移量。這個開關(guān)使得grep報(bào)告字節(jié)偏移量時,將文件作為Unix
風(fēng)格的文本文件看待,也就是說將CR字符去掉。這將產(chǎn)生與在一臺Unix主機(jī)上運(yùn)行g(shù)rep完全相同的結(jié)果。除非同時使用-b選項(xiàng),否則這個選項(xiàng)無效。這個選項(xiàng)在MS-DOS和MS-Windows之外的系統(tǒng)中無效。
-V 或者 --version
向標(biāo)準(zhǔn)錯誤輸出打印 grep 的版本號。
-v 或者 invert-match
顯示不包含匹配模式的所有行。
-w 或者 --word-regexp
只選擇含有能組成完整的詞的匹配的行。判斷方法是匹配的子字符串必須是一行的開始,或者是在一個不可能
-x 或者 --line-regexp
完全匹配。
-Z, --null
文件內(nèi)容全部顯示,不同字體通過顏色加以標(biāo)注
重點(diǎn)
雖然在上面我們可以看到,grep中有很多選項(xiàng),但是在工作中,大多數(shù)的選項(xiàng)是用不到的,這里我們劃一下重點(diǎn)。
常用參數(shù)
-E | 將后面的模式作為一個正則表達(dá)式(擴(kuò)展正則) |
---|---|
-e | 支持一個命令中多個正則匹配 |
-i | 忽略大小寫 |
-n | 在匹配的行前加入編號 |
-v | 只顯示不匹配的行 |
實(shí)例
使用到文件info,通過grep來進(jìn)行過濾,info的文件內(nèi)容如下:
-
查找文件info中包含ccc的內(nèi)容并打印行數(shù)
grep -n "ccc" info
2.查找文件info中包含ggg且忽略大小寫的字符并打印,
grep -i "ggg" info
3.過濾掉含有ccc的行
grep -v "ccc" info
?
4.查找包含ddd,eee,fff的行(注意:以下匹配用到正則)
grep -E "ddd|eee|fff" info
5.查找以c開頭的行
grep ^c info
6.查找以ccx開頭且結(jié)尾的行
grep ^ccx$ info
7.查找d字符前可以是任意字符的行
grep .d info
8.查找包含一個或多個d字符的行
grep -E d{1} info
9.顯示包含a,b,c的字符的行 ; 顯示不包含a,b,c字符的行
包含:grep -i ^[abc] info
不包含: grep -i [^abc] info (是全部字符不包含a或b或c)
10.顯示包含一個或多個含有a字符的行
grep -E a+ info
11.查找以cc開頭且包含c,x,ld字符的行
grep -E "cc(c|x|ld)" info
12.查找文件中所有的大寫字符
grep [[:upper:]] info
13.匹配任意一個字母和數(shù)字字符文章來源:http://www.zghlxwxcb.cn/news/detail-801490.html
grep [[:alnum:]] info
?文章來源地址http://www.zghlxwxcb.cn/news/detail-801490.html
到了這里,關(guān)于Linux系統(tǒng)三劍客之grep和正則表達(dá)式的介紹(一)的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!