正則表達(dá)式是用來表達(dá)字符串匹配模式的方法,利用正則表達(dá)式,可以讓我們輕易地實(shí)現(xiàn)對目標(biāo)字符串的 查找 、 刪除 、替換等操作。
正則表達(dá)式并不復(fù)雜,它并不包含難以理解的理論,只是一些約定好的匹配規(guī)則,但由于規(guī)則較多,可能比較容易忘記。
本文會(huì)先整理出所有的正則表達(dá)式以及其含義,接下來會(huì)利用grep命令,詳細(xì)介紹每種正則表達(dá)式的使用方式,并給出案例。
如果大家忘記了某個(gè)匹配規(guī)則的話,相信你只要再看一遍下方整理好的表格,就能回憶起其使用方法。
正則表達(dá)式規(guī)則
下方表格整理了常用正則表達(dá)式的匹配規(guī)則:
表達(dá)式 | 含義 |
---|---|
^word | 匹配關(guān)鍵字出現(xiàn)在行首的行下面命令查詢以Hello 開頭的行grep ^Hello regular.txt |
word** | 匹配關(guān)鍵字出現(xiàn)在行尾的行下面命令查詢以 complete 結(jié)尾的行grep complete**regular.txt |
. | 一定存在某個(gè)字符例如a.c 可以匹配abc ,acc ,adc ,aec 等字符串 |
\\ | 轉(zhuǎn)義符,去掉特殊符號(hào)的特殊含義下面的命令查找含有單引號(hào)' 的行grep \\' regular.txt |
* | 匹配0個(gè)或無窮多個(gè)前面的表達(dá)式下面命令查找es ,ess ,esss ,esss... 等字符串grep ess* regular.txt |
[list] | 匹配中括號(hào)中的一個(gè)字符例如,t[ae]st 既能匹配test ,也能匹配tast |
[n1-n2] | 是[list] 的簡寫形式,匹配兩個(gè)字符之間的所有連續(xù)字符例如,[A-Z] 匹配所有的大寫字符,[0-9] 匹配0和9之間的任意一個(gè)數(shù)字 |
[^list]或[^n1-n2] | 中括號(hào)中的^ 是取反的意思,它表示只要一行包含有非list中列出的任意字符,就會(huì)被匹配例如,下面命令查找包含有非大寫字符的行grep [^A-Z] regular.txt |
{n} | 匹配n個(gè)前面的表達(dá)式 |
{n, m} | 匹配連續(xù)n到m個(gè)前面的表達(dá)式 |
{n,} | 匹配連續(xù)n個(gè)或以上個(gè)前面的表達(dá)式 |
下面將使用grep命令演示各個(gè)表達(dá)式的執(zhí)行效果,測試使用的regular.txt文件內(nèi)容如下圖所示:
^word
grep one regular.txt
命令的執(zhí)行結(jié)果如下所示:
默認(rèn)條件下,grep命令會(huì)把包含“one”的行都檢索出來。但如果你只想檢索以“one”開頭的行,要使用如下命令:
grep ^one regular.txt
其執(zhí)行結(jié)果如下圖所示:
可以看到只有以“one”開頭的行被檢索出來了,那種雖然包含“one”,但并不以“one”開頭的行不會(huì)被檢索到。
word$
$
表示只查詢以某個(gè)關(guān)鍵字結(jié)尾的行:
默認(rèn)條件下,grep命令會(huì)把包含“three”的行都檢索出來。但使用$
后,只有以“three”結(jié)尾的行會(huì)被檢索到。
小數(shù)點(diǎn) .
.
表示一定匹配且僅匹配一個(gè)字符。在regular.txt
文件中,包含下面幾行:
taste
tst
tesst
test
但執(zhí)行grep t.st regular.txt
命令時(shí),只有taste和test兩行內(nèi)容會(huì)被檢索出來:
這是因?yàn)?code>.一定匹配一個(gè)任意字符,所以只有taste和test兩行內(nèi)容滿足要求。
星號(hào) *
*
表示重復(fù)任意次前面的表達(dá)式,包括0次和無窮次。
grep go* regular.txt
命令執(zhí)行結(jié)果如下:
g
、go
、goo
、goo...
等字符串都會(huì)被檢索到。
[list]
匹配中括號(hào)中的任意一個(gè)字符,注意“[]”表達(dá)式只表示一個(gè)字符,中括號(hào)內(nèi)的字符之間是“或”的關(guān)系。
grep t[ea] regular.txt
命令執(zhí)行結(jié)果如下:
tst
字符串就沒有被檢索到,因?yàn)閟不在[ea]
范圍內(nèi)。
[n1-n2]
這是對[list]
的簡寫形式,在處理連續(xù)字符集時(shí)很有效。
例如,想要列出所有的小寫字母,你可以用“[abcdefg...xyz]”來表達(dá),但這樣輸入太多,比較麻煩。
由于小寫字母是連續(xù)的,所以可以用[a-z]
表示所有的小寫字母。
grep t[a-z] regular.txt
執(zhí)行結(jié)果如下所示:
同理,[A-Z]
表示所有大寫字母,[0-9]
表示所有數(shù)字。
[^list] 或 [^n1-n2]
當(dāng)^
出現(xiàn)在中括號(hào)內(nèi)時(shí),它表達(dá)“取反”的含義。
下面是[list]
形式使用^
符號(hào)的前后結(jié)果對比:
下面是[n1-n2]
形式使用'^'符號(hào)的前后結(jié)果對比:
, ,
這三種表達(dá)式本質(zhì)上是一類表達(dá)式,都是表示前面表達(dá)式重復(fù)的次數(shù)。
go\\{4\\}
表示字母g
后面必須跟著4個(gè)字母o
:
go\\{4,6\\}
表示字母g
后面跟著4個(gè)字母o
到6個(gè)字母o
的字符串都是匹配的:
go\\{4,\\}
表示字母g
后面跟著4個(gè)字母o
或超過4個(gè)字母o
的字符串都是匹配的:
這里要注意,grep在使用\\{n,m\\}
表達(dá)式時(shí),表達(dá)式內(nèi)容必須用單引號(hào)'
或雙引號(hào)"
擴(kuò)起來。其它情況可以不使用雙引號(hào)或單引號(hào)。
反斜杠 \\
\\
是轉(zhuǎn)義字符,當(dāng)你要檢索某些特殊字符時(shí),就需要使用它。
例如,下面檢索包含單引號(hào)的行:
這里如果不使用\\
,將無法正常執(zhí)行命令:
—————END—————
技術(shù)人江湖互聯(lián)網(wǎng)技術(shù)分享,Elasticsearch系列教程
67篇原創(chuàng)內(nèi)容
公眾號(hào)
收錄于合集 **#**linux
12個(gè)
上一篇Linux必知必會(huì)10:環(huán)境變量設(shè)置方式及原理
-
Linux
+關(guān)注
關(guān)注
87文章
11345瀏覽量
210391 -
字符串
+關(guān)注
關(guān)注
1文章
585瀏覽量
20603 -
正則表達(dá)式
+關(guān)注
關(guān)注
0文章
27瀏覽量
3538
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
評(píng)論