正則表達(dá)式篩選中文
什么是正則表達(dá)式
正則表達(dá)式(Regular Expression,通??s寫為 regex 或 regexp)是一種強(qiáng)大的文本模式匹配和搜索工具,用于在文本中查找、匹配和操作特定模式的字符串。
它是一種基于字符串模式的編程技術(shù),允許你定義一種模式,然后使用該模式來搜索、替換或驗(yàn)證字符串。
正則表達(dá)式通常由一系列字符和特殊符號(hào)組成,用于描述要匹配的文本模式。這些模式可以包括字符類、量詞、分組、選擇等元素,允許你精確地指定要匹配的文本的規(guī)則。
正則表達(dá)式用途
文本搜索和匹配: 正則表達(dá)式可以用于在文本中查找特定模式的字符串,例如查找電子郵件地址、URL、日期等。
文本替換: 你可以使用正則表達(dá)式來查找并替換文本中的特定模式,例如將所有匹配的字符串替換為其他內(nèi)容。
輸入驗(yàn)證: 正則表達(dá)式可以用于驗(yàn)證用戶輸入是否符合特定的格式或規(guī)則,例如檢查電話號(hào)碼、郵政編碼、密碼等的有效性。
數(shù)據(jù)提?。?正則表達(dá)式可以用于從文本中提取特定的數(shù)據(jù),例如從日志文件中提取信息、從HTML中提取標(biāo)簽內(nèi)容等。
正則表達(dá)式是在許多編程語言中都得到支持的重要工具,包括Python、Java、JavaScript、Perl、C#等。
每種編程語言都有自己的正則表達(dá)式庫和函數(shù),允許開發(fā)人員在應(yīng)用程序中使用正則表達(dá)式來處理文本數(shù)據(jù)。
學(xué)會(huì)使用正則表達(dá)式可以大大提高文本處理的效率和精確性。
正則表達(dá)式也可以復(fù)雜表示,需要一定的學(xué)習(xí)和實(shí)踐才能熟練掌握。
篩選字符串至段位
查找"abc"到段尾。
abc.+
篩選字符串
查找所有后面既不是斜杠 "/" 也不是小寫字母 "a" 的冒號(hào) ":"
:(?![/a])
篩選文漢字
如果想匹配在正則表達(dá)式中前面是漢字或者不是漢字的情況,可以使用負(fù)向零寬斷言來實(shí)現(xiàn)。
負(fù)向零寬斷言用于在匹配時(shí)檢查某個(gè)位置之前不出現(xiàn)特定模式。
以下是一個(gè)正則表達(dá)式示例,用于匹配前面不是漢字的情況:
^(?![\u4e00-\u9fa5])
正則表達(dá)式常用操作符
https://z197.com/blog/regular-expression-operator.html