散文網(wǎng) » 生活 »日常 » Java學(xué)習(xí)之字符串和正則表達(dá)式

Java學(xué)習(xí)之字符串和正則表達(dá)式

2020-11-25 09:57 作者:每天一個(gè)禿頂小技巧 0人讀過 | 我要投稿

簡介

可以證明，字符串操作是計(jì)算機(jī)程序設(shè)計(jì)中最常見的行為不可變String String對(duì)象是不可變的，通過JDK文檔可以發(fā)現(xiàn)，每一個(gè)看似會(huì)修改String值的操作，實(shí)際上都是創(chuàng)建了一個(gè)新的String對(duì)象，以包含修改后的字符串內(nèi)容，而最初的String對(duì)象則絲毫未動(dòng)。

重載"+" 與StringBuilder String對(duì)象是不可變的額，你可以給String對(duì)象加任意多的別名。因?yàn)镾tring具有只讀特性，所以指向它的任何引用都不可能改變它的值，因此，也就不會(huì)對(duì)其他的引用有什么影響。不可變性會(huì)帶來一定的效率問題。為String對(duì)象重載的”+“操作符就是一個(gè)例子，用于String的”+“與”+=“被重載為用來連接兩個(gè)字符串

看下面代碼

上面代碼一開始聲明了一個(gè)Hello字符串，后面與World字符串進(jìn)行了連接賦值給了str2.所以最后會(huì)打印Hello World的字段現(xiàn)在看看代碼到底是如何工作的

上面是對(duì)源代碼進(jìn)行反編譯后的匯編語句。我們暫時(shí)不必讀懂，可以參考后面的注釋。

我們可以發(fā)現(xiàn)所謂的String字符串拼接實(shí)際上就是創(chuàng)建一個(gè)空的StringBuilder對(duì)象，并將對(duì)所有通過”+“進(jìn)行拼接的字符串進(jìn)行append操作，最后通過toString方法將拼接好的字符串賦值給str2引用。注意：雖然編譯器會(huì)將字符串的拼接優(yōu)化為StringBuilder的操作，但是這不意味著我們可以濫用”+“，這會(huì)我們帶來不少的資源浪費(fèi)。

現(xiàn)在看下面的代碼：

上面代碼中，前者通過”+=“來循環(huán)拼接字符串，這意味著每一次循環(huán)，都會(huì)創(chuàng)建一個(gè)新的SringBuilder對(duì)象，這會(huì)極大浪費(fèi)系統(tǒng)的性能，雖然垃圾回收機(jī)制可以回收存儲(chǔ)資源，但是創(chuàng)建對(duì)象是非常浪費(fèi)資源的是比較慢的，所以相比之下，后者的使用效率會(huì)更高。

String上的操作

格式化輸出 Formatter 在java中所有新的格式化功能都由java.util.Formatter類處理。可以將這個(gè)類當(dāng)作一個(gè)翻譯器，它將你的格式化字符串與數(shù)據(jù)翻譯成需要的結(jié)果。當(dāng)你創(chuàng)建一個(gè)Formatter對(duì)象的時(shí)候，需要向其構(gòu)造器傳遞一些信息，告訴它最終的結(jié)果將向哪里輸出：正則表達(dá)式正則表達(dá)式是一種靈活而強(qiáng)大的文本處理工具。通過正則表達(dá)式我們就能以編程的方式構(gòu)造復(fù)雜的文本模式，并對(duì)輸入的字符串進(jìn)行搜索。

一般來說，正則表達(dá)式就是以某種方式來描述字符串，因此，你可以說”如果一個(gè)字符串包含這樣那樣的東西，那么它就是我要找的“

創(chuàng)建正則表達(dá)式

量詞中的貪婪型、勉強(qiáng)型和占有型量詞描述了一個(gè)模式吸收輸入文本的方式

貪婪型貪婪型就是我們前面提到的量詞表中的形式，貪婪型會(huì)根據(jù)表達(dá)式去盡最大范圍去匹配

通過前面正則符號(hào)的學(xué)習(xí)我們可以知道”.“代表任意字符，而”+“則代表一個(gè)或多個(gè)字符，組合起來就表示匹配一個(gè)或多個(gè)任意字符。我們看到例子中的正則表達(dá)式”<.+>“表示會(huì)匹配一對(duì)尖括號(hào)<>，尖括號(hào)中間會(huì)有一個(gè)或多個(gè)任意字符。所以，通常來說我們會(huì)認(rèn)為例子中的符號(hào)會(huì)被匹配到量詞，因?yàn)橛袃蓚€(gè)尖括號(hào)是符合條件的。但是事實(shí)上我們看到輸出結(jié)果只匹配到了一個(gè)。

所以我們現(xiàn)在可以理解貪婪型中的盡最大范圍匹配是什么含義了勉強(qiáng)型勉強(qiáng)型就是在貪婪型的基礎(chǔ)上增加了”?“符號(hào)，通過前面的學(xué)習(xí)我們知道”?”代表0個(gè)或1個(gè)符號(hào)，但是如果前面已經(jīng)出現(xiàn)了量詞，那它將不再作為原來的含義使用。勉強(qiáng)型的含義剛好以貪婪型相反，它會(huì)近最小的匹配返回去匹配在上面例子中我們發(fā)現(xiàn)例子中的test字符串被匹配到了兩次，這不就是我們希望的結(jié)果嗎，事實(shí)上，勉強(qiáng)型就是會(huì)在遇到匹配的結(jié)果就不再擴(kuò)大范圍，直接完成對(duì)象匹配，然后完成對(duì)應(yīng)操作后再往后繼續(xù)重新開始匹配獨(dú)占型獨(dú)占型比較相比前兩者難理解，其實(shí)獨(dú)占型與貪婪型基本上是一樣的，都是盡最大范圍去匹配，只是獨(dú)占型沒有回退功能，所以如果一旦由于把范圍擴(kuò)的太大，會(huì)造成原先匹配到的對(duì)象都丟失的情況。

這樣說比較抽象。我們對(duì)正則匹配的方式進(jìn)行深度的說明下面圖中綠色代表匹配，黃色代表不匹配通過上面的圖我們可以發(fā)現(xiàn)到第四步，我們的“.++”把后面所有的字符都給匹配掉了，所以在第五步時(shí)，我們的“>”沒有可以匹配的字符了，這時(shí)候就會(huì)匹配失敗，如果時(shí)我們的獨(dú)占型，就會(huì)到此結(jié)束。但是如果是貪婪型，將會(huì)把之前匹配完成的結(jié)果進(jìn)行回退，一直退到符合匹配條件的或者全部都不匹配為止。 CharSequeue CharSequeue是一個(gè)從

CharBuffer、String、StringBuffer，StringBuilder類之中抽象出來的字符序列的一般化定義。這些類都實(shí)現(xiàn)了該接口。大多數(shù)正則表達(dá)式操作都會(huì)接收這個(gè)接口作為參數(shù)

。由于這個(gè)接口在1.8之后有大量的方法體，所以有需要可以自己去看看源碼 Pattern和Matcher 一般來說，比起功能有限的String類，我們更愿意構(gòu)造功能強(qiáng)大的正則表達(dá)式對(duì)象。只需要導(dǎo)入java.util.regex包，然后用static Pattern.compile()方法來編譯正則表達(dá)式即可。它會(huì)根據(jù)你的String類型的正則擺動(dòng)式生成一個(gè)Pattern對(duì)象。接下來，把你想要檢索的字符串傳入Pattern的matcher()方法。該方法會(huì)生成一個(gè)Macther對(duì)象，它會(huì)有許多的功能可用。

我們看下面的代碼組組是用括號(hào)劃分的正則表達(dá)式，可以根據(jù)組的編號(hào)來引用某個(gè)組。組號(hào)為0表示整個(gè)表達(dá)式，組號(hào)為1表示被第一對(duì)括號(hào)括起的組，依此推類看下面表達(dá)式下面介紹一下Matcher對(duì)象常用的一些方法 find()：查找多個(gè)匹配，每次調(diào)用查找一次，每次只找一個(gè)匹配項(xiàng)，但下次查找會(huì)從前一次匹配的結(jié)束位置的后一位開始查找，假設(shè)我們要查找ava，目標(biāo)字段是avava那只能find到一次 lookingAt()：只在正則表達(dá)式與輸入開始處就開始匹配時(shí)才會(huì)成功。舉個(gè)例子：表達(dá)式ava，遇到j(luò)ava會(huì)匹配失敗，但是遇上ava或者avaj都能夠匹配成功 matches()：只在正則表達(dá)式與輸入開始處就開始匹配并且表達(dá)式和輸入完全匹配時(shí)才會(huì)成功。舉個(gè)例子：表達(dá)式ava，遇到j(luò)ava和avaj會(huì)匹配失敗，只有遇上ava才能夠匹配成功注意，如果我們希望像上面代碼示例中一樣獲取組信息，需要先調(diào)用上面三個(gè)匹配方法，否則就會(huì)異常。

Pattern標(biāo)記 Pattern類的compile方法還有另一個(gè)版本，它接受一個(gè)標(biāo)記參數(shù)以調(diào)整匹配的行為掃描輸入我們通常通過Scanner對(duì)象完成對(duì)各種輸入流的類型讀寫，否則什么都要自己通過分解String然后進(jìn)行各種類型的parse會(huì)是一件很大的工程。這里只做一點(diǎn)簡單的額介紹，有需要可以自己去看一下源碼有哪些方法可用 Scanner定界符默認(rèn)情況下，Scanner根據(jù)空白字符對(duì)輸入進(jìn)行分詞，但是我們也可以使用正則表達(dá)式指定我們需要的定界符。通過上面例子我們能夠看出原字符串中是以“, ”作為分割符的，所以我們通過useDelimiter(",\s*")指定了新的分界符號(hào)。正則表達(dá)式掃描 Scanner除了掃描基本類型以外，還能夠使用自定義的正則表達(dá)式進(jìn)行掃描。這在掃描復(fù)雜數(shù)據(jù)時(shí)非常有用，下面例子將掃描一個(gè)防火墻日志文件中記錄的威脅數(shù)據(jù)

上面代碼中，我們希望從數(shù)據(jù)中篩選出我們需要的威脅記錄，并從中提取出ip和時(shí)間。注意，hasNext(pattern)和scanner.next(pattern)僅僅針對(duì)下一個(gè)輸入分詞進(jìn)行匹配，也就說，根據(jù)我們的正則表達(dá)式，在第三行數(shù)據(jù)會(huì)匹配失敗，此時(shí)不會(huì)往下繼續(xù)匹配，需要通過next()跳到下一個(gè)分詞

轉(zhuǎn)自網(wǎng)絡(luò)，侵刪

標(biāo)簽：

Java學(xué)習(xí)之字符串和正則表達(dá)式的評(píng)論 (共條)

愛情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩歌空間日志經(jīng)典語句愛情句子作文大全

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

Java學(xué)習(xí)之字符串和正則表達(dá)式

Java學(xué)習(xí)之字符串和正則表達(dá)式的評(píng)論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

Java學(xué)習(xí)之字符串和正則表達(dá)式

本文作者的其他文章

Java學(xué)習(xí)之字符串和正則表達(dá)式的評(píng)論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

Java學(xué)習(xí)之字符串和正則表達(dá)式的評(píng)論 (共條)