中文文件名提取

很多匹配、提取的操作都是和正則表達(dá)式掛鉤。熟練掌握正則表達(dá)式,有時(shí)候能幫你解決一些之前可能需要手動(dòng)操作的問(wèn)題。

對(duì)于 folder 內(nèi)不同的 .docx 文件,想要提取出 word 文件名中的中文,除了手動(dòng)復(fù)制粘貼文件名,是不是有更好的方式提?。窟@個(gè)時(shí)候,我們就可以借助正則表達(dá)式。
get_name=?function(loc){
??name=?list.files(loc,?full.names?=?TRUE)?|>?str_match_all('[\\p{Han}]')?|>?
????sapply(function(x){
??????as.vector(x)?|>?
????????str_c(collapse?=?'')
????})
??return(name)
}
其中,[\\p{Han}]
則是為了直接提取出文件名中的全部中文。因而,最后應(yīng)當(dāng)?shù)玫竭@樣的字符串向量:c('陸震', '陸震同學(xué)', '陸震')
。有興趣的同學(xué)可以自己嘗試下自己folder下的文件中文名稱提取。
對(duì)于正則表達(dá)式的學(xué)習(xí),可以由淺入深,平時(shí)在合適的場(chǎng)景多多使用,非常有助于對(duì)不同 pattern 規(guī)律的掌握。另外,后臺(tái)回復(fù)正則表達(dá)式可以收到 stringr 的 cheat sheet,同學(xué)們可以自己了解學(xué)習(xí)下。

非常感謝你能看到這里,如果你覺得寫得還不錯(cuò)的話,求轉(zhuǎn)發(fā)求關(guān)注,我們下篇文章再見???????