【MATLAB】關(guān)于使用Web函數(shù)進行網(wǎng)頁搜索
【背景】
最近在研究語文本聚類分析,有些時候在語料里發(fā)現(xiàn)部分名稱不知道是什么意思,那么就得使用百度進行檢索,如“數(shù)智建造”,就得手動拷貝到百度的網(wǎng)頁搜索進行查看。
由于文本聚類分析,我是采用的MATLAB app designer進行可視化開發(fā),那么我希望名詞進行自動搜索時能跳過手動拷貝這一步
【實現(xiàn)準(zhǔn)備】
這里需要用到百度api和urlencode函數(shù)來實現(xiàn):
如百度搜索“數(shù)智建造”,瀏覽器搜索欄反饋結(jié)果如下:

拷貝出來的結(jié)果如下:
https://www.baidu.com/s?wd=%E6%95%B0%E6%99%BA%E5%BB%BA%E9%80%A0&ie=UTF-8&tn=62095104_5_oem_dg
通過對以上簡化,以下鏈接也是有效的:

但拷貝出來就是下面的結(jié)果:
https://www.baidu.com/s?wd=%E6%95%B0%E6%99%BA%E5%BB%BA%E9%80%A0
因此,通過上面的測試,百度的api寫法應(yīng)該是【https://www.baidu.com/s?wd=】
對應(yīng)的“wd=”后面就是關(guān)鍵詞,通過百度后面是URL編碼,MATLAB里有urlencode可以實現(xiàn)字符串轉(zhuǎn)換為URL編碼的功能
以上,完成所有準(zhǔn)備工作
【代碼測試】
編寫代碼:
KeyWord = '數(shù)智建造'? % 必須為字符串,char形式
web(strcat('https://www.baidu.com/s?wd=',urlencode(KeyWord)));

標(biāo)簽: