使用網(wǎng)絡(luò)爬蟲自動抓取長江水位和流量數(shù)據(jù)

2020-11-30 12:45 作者:ocean_tide 0人讀過 | 我要投稿

如下圖所示，我們要從這個(gè)網(wǎng)站抓取長江主要站點(diǎn)的水位和流量數(shù)據(jù)。

首先使用urlread讀取網(wǎng)頁的內(nèi)容，再找到數(shù)據(jù)所在的字符串

str=urlread('http://www.cjh.com.cn/sssqcwww.html')

以向家壩為例，1710就是流量，266.22是水位

'{"oq":"0","q":"1710","rvnm":"長江","stcd":"60103400","stnm":"向家壩","tm":1606701600000,"wptn":"5","z":"266.22"}'

接著我們使用正則化表達(dá)來提取這些數(shù)據(jù)

flow=regexp(str,'{"oq":"0","q":"\d*','match');? %提取流量單位是m3/s
wl=regexp(str,'"wptn":"\d","z":"\S{2,10}"}','match'); %提取水位單位是米
name=regexp(str,'"stnm":"\S{2,10}","tm":','match'); %提取觀測站點(diǎn)名字

完整的程序如下，該程序會每小時(shí)運(yùn)行一次，抓取數(shù)據(jù)并保存成mat文件：

j=1; %網(wǎng)站數(shù)據(jù)是逐時(shí)的，整點(diǎn)會更新，為了預(yù)防可能出現(xiàn)的延遲問題，建議12點(diǎn)的數(shù)據(jù)12點(diǎn)15分時(shí)才去爬取
while 0<1
?time(j,:)=datestr(now);
str=urlread('http://www.cjh.com.cn/sssqcwww.html');
%str1='{"oq":"0","q":"1710","rvnm":"長江","stcd":"60103400","stnm":"向家壩","tm":1606701600000,"wptn":"5","z":"266.22"}'
flow=regexp(str,'{"oq":"0","q":"\d*','match');? %流量單位是m3/s
wl=regexp(str,'"wptn":"\d","z":"\S{2,10}"}','match'); %水位單位是米
name=regexp(str,'"stnm":"\S{2,10}","tm":','match'); %觀測站點(diǎn)名字
for i=1:length(flow)
??? d(j,i)=str2num(flow{i}(16:end));? %0代表沒有流量觀測
end

for i=1:length(wl)
??? sl(j,i)=str2num(wl{i}(17:end-2));?
end
j=j+1
save('Yangtze.mat','time','d','sl','name')
pause(3600); %每隔一小時(shí)執(zhí)行一次
end

標(biāo)簽：

使用網(wǎng)絡(luò)爬蟲自動抓取長江水位和流量數(shù)據(jù)的評論 (共條)

愛情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩歌空間日志經(jīng)典語句愛情句子作文大全

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

使用網(wǎng)絡(luò)爬蟲自動抓取長江水位和流量數(shù)據(jù)

使用網(wǎng)絡(luò)爬蟲自動抓取長江水位和流量數(shù)據(jù)的評論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

使用網(wǎng)絡(luò)爬蟲自動抓取長江水位和流量數(shù)據(jù)

本文作者的其他文章

使用網(wǎng)絡(luò)爬蟲自動抓取長江水位和流量數(shù)據(jù)的評論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

使用網(wǎng)絡(luò)爬蟲自動抓取長江水位和流量數(shù)據(jù)的評論 (共條)