“道高一尺,魔高一丈”, Python爬蟲與反爬蟲的拉鋸戰(zhàn)!


?這波攻勢太過凌厲,不過“反爬蟲”也不是吃素的,很快,他就找到了“爬蟲”的弱點,那就是:訪問太過頻繁。于是,“反爬蟲”馬上鎖定IP,對那只討厭的蟲子進行了"IP封鎖"! ?

這回該輪到"爬蟲"大俠沮喪了,IP被封,意味著不能使用這個IP繼續(xù)爬取數據了,不過很快,"爬蟲"大俠想到了另一個攻擊方法:“使用代理IP”,也就是花錢買很多IP,看你能封得過來嗎?!

? ?"反爬蟲"這回傻眼了,總不能為了贏得這場比武,封掉所有IP吧,這樣的話,那些好人也訪問不了網站了!“嗯......,怎么辦呢?怎么才能識別出這只可惡的爬蟲呢?”,有了,“反爬蟲”馬上就想到了一個好方法:“利用驗證碼辨別爬蟲”,這樣,如果是正常人,自然可以填寫正確的驗證碼,而如果是該死的爬蟲,呵呵......,于是“反爬蟲”馬上使出了驗證碼識別的招數。

"這......",爬蟲傻眼了,因為以"爬蟲"大俠目前的功力,確實還無法通過自己來識別驗證碼,“腫么辦呢?對了,可以借助第三方云平臺識別!”,這回,連“爬蟲”大俠自己都佩服自己的聰明才智了!

各種復雜的識別碼,都可借助第三方識別!“爬蟲”大俠這場比武似乎勢在必得!接下來,“反爬蟲”大俠該如何應對呢?讓我們拭目以待后續(xù)更精彩的戰(zhàn)況吧......
標簽: