drissionpage介紹
介紹
DrissionPage,即 driver 和 session 的合體,是一個(gè)基于 python 的 Web 自動(dòng)化操作集成工具。
requests 爬蟲面對(duì)要登錄的網(wǎng)站時(shí),要分析數(shù)據(jù)包、JS 源碼,構(gòu)造復(fù)雜的請(qǐng)求,往往還要應(yīng)付驗(yàn)證碼、JS 混淆、簽名參數(shù)等反爬手段,門檻較高。若數(shù)據(jù)是由 JS 計(jì)算生成的,還須重現(xiàn)計(jì)算過程,體驗(yàn)不好,開發(fā)效率不高。使用 selenium,則可以很大程度上繞過這些坑,但 selenium 效率不高。
因此,這個(gè)庫(kù)將 selenium 和 requests 合二為一,不同需要時(shí)切換相應(yīng)模式,并提供一種人性化的使用方法,提高開發(fā)和運(yùn)行效率。除了合并兩者,本庫(kù)還以網(wǎng)頁(yè)為單位封裝了常用功能,簡(jiǎn)化了 selenium 的操作和語(yǔ)句,在用于網(wǎng)頁(yè)自動(dòng)化操作時(shí),減少考慮細(xì)節(jié),專注功能實(shí)現(xiàn),使用更方便。
因此,這個(gè)庫(kù)將 selenium 和 requests 合二為一,不同需要時(shí)切換相應(yīng)模式,并提供一種人性化的使用方法,提高開發(fā)和運(yùn)行效率。除了合并兩者,本庫(kù)還以網(wǎng)頁(yè)為單位封裝了常用功能,簡(jiǎn)化了 selenium 的操作和語(yǔ)句,在用于網(wǎng)頁(yè)自動(dòng)化操作時(shí),減少考慮細(xì)節(jié),專注功能實(shí)現(xiàn),使用更方便。
特性:
允許在 selenium 和 requests 間無(wú)縫切換,共享 session。
2. 兩種模式提供一致的 API,使用體驗(yàn)一致。
3. 人性化的頁(yè)面元素操作方式,減輕頁(yè)面分析工作量和編碼量。
4. 對(duì)常用功能作了整合和優(yōu)化,更符合實(shí)際使用需要。
5. 兼容 selenium 代碼,便于項(xiàng)目遷移。
6. 使用 POM 模式封裝,便于擴(kuò)展。
7. 統(tǒng)一的文件下載方法,彌補(bǔ)瀏覽器下載的不足。
8. 簡(jiǎn)易的配置方法,擺脫繁瑣的瀏覽器配置。
安裝
安裝drissionpage包,如果遇到問題應(yīng)該是網(wǎng)絡(luò)問題
可以設(shè)置超時(shí)時(shí)間來(lái)嘗試解決
pip install DrissionPage? --default-timeout=1000
使用
具體事項(xiàng)參考
http://g1879.gitee.io/drissionpagedocs/