Python爬取豆瓣Top250并可視化(一) —— 保存數(shù)據(jù)到Excel —— openpyxl
前面做了第一篇關于保存爬蟲數(shù)據(jù)的文章,用的是xlwt。今天來第二彈,用openpyxl進行保存。思路都差不多,先爬取數(shù)據(jù),然后用openpyxl進行保存。代碼如下:

與xlwt比較,細節(jié)之處有幾點:
1,保存到excel的文件名不相同,xlwt保存的是后綴名是xls,而openpyxl保存的是xlsx;
2,雖然處理的爬蟲數(shù)據(jù)都是嵌套列表數(shù)據(jù)。用xlwt進行保存的時候,處理完完成列表還得提取出內(nèi)層嵌套列表的單個數(shù)據(jù),兒用openpyxl,只需遍歷外層列表,然后將每個內(nèi)層列表當成整體進行append就可以追加到表格;
3,用openpyxl一定要注意I/O問題,說白了就是創(chuàng)建工作簿和保存工作簿之間,一定要夾帶所要處理的所有數(shù)據(jù),不然很可能保存的時候就剩下25條數(shù)據(jù)了。
聲明:本文僅供學習和交流使用,特別是作者復習。
標簽: