Python與mysql保存豆瓣電影Top250筆記
保存爬蟲(chóng)的數(shù)據(jù)多種多樣,唯我mysql最香(對(duì)我來(lái)說(shuō))。

環(huán)境:
1,windows 10;
2,python3.8.3;
3,pycharm;
4,WAMP集成LAMP環(huán)境;

用到的python庫(kù):
1,requests,請(qǐng)求數(shù)據(jù);
2,parsel,解析數(shù)據(jù);
3,pymysql,python的mysql組件;

代碼:

解釋:
大多的解釋在代碼中注釋了。

主記:
1,python與mysql的步驟:首先是創(chuàng)建數(shù)據(jù)庫(kù),編碼很重要(phpmyadmin控制面板編碼為utf8_general_ci,navicat為utf8 -- UTF-8 Unicode,或者直接在代碼中創(chuàng)建,語(yǔ)句為:CREATE DATABSE [IF NOT EXISTS] 數(shù)據(jù)庫(kù)名 CHARACTER SET 編碼);其次是連接數(shù)據(jù)庫(kù)并選取數(shù)據(jù)表(沒(méi)有就創(chuàng)建);第三是獲取數(shù)據(jù)庫(kù)游標(biāo);第四是利用游標(biāo)進(jìn)行數(shù)據(jù)庫(kù)的增刪改查操作;第五是提交數(shù)據(jù)庫(kù)更改(如果是查詢,則不需要);第六是關(guān)閉數(shù)據(jù)庫(kù)連接;
2,構(gòu)造插入sql語(yǔ)句的方法,詳見(jiàn)代碼,一種是占位符,還一種是format,但是format直觀很多。如果數(shù)據(jù)類型不同一,那么占位符要多很多代碼,而且很容易出錯(cuò)。
3,可以在爬取的同時(shí)直接插入數(shù)據(jù)庫(kù)。思路更直觀。
打完收工。