最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

Python數(shù)據(jù)分析與可視化案例實(shí)戰(zhàn)

2023-07-28 21:11 作者:劉姥姥看人間  | 我要投稿

鏈接:https://pan.baidu.com/s/1RtNAEU1MBQ-hIaZHAbTWQQ?pwd=2hc1?

提取碼:2hc1

使用Python進(jìn)行數(shù)據(jù)分析與可視化十分便利且高效,因此Python被認(rèn)為是優(yōu)秀的數(shù)據(jù)分析工具之一。本書(shū)以22個(gè)案例,由淺入深地介紹不同數(shù)據(jù)分析與可視化的應(yīng)用和實(shí)現(xiàn)。僅通過(guò)這些案例并不能展示數(shù)據(jù)分析與可視化的全部精髓,而更多的應(yīng)用也值得讀者在學(xué)到一定的基礎(chǔ)技能后進(jìn)一步探索。


本書(shū)面向高等院校計(jì)算機(jī)科學(xué)、軟件工程、大數(shù)據(jù)、人工智能等相關(guān)專(zhuān)業(yè)的師生,以及Python語(yǔ)言初學(xué)者和數(shù)據(jù)分析從業(yè)人士。


目錄

第1章Python數(shù)據(jù)分析與可視化概述


1.1從MATLAB到Python


1.2NumPy


1.3Pandas


1.4Matplotlib


1.5SciPy與SymPy


第2章新生數(shù)據(jù)分析與可視化


2.1使用Pandas對(duì)數(shù)據(jù)預(yù)處理


2.2使用Matplotlib庫(kù)畫(huà)圖


2.3使用Pandas進(jìn)行繪圖


第3章Python表格處理分析


3.1背景介紹


3.2前期準(zhǔn)備與基本操作


3.2.1基本術(shù)語(yǔ)概念說(shuō)明


3.2.2安裝openpyxl并創(chuàng)建一個(gè)工作簿


3.2.3從Excel工作簿中讀取數(shù)據(jù)


3.2.4迭代訪(fǎng)問(wèn)數(shù)據(jù)


3.2.5插入數(shù)據(jù)


3.3進(jìn)階內(nèi)容


3.3.1為Excel表單添加公式


3.3.2為表單添加條件格式


3.3.3為Excel表單添加圖表


3.4數(shù)據(jù)分析實(shí)例


3.4.1背景與前期準(zhǔn)備


3.4.2使用openpyxl讀取數(shù)據(jù)并轉(zhuǎn)為DataFrame


3.4.3繪制數(shù)值列直方圖


3.4.4繪制相關(guān)性矩陣


3.4.5繪制散布矩陣


3.4.6將可視化結(jié)果插入Excel表格


第4章美國(guó)加利福尼亞州房?jī)r(jià)預(yù)測(cè)的數(shù)據(jù)分析


4.1數(shù)據(jù)的讀入和初步分析


4.1.1數(shù)據(jù)讀入


4.1.2分割測(cè)試集與訓(xùn)練集


4.1.3數(shù)據(jù)的初步分析


4.2數(shù)據(jù)的預(yù)處理


4.2.1拆分?jǐn)?shù)據(jù)


4.2.2空白值的填充


4.2.3數(shù)據(jù)標(biāo)準(zhǔn)化


4.2.4數(shù)據(jù)的流程化處理


4.3模型的構(gòu)建


4.3.1查看不同模型的表現(xiàn)


4.3.2選擇效果最好的模型進(jìn)行預(yù)測(cè)








第5章影評(píng)數(shù)據(jù)分析與電影推薦


5.1明確目標(biāo)與準(zhǔn)備數(shù)據(jù)


5.2工具選擇


5.3初步分析


5.3.1用戶(hù)角度分析


5.3.2電影角度分析


5.4電影推薦


第6章醫(yī)療花費(fèi)預(yù)測(cè)


6.1數(shù)據(jù)讀取


6.2數(shù)據(jù)預(yù)處理


6.2.1字符串類(lèi)型的轉(zhuǎn)換


6.2.2數(shù)據(jù)的分布和映射


6.3數(shù)據(jù)分析


6.3.1協(xié)方差矩陣和熱力圖


6.3.2DBSCAN聚類(lèi)算法


6.3.3支持向量機(jī)分類(lèi)算法


6.4線(xiàn)性回歸


6.5結(jié)果預(yù)測(cè)


6.6結(jié)果分析


第7章用戶(hù)消費(fèi)行為分析


7.1RFM模型簡(jiǎn)介


7.2數(shù)據(jù)讀入


7.3數(shù)據(jù)清洗和預(yù)處理


7.3.1數(shù)據(jù)清洗


7.3.2數(shù)據(jù)預(yù)處理


7.4RFM統(tǒng)計(jì)量計(jì)算


7.5RFM歸類(lèi)


7.6結(jié)果保存


7.7可視化結(jié)果


第8章用戶(hù)流失預(yù)警


8.1讀入數(shù)據(jù)


8.2數(shù)據(jù)預(yù)處理和自變量標(biāo)準(zhǔn)化


8.3五折交叉驗(yàn)證


8.4代入三種模型


8.5調(diào)整prob閾值,輸出精度評(píng)估


第9章在Kaggle上預(yù)測(cè)房?jī)r(jià)


9.1讀取數(shù)據(jù)集


9.2預(yù)處理數(shù)據(jù)集


9.3訓(xùn)練模型


9.4k折交叉驗(yàn)證


9.5模型選擇和調(diào)整


9.6在Kaggle上提交預(yù)測(cè)結(jié)果


第10章世界杯


10.1數(shù)據(jù)說(shuō)明


10.2世界杯觀眾


10.3世界杯冠軍


10.4世界杯參賽隊(duì)伍與比賽


10.5世界杯進(jìn)球


第11章股價(jià)預(yù)測(cè)


11.1使用Tsfresh進(jìn)行升維和特征工程


11.2程序設(shè)計(jì)思路


11.3程序設(shè)計(jì)步驟


11.3.1讀入并分析數(shù)據(jù)


11.3.2移窗


11.3.3升維


11.3.4方差過(guò)濾


11.3.5使用AdaBoostRegressor模型進(jìn)行回歸預(yù)測(cè)


11.3.6預(yù)測(cè)結(jié)果分析


第12章基于上下文感知的多模態(tài)交通推薦


12.1案例目標(biāo)


12.2數(shù)據(jù)說(shuō)明


12.2.1查詢(xún)記錄


12.2.2顯示記錄


12.2.3點(diǎn)擊記錄


12.2.4用戶(hù)記錄


12.3解決方案


12.3.1導(dǎo)入工具包和數(shù)據(jù)


12.3.2特征導(dǎo)入和數(shù)據(jù)處理


12.3.3模型訓(xùn)練與結(jié)果保存


第13章美國(guó)波士頓房?jī)r(jià)預(yù)測(cè)


13.1背景介紹


13.2數(shù)據(jù)清洗


13.3數(shù)據(jù)分析


13.4分析結(jié)果


第14章機(jī)器人最優(yōu)路徑走迷宮


14.1關(guān)鍵技術(shù)


14.1.1馬爾可夫決策過(guò)程


14.1.2Bellman方程


14.2程序設(shè)計(jì)步驟


14.2.1初始化迷宮地圖


14.2.2計(jì)算不同位置的最優(yōu)路徑


第15章基于Kmeans算法的鳶尾花數(shù)據(jù)聚類(lèi)和可視化


15.1數(shù)據(jù)及工具簡(jiǎn)介


15.1.1Iris數(shù)據(jù)集(鳶尾花數(shù)據(jù)集)


15.1.2Tkinter


15.2案例分析


15.2.1模塊引入


15.2.2布局圖形界面


15.2.3讀取數(shù)據(jù)文件


15.2.4聚類(lèi)


15.2.5聚類(lèi)結(jié)果可視化


15.2.6誤差分析及其可視化


15.2.7使用流程


第16章利用手機(jī)的購(gòu)物評(píng)論分析手機(jī)特征


16.1數(shù)據(jù)準(zhǔn)備


16.2數(shù)據(jù)分析


16.2.1模型介紹


16.2.2算法應(yīng)用


16.2.3名詞提取


16.2.4情感分析


第17章菜譜分析


17.1數(shù)據(jù)集介紹


17.2數(shù)據(jù)觀察


17.2.1數(shù)據(jù)讀入


17.2.2分布統(tǒng)計(jì)


17.3數(shù)據(jù)預(yù)處理


17.3.1英文單詞標(biāo)準(zhǔn)化


17.3.2數(shù)據(jù)向量化


17.4模型構(gòu)建


第18章基于回歸問(wèn)題和XGBoost模型的房?jī)r(jià)預(yù)測(cè)


18.1XGBoost模型介紹


18.2技術(shù)方案


18.2.1數(shù)據(jù)分析


18.2.2XGBoost模型參數(shù)


18.2.3調(diào)參過(guò)程


18.3完整代碼及結(jié)果展示


第19章基于VGG19和TensorBoard的圖像分類(lèi)和數(shù)據(jù)可視化


19.1背景概念介紹


19.1.1VGG19模型


19.1.2TensorBoard


19.1.3CIFAR10數(shù)據(jù)集


19.2網(wǎng)絡(luò)搭建與TensorBoard可視化實(shí)戰(zhàn)


19.2.1網(wǎng)絡(luò)搭建


19.2.2準(zhǔn)備數(shù)據(jù)并構(gòu)建網(wǎng)絡(luò)實(shí)例


19.2.3TensorBoard訓(xùn)練過(guò)程可視化


第20章基于Elasticsearch實(shí)現(xiàn)附近小區(qū)信息搜索


20.1Elasticsearch的簡(jiǎn)介與安裝


20.1.1Elasticsearch的簡(jiǎn)介


20.1.2Elasticsearch的安裝


20.2數(shù)據(jù)準(zhǔn)備


20.2.1網(wǎng)頁(yè)分析與信息提取


20.2.2獲取經(jīng)緯度


20.2.3數(shù)據(jù)格式轉(zhuǎn)換


20.3Python實(shí)現(xiàn)Elasticsearch基礎(chǔ)操作


20.3.1創(chuàng)建索引和插入數(shù)據(jù)


20.3.2查詢(xún)數(shù)據(jù)和數(shù)據(jù)類(lèi)型


20.3.3刪除相關(guān)操作


20.3.4檢索功能


20.4房?jī)r(jià)地理位置坐標(biāo)搜索實(shí)現(xiàn)


第21章汽車(chē)貸款違約的數(shù)據(jù)分析


21.1數(shù)據(jù)樣本分析


21.1.1數(shù)據(jù)樣本概述


21.1.2變量類(lèi)型分析


21.1.3Python代碼實(shí)踐


21.2數(shù)據(jù)的預(yù)處理


21.2.1目標(biāo)變量探索


21.2.2X變量初步探索


21.2.3連續(xù)變量的缺失值處理


21.2.4分類(lèi)變量的缺失值處理


21.3數(shù)據(jù)分析的模型建立與評(píng)估


21.3.1數(shù)據(jù)的預(yù)處理與訓(xùn)練集劃分


21.3.2采用回歸模型進(jìn)行數(shù)據(jù)分析


21.3.3采用決策樹(shù)進(jìn)行數(shù)據(jù)分析


21.3.4采用隨機(jī)森林優(yōu)化決策樹(shù)模型


第22章基于Spark的搜索引擎日志用戶(hù)行為分析


22.1功能需求


22.1.1搜索引擎用戶(hù)行為分析的意義


22.1.2搜索引擎日志概述


22.2系統(tǒng)架構(gòu)


22.2.1用戶(hù)搜索流程


22.2.2系統(tǒng)架構(gòu)設(shè)計(jì)


22.3功能實(shí)現(xiàn)


22.3.1Spark本地運(yùn)行環(huán)境搭建


22.3.2搜索引擎日志數(shù)據(jù)獲取


22.3.3分析指標(biāo)


22.3.4Spark任務(wù)提交


第23章科比職業(yè)生涯進(jìn)球分析


23.1預(yù)處理


23.2分析科比的命中率


23.3分析科比的投籃習(xí)慣


附錄APyTorch環(huán)境搭建


A.1Linux平臺(tái)下PyTorch環(huán)境搭建


A.2Windows平臺(tái)下PyTorch環(huán)境搭建



參考文獻(xiàn)


查看全部↓

前言/序言

隨著互聯(lián)網(wǎng)的飛速發(fā)展,人們?cè)诨ヂ?lián)網(wǎng)上的行為產(chǎn)生了海量數(shù)據(jù),對(duì)這些數(shù)據(jù)進(jìn)行存儲(chǔ)、處理與分析帶動(dòng)了大數(shù)據(jù)技術(shù)的發(fā)展。其中,數(shù)據(jù)挖掘和分析技術(shù)可以幫助人們從龐大的數(shù)據(jù)中找到有價(jià)值的信息和規(guī)律,使人們對(duì)世界的認(rèn)識(shí)更快、更便捷。由于Python語(yǔ)言簡(jiǎn)單易用,有強(qiáng)大的第三方庫(kù)強(qiáng),并且提供了完整的數(shù)據(jù)分析框架,因此深受數(shù)據(jù)分析人員的青睞,Python已經(jīng)當(dāng)仁不讓地成為數(shù)據(jù)分析人員的一把利器。


本書(shū)通過(guò)22個(gè)案例,系統(tǒng)地介紹數(shù)據(jù)分析和可視化的應(yīng)用和實(shí)現(xiàn),帶領(lǐng)讀者一步步掌握Python數(shù)據(jù)分析與可視化的相關(guān)知識(shí); 同時(shí),幫助讀者建立知識(shí)點(diǎn)之間的聯(lián)系,形成對(duì)數(shù)據(jù)分析與可視化的整個(gè)知識(shí)面的清晰認(rèn)知,提高讀者解決實(shí)際問(wèn)題的能力。

建議讀者在閱讀這些案例時(shí),可以跟隨介紹進(jìn)行嘗試,一定會(huì)發(fā)現(xiàn)數(shù)據(jù)分析的魅力所在。


Python數(shù)據(jù)分析與可視化案例實(shí)戰(zhàn)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
襄汾县| 民和| 东乡族自治县| 韶关市| 轮台县| 东乡族自治县| 彭泽县| 芜湖市| 峨山| 景洪市| 寿光市| 鄂伦春自治旗| 凤阳县| 新巴尔虎左旗| 泾源县| 金平| 赤水市| 宣汉县| 武汉市| 封丘县| 扎兰屯市| 肥乡县| 上饶市| 克什克腾旗| 横峰县| 新晃| 方山县| 永登县| 从化市| 贡觉县| 武鸣县| 淳安县| 武冈市| 武威市| 罗田县| 吉隆县| 万山特区| 台州市| 泰兴市| 和硕县| 襄垣县|