Python數(shù)據(jù)分析入門(一):搭建環(huán)境

Python版本:
本課程用到的Python版本都是3.x。要有一定的Python基礎(chǔ),知道列表、字符串、函數(shù)等的用法。
Anaconda:
Anaconda(水蟒)是一個(gè)捆綁了Python、conda、其他相關(guān)依賴包的一個(gè)軟件。包含了180多個(gè)可學(xué)計(jì)算包及其依賴。Anaconda3是集成了Python3的環(huán)境,Anaconda2是集成了Python2的環(huán)境。Anaconda默認(rèn)集成的包,是屬于內(nèi)置的Python的包。并且支持絕大部分操作系統(tǒng)(比如:Windows、Mac、Linux等)。下載地址如下:https://www.anaconda.com/distribution/(如果官網(wǎng)下載太慢,可以在清華大學(xué)開源軟件站中下載:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/)。根據(jù)自己的操作系統(tǒng),下載相應(yīng)的版本,因?yàn)锳naconda內(nèi)置了許多的包,所以安裝過程需要耗費(fèi)相當(dāng)長(zhǎng)的時(shí)間,大家在安裝的時(shí)候需要耐心等待。在安裝完成后,會(huì)有以下幾個(gè)模塊:Anaconda prompt、Anaconda Navigator、Spyder、jupyter notebook,以下分別做一些介紹。
Anaconda prompt:
Anaconda prompt是專門用來操作anaconda的終端。如果你安裝完Anaconda后沒有在環(huán)境變量的PATH中添加相關(guān)的環(huán)境變量,那么以后你想在終端使用anaconda相關(guān)的命令,則必須要在Anaconda prompt中完成。

Anaconda Navigator:
這個(gè)相當(dāng)于是一個(gè)導(dǎo)航面板,上面組織了Anaconda相關(guān)的軟件。
Spyder:
一個(gè)專門開發(fā)Python的軟件,熟悉MATLAB的同學(xué)會(huì)比較有親切感,但在后期的學(xué)習(xí)過程中,我們將不會(huì)使用這個(gè)工具寫代碼,因?yàn)檫€有更好的可替代的工具。

jupyter notebook:
一個(gè)Python編輯環(huán)境,可以實(shí)時(shí)的查看代碼的運(yùn)行效果。

使用jupyter notebook的姿勢(shì):
先打開Anaconda Prompt,然后進(jìn)入到項(xiàng)目所在的目錄。
輸入命令jupyter notebook打開jupyter notebook瀏覽器。
conda基本使用:
conda伴隨著Anaconda安裝而自動(dòng)安裝的。conda可以跟virtualenv一樣管理不同的環(huán)境,也可以跟pip一樣管理某個(gè)環(huán)境下的包。以下來看看兩個(gè)功能的用法。
環(huán)境管理:
conda能跟virtualenv一樣管理不同的Python環(huán)境,不同的環(huán)境之間是互相隔離,互不影響的。為什么需要?jiǎng)?chuàng)建不同的環(huán)境呢?原因是有時(shí)候項(xiàng)目比較多,但是項(xiàng)目依賴的包不一樣,比如A項(xiàng)目用的是Python2開發(fā)的,而B項(xiàng)目用的是Python3開發(fā)的,那么我們?cè)谕慌_(tái)電腦上就需要兩套不同的環(huán)境來支撐他們運(yùn)行了。創(chuàng)建環(huán)境的基本命令如下:
這樣將創(chuàng)建一個(gè)叫做da-env的環(huán)境,這個(gè)環(huán)境的python解釋器根據(jù)anaconda來,如果anaconda為3.7,那么將默認(rèn)使用3.7的環(huán)境,如果anaconda內(nèi)置的是2.7,那么將默認(rèn)使用2.7的環(huán)境。然后你就可以使用conda install numpy的方式來安裝包了,并且這樣安裝進(jìn)來的包,只會(huì)安裝在當(dāng)前環(huán)境中。有的同學(xué)可能有想問,如果想要裝一個(gè)Python2.7的環(huán)境,anaconda中沒有內(nèi)置Python2.7,那么該怎么實(shí)現(xiàn)呢?。實(shí)際上,我們只需要在安裝的時(shí)候指定python的版本,如果這個(gè)版本現(xiàn)在不存在,那么anaconda會(huì)自動(dòng)的給我們下載。所以安裝Python2.7的環(huán)境,使用以下代碼即可實(shí)現(xiàn):
以下再列出conda管理環(huán)境的其他命令:
創(chuàng)建的時(shí)候指定需要安裝的包:
創(chuàng)建的時(shí)候既需要指定包,也需要指定python環(huán)境:
進(jìn)入到某個(gè)環(huán)境
退出環(huán)境:
列出當(dāng)前所有的環(huán)境:
移除某個(gè)環(huán)境:
環(huán)境下的包導(dǎo)出和導(dǎo)入:
導(dǎo)出:conda env export > environment.yml。
導(dǎo)入:conda env create --name xxx -f environment.yml。
包管理:
conda也可以用來管理包。比如我們創(chuàng)建完一個(gè)新的環(huán)境后,想要在這個(gè)環(huán)境中安裝包(比如numpy),那么可以通過以下代碼來實(shí)現(xiàn):
以下再介紹一些包管理常用的命令:
在不進(jìn)入某個(gè)環(huán)境下直接給這個(gè)環(huán)境安裝包:
列出該環(huán)境下所有的包:
卸載某個(gè)包:
設(shè)置安裝包的源: