1000+常用Python庫(kù)大全,太實(shí)用了?。?)

這次給大家總結(jié)整理了1000+常用Python庫(kù),主要分為以下部分??文本處理、文件處理、圖像處理、游戲和多媒體、大數(shù)據(jù)和科學(xué)計(jì)算、人工智能和機(jī)器學(xué)習(xí)、系統(tǒng)與命令行、數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)、web框架、安全、封裝、代碼調(diào)試
01
文本處理
Chardet字符編碼探測(cè)器,可以自動(dòng)檢測(cè)文本、網(wǎng)頁(yè)、xml的編碼。
colorama主要用來(lái)給文本添加各種顏色,并且非常簡(jiǎn)單易用。
Prettytable主要用于在終端或?yàn)g覽器端構(gòu)建格式化的輸出。
difflib,[Python]標(biāo)準(zhǔn)庫(kù),計(jì)算文本差異Levenshtein,快速計(jì)算字符串相似度。
fuzzywuzzy,字符串模糊匹配。
esmre,正則表達(dá)式的加速器。
shortuuid,一組簡(jiǎn)潔URL/UUID函數(shù)庫(kù)。
ftfy,Unicode文本工具7unidecode,ascii和Unicode文本轉(zhuǎn)換函數(shù)。
xpinyin,將漢字轉(zhuǎn)換為拼音的函數(shù)庫(kù)pangu.py,調(diào)整對(duì)中日韓文字當(dāng)中的字母、數(shù)字間距。pyfiglet,Python寫(xiě)的figlet程序,使用字符組成ASCII藝術(shù)圖片uniout,提取字符串中可讀寫(xiě)的字符awesome slugify,一個(gè)Python slugify庫(kù),用于處理Unicode。
python-slugify,轉(zhuǎn)換Unicode為ASCII內(nèi)碼的slugify函數(shù)庫(kù)。
unicode-slugify,生成unicode內(nèi)碼,Django的依賴包。
ply,Python版的lex和yacc的解析工具phonenumbers,解析電話號(hào)碼,格式,存儲(chǔ)和驗(yàn)證的國(guó)際電話號(hào)碼。
python-user-agents,瀏覽器的用戶代理(user-agents)的解析器。
sqlparse,SQL解析器。pygments,一個(gè)通用的語(yǔ)法高亮工具。
python-nameparser,解析人名,分解為單獨(dú)的成分。
pyparsing,通用解析器生成框架。
tablib,表格數(shù)據(jù)格式,包括,XLS、CSV,JSON,YAML。
python-docx,docx文檔讀取,查詢和修改,微軟Word 2007 / 2008的docx文件。
xlwt/xlrd,讀寫(xiě)Excel格式的數(shù)據(jù)文件。
xlsxwriter,創(chuàng)建Excel格式的xlsx文件。
xlwings,利用Python調(diào)用Excelcsvkit,CSV文件工具包。
marmir,把Python[數(shù)據(jù)結(jié)構(gòu)],轉(zhuǎn)化為電子表格。
pdfminer,從PDF文件中提取信息。
pypdf2, 合并和轉(zhuǎn)換PDF頁(yè)面的函數(shù)庫(kù)。
Python-Markdown,輕量級(jí)標(biāo)記語(yǔ)言Markdown的Python實(shí)現(xiàn)。
Mistune,,快速、全功能的純Python編寫(xiě)的Markdown解釋器。
dateutil,標(biāo)準(zhǔn)的Python官方datetime模塊的擴(kuò)展包,字符串日期工具,其中parser是根據(jù)字符串解析成datetime,而rrule是則是根據(jù)定義的規(guī)則來(lái)生成datetime。
arrow,更好的日期和時(shí)間處理Python庫(kù)chronyk,一個(gè)Python 3版函數(shù)庫(kù),用于解析人寫(xiě)的時(shí)間和日期。
delorean,清理期時(shí)間的函數(shù)庫(kù)。
when.py,為見(jiàn)的日期和時(shí)間,提供人性化的功能。
moment,類似Moment.js的日期/時(shí)間Python庫(kù)pytz,世界時(shí)區(qū),使用tz database時(shí)區(qū)信息[數(shù)據(jù)庫(kù)]BeautifulSoup,基于Python的HTML/XML解析器,簡(jiǎn)單易用, 功能很強(qiáng)大,即使是有bug,有問(wèn)題的html代碼,也可以解析lxml,快速,易用、靈活的HTML和XML處理庫(kù),功能超強(qiáng),在遇到有缺陷、不規(guī)范的xml時(shí),Python自帶的xml處理器可能無(wú)法解析。報(bào)錯(cuò)時(shí),程序會(huì)嘗試再用lxml的修復(fù)模式解析。
htmlparser,官方版解析HTML DOM樹(shù),偶爾搞搞命令行自動(dòng)表單提交用得上。
pyyaml,Python版本的YAML解釋器。html5lib,-標(biāo)準(zhǔn)庫(kù),解析和序列化HTML文檔和片段。
pyquery,類似[jQuery]的的HTML解釋器函數(shù)庫(kù)。
cssutils,Python CSS庫(kù)。
MarkupSafe,XML或HTML / XHTML安全字符串標(biāo)記工具。
cssutils - ACSS library for Python., MarkupSafe - Implements a XML/HTML/XHTMLbleach,漂白,基于HTML的白名單函數(shù)庫(kù)。
xmltodict,類似JSON的XML工具包。
xhtml2pdf,HTML / CSS格式轉(zhuǎn)換器,看生成pdf文檔。
untangle,把XML文檔,轉(zhuǎn)換為Python對(duì)象,方便訪問(wèn)。
02
文件處理
Mimetypes,Python標(biāo)準(zhǔn)庫(kù),映射文件名到MIME類型。
imghdr,Python標(biāo)準(zhǔn)庫(kù),確定圖像類型。
python-magic,libmagic文件類型識(shí)別庫(kù),Python接口格式。path.py,os.path模塊的二次封裝。
watchdog,一組API和shell實(shí)用程序,用于監(jiān)視文件系統(tǒng)事件。
Unipath,面向?qū)ο蟮奈募?目錄的操作工具包。pathlib,-(Python 3.4版已經(jīng)作為Python標(biāo)準(zhǔn)庫(kù)),一個(gè)跨平臺(tái),面向path的函數(shù)庫(kù)。
pickle/cPickle,python的pickle模塊實(shí)現(xiàn)了基本的數(shù)據(jù)序列和反序列化。通過(guò)pickle模塊的序列化操作我們能夠?qū)⒊绦蛑羞\(yùn)行的對(duì)象信息保存到文件中去,永久存儲(chǔ);通過(guò)pickle模塊的反序列化操作,我們能夠從文件中創(chuàng)建上一次程序保存的對(duì)象。
cPickle是[C語(yǔ)言]實(shí)現(xiàn)的版本,速度更快。
ConfigParser,Python標(biāo)準(zhǔn)庫(kù),INI文件解析器。
configobj,INI文件解析器。
config,分層次配置,logging作者編寫(xiě)。profig,多格式配置轉(zhuǎn)換工具。
logging,Python標(biāo)準(zhǔn)庫(kù),日志文件生成管理函數(shù)庫(kù)。logbook,logging的替換品。
Sentry,實(shí)時(shí)log服務(wù)器。Raven,哨兵Sentry的Python客戶端。
Sphinx,斯芬克斯(獅身人面像),Python文檔生成器。
reStructuredText,標(biāo)記語(yǔ)法和解析工具,Docutils組件。mkdocs,Markdown格式文檔生成器。
pycco,簡(jiǎn)單快速、編程風(fēng)格的文檔生成器。
pdoc,自動(dòng)生成的Python庫(kù)API文檔epydoc,從源碼注釋中生成各種格式文檔的工具
03
圖像處理
PIL(Python Image Library),基于Python的圖像處理庫(kù),功能強(qiáng)大,對(duì)圖形文件的格式支持廣泛,內(nèi)置許多圖像處理函數(shù),如圖像增強(qiáng)、濾波[算法]等Pillow,圖像處理庫(kù),PIL圖像庫(kù)的分支和升級(jí)替代產(chǎn)品。
Matplotlib,著名的繪圖庫(kù),提供了整套和matlab相似的命令A(yù)PI,用以繪制一些高質(zhì)量的數(shù)學(xué)二維圖形,十分適合交互式地進(jìn)行制圖。
brewer2mpl,有一個(gè)專業(yè)的python配色工具包,提供了從美術(shù)角度來(lái)講的精美配色。
PyGame基于Python的多媒體開(kāi)發(fā)和游戲軟件開(kāi)發(fā)模塊,包含大量游戲和圖像處理功能
Box2d,開(kāi)源的2d物理引擎,憤怒的小鳥(niǎo)就是使用了這款物理引擎進(jìn)行開(kāi)發(fā)的,Box2d物理引擎內(nèi)部模擬了一個(gè)世界,你可以設(shè)置這個(gè)世界里的重力,然后往這個(gè)世界里添加各種物體,以及他們的一些物理特性,比如質(zhì)量,摩擦,阻尼等等。
Pymunk,類似box2d的開(kāi)源物理圖形模擬庫(kù)OpenCV, 目前最好的開(kāi)源圖像/視覺(jué)庫(kù),包括圖像處理和計(jì)算機(jī)視覺(jué)方面、[機(jī)器學(xué)習(xí)]的很多通用算法。
SimpleCV,計(jì)算機(jī)視覺(jué)開(kāi)源框架,類似opencv。
VTK,視覺(jué)化工具函式庫(kù)(VTK, Visualization Toolkit)是一個(gè)開(kāi)放源碼,跨平臺(tái)、支援平行處理(VTK曾用于處理大小近乎1個(gè)Petabyte的資料,其平臺(tái)為美國(guó)Los Alamos國(guó)家實(shí)驗(yàn)室所有的具1024個(gè)處理器之大型系統(tǒng))的圖形應(yīng)用函式庫(kù)。2005年時(shí)曾被美國(guó)陸軍研究實(shí)驗(yàn)室用于即時(shí)模擬俄羅斯制反導(dǎo)彈戰(zhàn)車ZSU23-4受到平面波攻擊的情形,其計(jì)算節(jié)點(diǎn)高達(dá)2.5兆個(gè)之多。
cgkit,Python Computer Graphics Kit,其module 主要分兩個(gè)部分,
1、與3d相關(guān)的一些python module 例如the vector, matrix and quaternion types, the RenderMan bindings, noise functions 這些模塊可以在maya houdini nuke blender 等有Python擴(kuò)展的程序中直接用;
2、提供完整的場(chǎng)景操作的module, 他類似其他三維軟件,在內(nèi)存中保留完整的描述場(chǎng)景的信息。
不能直接用于maya 等CGAL,Computational Geometry Algorithms Library,計(jì)算幾何算法庫(kù),提供計(jì)算幾何相關(guān)的數(shù)據(jù)結(jié)構(gòu)和算法,諸如三角剖分(2D約束三角剖分及二維和三維Delaunay三角剖分),Voronoi圖(二維和三維的點(diǎn),2D加權(quán)Voronoi圖,分割Voronoi圖等),多邊形(布爾操作,偏置),多面體(布爾運(yùn)算),曲線整理及其應(yīng)用,網(wǎng)格生成(二維Delaunay網(wǎng)格生成和三維表面和體積網(wǎng)格生成等),幾何處理(表面網(wǎng)格簡(jiǎn)化,細(xì)分和參數(shù)化等),凸殼算法(2D,3D和dD),搜索結(jié)構(gòu)(近鄰搜索,kd樹(shù)等),插值,形狀分析,擬合,距離等。
Aggdraw,開(kāi)源圖像庫(kù),幾乎涵蓋了2d image操作的所有功能,使用起來(lái)非常靈活Pycairo,開(kāi)源矢量繪圖庫(kù)Cairo開(kāi)羅的python接口,cairo提供在多個(gè)背景下做2-D的繪圖,高級(jí)的更可以使用硬件加速功能。
wand,Python綁定魔杖工具(MagickWand),C語(yǔ)言API接口。
thumbor, -智能成像工具,可調(diào)整大小和翻轉(zhuǎn)圖像。
imgSeek,查詢相似的圖像。python-qrcode,純Python的二維碼(QR碼)生成器。
pyBarcode,創(chuàng)建條碼,無(wú)需PIL模塊。pygram,Instagram像圖像過(guò)濾器。
Quads,基于四叉樹(shù)的計(jì)算機(jī)藝術(shù)。
nude.py,裸體檢測(cè)函數(shù)。
scikit-image,scikit工具箱的圖像處理庫(kù)。hmap,圖像直方圖工具。
bokeh,交互的Web繪圖。
plotly,Web協(xié)同的Python和Matplotlib繪制。
vincent,文森特,Python Vega的函數(shù)庫(kù)。
d3py,Python繪圖庫(kù),基于D3.JS, ggplot -API兼容R語(yǔ)言的ggplot2.Kartograph.py,在Python繪制漂亮的SVG地圖。
pygal, SVG圖表的創(chuàng)造者。
pygraphviz,Graphviz的Python接口。
Fonttlools,ttf字體工具函數(shù)包,用于fontforge、ttx等字體軟件。
04
游戲和多媒體
audiolazy,數(shù)字信號(hào)處理(DSP)的Python工具包。
audioread,跨平臺(tái)(GStreamer + Core Audio + MAD + FFmpeg)音頻解碼庫(kù)。beets,音樂(lè)庫(kù)管理。
dejavu,音頻指紋識(shí)別算法。
Dejavu 聽(tīng)一次音頻后就會(huì)記錄該音頻的指紋信息,然后可通過(guò)麥克風(fēng)對(duì)輸入的音頻進(jìn)行識(shí)別是否同一首歌。
django-elastic-transcoder,Django +亞馬遜elastic轉(zhuǎn)碼。
eyeD3,音頻文件工具,特別是MP3文件包含的ID3元數(shù)據(jù)。
id3reader,用于讀取MP3的元數(shù)據(jù)。
mutagen,處理音頻元數(shù)據(jù)。
pydub,-操縱音頻和簡(jiǎn)單的高層次的接口。
pyechonest,Echo Nest API客戶端。
talkbox,語(yǔ)音和信號(hào)處理的Python庫(kù)。
TimeSide,開(kāi)放的網(wǎng)絡(luò)音頻處理框架。
tinytag,讀取音樂(lè)文件元數(shù)據(jù),包括的MP3,OGG,F(xiàn)LAC和wave文件。m3u8,用于解析m3u8文件。
moviepy,多格式視頻編輯腳本模塊,包括GIF動(dòng)畫(huà)。shorten.tv,視頻摘要。
scikit視頻,SciPy視頻處理例程。
GeoDjango,一個(gè)世界級(jí)的地理Web框架。geopy,Geo地理編碼的工具箱。
pygeoip,純Python寫(xiě)的GeoIP API。GeoIP,Python API接口,使用高精度GeoIP Legacy Database數(shù)據(jù)庫(kù)。
geojson,GeoJSON函數(shù)庫(kù)django-countries,一個(gè)Django程序,提供國(guó)家選擇,國(guó)旗圖標(biāo)的靜態(tài)文件,和一個(gè)國(guó)家的地域模型。
Pygame,Python游戲設(shè)計(jì)模塊。
Cocos2d,2D游戲框架,演示,和其他的圖形/交互應(yīng)用,基于pyglet。
Cocos2d- cocos2d is a framework for building 2D games, demos, and other graphical/interactive applications. It is based on pyglet.,PySDL2,SDL2的封裝庫(kù)。
Panda3D- 3D游戲引擎,迪士尼開(kāi)發(fā)。用C++寫(xiě)的,完全兼容Python。
PyOgre,OGRE 3D渲染引擎,可用于游戲,模擬,任何3D。
PyOpenGL,綁定OpenGL和它相關(guān)的API。PySFML,Python綁定SFMLRenPy,視覺(jué)小說(shuō)引擎。
05
大數(shù)據(jù)與科學(xué)計(jì)算
pycuda/opencl,GPU高性能并發(fā)計(jì)算Pandas,python實(shí)現(xiàn)的類似R語(yǔ)言的數(shù)據(jù)統(tǒng)計(jì)、分析平臺(tái)。基于NumPy和Matplotlib開(kāi)發(fā)的,主要用于數(shù)據(jù)分析和數(shù)據(jù)可視化,它的數(shù)據(jù)結(jié)構(gòu)DataFrame和R語(yǔ)言里的data.frame很像,特別是對(duì)于時(shí)間序列數(shù)據(jù)有自己的一套分析機(jī)制,非常不錯(cuò)。Open Mining,商業(yè)智能(BI),Pandas的Web界面。
blaze,NumPy和Pandas大數(shù)據(jù)界面。
SciPy,開(kāi)源的Python算法庫(kù)和數(shù)學(xué)工具包,SciPy包含的模塊有最優(yōu)化、線性代數(shù)、積分、插值、特殊函數(shù)、快速傅里葉變換、信號(hào)處理和圖像處理、常微分方程求解和其他科學(xué)與工程中常用的計(jì)算。其功能與軟件MATLAB、Scilab和GNU Octave類似。
Numpy和Scipy常常結(jié)合著使用,Python大多數(shù)機(jī)器學(xué)習(xí)庫(kù)都依賴于這兩個(gè)模塊。
ScientificPython,一組經(jīng)過(guò)挑選的Python程序模塊,用于科學(xué)計(jì)算,包括幾何學(xué)(矢量、張量、變換、矢量和張量場(chǎng)),四元數(shù),自動(dòng)求導(dǎo)數(shù),(線性)插值,多項(xiàng)式,基礎(chǔ)統(tǒng)計(jì)學(xué),非線性最小二乘擬合,單位計(jì)算,F(xiàn)ortran兼容的文本格式,通過(guò)VRML的3D顯示,以及兩個(gè)Tk小工具,分別用于繪制線圖和3D網(wǎng)格模型。此外還具有到netCDF,MPI和BSPlib庫(kù)的接口。NumPy科學(xué)計(jì)算庫(kù),提供了矩陣,線性代數(shù),傅立葉變換等等的解決方案, 最常用的是它的N維數(shù)組對(duì)象. NumPy提供了兩種基本的對(duì)象:ndarray(N-dimensional array object)和 ufunc(universal function object)。
ndarray是存儲(chǔ)單一數(shù)據(jù)類型的多維數(shù)組,而ufunc則是能夠?qū)?shù)組進(jìn)行處理的函數(shù)。Cvxopt,最優(yōu)化計(jì)算包,可進(jìn)行線性規(guī)劃、二次規(guī)劃、半正定規(guī)劃等的計(jì)算。
Numba,科學(xué)計(jì)算速度優(yōu)化編譯器。
pymvpa2,是為大數(shù)據(jù)集提供統(tǒng)計(jì)學(xué)習(xí)分析的Python工具包,它提供了一個(gè)靈活可擴(kuò)展的框架。它提供的功能有分類、回歸、特征選擇、數(shù)據(jù)導(dǎo)入導(dǎo)出、可視化等NetworkX,復(fù)雜網(wǎng)絡(luò)的優(yōu)化軟件包。
zipline,交易算法的函數(shù)庫(kù)。PyDy, Python動(dòng)態(tài)建模函數(shù)庫(kù)。
SymPy,符號(hào)數(shù)學(xué)的Python庫(kù)。statsmodels,Python的統(tǒng)計(jì)建模和計(jì)量經(jīng)濟(jì)學(xué)。
astropy,天文學(xué)界的Python庫(kù)。
orange,橙色,數(shù)據(jù)挖掘,數(shù)據(jù)可視化,通過(guò)可視化編程或Python腳本學(xué)習(xí)機(jī)分析。RDKit,化學(xué)信息學(xué)和機(jī)器學(xué)習(xí)的軟件。
Open Babel,巴貝爾,開(kāi)放的化學(xué)工具箱。cclib,化學(xué)軟件包的計(jì)算函數(shù)庫(kù)。
Biopython,免費(fèi)的生物計(jì)算工具包。
bccb,生物分析相關(guān)的代碼集。bcbio-nextgen,提供完全自動(dòng)化、高通量、測(cè)序分析的工具包。
visvis, 可視化計(jì)算模塊庫(kù),可進(jìn)行一維到四維數(shù)據(jù)的可視化。
MapReduce是Google提出的一個(gè)軟件[架構(gòu)],用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運(yùn)算。概念“Map(映射)”和“Reduce(歸納)”,及他們的主要思想,都是從函數(shù)式編程語(yǔ)言借來(lái)的MapReduce函數(shù)庫(kù)。
Framworks and libraries for MapReduce.,PySpark,[Spark]的Python API。
dpark,Spark的Python克隆,Python中的MapReduce框架。
luigi,為批量工作,建立復(fù)雜的管道。
mrjob,運(yùn)行在[Hadoop],或亞馬遜網(wǎng)絡(luò)服務(wù)的,MapReduce工作。
06
人工智能與機(jī)器學(xué)習(xí)
NLTK(natural language toolkit),是python的自然語(yǔ)言處理工具包。2001年推出,包括了大量的詞料庫(kù),以及自然語(yǔ)言處理方面的算法實(shí)現(xiàn):分詞, 詞根計(jì)算, 分類, 語(yǔ)義分析等。Pattern,數(shù)據(jù)挖掘模塊,包括自然語(yǔ)言處理,機(jī)器學(xué)習(xí)工具,等等。
textblob,提供API為自然語(yǔ)言處理、分解NLP任務(wù)?;贜LTK和Pattern模塊。
jieba,結(jié)巴,中文分詞工具。snownlp,用于處理中文文本庫(kù)。
loso,中文分詞函數(shù)庫(kù)。
genius,中文CRF基礎(chǔ)庫(kù),條件隨機(jī)場(chǎng)(conditional random field,簡(jiǎn)稱 CRF),是一種鑒別式機(jī)率模型,是隨機(jī)場(chǎng)的一種,常用于標(biāo)注或分析序列資料,如自然語(yǔ)言文字或是生物序列Gensim,一個(gè)相當(dāng)專業(yè)的主題模型Python工具包,無(wú)論是代碼還是文檔,可用于如何計(jì)算兩個(gè)文檔的相似度LIBSVM,是臺(tái)灣大學(xué)林智仁(Lin Chih-Jen)教授等開(kāi)發(fā)設(shè)計(jì)的一個(gè)簡(jiǎn)單、易于使用和快速有效的SVM模式識(shí)別與回歸的軟件包,他不但提供了編譯好的可在Windows系列系統(tǒng)的執(zhí)行文件,還提供了源代碼,方便改進(jìn)、修改以及在其它[操作系統(tǒng)]上應(yīng)用;該軟件對(duì)SVM所涉及的參數(shù)調(diào)節(jié)相對(duì)比較少,提供了很多的默認(rèn)參數(shù),利用這些默認(rèn)參數(shù)可以解決很多問(wèn)題;并提供了交互檢驗(yàn)(Cross Validation)的功能。該軟件可以解決C-SVM、ν-SVM、ε-SVR和ν-SVR等問(wèn)題,包括基于一對(duì)一算法的多類模式識(shí)別問(wèn)題。
scikits.learn,構(gòu)建在SciPy之上用于機(jī)器學(xué)習(xí)的 Python 模塊。它包括簡(jiǎn)單而高效的工具,可用于數(shù)據(jù)挖掘和數(shù)據(jù)分析。涵蓋分類,回歸和聚類算法,例如SVM, 邏輯回歸,樸素貝葉斯,隨機(jī)森林,k-means等算法,代碼和文檔都非常不錯(cuò),在許多Python項(xiàng)目中都有應(yīng)用。例如在我們熟悉的NLTK中,分類器方面就有專門(mén)針對(duì)scikit-learn的接口,可以調(diào)用scikit-learn的分類算法以及訓(xùn)練數(shù)據(jù)來(lái)訓(xùn)練分類器模型。
PyMC,機(jī)器學(xué)習(xí)采樣工具包,scikit-learn似乎是所有人的寵兒,有人認(rèn)為,PyMC更有魅力。PyMC主要用來(lái)做Bayesian分析。
Orange,基于組件的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)軟件套裝,它的功能即友好,又很強(qiáng)大,快速而又多功能的可視化編程前端,以便瀏覽數(shù)據(jù)分析和可視化,包含了完整的一系列的組件以進(jìn)行數(shù)據(jù)預(yù)處理,并提供了數(shù)據(jù)帳目,過(guò)渡,建模,模式評(píng)估和勘探的功能。側(cè)重?cái)?shù)據(jù)挖掘,可以用可視化語(yǔ)言或Python進(jìn)行操作,擁有機(jī)器學(xué)習(xí)組件,還具有生物信息學(xué)以及文本挖掘的插件。
Milk,機(jī)器學(xué)習(xí)工具箱,其重點(diǎn)是提供監(jiān)督分類法與幾種有效的分類分析:SVMs(基于libsvm),K-NN,隨機(jī)森林經(jīng)濟(jì)和決策樹(shù)。它還可以進(jìn)行特征選擇。這些分類可以在許多方面相結(jié)合,形成不同的分類系統(tǒng)。對(duì)于無(wú)監(jiān)督學(xué)習(xí),它提供K-means和affinity propagation聚類算法。PyMVPA(Multivariate Pattern Analysis in Python),是為大數(shù)據(jù)集提供統(tǒng)計(jì)學(xué)習(xí)分析的Python工具包,它提供了一個(gè)靈活可擴(kuò)展的框架。它提供的功能有分類、回歸、特征選擇、數(shù)據(jù)導(dǎo)入導(dǎo)出、可視化等NuPIC,開(kāi)源人工智能平臺(tái)。
該項(xiàng)目由Grok(原名 Numenta)公司開(kāi)發(fā),其中包括了公司的算法和軟件架構(gòu)。NuPIC 的運(yùn)作接近于人腦,“當(dāng)模式變化的時(shí)候,它會(huì)忘掉舊模式,記憶新模式”。如人腦一樣,CLA 算法能夠適應(yīng)新的變化。
Pylearn2,-基于Theano的機(jī)器學(xué)習(xí)庫(kù)。
hebel,GPU加速,[深度學(xué)習(xí)]Python庫(kù)。
gensim,機(jī)器學(xué)習(xí)庫(kù)。pybrain,機(jī)器學(xué)習(xí)模塊,它的目標(biāo)是為機(jī)器學(xué)習(xí)任務(wù)提供靈活、易應(yīng)、強(qiáng)大的機(jī)器學(xué)習(xí)算法。pybrain包括神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)(及二者結(jié)合)、無(wú)監(jiān)督學(xué)習(xí)、進(jìn)化算法。以神經(jīng)網(wǎng)絡(luò)為核心,所有的訓(xùn)練方法都以神經(jīng)網(wǎng)絡(luò)為一個(gè)實(shí)例Mahout,是 Apache Software Foundation(ASF) 旗下的一個(gè)開(kāi)源項(xiàng)目,提供一些可擴(kuò)展的機(jī)器學(xué)習(xí)領(lǐng)域經(jīng)典算法的實(shí)現(xiàn),旨在幫助開(kāi)發(fā)人員更加方便快捷地創(chuàng)建智能應(yīng)用程序。
Mahout包含許多實(shí)現(xiàn),包括聚類、分類、推薦過(guò)濾、頻繁子項(xiàng)挖掘。此外,通過(guò)使用 Apache Hadoop 庫(kù),Mahout 可以有效地?cái)U(kuò)展到云中。
Crab,靈活的,快速的推薦引擎。python-recsys,娛樂(lè)系統(tǒng)分析,推薦系統(tǒng)。vowpal_porpoise,Vowpal Wabbit輕量級(jí)Python封裝。
Theano,用來(lái)定義、優(yōu)化和模擬數(shù)學(xué)表達(dá)式計(jì)算,用于高效的解決多維數(shù)組的計(jì)算問(wèn)題的python軟件包。它使得寫(xiě)深度學(xué)習(xí)模型更加容易,同時(shí)也給出了一些關(guān)于在GPU上訓(xùn)練它們的選項(xiàng)。
更多數(shù)據(jù)分析內(nèi)容
掃描二維碼即可了解
