最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

六星源課堂:10個常用的Python機器學(xué)習(xí)庫,你知道幾個?

2022-07-08 09:47 作者:六星源課堂  | 我要投稿

今天給大家分享10個常用的Python機器學(xué)習(xí)庫,非常實用,建議收藏!

1. Awkward Array

根據(jù)官方介紹,Awkward Array用于嵌套的、大小不一的數(shù)據(jù),包括任意長度的列表、記錄、混合的類型和缺失數(shù)據(jù),使用起來類似NumPy。

看起來像是升級版的NumPy呀。

不同長度的數(shù)組可以直接放在一起運算。

并且,官方表示Awkward Array不僅使用起來更簡便,在速度和內(nèi)存上也有量級的優(yōu)勢。

看看是不是可以安排上了~

2. Jupytext

相信大家對Jupyter Notebook都不陌生。

當(dāng)你有了Jupytext這個小插件就可以將Jupyter Notebook和IDE完美結(jié)合,聽起來是不是很棒!

從此Jupyter Notebook可以被存儲為Markdown文件或多種語言的腳本文件。

Jupytext可以做的事主要有:

Jupyter Notebook的版本控制

在你喜歡的文本編輯器中編輯、合并或重構(gòu)Notebook

在Notebook上使用Q&A檢查

在Python中使用的樣子:


此項目在Github上已有5k+star。

3. Gradio

比Streamlit還輕量的UI設(shè)計庫,Gradio讓你輕松在瀏覽器中“玩轉(zhuǎn)”你的模型,可以直接在瀏覽器中拖放圖片,粘貼文字,錄制聲音,等等。

只要將launch()函數(shù)中的參數(shù)設(shè)置為share=True,還能得到一個可分享的網(wǎng)址,拿到鏈接的朋友在電腦和手機端都能打開,活脫脫就是一個小程序。

時常需要做Demo的小伙伴快看起來吧,此項目在Github上已有4.5k+star。

4. Hub

這個Hub在數(shù)據(jù)管理和數(shù)據(jù)預(yù)處理上可是一把好手。

它可以處理任何類型,任何大小的數(shù)據(jù),并且因為數(shù)據(jù)儲存在云端上,所以可以無縫在任何機器上訪問。

被壓縮為二進制字節(jié)的數(shù)據(jù)可以被存儲在任何地方,并且只有在需要的時候才會被獲取,所以沒有TB級硬盤也可以處理TB級數(shù)據(jù)。

Hub貼心地提供了重要API,支持數(shù)據(jù)在常用工具(PyTorch等)上的使用,數(shù)據(jù)版本控制,數(shù)據(jù)轉(zhuǎn)換等功能。

此項目在github上已有4.1k+star。

5. AugLy

AugLy是facebook最新推出的數(shù)據(jù)增強庫,同時支持語音,文本,圖像和視頻類型的數(shù)據(jù),包含了100多種增強方式。

數(shù)據(jù)對于模型訓(xùn)練至關(guān)重要,而標(biāo)注大規(guī)模數(shù)據(jù)十分困難。由于人力資源,和模型特性的限制,數(shù)據(jù)增強的應(yīng)用越來越廣泛。

AugLy的優(yōu)點:

處理類型更為全面。其他的數(shù)據(jù)增強庫,例如Albumentations和NVIDIA DALI,主要負責(zé)圖像相關(guān)數(shù)據(jù)的處理,文字數(shù)據(jù)不支持。

處理方式十分人性化。AugLy可以將一張圖片做成備忘錄,在圖片/視頻上疊加文字/Emojis,轉(zhuǎn)發(fā)社交媒體上的截圖,還可以幫助你處理諸如拷貝檢測、仇恨言論檢測或版權(quán)侵權(quán)等問題。

此項目在Github上已有4.1k+star。

6. Evidently

Evidently是用來監(jiān)測模型效果的工具,可從Pandas DataFrame或csv文件中生成交互式可視化報告和JSON格式的效果簡介。在Jupyter Notebook中可以使用。

目前可以提供6種報告:數(shù)據(jù)漂移、數(shù)值目標(biāo)漂移、分類目標(biāo)漂移、回歸模型性能、分類模型性能和概率分類模型性能。

此項目在Github上已有1.8k+star。

7. YOLOX

如果你熟悉YOLO的話,那你或許會對曠視今年推出的YOLOX感興趣。

YOLO就是那個目標(biāo)檢測算法,可以被使用在汽車自動駕駛等前沿技術(shù)中。

而YOLOX是YOLO的無錨版本,設(shè)計更簡單,但性能更好!它的目標(biāo)是在研究界和工業(yè)界之間架起一座橋梁,同時彌合兩方之間的差距。

這個Github上的開源項目在短短半年內(nèi)已獲得5.2k+star。

8. LightSeq

正如它的名字一樣,LightSeq是一款由字節(jié)跳動開發(fā)的支持BERT、GPT、Transformer等眾多模型的超快推理引擎。

可以看到它的表現(xiàn),比FasterTransformer還要Fast。



LightSeq支持的模型也是非常全面。



總之就是兩個字“好用”。此項目在Github上已有1.9k+star。

9. Greykite

想預(yù)測COVID-19的恢復(fù)速度嗎?那就來看看LinkedIn為了自家時間序列預(yù)測需求開發(fā)的Greykite吧。


功能全面(多種時間趨勢),界面直觀,預(yù)測速度快和可擴展性強是它最大的亮點。


被應(yīng)用在上面的三大算法:

Silverkite (Greykite’s flagship algorithm)

Facebook Prophet

Auto Arima

感興趣的話就去研究看看吧,此項目在Github上已有1.4k+star。

10. Jina and Finetuner

如今,在搜索引擎等應(yīng)用上,語義識別的地位越來越高,因為它可以有效避免字詞匹配的局限。

不過語義識別涉及的神經(jīng)網(wǎng)絡(luò)可能會讓很多人感到頭大,Jina和Finetuner可以幫你解決這些問題。



Jina是一個神經(jīng)搜索框架,使任何人都能在幾分鐘內(nèi)建立可擴展的深度學(xué)習(xí)搜索應(yīng)用程序。

Finetuner配合Jina幫助你對神經(jīng)網(wǎng)絡(luò)進行調(diào)參,以獲得神經(jīng)搜索任務(wù)的最佳結(jié)果。

Jina和Finetuner適合沒什么經(jīng)驗,又想嘗試的朋友。

以上就是本次分享的全部內(nèi)容,想學(xué)習(xí)更多Python技巧,歡迎持續(xù)關(guān)注六星源課堂!


六星源課堂:10個常用的Python機器學(xué)習(xí)庫,你知道幾個?的評論 (共 條)

分享到微博請遵守國家法律
海安县| 广州市| 汶上县| 丰宁| 乡城县| 涟水县| 神农架林区| 龙州县| 吴忠市| 和林格尔县| 承德县| 聂拉木县| 徐州市| 梁山县| 景泰县| 花莲市| 汾阳市| 贵定县| 青海省| 永吉县| 长宁县| 赫章县| 越西县| 当雄县| 唐山市| 玉溪市| 麻城市| 连平县| 思茅市| 铜梁县| 宁都县| 冀州市| 绥宁县| 柘荣县| 友谊县| 青铜峡市| 罗定市| 达拉特旗| 威信县| 鲁山县| 固阳县|