6 大經(jīng)典機(jī)器學(xué)習(xí)數(shù)據(jù)集,3w+ 用戶票選得出,建議收藏
內(nèi)容一覽:本期匯總了超神經(jīng)下載眾多的 6 個(gè)數(shù)據(jù)集,涵蓋圖像識(shí)別、機(jī)器翻譯、遙感影像等領(lǐng)域。這些數(shù)據(jù)集質(zhì)量高、數(shù)據(jù)量大,經(jīng)歷人氣認(rèn)證值得收藏碼住。 關(guān)鍵詞:數(shù)據(jù)集 機(jī)器翻譯 機(jī)器視覺(jué)
數(shù)據(jù)集是機(jī)器學(xué)習(xí)模型訓(xùn)練的基礎(chǔ),優(yōu)質(zhì)的公開(kāi)數(shù)據(jù)集對(duì)于模型訓(xùn)練效果、研究成果可靠度等具有重要意義。
HyperAI超神經(jīng)自上線以來(lái),為數(shù)據(jù)科學(xué)從業(yè)者提供了大量?jī)?yōu)質(zhì)的公開(kāi)數(shù)據(jù)集。本期內(nèi)容分享,我們篩選出了 6 個(gè)熱門數(shù)據(jù)集,其總下載次數(shù)已達(dá)到 32,569 次。希望這些數(shù)據(jù)集能進(jìn)一步為廣大開(kāi)發(fā)者服務(wù)~
注:本文梳理的數(shù)據(jù)集均來(lái)自網(wǎng)站:
https://hyper.ai/datasets


Tanks Temple 圖像數(shù)據(jù)集提供高分辨率的視頻,研究人員可以從視頻中采集圖像,依據(jù)圖像進(jìn)行三維重建。該數(shù)據(jù)集包括訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)兩類,其中測(cè)試數(shù)據(jù)分為中級(jí)組和高級(jí)組


DOTA 全稱為 A Large-scale Dataset for Object DeTection in Aerial Images,是一個(gè)包含 2,806 張航拍圖的圖像數(shù)據(jù)集,被用于在航拍圖像中進(jìn)行目標(biāo)檢測(cè),發(fā)現(xiàn)和評(píng)估圖像中的物體。
這些圖像來(lái)源包含不同傳感器和平臺(tái)。每張圖像的像素尺寸在 800*800 到 4000*4000 的范圍內(nèi),其中包含不同尺度、方向和形狀的物體。
往期推送請(qǐng)?jiān)L問(wèn):
DOTA 數(shù)據(jù)集:2806 張遙感圖像,近 19 萬(wàn)個(gè)標(biāo)注實(shí)例


VGG-Face2 是一個(gè)人臉圖像數(shù)據(jù)集,包含共計(jì) 9131 個(gè)人的面部數(shù)據(jù),圖像均來(lái)自 Google 的圖片搜索。數(shù)據(jù)集中的人在姿勢(shì)、年齡、種族和職業(yè)方面有很大差異。該數(shù)據(jù)集由牛津大學(xué)的工程科學(xué)系視覺(jué)幾何組于 2015 年發(fā)布,相關(guān)論文有《Deep Face Recognition》。


UCAS-AOD 是一個(gè)遙感影像數(shù)據(jù)集,用于飛機(jī)和車輛檢測(cè)。該數(shù)據(jù)集由國(guó)科大于 2014 年首次發(fā)布,并于 2015 年補(bǔ)充,相關(guān)論文有《Orientation Robust Object Detection in Aerial Images Using Deep Convolutional Neural Network》


OpenMantra 是一個(gè)針對(duì)日文漫畫(huà)的機(jī)器翻譯評(píng)估數(shù)據(jù)集,包含五種不同風(fēng)格(fantacy、romance、battle、mystery、slice of life)的漫畫(huà)。數(shù)據(jù)集中共包含 1593 個(gè)句子,848 個(gè)場(chǎng)景畫(huà)面和 214 頁(yè)漫畫(huà),由東京大學(xué) Mantra 團(tuán)隊(duì)發(fā)布。
往期推送請(qǐng)查看:
漫畫(huà)翻譯、嵌字 AI,東京大學(xué)論文被 AAAI’21 收錄


ImageNet 是目前世界上最大的圖像識(shí)別數(shù)據(jù)庫(kù),由斯坦福大學(xué)教授李飛飛等人創(chuàng)建。主要用于機(jī)器視覺(jué)領(lǐng)域的圖像分類和目標(biāo)檢測(cè)。
數(shù)據(jù)集根據(jù) WordNet 層次結(jié)構(gòu)組織,其中每個(gè)節(jié)點(diǎn)(也稱為類別)由數(shù)百甚至數(shù)千張圖像組成。該數(shù)據(jù)集共包含 2.2 萬(wàn)個(gè)圖像類別,約 1500 萬(wàn)張圖片。
往期推送請(qǐng)?jiān)L問(wèn):
當(dāng)年這個(gè)決定,讓李飛飛奠定 AI 江湖的女王地位
以上就是本期推薦的 6 個(gè) hyper.ai 高頻下載數(shù)據(jù)集,更多數(shù)據(jù)科學(xué)優(yōu)質(zhì)公開(kāi)數(shù)據(jù)集,可點(diǎn)擊文末閱讀原文,或訪問(wèn)以下鏈接下載:
https://hyper.ai/datasets
本文首發(fā)自微信公眾號(hào)「HyperAI超神經(jīng)」原文可見(jiàn)『6 大經(jīng)典機(jī)器學(xué)習(xí)數(shù)據(jù)集,3w+ 用戶票選得出,建議收藏』
—— 完 ——