“愛裝X”開源組織:“教科書級(jí)”AI知識(shí)樹究竟長(zhǎng)什么樣?

作者 | Just
出品 | AI科技大本營(yíng)(ID:rgznai100)
你看了很多本人工智能的入門書籍,但發(fā)現(xiàn)還是不能有效的將它們有效分類連接,進(jìn)行結(jié)構(gòu)化表達(dá),因?yàn)橹R(shí)點(diǎn)在你的大腦中是碎片化的,一片混亂。
最好的方式是以一本書為主干,然后利用其它書籍進(jìn)行補(bǔ)漏查缺。但是,如果你自己整理,肯定需要花費(fèi)很長(zhǎng)時(shí)間,因?yàn)槊勘緯挠行﹥?nèi)容是重復(fù)的,不重復(fù)的內(nèi)容如何分類填補(bǔ)也并不容易。
不要緊,只要你動(dòng)動(dòng)手,在網(wǎng)上我們總能找到這樣的資源?,F(xiàn)在,已經(jīng)有人為你做了整理和篩選工作。開源社區(qū) ApacheCN 的成員將人工智能入門疏解的每本書的章節(jié)拆開,再按照知識(shí)點(diǎn)合并,手動(dòng)整理了人工智能知識(shí)樹。你可以按照知識(shí)點(diǎn)依次學(xué)習(xí),如果理解了一個(gè)知識(shí)點(diǎn),就沒必要再去查看其余文章。
這份人工智能知識(shí)樹 v1.0 是整理了從零到一的學(xué)習(xí)內(nèi)容,主要包括統(tǒng)計(jì)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、時(shí)間序列、機(jī)器視覺、圖嵌入/圖的表示學(xué)習(xí)、自然語言處理、強(qiáng)化學(xué)習(xí)、推薦系統(tǒng)、處理/特征工程、模型評(píng)估/模型調(diào)優(yōu)、最優(yōu)化以及其它學(xué)習(xí)筆記十二部分內(nèi)容。
以統(tǒng)計(jì)機(jī)器學(xué)習(xí)部分為例,主要?jiǎng)澐譃榛A(chǔ)知識(shí)、線性回歸/邏輯回歸/softmax 回歸、決策樹/隨機(jī)森林、GDBT/XGBoost、樸素貝葉斯、支持向量機(jī)、K 近鄰、KMeans 等 19 個(gè)知識(shí)點(diǎn)。

再比如深度學(xué)習(xí)、時(shí)間序列、機(jī)器視覺等內(nèi)容,知識(shí)點(diǎn)涵蓋非常全面,實(shí)打?qū)嵉貙儆凇翱催@一本就夠了”。

獲取資料的 GitHub 地址看這里:
https://github.com/apachecn/ai-roadmap/tree/master/v1.0
當(dāng)然,ApacheCN 中不止有人工智能知識(shí)樹 v1.0 這一份資料,除了人工智能學(xué)習(xí)資料外,該開源組織還整理了算法刷題訓(xùn)練指南、scikit-learn 中文文檔、kaggle 項(xiàng)目實(shí)戰(zhàn)教程以及 PyTorch 中文文檔。

如果你想找系統(tǒng)化梳理的人工智能學(xué)習(xí)資料,ApacheCN 整理的內(nèi)容一定會(huì)給你驚喜。
官網(wǎng)地址:http://home.apachecn.org/
最后,大部分開源組織其實(shí)都是一群在免費(fèi)資源背后默默付出,為開源世界做著力所能及的貢獻(xiàn)的人,而不是機(jī)器和程序。套用一句時(shí)髦的話就是,他們也應(yīng)該擁有姓名。
這次,AI科技大本營(yíng)特意采訪了 ApacheCN 的創(chuàng)始成員,他們說 ApacheCN 是一個(gè)“國(guó)內(nèi)第一個(gè)有組織性、敢?guī)搜bX、敢真的分享、并且敢戴綠帽的中文開源組織?!毕袼械拈_源組織一樣,我們希望他們能被更多人知道,走得更遠(yuǎn)。
1、簡(jiǎn)單介紹一下 ApacheCN?
ApacheCN 是 2016 年 8 月份就開始搭建網(wǎng)站雛形, 2017 年 6 月份正式全職來做,是國(guó)內(nèi)第一個(gè)有組織性、敢?guī)搜bX、敢真的分享、并且敢戴綠帽的中文開源組織。

成立 ApacheCN 是因?yàn)閲?guó)內(nèi) AI 方面(包括但不僅限于 AI 方面)的資料過于貧乏,大多零散且維護(hù)滯后,有明顯的學(xué)習(xí)門檻 。大牛們的分享往往要么過于表面,要么充斥著大量的專有名詞難以理解(P.S.:盡管 AI 方向確實(shí)存在很多專有名詞,但是我們還是希望能夠讓它更易于理解)。另外,國(guó)內(nèi)知識(shí)付費(fèi)的門檻又很低,很多低質(zhì)量的知識(shí)在大肆收割智商稅的同時(shí),高質(zhì)量?jī)?nèi)容無人問津,正是這種劣幣驅(qū)逐良幣的現(xiàn)象,讓我們萌生了建立一個(gè)高質(zhì)量、公開且具有活力的社區(qū)。
我們現(xiàn)在的組織架構(gòu)一個(gè)是完全個(gè)性化安排,團(tuán)隊(duì)成員負(fù)責(zé)喜歡的方向,只要對(duì)學(xué)習(xí)有幫助,組織就全力支持?。?,另一個(gè)是換屆制管理,由于開源人才的流動(dòng)性大,避免死?,F(xiàn)象,開源更適合這種模式。
內(nèi)容方面的話,主要以興趣、工作、權(quán)威和需求為導(dǎo)向來建立標(biāo)準(zhǔn)規(guī)范。
2、 請(qǐng)介紹一下團(tuán)隊(duì)創(chuàng)始成員各自的工作背景?在 ApacheCN 的主要職責(zé)分別是什么?
@片刻:工作 5 年從事 NLP,目前在創(chuàng)業(yè)公司打雜。負(fù)責(zé)組織內(nèi)部穩(wěn)定和協(xié)調(diào)、錄制面試和求職干貨。
@庭哥:工作 5 年從事大數(shù)據(jù)。負(fù)責(zé)組織內(nèi)部基礎(chǔ)文檔模塊的雛形構(gòu)建。
@小瑤:工作 3 年從事 CV 方向。目前主要負(fù)責(zé)新聞資訊相關(guān),以及配合組織內(nèi)各大佬的工作。
@飛龍:南理工碩士在讀(人工智能方向)。負(fù)責(zé)翻譯活動(dòng)和媒體運(yùn)營(yíng)。
@咸魚:創(chuàng)業(yè)公司打雜。負(fù)責(zé)項(xiàng)目管理和產(chǎn)品需求,組織內(nèi)負(fù)責(zé)對(duì)外合作等事宜。
@算子:致力于融合人工智能與網(wǎng)絡(luò)應(yīng)用,創(chuàng)業(yè)中。負(fù)責(zé)組織網(wǎng)站平臺(tái)建設(shè)。
3、 你們應(yīng)該都是在空閑時(shí)間打理 ApacheCN,介紹一下大概需要做的工作?
翻譯活動(dòng):需要跑腳本和處理合并請(qǐng)求,大概每天十幾分鐘。
媒體運(yùn)營(yíng):需要發(fā)周報(bào),大概每個(gè)周末兩個(gè)小時(shí)。
群活躍:需要每天花費(fèi) 1~2 個(gè)小時(shí)吧(不過都是零散時(shí)間)。
內(nèi)容分享:會(huì)把自己每天學(xué)習(xí)有價(jià)值的干貨分享給大家(幾分鐘,零散時(shí)間,順便的事情)。
對(duì)外合作:目前跟其他幾家平臺(tái)聯(lián)合搞一些事情,每周會(huì)花 5 小時(shí)左右。
內(nèi)容錄制:晚上在家或周末,會(huì)錄制一些比賽視頻 or 面試簡(jiǎn)歷講解。
網(wǎng)站平臺(tái):遇到網(wǎng)站需要升級(jí)完善可能要每天花幾個(gè)小時(shí),如果是日常維護(hù)每天大概花費(fèi)十幾分鐘修補(bǔ)一些內(nèi)容。
4、 類似的開源組織應(yīng)該也有很多,ApacheCN 是否有自己特別的發(fā)展方向?
首先我們主要致力于 AI 的普及,我們認(rèn)為各行各業(yè)的人都需要學(xué)習(xí)和使用 AI,AI 會(huì)在各行各業(yè)創(chuàng)造更大的價(jià)值。
我們不會(huì)局限于現(xiàn)有的推廣渠道,或者某些固有的傳播學(xué)認(rèn)知,不介意用任何增長(zhǎng)黑客策略。為了降低運(yùn)營(yíng)成本,使組織持續(xù)發(fā)展,我們會(huì)使用一些工具,使各個(gè)流程數(shù)據(jù)化和自動(dòng)化,讓開源社區(qū)的運(yùn)營(yíng)就像每天刷牙洗臉一樣簡(jiǎn)單。
與某些有大公司背書的開源組織不同,我們不設(shè)定門檻,你只要愛學(xué)習(xí),樂于提問和分享,那么就符合我們要求,也符合我們對(duì)開源的認(rèn)知:人人都可以開源、人人都可以參與,這個(gè)時(shí)代大家智商都差不多,所以更應(yīng)該有更大的包容心?。ǘ粌H僅是秀背景和學(xué)歷?。?/p>
與商業(yè)組織不同,我們并不會(huì)追逐熱點(diǎn),或者唯利是圖,而是打造真正有價(jià)值的長(zhǎng)尾作品。我們非常在乎作品的潛在價(jià)值,希望它能幫助用戶解決工作和生活上的問題,進(jìn)而產(chǎn)生意想不到的價(jià)值。
我們堅(jiān)信“產(chǎn)品決定品牌”而不是“品牌決定產(chǎn)品”,并且把宣傳也看成作品的一個(gè)不可分割的部分。作為一個(gè)開源社區(qū),我們視功名為浮云,將良好的內(nèi)容和宣傳策略當(dāng)作成功的保證。
互聯(lián)網(wǎng)上的信息大多是 混沌和稀疏的,我們秉承 “海量信息等于沒有信息” ,有甄別地提供我們的內(nèi)容,使用 AI、數(shù)據(jù)挖掘等技術(shù)來優(yōu)化我們的流程和工具,充分利用大家的認(rèn)知盈余,提供高質(zhì)量的社區(qū)內(nèi)容。
5、 你們的口號(hào)為什么是“不裝X的人,我們都不想認(rèn)識(shí)”(門檻這么高?低調(diào)且牛X的人怎么就沒資格加入了:))
@平靜:裝X可以是一種公用屬性。我們歡迎樂意分享,喜歡 AI 的成員。
@飛龍:裝X實(shí)際上是“打造個(gè)人品牌”,因?yàn)槌蓡T為組織做貢獻(xiàn),組織反過來幫助成員,這樣才能形成正反饋,持續(xù)發(fā)展。例如,組織幫助成員打造個(gè)人品牌,提高身價(jià),成員會(huì)更樂意,或更有能力為組織做貢獻(xiàn),這是件雙贏的事情。“裝X”這個(gè)詞是非常有號(hào)召力的,設(shè)計(jì)口號(hào)的時(shí)候,我們發(fā)現(xiàn)把它換成任何一個(gè)詞,都不如“裝X”好。
@大魚:最好的裝X一般是無形的。比如說,如果我們?yōu)榱鞒痰哪硞€(gè)環(huán)節(jié)寫了一個(gè)輔助工具,我們不會(huì)說“我們非常厲害,為某個(gè)活動(dòng)特此設(shè)計(jì)了工具”,而是說“我們不是很厲害,沒找到業(yè)界通用的工具,于是自己做了一個(gè)”。
@算子:一切為了X格。
@張一極:為了知識(shí)和技術(shù)的傳播,我們選擇一直(裝X?)。
@揚(yáng)帆起航:堅(jiān)持把技術(shù)傳播下去,時(shí)間一長(zhǎng)也就成了裝X大佬。
@片刻:裝X是一種樂于分享的姿態(tài),就像別人總說:片刻大佬,好裝X啊!其實(shí)不是說你牛X,而是說你愿意把你牛X的東西分享給大家,大家對(duì)你的認(rèn)可的方式?。ㄎ覀?nèi)河幸粋€(gè)煩燜雞老哥就是默默無聞,沒事就分享一些筆記資料和回答問題,然后下面小老弟各種拜膜)
@小瑤:懷著裝X的心去吹牛X多爽!吹牛X人人都會(huì)吹,但我們與他們的不同是,我們不僅僅會(huì)吹牛X,還會(huì)把吹出去的牛X,實(shí)現(xiàn)并且做到能力所及的最好,這何嘗不是一種裝X?跟著我們走,你會(huì)發(fā)現(xiàn)你的吹牛X能力增長(zhǎng)迅猛,裝X的心也會(huì)越來越大。。。只要你想變強(qiáng),內(nèi)在心理是裝X的,那就能加入,哈哈。
@蛋黃:常與同好爭(zhēng)高低。再低調(diào)牛X的人,在自己的領(lǐng)域,也會(huì)有爭(zhēng)勝之心。討論和交流,才會(huì)產(chǎn)生真正有價(jià)值的東西。
@庭 : 一個(gè)人可以走(zhuang)的(bi)很快,一起卻可以走(zhuang)的(bi)更遠(yuǎn) 。。。
6、 ApacheCN 現(xiàn)在的運(yùn)營(yíng)狀態(tài)如何?團(tuán)隊(duì)日常的運(yùn)營(yíng)和維護(hù)費(fèi)用是怎么解決的?
我們擁有一個(gè)日 UIP 4k 的網(wǎng)站(流量相當(dāng)于 RubyChina 或 1/30 個(gè) OSChina),廣告收入能夠抵消服務(wù)器的開銷。我們沒有在推廣方面花過錢,所有渠道都是成員自帶,或者一點(diǎn)一點(diǎn)做起來的。當(dāng)然,我們目前也僅僅是能夠自收自支的狀態(tài),談不上盈利。
7、 作為一個(gè)開源組織,你們目前需要什么來自外界的幫助?
期待公益基金贊助: 100萬元/2年。主要用途:1.組織員工基礎(chǔ)工資;2.對(duì)貢獻(xiàn)者的獎(jiǎng)勵(lì);3.基礎(chǔ)的服務(wù)硬件。希望通過我們的汗水,給更多的人學(xué)習(xí)帶來更便捷的知識(shí)財(cái)富。
8、 關(guān)于 ApacheCN,還有什么想說的?
我覺得我們真的沒什么特別的地方,我們都是一群普普通通的一群愛吃辣條、愛分享的人,我們沒有靠什么背景,也沒有什么資源,分享的東西也沒有多么牛X,甚至我們分享的教程、比賽、也沒有得過什么大獎(jiǎng)(當(dāng)然群友有一些牛X的),但我們是真心愿意高標(biāo)準(zhǔn)要求自己,低姿態(tài)接納小白,把學(xué)到的知識(shí)真心的去分享給他們、幫助他們、讓他們少走彎路,并帶他們一起牛X。
雖然在 GitHub 上面被網(wǎng)友力推,得到全球組織排名 119,我感覺的只是我們?cè)敢夥瞰I(xiàn)而已。期待更多的人加入 ApacheCN 或者和 ApacheCN 一起推動(dòng)國(guó)內(nèi)的知識(shí)開源,讓開源更健康成長(zhǎng)。
最后還要感謝組織內(nèi)部樂于分享者、各種渠道方式的受眾、還有那些默默輸送資源、背后維護(hù)平臺(tái)穩(wěn)定和發(fā)展的美女靚仔們。