最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊

錯(cuò)過就虧了!數(shù)據(jù)人不能忽視的機(jī)器知識(shí)學(xué)習(xí)平臺(tái)

2021-03-06 15:49 作者:愛數(shù)據(jù)分析社區(qū)  | 我要投稿

作者:飛狐沖沖

在國內(nèi)某知名央企負(fù)責(zé)數(shù)據(jù)挖掘與分析相關(guān)工作,并曾經(jīng)在京東、美團(tuán)等大型互聯(lián)網(wǎng)公司擔(dān)任算法工程師的崗位,有一定算法開發(fā)經(jīng)驗(yàn)。

眾所周知,當(dāng)今社會(huì)大數(shù)據(jù)和人工智能技術(shù)正助推各個(gè)領(lǐng)域迅猛發(fā)展,各大企業(yè)都在通過機(jī)器學(xué)習(xí)算法挖掘業(yè)務(wù)背后的商業(yè)價(jià)值,打造AI產(chǎn)品,快速的從數(shù)據(jù)轉(zhuǎn)化為收益。

因此,業(yè)務(wù)、數(shù)據(jù)、算法成為AI產(chǎn)品的三個(gè)重要因素。通過對數(shù)據(jù)進(jìn)行算法建模,賦能業(yè)務(wù),產(chǎn)生價(jià)值。稍微對算法有了解的同學(xué)都知道,算法開發(fā)工作一般包括數(shù)據(jù)準(zhǔn)備、特征工程、算法建模、模型評估、模型調(diào)優(yōu)、模型部署以及模型監(jiān)控等步驟,如下圖所示:

從算法開發(fā)整個(gè)流程可以看出,在算法開發(fā)落地應(yīng)用整個(gè)過程中,其實(shí)摻雜著與很多機(jī)器學(xué)習(xí)本身不是很相關(guān),但與其他工程領(lǐng)域強(qiáng)相關(guān)而且通用的事情,比如模型部署、任務(wù)監(jiān)控、模型可視化甚至包括環(huán)境搭建、資源調(diào)度等。于是,幫助大家脫離繁瑣的工程化開發(fā),如何讓機(jī)器學(xué)習(xí)快速落地應(yīng)用并提供通用的能力,成為機(jī)器學(xué)習(xí)平臺(tái)這個(gè)概念產(chǎn)生的意義。

為了便于大家理解不混淆,這里對機(jī)器學(xué)習(xí)平臺(tái)相關(guān)的名詞做了一定的解釋。
機(jī)器學(xué)習(xí)算法。簡稱算法,指使用各類編程語言構(gòu)建的算法,大部分情況下和具體業(yè)務(wù)是無關(guān)的。主要包括統(tǒng)計(jì)方法、傳統(tǒng)機(jī)器學(xué)習(xí)算法、深度學(xué)習(xí)甚至某些數(shù)學(xué)規(guī)則等。比如無監(jiān)督K均值聚類算法,有監(jiān)督LR、隨機(jī)森林、GBDT等算法,還有DNN、RNN深度學(xué)習(xí)等算法。

機(jī)器學(xué)習(xí)模型。簡稱模型,對具體業(yè)務(wù)強(qiáng)依賴,與業(yè)務(wù)強(qiáng)相關(guān),用來對新數(shù)據(jù)進(jìn)行直接預(yù)測的一系列算法參數(shù)的集合,通常需要和機(jī)器學(xué)習(xí)算法配合進(jìn)行工作。比如金融風(fēng)控模型、推薦模型、廣告點(diǎn)擊率模型、銷量預(yù)測模型等。

機(jī)器學(xué)習(xí)框架。也可稱為機(jī)器學(xué)習(xí)運(yùn)行時(shí)環(huán)境,是指能夠直接提供機(jī)器學(xué)習(xí)算法編寫、模型訓(xùn)練和模型應(yīng)用的軟件系統(tǒng),如Tensorflow、MxNet等,這些框架會(huì)直接調(diào)度計(jì)算資源和存儲(chǔ)資源,其運(yùn)行機(jī)制和具體的業(yè)務(wù)場景無關(guān)。

機(jī)器學(xué)習(xí)平臺(tái)。上面已經(jīng)說明,通過平臺(tái)化來封裝整個(gè)機(jī)器學(xué)習(xí)建模流程,允許用戶使用主流的機(jī)器學(xué)習(xí)框架進(jìn)行算法開發(fā)工作并且大部分提供可視化的構(gòu)建流程。比如阿里云PAI、騰訊Ti-ML等(后面會(huì)具體描述)。其目的是為了使機(jī)器學(xué)習(xí)快速工程化落地應(yīng)用,產(chǎn)生價(jià)值。

機(jī)器學(xué)習(xí)平臺(tái)能夠支撐算法開發(fā)、分享、模型訓(xùn)練、部署、監(jiān)控等?站式算法服務(wù),其一般的框架及功能如上圖所示,其功能主要有大量內(nèi)置的基礎(chǔ)算法、統(tǒng)一的數(shù)據(jù)管理、集成的運(yùn)行環(huán)境、可視化建模、模型復(fù)用等,還可以在此基礎(chǔ)上進(jìn)行算法超市開發(fā)沉淀解決方案。這里主要介紹一下可視化建模。

可視化建模不同于算法工程師利用編程語言(比如:Python、java等)進(jìn)行算法開發(fā),它通過拖拉拽的方式完成數(shù)據(jù)到圖形的映射,引導(dǎo)用戶直觀的進(jìn)行數(shù)據(jù)操作、探索。

如下圖所示:

可視化建??梢宰層脩艋谄脚_(tái)內(nèi)部的數(shù)據(jù)處理、算法節(jié)點(diǎn),以拖拉拽迅速完成機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語言處理等算法模型構(gòu)建,實(shí)現(xiàn)數(shù)據(jù)的關(guān)聯(lián)、模型的預(yù)測等功能。這樣就降低了建模工作對于專業(yè)算法工程師的依賴,更加智能、高效的進(jìn)行算法開發(fā)工作。

業(yè)內(nèi)比較知名的機(jī)器學(xué)習(xí)平臺(tái)有阿里云PAI、騰訊Ti-ML、第四范式先知、美林Tempo等。

阿里云PAI是目前國內(nèi)應(yīng)用范圍最廣泛的機(jī)器學(xué)習(xí)平臺(tái),也是國內(nèi)技術(shù)能力公認(rèn)最強(qiáng)的平臺(tái)之一。主要優(yōu)點(diǎn)有:

1.多框架支持

2.多語言間接支持(默認(rèn)提供 Python 編程入口,其他語言需要自己提供運(yùn)行環(huán)境)

3.阿里云集成度較高

4.豐富的API接口

?Ti-ML包含三個(gè)機(jī)器學(xué)習(xí)平臺(tái)自產(chǎn)品,分別是:

(1)Ti-ONE,一站式機(jī)器學(xué)習(xí)平臺(tái),提供AutoML能力,自動(dòng)化的構(gòu)建機(jī)器學(xué)習(xí)程序;

(2)Ti-EMS,自動(dòng)根據(jù)客戶的機(jī)器學(xué)習(xí)程序來進(jìn)行資源需求推理和調(diào)度;

(3)Ti-Insight,根據(jù)工業(yè)界的需求,內(nèi)置了各類主流的機(jī)器學(xué)習(xí)場景流程,用戶可以直接從模板構(gòu)建自己的機(jī)器學(xué)習(xí)應(yīng)用。

騰訊推出其機(jī)器學(xué)習(xí)平臺(tái)相對較晚,但其功能和定位和阿里云PAI即無二致。主要優(yōu)點(diǎn)為:

1.多框架支持。

2.多語言間接支持。

3.騰訊云集成度高。

4.API 豐富等。

第四范式公司是專門做機(jī)器學(xué)習(xí)平臺(tái)的AI技術(shù)與服務(wù)商,先知是國內(nèi)曝光率最高的機(jī)器學(xué)習(xí)平臺(tái)之一。國際權(quán)威研究機(jī)構(gòu)IDC發(fā)布了首份《IDC MarketScape:中國機(jī)器學(xué)習(xí)開發(fā)平臺(tái)市場評估》。

該評估結(jié)果顯示,第四范式市場份額位列中國第一,并處于機(jī)器學(xué)習(xí)平臺(tái)市場領(lǐng)導(dǎo)者位置。其優(yōu)點(diǎn)主要為:

1.自成一體,通??梢苑奖愕莫?dú)立部署。

2.國內(nèi)專門做機(jī)器學(xué)習(xí)的商業(yè)化公司,通??梢苑奖愕奶峁┒伍_發(fā)服務(wù)。

3.自研GDBT計(jì)算性能,處理大規(guī)模數(shù)據(jù)和高維特征優(yōu)勢明顯。

美林成立于1998年,成立時(shí)間比較久,雖然公司規(guī)模不大,但在數(shù)據(jù)分析領(lǐng)域已經(jīng)有不少的積淀。

其中TempoData機(jī)器學(xué)習(xí)平臺(tái)作為其主打產(chǎn)品,其主要優(yōu)點(diǎn)為:

1.入門門檻較低,功能的復(fù)雜度遠(yuǎn)遠(yuǎn)低于阿里云PAI。

2.作為專業(yè)商業(yè)服務(wù)公司,便于二次開發(fā)。

此外,還有百度EasyDL、九章云極等,這里就不一一做介紹了。

大部分機(jī)器學(xué)習(xí)平臺(tái)的早期都是公司內(nèi)部普遍使用,隨著人工智能和大數(shù)據(jù)技術(shù)的火熱,逐漸產(chǎn)品成熟度增加,最后進(jìn)行市場化推廣?;贏I應(yīng)用的機(jī)器學(xué)習(xí)平臺(tái)是快速實(shí)踐業(yè)務(wù)創(chuàng)新的基礎(chǔ)底座,ta不但幫助算法工程師脫離繁瑣的工程化開發(fā),把有限的精力聚焦于自己優(yōu)勢算法策略的迭代上面,也使非專業(yè)IT人員可以進(jìn)行可視化建模,降低了AI開發(fā)的門檻。

以上內(nèi)容,為個(gè)人理解總結(jié)而來。如有不對的地方,歡迎指正,萬分感謝~~


想獲取更多精彩資訊

掃描下方二維碼關(guān)注數(shù)據(jù)分析


錯(cuò)過就虧了!數(shù)據(jù)人不能忽視的機(jī)器知識(shí)學(xué)習(xí)平臺(tái)的評論 (共 條)

分享到微博請遵守國家法律
吉木萨尔县| 玛纳斯县| 城口县| 荔浦县| 金塔县| 东兴市| 贡山| 抚松县| 犍为县| 板桥市| 铁力市| 丰县| 鄂州市| 大田县| 乐昌市| 北川| 藁城市| 黎城县| 上林县| 上犹县| 苏尼特右旗| 买车| 枣庄市| 宁安市| 浦北县| 云南省| 布拖县| 黔江区| 兖州市| 正宁县| 仁寿县| 万载县| 盐城市| 长寿区| 泸西县| 团风县| 正宁县| 旌德县| 乐都县| 兴国县| 定结县|