最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

數(shù)匠專訪|高級數(shù)據(jù)挖掘師工作經(jīng)驗分享

2021-07-30 15:26 作者:愛數(shù)據(jù)分析社區(qū)  | 我要投稿

出品|愛數(shù)據(jù)LoveData(ID:cntongji)

嘉賓|簡楊君

采訪|夏天

編輯|小數(shù)

1、老師可以分享一下之前在大學(xué)和工作當(dāng)中對于數(shù)據(jù)分析和數(shù)據(jù)挖掘這方面能力的培養(yǎng)和成長路徑嗎?


我大學(xué)專業(yè)是理工科專業(yè),對于我現(xiàn)在數(shù)據(jù)工作是專業(yè)對口,早期也在傳統(tǒng)行業(yè)行業(yè)甲方工作過,目前是在第三方的一個互聯(lián)網(wǎng)公司。

?

整個從業(yè)經(jīng)驗是最早剛開始的時候,多是統(tǒng)計、數(shù)據(jù)報表為主,不斷的熟悉會接觸到甲方的數(shù)據(jù),包括業(yè)務(wù)層的數(shù)據(jù)、移動應(yīng)用端的數(shù)據(jù),再從這個數(shù)據(jù)當(dāng)中去推進企業(yè)經(jīng)營的數(shù)據(jù)分析決策過程中,再到第三方,通過第三方的一數(shù)據(jù)統(tǒng)計去衡量行業(yè)的發(fā)展的狀況。

?

就整個過程我覺得如果你是一個學(xué)生,在大學(xué)期間最好是以基礎(chǔ)為主。比如說我們統(tǒng)計學(xué)院數(shù)學(xué)或者一些經(jīng)管類學(xué)科的學(xué)生,可以在專業(yè)知識方面去加強一下,統(tǒng)計學(xué)知識是非常重要的,是一定要去學(xué)習(xí)的。在數(shù)據(jù)工作當(dāng)中看數(shù)據(jù)需要,我們是需要去進行統(tǒng)計聚合分析的,都需要一定的統(tǒng)計知識。如果你是在學(xué)校缺乏一些社會經(jīng)驗,其實也可以通過目前參加一些比賽,比如說kaggle、阿里云的一些數(shù)據(jù)競賽,去增加項目經(jīng)驗,或者以自己的興趣愛好結(jié)合生活做一些分析,比如說租房真實情況,去做一些分析和挖掘,分析我們房價、地域、價格趨勢,挖掘住房價格是受哪些因素的影響,預(yù)測房價趨勢等,這些更貼近生活真實的一個場景,做這樣的實踐演練。

?

如果在工作中,相對比較綜合的,也并不是前面我們講的單純的統(tǒng)計,不是只有統(tǒng)計學(xué)就可以做好我們的數(shù)據(jù)工作,其實還是要不斷的結(jié)合在企業(yè)當(dāng)中的一些業(yè)務(wù)場景去探索,去分析如何去驅(qū)動我們的企業(yè)使用數(shù)據(jù)分析或者數(shù)據(jù)挖掘的工具去提升效率,提升企業(yè)在經(jīng)營當(dāng)中的一個競爭力。

?

對于這塊的一個發(fā)展,按照目前行業(yè)的需求來說,其實還并沒有那么飽和,還是挺缺乏一些在這方面比較有專業(yè)知識的人,特別是像數(shù)據(jù)人才,需要結(jié)合我很多第三方的學(xué)科,包括材料、是生物、汽車,這些都在往數(shù)據(jù)驅(qū)動這個方向發(fā)展,包括我們的材料工程會使用模型去生成一些新的材料、我們的汽車會往自動駕駛的這個方向等,其實都是在展現(xiàn)的整個數(shù)據(jù)行業(yè)的發(fā)展,其實目前還是在處于發(fā)展中的階段。


我當(dāng)時從傳統(tǒng)企業(yè)到互聯(lián)網(wǎng),當(dāng)時處于在傳統(tǒng)行業(yè)數(shù)據(jù)化的這個過程,包括我們啟用一些數(shù)據(jù)系統(tǒng),如何去就跟蹤我們的運營的操作,所以我們在這個過程當(dāng)中,學(xué)習(xí)了怎么去利用統(tǒng)計分析跟蹤運營的情況,當(dāng)時是在物流行業(yè)。其實物流這個行業(yè)是有涉及到一些車輛運營的路線,我們可以根據(jù)系統(tǒng)里面車輛的出發(fā)跟結(jié)束的這個點,能夠知道這輛車的行駛狀況,包括時間、準點、這些數(shù)據(jù),相當(dāng)于可以去跟蹤到企業(yè)經(jīng)理運營當(dāng)中的運營情況,即使是在傳統(tǒng)行業(yè),但其實對過往的工作項目或者經(jīng)驗,積累和沉淀了原數(shù)據(jù)相關(guān)的方法論或者經(jīng)驗總結(jié)?;ヂ?lián)網(wǎng)和數(shù)據(jù)分析關(guān)系十分緊密,我覺得在傳統(tǒng)行業(yè),目前的一個現(xiàn)狀是比較缺乏數(shù)據(jù)化的這個過程。如果你想往傳統(tǒng)行業(yè)數(shù)字化去發(fā)展,其實這里有很大的空間,因為傳統(tǒng)企業(yè)在轉(zhuǎn)型數(shù)字化的這個過程當(dāng)中,需要去搭建基礎(chǔ)的數(shù)據(jù)設(shè)施,包括如何去搭建、構(gòu)建、采集、記錄用戶的信息等。

?

這個過程我覺得就是在傳統(tǒng)企業(yè)當(dāng)中可以去大力去挖掘的一個點,也是職場發(fā)展的一個機會點。

?

2、老師可以談?wù)剶?shù)據(jù)分析vs數(shù)據(jù)挖掘vs數(shù)據(jù)科學(xué)區(qū)別和聯(lián)系嗎?


【數(shù)據(jù)分析】

數(shù)據(jù)分析主要是用統(tǒng)計學(xué)的知識,對現(xiàn)有的數(shù)據(jù)進行分析,包括常見的描述性數(shù)據(jù)分析,探索性數(shù)據(jù)分析。比如我們會對每天每月每周用戶數(shù)進行同比環(huán)比的對比分析、細分不同人群的交叉分析、以及我們可以利用數(shù)據(jù)可視化的方式去展示數(shù)據(jù)的整體情況,包括展示社交人群當(dāng)中,他對于其他人就節(jié)點上的數(shù)據(jù)關(guān)聯(lián)情況,其實這更多的就是使用到統(tǒng)計學(xué)的知識。

?

【數(shù)據(jù)挖掘】

數(shù)據(jù)挖掘其實有一部分是包含的數(shù)據(jù)分析的,因為我們需要對數(shù)據(jù)進行比較深刻的理解,是需要去分析數(shù)據(jù)的整體情況,包括探索性數(shù)據(jù)分析,是現(xiàn)在挖掘當(dāng)中比較重要的一個環(huán)節(jié)。通過數(shù)據(jù)挖掘的算法從數(shù)據(jù)中挖掘有用的信息。例如通過算法去挖掘用戶購買的商品之間的關(guān)聯(lián),什么樣的用戶是是高質(zhì)量的用戶等,這些問題都是需要我們從數(shù)據(jù)挖掘的角度去分析。

?

【數(shù)據(jù)科學(xué)】

數(shù)據(jù)科學(xué)是相對比較綜合的,它既包含像前面講的統(tǒng)計分析,又包含數(shù)據(jù)挖掘的算法,同時還需要借助大數(shù)據(jù)以及計算機編程來實現(xiàn)更多的數(shù)據(jù)提取和分析,也需要將模型進行部署,所以說數(shù)據(jù)科學(xué)是相對比較綜合的。

?

如果說我們要來談數(shù)據(jù)科學(xué),它是涉及到數(shù)據(jù)中的各個環(huán)節(jié),并不是單一一個環(huán)節(jié),比如在企業(yè)當(dāng)中需要去獲取數(shù)據(jù),它其實也是算是數(shù)據(jù)科學(xué)里面的一個環(huán)節(jié)。

?

3、什么樣的公司會有數(shù)據(jù)科學(xué)家這樣的招聘需求?


數(shù)據(jù)科學(xué)家更加多適用于相對比較成熟的一些公司,這類公司產(chǎn)品線特別多,需要利用數(shù)據(jù)來幫助公司進行決策,各個產(chǎn)品線如何利用數(shù)據(jù)工具提高用戶運營效率等。對于一般垂直類公司,比如說他是做單一業(yè)務(wù),基本只需要數(shù)據(jù)分析師來分析和挖掘更加貼切實際,因為如果需要運用到數(shù)據(jù)科學(xué)部,他是相對比較綜合的。那如果企業(yè)達不到那個條件,工作內(nèi)容當(dāng)中會涉及數(shù)據(jù)分析和數(shù)據(jù)挖掘多一點。

?

像國內(nèi)的一些大廠,包括騰訊、阿里巴巴,他其實有很多的產(chǎn)品線,產(chǎn)品線之間是有一些重復(fù)可以使用到的信息。例如淘寶天貓海淘,這三個產(chǎn)品都有一些共性,這是它屬于購物的,那么在購物當(dāng)中會有通過推薦或者廣告流量來驅(qū)動用戶去購買,所以多個不同產(chǎn)品,他本身是有共性的。對于這件事情的統(tǒng)一,就需要數(shù)據(jù)科學(xué)家去構(gòu)建一個能夠在不同的業(yè)務(wù)場景下的推薦的算法,這個落地執(zhí)行是需要數(shù)據(jù)科學(xué)家去做這件事情的。


4、作為高級數(shù)據(jù)挖掘,您目前的工作內(nèi)容有哪些?


目前工作其實一般分兩部分,一部分是項目上的數(shù)據(jù)挖掘,另外一部分是產(chǎn)品創(chuàng)新。

項目挖掘,主要是在公司層面上面不同的一些業(yè)務(wù)需求。例如我們在一家游戲公司,想要了解到用戶對游戲的偏好,一款游戲這個產(chǎn)品他的活躍用戶怎么去做個分析這類;在產(chǎn)品創(chuàng)新上,以打車應(yīng)用為舉例,就是我們打算怎么將用戶的使用場景進行歸納總結(jié),這樣我們可以分不同的使用場景去貼近用戶的服務(wù),比如在下班的途中、或者下雨天的這個場景下,那在這些場景下怎么樣去更好的服務(wù)用戶等。

?

核心的工作可以概括為:當(dāng)客戶描述有一個需求,比如說什么下降了,然后去給他們做分析,給他們解釋這個原因,然后輔助他們接下來的運營動作;相當(dāng)于根據(jù)他們現(xiàn)有的一個數(shù)據(jù)情況,給他們提供了自己的方案,也就是解釋原因,輔助他們運營。

?

更多的偏向于非標準的一個數(shù)據(jù)挖掘,因為我們一般很多的項目其實不一定是能夠產(chǎn)品化的,所以會走數(shù)據(jù)挖掘的這個形式去處理。創(chuàng)新是相當(dāng)于為客戶提供了一個數(shù)據(jù)產(chǎn)品,給他們做了一個數(shù)據(jù)產(chǎn)品。創(chuàng)新它其實根據(jù)不同的業(yè)務(wù),創(chuàng)新的一個方式、使用到的數(shù)據(jù)都是不一樣的。

?

我這里舉一個應(yīng)用的使用場景的分類,就比如說現(xiàn)在的客戶是游戲公司,他們其實只能做一個初步的分析,大部分游戲公司是沒有做數(shù)據(jù)挖掘這種偏技術(shù)的,然后他會找一些專業(yè)的公司來幫助他們更精細化的去分析,去挖掘。因為不是每一家公司他都能夠搭建模型,能夠做好用戶畫像。對于這樣的一個需求場景,需要專業(yè)的技術(shù)和分析團隊提供更好的服務(wù),因為它結(jié)合了很多的用戶使用場景。對于甲方的游戲公司,以用戶注冊的時候收集的信息為主,進行分析大概是這樣的。比如我們會做競品分析,同行業(yè)分析挖掘。

?

如果是作為投資項目,更多的是要去從海量的產(chǎn)品里面去挖掘客戶想要的、能夠體現(xiàn)這個用戶整體增長趨勢的分析,或者當(dāng)前行業(yè)的興趣方向等,它其實是分不同的公司的。

?

比如說開發(fā)一款游戲,得知道用戶是對哪一種游戲會更加感興趣一點,就是在產(chǎn)品還沒開發(fā)之前會做一件事情,就是調(diào)研。因為你不可能說你等到你產(chǎn)品做好之后,發(fā)現(xiàn)這個市場價值嗯用戶量很小,這個時候產(chǎn)品已經(jīng)投入了很大的一個精力、成本。它是一個流程,從產(chǎn)品的開發(fā)之前的調(diào)研,然后到產(chǎn)品上線,再到這個產(chǎn)品整個的分析和挖掘。

?

我們就是使用數(shù)據(jù)解決公司在產(chǎn)品開發(fā)之前到產(chǎn)品開發(fā)中以及產(chǎn)品的生命周期的這些環(huán)節(jié)問題。


5、老師平時是如何展開工作的,可以分享一下嗎?


我這里講一個案例,比如說我們現(xiàn)在的客戶是一家游戲公司,“這個月的的活躍用戶數(shù)相比上個月下降了”,對于這個問題,我們首先是需要確定目標,我們需要去分析一下下降到底是什么原因產(chǎn)生的。

?

在這個過程當(dāng)中,我們就需要去收集數(shù)據(jù),包括我們這個月的活躍用戶數(shù)多少,上個月的活躍用數(shù)多少,因為我們對于下降的這個概念是沒有一個標準的,如果我們收集完數(shù)據(jù)之后,我們就能夠知道這個月比上個月下降了20%,那么上個月比上上個月又提高了10%。

?

所以就可以看得到,如果運營當(dāng)中沒有去做更多的活動,以及運營策略的變化,它其實很難有這樣的一個數(shù)據(jù)結(jié)果的,我們從收集到數(shù)據(jù)的這個過程,就可以慢慢的去挖掘這個數(shù)據(jù)是不是有這樣的疑問,然后我們再去深入的挖掘。

?

再繼續(xù),我們需要去將數(shù)據(jù)進行拆分,因為前面只是滿足了我們月的這個維度,我們也不了解他到底是那什么樣的原因產(chǎn)生。就比如說我們的設(shè)備是會有安卓和ios 的,我們將用戶機型進行拆分,就可以得到兩個月的安卓跟ios活躍用戶的比例,然后我們再進行對比分析,我們就能夠發(fā)現(xiàn),比如說發(fā)現(xiàn)安卓的用戶下降了。

?

安卓活躍用戶下降了,那么安卓用戶下降有可能的因素,比如我們再去假設(shè)一個因素,這個月做了更新,然后這個更新可能會導(dǎo)致影響用戶使用,就可以再從時間的維度上去去驗證我們的假設(shè),包括用戶點擊的這個時間節(jié)點,是不是跟我們上線的產(chǎn)品創(chuàng)建的這個時間節(jié)點吻合等。

?

以上主要是數(shù)據(jù)分析的工作。針對數(shù)據(jù)挖掘,可以這么理解我們想要知道什么樣的用戶才會流失,我們需要通過定義一個標準,也就是什么樣的用戶屬于流失用戶,定義完這個標準之后,我們?nèi)ネㄟ^提取用戶的一個數(shù)據(jù)特征,包括他的行為,再通過一些聚類或者回歸的方式去把這批用戶給找出來,這樣就是通過挖掘的方式去進行工作。

?

數(shù)據(jù)挖掘更多的是從數(shù)據(jù)中去挖掘信息。如果只是分析相關(guān)或者因果,更多的是用到分析這個過程。但是如果想要使用的模型去識別我們的用戶,就需要用到數(shù)據(jù)挖掘。

?

6、勝任就是數(shù)據(jù)挖掘變更工作,應(yīng)該具備哪些能力?


首先有一點就是我們必須對數(shù)據(jù)有敏感度,這就是為什么我們數(shù)據(jù)分析、數(shù)據(jù)挖掘的工作,很多時候想要招的是工科生的一個原因,就在于他們會對于這種比較枯燥的數(shù)據(jù),有更加高的數(shù)據(jù)敏感度。

文科生在一些數(shù)據(jù)的理解上可能會遇到困難,那么如果我們在有一定的數(shù)據(jù)敏感度,使用的我們的統(tǒng)計學(xué)的知識,其實是可以很快速的定位到數(shù)據(jù)問題,包括我們怎么去對數(shù)據(jù)進行處理,清洗等。


這其實都是工作當(dāng)中比較重要,花時間比較長的一部分工作。另外的就是對于一些特定的場景,包括行業(yè)上項目經(jīng)驗。如果你是在游戲公司工作的,你肯定是知道用戶的偏好,或者用戶游戲興趣愛好等,這些其實更有利于你在這分析當(dāng)中假設(shè)建立。


另外的就是我們現(xiàn)在互聯(lián)網(wǎng)比較普及,那很多數(shù)據(jù)的維度跟量級都是不斷地在加深。這就增加了那個分析的難度。所以我們很多時候做數(shù)據(jù)處理,其實是會遇到一些困難的,包括我們在處理文本數(shù)據(jù)的時候,其實是一種半結(jié)構(gòu)化數(shù)據(jù),如果我們現(xiàn)在是會一門編程語言,就會更好一點。比如使用Python,或者更高級一點的算法模型,都可以在這個基礎(chǔ)上去。

?

7、面試的時候會問面試者哪些問題?


從轉(zhuǎn)行的和應(yīng)屆兩種類型來說吧。

對于轉(zhuǎn)行的同學(xué),一般會考察他對數(shù)據(jù)的理解,以及之前的項目經(jīng)驗為主。

我們通過了解項目經(jīng)驗去詢問他就如何通過數(shù)據(jù)去驅(qū)動業(yè)務(wù)的,或者說設(shè)定某個業(yè)務(wù)場景去展開如何進行數(shù)據(jù)分析數(shù)據(jù)挖掘。因為這一類的同學(xué)他本身就有工作的經(jīng)驗,包括行業(yè)的經(jīng)驗。所以可能我們會更加注重他怎么樣去利用數(shù)據(jù)去驅(qū)動業(yè)務(wù)。

對于應(yīng)屆的同學(xué),由于工作經(jīng)驗比較少,更多的是一些實習(xí)經(jīng)驗。所以會問一些比較基礎(chǔ)的問題,包括統(tǒng)計學(xué)的相關(guān)基礎(chǔ),還有就是他對整個行業(yè)的理解或者看法,以及他的興趣和個人發(fā)展規(guī)劃。

?

8、搭建指標體系的過程,流程和難點老師可以跟我們分享一下嗎?


要搭建一個產(chǎn)品的指標體系,首先需要有一個框架:搭建這個數(shù)據(jù)指標體系,需要明確是用來做什么的。例如是要用來指導(dǎo)我們的日常的運營做用戶增長,這就是你做這個數(shù)據(jù)指標體系的一個目的。


有了這個目的之后,就可以把我們目標進行拆解,我們能夠去做什么新的數(shù)據(jù),以及去做什么。在這個過程當(dāng)中的難點是對不同的數(shù)據(jù)的處理、理解、計算維度、顆粒度,都是需要去深入挖掘的。


因為不同的指標,它的適用范圍、它的意義是不同的,那么要求你對一些數(shù)據(jù)指標是比較了解。然后另外的就是每個指標它的一個范圍,包括他的影響程度也是需要去考慮。這些更多的會基于業(yè)務(wù)背景。


移動應(yīng)用有一套比較通用的數(shù)據(jù)指標、一些垂直或者特定場景有自己的數(shù)據(jù)指標體系等,在這個基礎(chǔ)上也需要你對業(yè)務(wù)有一定的了解程度才能更加深入的做好這個指標體系的搭建。


例如說短視頻,短視頻算視頻行業(yè)的內(nèi)容類,知乎這種也算內(nèi)容類,但其實整個數(shù)據(jù)指標體系是不一樣的。針對移動互聯(lián)網(wǎng)它是有一套指標體系,比如 GrowingIO、神策他們把移動互聯(lián)網(wǎng)大體是分為幾個數(shù)據(jù)指標:

①拉新:通過各種推廣渠道,以各種方式獲取目標用戶,利用技術(shù)手段,不斷優(yōu)化策略。降低獲客成本。幫助市場推廣部門衡量各個渠道的拉新效果,評估新用戶的用戶質(zhì)量。

關(guān)鍵指標:點開率、安裝率、激活率、注冊率、留存率、付費率等。

②活躍:活躍用戶指愿意為產(chǎn)品買單、消費,我們需要分析用戶的行為數(shù)據(jù),監(jiān)控產(chǎn)品的健康程度。能夠幫助衡量產(chǎn)品的核心價值。

關(guān)鍵指標:新老用戶占比、DAU/WAU/MAU、日均登錄次數(shù)、日均使用時長等。

③留存:衡量用戶粘性和質(zhì)量的指標。

關(guān)鍵指標:新用戶留存率、老用戶留存率、活躍用戶留存率、流失率等。

④轉(zhuǎn)化(變現(xiàn)):能夠體現(xiàn)產(chǎn)品的商業(yè)價值。

關(guān)鍵指標:ARPU、ARPPU、付費率 等。

⑤傳播:通過口碑效應(yīng),讓用戶之間自發(fā)互相引薦、營銷。

關(guān)鍵指標:病毒式傳播等。


首先是獲取用戶,即新增用戶的這個維度;其次是新用戶的活躍度,用戶在這個階段,會產(chǎn)生時間這個維度上的指標,比如說他活躍了多少天、活躍的次數(shù)、使用設(shè)施時長,這些都是考驗用戶的一個黏性的指標;那么活躍用戶之后,他是否留存;以及后面的轉(zhuǎn)化和傳播,以上是移動互聯(lián)網(wǎng)常見的關(guān)鍵指標。這個也是AARRR模型在指標體系搭建的應(yīng)用方式之一。


另外挖掘型中,包括一些用戶畫像的指標,通用的指標體系包括性別、城市、年齡等基礎(chǔ)信息。


再說下剛才提到知乎這類的內(nèi)容平臺,他們的指標還是有差別的。我們前面講移動應(yīng)用主要是移動互聯(lián)網(wǎng)能的通用指標,對于不同的業(yè)務(wù)有自己的業(yè)務(wù)指標,比如說用戶的閱讀時長,這個是基于內(nèi)容的類型來定,例如說體育、新聞這、美妝,有不同的內(nèi)容標簽和時長指標,不同的版塊的業(yè)務(wù)好衡量指標內(nèi)容是不一樣;再說音樂行業(yè),關(guān)注的是在付費用戶這一塊,會有兩種模式,一種服務(wù)按時長的訂閱,一種是按照購買新服務(wù)的,對應(yīng)不同模式下的指標也會有一定的區(qū)別。


如果單說內(nèi)容上,大部分更多的是說用戶在這個內(nèi)容上廣告的一個點擊率,會衍生不同的一個數(shù)據(jù)指標出來。

?

愛數(shù)據(jù)社區(qū)直播

互聯(lián)網(wǎng)業(yè)務(wù)指標介紹案例分享

?


9、數(shù)據(jù)崗位的職業(yè)發(fā)展與規(guī)劃方面,老師可以分享一下您的經(jīng)驗嗎?


首先是對行業(yè)的喜好,就是說如果你這個不感興趣,會覺得數(shù)據(jù)是很枯燥的。如果進入這個行業(yè),在這個行業(yè)發(fā)展,需要去堅定數(shù)據(jù)是能夠驅(qū)動企業(yè)經(jīng)營分析的。

?

然后怎么樣去做我們的職業(yè)規(guī)劃呢?因為我早期更多的做一些基礎(chǔ)的工作。當(dāng)你對整個數(shù)據(jù)分析數(shù)據(jù)挖掘流程比較熟悉的情況下,那你肯定會構(gòu)建一個整體的框架,怎么樣去完成這些事情,或者說用一個通用的方式去做這些事情。

?

那到了職業(yè)發(fā)展階段,一般會分兩個方向,一是往管理的方向,另外一個技術(shù)方向。如果你是喜歡做溝通交流,能夠去跟進整個項目,是比較適合管理這個方向的;如果你是對算法或者對一些技術(shù)比較感興趣,把它研究比較深,你可以往技術(shù)這個方向走,技術(shù)這個方向往后例如說技術(shù)顧問。所以我覺得應(yīng)該是分階段來討論這個職業(yè)發(fā)展方向的,初入職場,一定先做一些基礎(chǔ)工作,打基礎(chǔ)學(xué)習(xí)階段掌握技能,以了解整個行業(yè)的狀況為主。

?

那后期肯定是需要去往管理或者技術(shù)方向繼續(xù)提升。剛才有提到管理崗和技術(shù)崗,比如說數(shù)據(jù)產(chǎn)品經(jīng)理,他其實偏向于要去溝通、跟進項目;像如果做一些開發(fā)類的工作,這個屬于技術(shù)類。對應(yīng)管理和技術(shù)有,不是完全獨立,尤其越往上發(fā)展,管理和技術(shù)只是說側(cè)重點不同。比如數(shù)據(jù)科學(xué)家,他是一個相對比較綜合的崗位,有的情況下也可看成是管理崗。因為具體落地不一定需要他去做,是需要主導(dǎo)團隊來完成,他需要對這個業(yè)務(wù)、算法十分的了解和熟悉,因此說他能夠主導(dǎo)這個項目交付才是關(guān)鍵。

?

對于技術(shù)崗,一些前沿算法,以及能夠在這個場景用什么樣的算法,怎么樣去做優(yōu)化,是需要比團隊其他成員這方面更加了解和熟悉。

?

10、老師可以談?wù)勔幌聰?shù)據(jù)挖掘和算法的關(guān)系嗎?


算法工程師工作其實是非常垂直的,因為他核心是做算法模型的。但是數(shù)據(jù)挖掘需要去考慮很多的業(yè)務(wù)場景,選擇用什么的算法來實現(xiàn)他的一個挖掘。

如果你是算法工程師,需要計算出最優(yōu)路徑,這個就是很特定的需求,他不會去考慮到底用這個東西去提升什么。如果是做數(shù)據(jù)挖掘的,我要用最短的路線,能夠去判斷這個用戶到底是屬于什么樣的用戶。


在企業(yè)當(dāng)數(shù)據(jù)挖掘更多時候是做一個探索,或者設(shè)定一個基礎(chǔ)模型。但至于這個基礎(chǔ)模型的性能或者效果,它不一定是最好的。這個時候算法工程師他會基于自己的理解,會重新設(shè)計,比如說新的一個算法去優(yōu)化這個場景下的效果。

算法工程師更多的對接的是產(chǎn)品,數(shù)據(jù)挖掘一般用的都是比較成熟的算法,現(xiàn)有的就已經(jīng)滿足需求,不一定是需要用到非常之復(fù)雜的。但是如果你是做算法的,例如說人臉識別,這個場景加了一個口罩,那對于產(chǎn)品來說,需要去做這樣的識別;這個時候不需要挖掘工程師來掘用戶是不是帶了口罩,具體案例來說明更多的是技術(shù)實現(xiàn)方面做的一個算法工作。


總之,在上面的案例里面,產(chǎn)品有這個需求,是通過算法工程師來實現(xiàn),可以把產(chǎn)品的需求是為了滿足對外;了解產(chǎn)品服務(wù)的用戶情況,進而輔助經(jīng)營分析需要數(shù)據(jù)挖掘,這個可以理解為對內(nèi),可以這樣理解一下算法工程師和數(shù)據(jù)挖掘工程師。

?

11、轉(zhuǎn)行以及應(yīng)屆的同學(xué)想從事數(shù)據(jù)崗位,老師可以給愛數(shù)據(jù)社區(qū)小伙伴有一些建議嗎?


如果你是在大學(xué),那肯定先接觸學(xué)習(xí)統(tǒng)計基礎(chǔ)知識會比較重要一點。如果有時間條件參加多一些比如說數(shù)據(jù)競賽,能夠提升項目經(jīng)驗,或者說利用的數(shù)據(jù)做分析挖掘,當(dāng)你在求職的時候,有一個具體的案例來體現(xiàn)你的數(shù)據(jù)能力。我也覺得這是在想要去從事這個方向的同學(xué)需要去做的事情。

?

轉(zhuǎn)行的同學(xué),首先你有一定的行業(yè)經(jīng)驗,基于這行業(yè)經(jīng)驗?zāi)隳軌蛴脭?shù)據(jù)去做什么樣的事情,你這個事情是需要去做準備的,或者說你跨了一個行業(yè),你能夠從原來的行業(yè)或者以你現(xiàn)在的適應(yīng)能力能為這個行業(yè)帶來什么,或者能夠做什么事情,就是需要去思考或者做好一個準備。


數(shù)匠訪談介紹

《數(shù)匠訪談》是愛數(shù)據(jù)社區(qū)一檔針對一線各行各業(yè)資深數(shù)據(jù)從業(yè)人員進行的深度訪談的欄目。?愛數(shù)據(jù)社區(qū)《數(shù)匠訪談》旨在分享:在數(shù)據(jù)作為新的生產(chǎn)資料和驅(qū)動力的數(shù)字化時代背景下,數(shù)據(jù)從業(yè)人員如何發(fā)揮數(shù)據(jù)價值的見解和洞察,共同探討數(shù)據(jù)應(yīng)用與發(fā)展趨勢等話題。?訪談嘉賓均來自:一線各行各業(yè)的資深數(shù)據(jù)分析師、數(shù)據(jù)產(chǎn)品經(jīng)理、數(shù)據(jù)開發(fā)工程師、數(shù)據(jù)建模專家、算法工程師、數(shù)據(jù)倉庫架構(gòu)師、數(shù)據(jù)總監(jiān)等,行業(yè)覆蓋新零售、O2O、電商、互聯(lián)網(wǎng)、教育、物流、金融、信息流、醫(yī)藥等。?《數(shù)匠訪談》通過深度訪談一線資深數(shù)據(jù)從業(yè)人員,整理發(fā)布數(shù)據(jù)嘉賓的實戰(zhàn)工作經(jīng)驗、行業(yè)洞見和先進的數(shù)據(jù)技術(shù),為入行數(shù)據(jù)從業(yè)者、數(shù)據(jù)愛好者提供寶貴意見,為行業(yè)發(fā)展起到積極促進作用,進而達到數(shù)據(jù)人才價值實現(xiàn),推動數(shù)據(jù)產(chǎn)業(yè)發(fā)展。


數(shù)匠專訪|高級數(shù)據(jù)挖掘師工作經(jīng)驗分享的評論 (共 條)

分享到微博請遵守國家法律
石楼县| 镇沅| 铜山县| 疏勒县| 河曲县| 陆川县| 滦平县| 阳朔县| 玛多县| 武功县| 茌平县| 平顺县| 萝北县| 蓝田县| 夏津县| 黄大仙区| 习水县| 宁津县| 科技| 临清市| 南漳县| 重庆市| 开平市| 榕江县| 航空| 洛宁县| 珲春市| 龙川县| 大新县| 涿鹿县| 斗六市| 呼玛县| 扎兰屯市| 济源市| 开江县| 宽甸| 沧源| 东宁县| 海阳市| 南投县| 喜德县|