最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

指南者背景提升學員提升數(shù)據(jù)分析能力后,收獲南安普頓統(tǒng)計學錄取!

2022-07-01 16:14 作者:指南者背景提升  | 我要投稿

※ 本文為指南者留學學員原創(chuàng),轉載請聯(lián)系授權

學員背景

F同學

本科背景
廣東財經大學 應用統(tǒng)計專業(yè)

GPA 81.1 雅思7

指南者商業(yè)分析項目實戰(zhàn)學員

錄取學校(2022年秋季入學)南安普頓大學(QS排名78) 應用統(tǒng)計學專業(yè)

背提戰(zhàn)績

前言:

距離項目結束已經過去兩個月了,當時參加這個項目的情形還歷歷在目。我是在今年1月初的時候報名這個項目的,其實當時最擔心的問題是這個項目會不會很水,因為網(wǎng)絡上一直詬病于這些項目,但當我真正參與到課程中去的時候,我發(fā)現(xiàn)我的想法是錯誤的。
項目中很多地方對我影響很大,當然我也受益其中,這個項目強化了我的專業(yè)技能(提前學習數(shù)據(jù)分析和挖掘建模方面的技能),豐富了我的實踐經歷,對我之后拿到研究生offer有直接有力的幫助。

01

背景與契機


一開始選擇參加指南者的背景提升項目,是因為覺得自己的項目經歷太少再加上自己是雙非學校的背景,缺少具體的實戰(zhàn)經驗,大學里參加的項目也很少。即使我是應用統(tǒng)計專業(yè),在學校里學了R語言和SQL,但是Python的實際應用一直是我的弱點,所以基于這個想法,我想?yún)⒓右粋€提升個人編程能力的項目。
考慮到我后期我想申請港校和英國商業(yè)分析的方向,擁有相關的背景經歷也是非常有必要的,國外的學校在BA這塊的錄取會特別注重申請者的數(shù)據(jù)分析和建模能力以及實踐經驗,這些都是我當時比較缺少的幾點吧。包括我直系的師兄師姐和顧問老師也跟我說擁有幾段與碩士項目相似的經歷會大大提高成功的概率,因為能體現(xiàn)出自身與項目的匹配度。
同時我未來的就業(yè)方向也是想往數(shù)據(jù)分析和商業(yè)分析這兩個方向,所以提前了解這個領域所必備的技能對以后就業(yè)或找實習都會有一定的好處?;谶@幾點,我決定參加這個項目提升自己的背景與能力,最終收獲滿滿。

02

項目介紹


我參加的這個項目的名字叫做基于電商大數(shù)據(jù)零食市場的分析,這個項目主要是收集各類淘寶村的店鋪數(shù)據(jù)和商品價格、銷量和人氣等數(shù)據(jù),以可視化和挖掘建模的方式解讀農村淘寶的經濟特征,從商品特色、品質和口碑等方面,共同探究淘寶村如何實現(xiàn)興農扶貧的目標。
本次項目的授課老師——王老師,他在bilibili平臺的Tableau可視化視頻幾年來穩(wěn)居第一,而且他本人也曾經在世界知名的咨詢公司工作過很多年,能夠真正給到我一些很實用的建議,所以個人覺得同學們完全可以大膽去報名這個項目。

關于學習的內容,總共分為六大節(jié),上課所用到主要是以SQL、Python這兩大軟件為主,包括SQL的增刪改查、Python與numpy基礎、pandas、多分類問題、語義情感分析、預測與相關因素分析,最牛的莫過于是利用百度智能云進行語句情感得分分析,直接調用一段代碼就可以了,大大減少了代碼的書寫時間提高了效率,關鍵這是我從來沒有在學校的一門課程里接觸到類似的知識,我認為這也是項目中的一個亮點之一,緊跟現(xiàn)在人工智能的一個潮流。

03

準備過程


即使我是學統(tǒng)計專業(yè),但在實際的操作中也會遇到不少“困難”,有一些是十分低級的錯誤,比如使用jupyter notebook的時候把小窗口直接關掉,導致了程序無法正常運行,但是王老師還是十分耐心地告訴我一些需要注意的地方。
這個項目里需要每周一次作業(yè),來檢查同學們的聽課情況,因為當時在寫畢業(yè)設計,時間分配和把控上做得不是很好,沒怎么認真聽課。所以想一次性利用課程的課件把作業(yè)完成好然后交給老師,但是沒想到當中遇到不少問題,在群上詢問老師意見,一下子就被老師發(fā)現(xiàn)了,老師很嚴厲地批評了我,并語重心長地對我說:編程是需要時間去練習的。
從那時開始,我每周的課都聽三遍,并將代碼自己再運行一遍,務必讓自己每一個知識點都掌握好,這樣操作下來感覺就沒有特別大的問題了,因為很多難點都是老師所設計好的,相信自己一定是可以掌握的,還有給我的啟示就是日常需要有目的性地去練習編程,提高個人的編程能力,比如在牛客網(wǎng)、leetcode上多刷題,這些才是真正為以后就讀研究生甚至是就業(yè)做好充分的準備。

04

項目實戰(zhàn)


經過一個多月的學習之后,我對Python和SQL已經掌握得差不多了,在課程的最后就是需要進行項目實操。個人猜測,老師應該運用了web?scraper插件在天貓上爬取了近3000多條數(shù)據(jù)以及商品的評論區(qū)的數(shù)據(jù),我們參加項目的同學進行后續(xù)的操作。
首先基本操作,先導入numpy和pandas包,然后對excel表格里的數(shù)據(jù)進行處理,因為正常情況下獲取的數(shù)據(jù)都是會有異常值與缺失值,所以我依照老師在課程上講過的處理方法,利用pandas庫對二維數(shù)據(jù)表對空白值去除填充,并且定義新函數(shù)對發(fā)貨地址的省份與城市實現(xiàn)Excel中的分列功能,最后運用數(shù)組與集合等知識來對列中不規(guī)則的信息有效提取出來,以獲得商品的具體分類。在這個過程中,老師還經常提醒我們要定期對表內的信息進行檢查,不然會影響到后續(xù)的操作。

這個項目中最精彩的部分估計就是Tableau部分了,做出很多意義的圖表,但我一開始沒有什么方向,十分著急,不知道怎么辦好。后面老師給出不同的方向,發(fā)貨地址、店鋪銷量分析、單品分析,并且利用詞云wordart 做出評論區(qū)頻次最高的詞匯,消費者對產品的態(tài)度一目了然。

當然這些僅僅停留在描述統(tǒng)計的范疇里面,是經不起考驗的。后面我們需要借助統(tǒng)計模型建立多元線性回歸模型和PCA模型,利用相關理論進行必要的降維,導入seaborn和matplotlib包最后繪制出熱力圖,不同變量之間的相關性通過顏色的深淺就可以看出。最后利用百度智能云情感分析系統(tǒng)對商品評論內容進行分析,這一步的操作行云流水,十分體現(xiàn)技術,因為在實際處理中,用戶會輸入很多表情,這些都屬于異常字符,都需要進行過濾,所以老師介紹了try…except…的解決方案,完美避開了表情包的干擾,這樣能使工具能夠順利進行,最后計算出同一產品的中位數(shù),并繪制頻率密度直方圖,這樣就可以更清晰地反映用戶的情感得分分布,對后續(xù)的商家的運營策略調整具有積極性意義。

05

個人感受


我之前一直覺得SQL和Python在實際工作用到的情況十分少,我本人對我自己的Excel水平十分自信,覺得Excel應該可以處理大部分數(shù)據(jù)分析的問題了,Python就是算法和爬蟲工程師需要做的事。但是面對十分大的數(shù)據(jù)量的時候,上萬條數(shù)據(jù)的時候Excel就可以不管用了,可以說是內存不夠,Python和SQL則可以改善這些缺點,在電腦里相當于是建立了一個虛擬內存,處理數(shù)據(jù)起來就會十分快捷,這也是Excel無法達到的高度,所以如果以后要吃數(shù)據(jù)分析這口飯,Python和SQL真的能決定這一份職業(yè)的上限。
目前我拿到了南安普頓大學應用統(tǒng)計專業(yè)的offer,很感謝這個項目給予我的幫助,也增強了我對數(shù)據(jù)分析技能的信心,當然想要成功,單靠這個課程是不夠的,還需要自身在日常生活中不斷耕耘,在實際數(shù)據(jù)分析操作中不斷查缺補漏,老師說的話和這股信念鼓勵著我一定要一直走下去。


想要咨詢本項目,或者了解指南者留學更多的背景提升項目,歡迎私信~


指南者背景提升學員提升數(shù)據(jù)分析能力后,收獲南安普頓統(tǒng)計學錄?。〉脑u論 (共 條)

分享到微博請遵守國家法律
兰坪| 独山县| 开远市| 盖州市| 景泰县| 佛学| 河北区| 黄骅市| 贺州市| 邵阳市| 通城县| 聊城市| 宜春市| 哈尔滨市| 保康县| 确山县| 宁海县| 洛宁县| 平原县| 汉中市| 衡阳市| 喀喇沁旗| 元朗区| 甘洛县| 台前县| 威远县| 横峰县| 社旗县| 马龙县| 新密市| 五大连池市| 抚州市| 宁化县| 东阳市| 汾阳市| 雷波县| 织金县| 达拉特旗| 南宁市| 扎兰屯市| 漠河县|