指南者背景提升成員發(fā)表國際一作論文助力留學申請!
學員背景:
C同學
雙非一本 金融學
打算申請人資管理,商業(yè)分析,數(shù)據(jù)分析方向海外研究生
參與項目
指南者商業(yè)分析科研論文指導
選擇背提的目的
大二的時候,我簽約了指南者留學。由于準備時間較為充足,申請主導師就向我推薦了背景提升項目,以提升自身的軟實力背景。
我的專業(yè)是金融學,但是我要申請的方向是人資管理/商業(yè)分析/數(shù)據(jù)分析,這些專業(yè)對編程語言和數(shù)據(jù)分析的經(jīng)歷都有一定的要求,比如需要掌握Python,R,SPSS等,跨專業(yè)申請還要求有相關的項目經(jīng)驗。而學校對商科所開設的數(shù)據(jù)分析課程都是很簡單的課程,對實際工作沒有太大幫助,所以一開始,我選擇指南者留學的背景提升項目就是想提高Python數(shù)據(jù)分析的能力。
我在接觸這個項目之前沒有學過Python,就連Excel也不太會,英語能力也不是很強,所以很擔心會完不成這個科研。甚至在學習過程中,有時也會對自己產生質疑,但做完了之后,我才發(fā)現(xiàn)科研其實并沒有想象中那么難,而且還收獲了很多知識。
項目具體學習
理論培訓部分
首先,我對Python知識進行了初步學習,包括Python基礎,NumPy庫,pandas庫,matplotlib庫(數(shù)據(jù)可視化),數(shù)據(jù)清理和數(shù)據(jù)處理,特征工程(特征篩選,特征處理等),聚類,降維,還有回歸模型,分類模型和stacking算法等機器學習和集成學習領域的知識。我之前從來沒有接觸過Python,一開始學的時候學得很投入,大約花了一周就學完了所有內容。
指南者老師錄的課講得非常清楚,脈絡也很清晰。相較于網(wǎng)上幾百集的python課程,我更偏好于指南者的課程:教給學生最核心的內容,然后再慢慢拓展,而且每節(jié)課課后都會有作業(yè)可以幫助理解內容和大致框架,做完作業(yè)之后也會有老師認真地給我批改和講解,即使有不懂的點,在講解過后也變得易懂了。此外,課程中基本沒有刻意地去背知識或者記代碼的部分。感覺最重要的還是“重復應用”和“練習”,反復訓練就能夠初步了解并熟悉框架。
在理論學習過程中,我的進展也比較順利,所以很快就進行到了項目的實戰(zhàn)階段。
選題方向
我要申請的方向和人資管理還有數(shù)據(jù)分析都有關系,因此教授提出了一個叫做“基于面試者建立的薪資預測模型”的課題,和我要申請的方向非常符合。而且,李教授本身也是南洋理工大學商學院的教授,管理科學雜志審稿人,對此十分有經(jīng)驗。最終我們確定以此作為選題。
科研過程
在確定選題之后,李教授給我發(fā)了一個薪資數(shù)據(jù)集,逐步教我如何開始研究。每周末我都會和李教授、梅老師進行線上會議匯報工作,教授會給我一些指導,以及布置下一周的任務和方向。

平時,教授和梅老師會很耐心地回答我提出的問題,且不會直接給我答案,而是引導性地提出一些問題和思考,讓我自己先去嘗試和思考還有查詢相關內容。
比如在學習如何把分類變量轉化為虛擬變量時,老師們會讓我自己先去查詢和研究。還有在特征篩選的時候使用點二列相關算法,隨機森林特征重要性等,老師不會直接告訴我結果,除非在我研究過后還是不懂,才會給我示范一遍,這使得我在做項目的過程中能夠不斷磨煉和提升自己的能力。


在科研過程中,我嘗試用各種回歸算法建立薪資預測模型,最后還用了stacking算法集成模型,將多個第一層回歸模型的預測結果作為第二層模型(元模型)的輸入值進行再次擬合,然后得到最后的回歸預測結果,減小過擬合的風險。經(jīng)過多次建模之后,我發(fā)現(xiàn)自己已經(jīng)能顯著地減少預測誤差,建立出一個薪資預測模型。
李教授在授課中提到,我不僅需要關注最后的預測結果,還要增強數(shù)據(jù)敘事的能力。于是我用OLS線性回歸得到了各個變量和薪資之間的相關系數(shù)以及p值,還有其他的一些數(shù)據(jù),接著還進行了一些數(shù)據(jù)可視化展示,通過可視化進行分析。
論文寫作與發(fā)表
完成科研實驗之后,老師讓我閱讀了幾篇英語論文,并給了我大概的論文寫作框架以及側重點。
我一開始挺害怕寫全英論文的,但其實論文寫作是整個科研過程中最簡單的部分。本著循序漸進的想法,我首先完成了論文中介紹研究背景、數(shù)據(jù)集和理論基礎的部分,然后寫清楚研究的過程,包括數(shù)據(jù)清洗和數(shù)據(jù)預處理,特征工程,建模過程還有調參過程等等,最后列出對照組和實驗組的結果,并總結出相關結論。
論文初稿完成后,老師會提出內容的修改意見,進行一些排版問題(如圖表)的調整等。接下來老師會去選擇相關的國際會議,并準備將論文投稿到國際會議上。
最后,我的論文被CPCI會議錄用,并在會議上進行了英文匯報演講。

自我提升與收獲
完成背景提升項目后,我不僅收獲到了教授的推薦信,還有獨立一作+通訊的CPCI會議論文,也能夠去進行數(shù)據(jù)清洗,預處理和可視化,很熟練地建立回歸和分類模型解決實際問題等等。這意味著我已經(jīng)可以比較熟練地進行數(shù)據(jù)分析了。
如果大家想要留學,建議在個人軟背景方面提前做好準備,這樣就可以在更充分的時間內提升自我。而且,接觸科研對我們后期的科研打好基礎很有幫助。我在那段時間學到的知識,在之后的學業(yè)過程、競賽和實習中都可以應用到,也讓我能更快地學習和理解新的Python知識。之后,我還自己發(fā)了兩篇EI會議,并獲得了安永數(shù)據(jù)科學挑戰(zhàn)賽的全球前十,其中也用到了stacking算法。
到現(xiàn)在,我已經(jīng)完成了從零到一的自我蛻變,從科研小白變得能夠參加比賽、自己發(fā)表實習等等。這段經(jīng)歷教會了我一點:科研是件循序漸進的、持續(xù)提升的事。它既需要合適的領路人,也需要自身的努力和不斷的試錯。希望大家都能夠達成理想中的目標,變成更好的自己!
想要咨詢本項目,或者了解指南者留學更多的背景提升項目,歡迎私信~