學(xué)子風(fēng)采 | 與深圳市大數(shù)據(jù)研究院聯(lián)合培養(yǎng)項目獎學(xué)金獲得者科研心得分享

為發(fā)掘培養(yǎng)優(yōu)秀的大數(shù)據(jù)領(lǐng)域跨學(xué)科人才,香港中文大學(xué)(深圳)于2020年8月開始與深圳市大數(shù)據(jù)研究院啟動聯(lián)合培養(yǎng)項目。
項目旨在資助成績優(yōu)異且有志在研究院所設(shè)研究所及實驗室擔(dān)任具體科研工作的香港中文大學(xué)(深圳)相關(guān)領(lǐng)域博士生在學(xué)校產(chǎn)生的學(xué)費,資助時間為每年9月至次年8月。
截至2022年12月31日,聯(lián)合培養(yǎng)項目累計共有博士生186人次、博士后14人次進入計劃。
為進一步提升聯(lián)合培養(yǎng)項目質(zhì)量,培養(yǎng)適應(yīng)社會、產(chǎn)業(yè)需求的大數(shù)據(jù)領(lǐng)域復(fù)合型人才,特推出項目獎學(xué)金獲得者科研心得分享系列文章。
聯(lián)合培養(yǎng)項目學(xué)生:張樹韜?
指導(dǎo)老師:張縱輝、史清江

張樹韜,2018年于中山大學(xué)通信工程專業(yè)獲得學(xué)士學(xué)位,2020年于中山大學(xué)電子與通信工程專業(yè)獲得碩士學(xué)位,同年9月加入香港中文大學(xué)(深圳)理工學(xué)院攻讀博士學(xué)位,并入選深圳市大數(shù)據(jù)研究院聯(lián)合培養(yǎng)博士生項目。2022年8月至今在鵬城實驗室未來網(wǎng)絡(luò)系統(tǒng)優(yōu)化基礎(chǔ)研究室交流。目前已申請發(fā)明專利兩項、發(fā)表會議論文兩篇,其中一篇被評為IEEE ISWCS 2022最佳論文。
科研感想:
非常榮幸深圳市大數(shù)據(jù)研究院能夠提供這樣一個平臺,讓我們有機會與業(yè)界龍頭企業(yè)展開合作,并且能夠得到大牛老師的親身指導(dǎo),將通信技術(shù)與實際工程經(jīng)驗結(jié)合起來,為真實網(wǎng)絡(luò)環(huán)境中亟待解決的問題提供有效解決方案,從而獲得更大的經(jīng)濟效益。
我在深圳市大數(shù)據(jù)研究院中已度過兩年半時間,期間主要參與了與華為公司合作的在地化統(tǒng)計信道建模項目。該項目通過少量路測數(shù)據(jù),建立參考信號接收功率與信道角度功率譜的統(tǒng)計關(guān)系,進一步考慮地理空間與用戶信道的交互作用機理,利用稀疏優(yōu)化、貝葉斯推斷等技術(shù)高效提取信道角度功率譜一階和二階大尺度統(tǒng)計特性,從而精細化地刻畫實際的通信網(wǎng)絡(luò)環(huán)境,賦能網(wǎng)絡(luò)優(yōu)化。所設(shè)計方案的平均預(yù)測誤差小于5 dB,大幅優(yōu)于傳統(tǒng)的Ray tracing仿真方法(誤差10 dB以上)。
我覺得實際工程中往往越簡單的算法越有效,而且永遠不要以為自己的某個想法很新穎,因為你總是能夠發(fā)現(xiàn)在這個世界的某個角落已經(jīng)有人做過類似的工作了,因此要廣泛調(diào)研,找準(zhǔn)問題所在,為所研究的場景設(shè)計合適的算法。
聯(lián)合培養(yǎng)項目學(xué)生?:李子牛??
指導(dǎo)老師:羅智泉? ? ??

李子牛,2019年6月于西安交通大學(xué)獲得學(xué)士學(xué)位,2020年9月起在香港中文大學(xué)(深圳)攻讀數(shù)據(jù)科學(xué)博士學(xué)位,并參與深圳市大數(shù)據(jù)研究院聯(lián)合培養(yǎng)項目,在羅智泉教授的指導(dǎo)下進行機器學(xué)習(xí)相關(guān)研究。曾在頂級會議(如ICLR、NeurIPS、IJCAI)和頂級期刊(如TPAMI)上共發(fā)表5篇文章。曾參加深圳市大數(shù)據(jù)研究院第一屆博士生與博士后學(xué)術(shù)論壇,獲得口頭報告一等獎。
科研感想:
香港中文大學(xué)(深圳)和深圳大數(shù)據(jù)研究院有很多頂尖學(xué)者,這里學(xué)術(shù)氛圍非常濃厚。在我剛?cè)雽W(xué)的時候,對科研還是非常懵懂,很多思維和技能都停留在本科生階段。具體地,在科研方向上缺少大局觀,不會判斷問題的重要性和研究價值,即便已經(jīng)讀了很多論文,思路還是比較局限。此外,我的論文寫作和口頭展示能力也比較差,寫出來的一些論文連合作者都很難理解,更別說廣泛的讀者了。
在羅老師的細心指導(dǎo)下,我能逐漸感覺到什么樣的研究問題是重要的,并且開始學(xué)習(xí)如何在現(xiàn)有的結(jié)果上創(chuàng)新。研究院和羅老師組里的學(xué)長學(xué)姐們也經(jīng)常幫助我,他(她)們會認真地讀我的草稿、聽我的一些學(xué)術(shù)報告,并且給出有用的反饋,因此我的寫作、展示和溝通技巧在過去兩年有很大的提升。我非常感謝他(她)們的幫助。
在過去兩年多的生活里,我經(jīng)常會遇到各種挫折:讀不懂論文的證明,無法復(fù)現(xiàn)已有的實驗結(jié)果,嘗試的新思路被卡殼。在這個過程中,我更加意識到:一次性的成功是極少的,更多的是失敗和隨之而來的沮喪。有的時候,這些挫折會讓我暫時看不到希望,甚至想打退堂鼓。但好在老師和朋友們會不斷鼓勵我,而我自己內(nèi)心深處也有對科學(xué)研究的喜愛,因此在失敗后我沒有放棄繼續(xù)探索?,F(xiàn)在我能更加體會到:很多時候,放棄是一個很容易的選擇,難能可貴的是堅持下去。
聯(lián)合培養(yǎng)項目學(xué)生:董巖巖
指導(dǎo)老師:楊升浩

董巖巖,2017年于吉林大學(xué)數(shù)學(xué)與應(yīng)用數(shù)學(xué)專業(yè)獲得學(xué)士學(xué)位,同年8月于香港中文大學(xué)(深圳)攻讀計算機與信息工程博士學(xué)位。入校以來,在楊升浩教授的指導(dǎo)下從事網(wǎng)絡(luò)編碼、無線通信以及編碼理論的研究,目前在國際核心期刊及會議發(fā)表論文數(shù)篇,2020年獲得深圳市大數(shù)據(jù)研究院獎學(xué)金。近期即將前往新加坡國立大學(xué)作為博士后繼續(xù)進行科研工作。
科研感想:
轉(zhuǎn)眼之間,我在香港中文大學(xué)(深圳)已經(jīng)學(xué)習(xí)了五年,這期間我在科研學(xué)習(xí)方面受益匪淺,這也得益于深圳市大數(shù)據(jù)研究院的良好學(xué)術(shù)氛圍以及優(yōu)秀的師資環(huán)境。
非常感謝楊升浩老師對我科研上的悉心指導(dǎo)、嚴(yán)格要求和高質(zhì)量的能力訓(xùn)練,這極大啟發(fā)了我對于課題的思路,使我能夠順利完成課題的研究目標(biāo)。同時也要感謝團隊其他老師和同學(xué)對我科研、生活上的幫助,使我的研究生生涯無比的充實和有意義。
在整個博士生階段的學(xué)習(xí)研究中,我有了很多深入的思考。不同于本科階段的學(xué)習(xí),研究生階段更多的是主動去發(fā)現(xiàn)課題里目前未解決的問題,找到自己的興趣點以及可以做的事情,并且在不斷地訓(xùn)練下,使自己逐漸能夠獨立地去解決問題。也有很重要的一點,是對課題要有自己的思考與探索,這對于長久的科研學(xué)習(xí)非常有利。在平時也要積極與同學(xué)和老師進行交流,可以幫助我們在科研學(xué)習(xí)過程中獲取新的視角并激發(fā)出新穎的想法。


張雨舜是香港中文大學(xué)(深圳)數(shù)據(jù)科學(xué)學(xué)院四年級博士生,導(dǎo)師為羅智泉教授。2019年本科畢業(yè)于南方科技大學(xué)數(shù)學(xué)系,曾獲得南方科技大學(xué)校級優(yōu)秀畢業(yè)生和數(shù)學(xué)系杰出十佳學(xué)生獎學(xué)金。他的研究方向是深度學(xué)習(xí)和優(yōu)化理論。研究成果曾發(fā)表在機器學(xué)習(xí)會議NeurIPS 2021, ICLR2021, NeurIPS 2022。
科研感想:
時光荏苒,來到港中深學(xué)習(xí)三年多了 ,在學(xué)校及深圳市大數(shù)據(jù)研究院優(yōu)異的科研環(huán)境沐浴下,我感覺自己在各方面都成長了特別多。用一個詞來自我總結(jié)這幾年的科研的話,就是“剛剛?cè)腴T”。其實要達到這幾個字并不簡單,個人覺得主要需要三方面能力:一是找問題的品味,二是解決問題的技巧, 三是呈現(xiàn)結(jié)果的功力。回想本科和19年、20年的時候,我的這三方面能力幾乎都為0,我都很佩服自己怎么有勇氣來讀Phd的。但在過去的一兩年里,我在這幾方面都有了很大進步,這要歸功于這幾年,我遇見了對我人生軌跡產(chǎn)生重要影響的老師:羅智泉老師。
首先要感謝羅智泉老師在我人生的十字路口指引了方向,我本科即將畢業(yè)的時候一度對未來要走什么樣的道路非常迷茫,要做出什么樣的成果,亦或是更基本的問題“該成為什么樣的人”。這些問題使我在數(shù)學(xué)、統(tǒng)計、計算機的分叉路口徘徊不前。直到有一天我參加了羅智泉老師的面試,他堅毅地看著我的眼睛說''life is short, we only do things that are useful''。?自那一天起,我對未來的規(guī)劃變得清晰了起來。在羅老師組內(nèi)讀書的這幾年,無論是生活還是科研,羅老師都幫我樹立起了正直、陽光的價值觀,我心中也因此一直鉚足了一股勁,想成為跟他一樣的優(yōu)秀學(xué)者。?
平時科研生活中最喜歡的環(huán)節(jié)就是羅老師的組會了。盡管他有時非常忙碌,也都會在每周六堅持花一個上午的時間給我們開組會,全身心地帶大家研討一篇論文。由于我平時也會參加一些其他的學(xué)術(shù)研討活動,能觀察到平均來說大家的注意力高度集中的階段往往不會超過一個小時,而羅老師的組會卻完全不同。每周在羅老師的帶領(lǐng)下,大家都會全神貫注地專注于一個課題討論三個多小時,最終往往能對所討論的課題產(chǎn)生新的、深的理解。這樣專注認真的氛圍是相當(dāng)難能可貴的。此外,組會討論的知識面跨度非常大,包括了機器學(xué)習(xí)、強化學(xué)習(xí)、統(tǒng)計、優(yōu)化、到無線通信等各類課題。即使有些課題我沒有基礎(chǔ),羅老師也鼓勵大家提問。他說組會上沒有愚蠢的問題, 我們要在不斷提問的過程中快速學(xué)習(xí)。同時,通過討論各類跨學(xué)科跨專業(yè)的課題,羅老師也希望我們能成為更全面的研究者,培養(yǎng)廣泛的科研興趣和學(xué)術(shù)溝通的能力(特別是與非自己領(lǐng)域研究者溝通的技巧),而不是只會盯著自己的小課題其它啥也不會。我覺得羅老師的組會有這樣的科研模式是非常難得且難以復(fù)制的,我也因此很珍惜每周的組會時間,努力學(xué)習(xí)到正確的研究品味和科研方法。??
讀博的時光不知不覺過去三年多了,很高興自己能慢慢入了科研的大門。但是我覺得自己在很多方面還非常不足,未來的路更是充滿艱難險阻,希望自己能持續(xù)好好努力,早日達成自己心中的目標(biāo)和理想。


朱明遠,2019年6月及2021年3月于吉林大學(xué)和諾丁漢大學(xué)獲得學(xué)士及碩士學(xué)位,2021年9月起在香港中文大學(xué)(深圳)攻讀計算機信息與工程方向博士學(xué)位,并入選深圳市大數(shù)據(jù)研究院聯(lián)合培養(yǎng)博士生項目,在蔡小強教授的指導(dǎo)下進行運營管理相關(guān)研究。曾參與完成華為、廣鐵等多項業(yè)界項目,項目結(jié)題并發(fā)表專利著作數(shù)篇。
科研感想:
非常榮幸深圳市大數(shù)據(jù)研究院能夠提供這樣一個將業(yè)界難點痛點、企業(yè)專家經(jīng)驗和學(xué)術(shù)研究結(jié)合起來的平臺與機會,讓大家有機會與國內(nèi)外業(yè)界龍頭展開合作交流,進行多方的互動合作。項目過程中,來自業(yè)界的資深一線領(lǐng)導(dǎo)、代碼落地的工程化開發(fā)人員、學(xué)校教師團隊給予學(xué)生們非常多的指導(dǎo),大家經(jīng)常一起討論項目該怎么做,如何將優(yōu)化理論與實際項目工程管理經(jīng)驗結(jié)合起來,為真實運營管理環(huán)境中的問題提供有效的解決方案。項目課題也與學(xué)術(shù)研究高度契合,研究院的老師們幫忙整合了多學(xué)院跨學(xué)科的指導(dǎo)老師資源,經(jīng)常會在一個小課題中見到數(shù)據(jù)科學(xué)學(xué)院、商學(xué)院、計算機科學(xué)學(xué)院的老師們一起探討,這種跨學(xué)科方法論的碰撞,常常給研究帶來濃墨重彩的點睛一筆。?
此外,聯(lián)合培養(yǎng)項目還是一個很好的與業(yè)界溝通的橋梁。與在讀期間自己申請去校外實習(xí)相比,項目同樣給同學(xué)們很多時間去公司參與活動,了解公司的工程實際細節(jié),但時間和活動安排更彈性。對和我一樣以后想去工業(yè)界工作的同學(xué)來說,聯(lián)合培養(yǎng)項目省去了申請去頭部公司單獨實習(xí)的麻煩,并且項目能很好地貼合自己的研究。完成一個項目不僅局限于對業(yè)界工程的貢獻,對學(xué)術(shù)研究也相輔相成。人多力量大,這個道理在項目中體現(xiàn)的非常明顯。從親身經(jīng)歷來說,在華為以及某消費品企業(yè)的項目中,企業(yè)團隊也做了很多的算法嘗試,公司數(shù)十人的團隊在幫你試錯。因此作為偏向?qū)嵺`的研究,團隊眾人的調(diào)研以及實驗會不斷幫助你印證對問題的假設(shè),最終找準(zhǔn)問題難點所在以及適合場景的最佳算法。


胡金鵬,2017年和2019年分別于哈爾濱工業(yè)大學(xué)獲得計算機科學(xué)與技術(shù)專業(yè)的學(xué)士和碩士學(xué)位,2019年9月加入香港中文大學(xué)(深圳)理工學(xué)院攻讀博士學(xué)位,并參與深圳市大數(shù)據(jù)研究院聯(lián)合培養(yǎng)項目。在張縱輝教授和萬翔教授的指導(dǎo)下進行自然語言處理相關(guān)研究,曾發(fā)表數(shù)篇會議論文(如ACL、NAACL、AAAI等)。
科研感想:
深圳市大數(shù)據(jù)研究院擁有專業(yè)的研究團隊和豐富的科研資源。在這里,學(xué)生可以獲得優(yōu)秀老師的指導(dǎo),而且彼此之間也樂于相互幫助、共同進步,有著濃厚的科研氛圍。
我在深圳市大數(shù)據(jù)研究院學(xué)習(xí)的這段時間,在張老師和萬老師的指導(dǎo)下,參與了醫(yī)療相關(guān)的項目,能夠有機會接觸一線的醫(yī)療數(shù)據(jù)以及較多的計算資源。我主要的工作集中在醫(yī)療的實體識別以及影像報告摘要。其中實體識別旨在從醫(yī)療文本中抽取出疾病、癥狀等關(guān)鍵詞,醫(yī)療影像摘要是通過模型總結(jié)醫(yī)療影像報告的描述生成結(jié)論。
在過去的幾年里,我遇到了很多科研上的困難和挫折。這個過程也讓我學(xué)習(xí)到了堅持不懈是非常重要的品質(zhì),遇到困難要學(xué)會思考如何去解決問題,學(xué)會如何通過相關(guān)的研究工作來幫助自己解決遇到的難題,這對于長期的科研學(xué)習(xí)是非常有利的。此外,善于發(fā)現(xiàn)問題對科研工作也非常重要,需要學(xué)會尋找有意義的科學(xué)問題,并以新的角度思考這些新問題,提出新的思路和見解。同時,老師和同學(xué)們在這一路上也給我提供了很多幫助,在討論和交流中不斷完善思考問題的全面性,這也讓我意識到了團隊合作的重要性。


科研感想:
作為一個聯(lián)合培養(yǎng)項目的受益者,我感到非常榮幸和幸運能夠參加這個項目。這個聯(lián)合培養(yǎng)項目給我提供了與行業(yè)領(lǐng)袖進行合作的機會,并且讓我深刻地認識到,科研創(chuàng)新需要開放的思維方式和廣泛的合作,以及深入的探究和思考。
我加入深圳市大數(shù)據(jù)研究院后,主要參與了一項與全棉時代公司合作的購物場景下的需求預(yù)測項目。在該項目中,我們使用了機器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等技術(shù),基于混雜的銷售數(shù)據(jù)建立需求預(yù)測模型,進一步考慮價格和銷量的交互作用情況。這項工作的目標(biāo)是預(yù)測未來銷量以輔助公司各項決策。在這個項目中,我從我的導(dǎo)師和其他學(xué)者身上學(xué)到了很多東西。我學(xué)會了如何在現(xiàn)有的研究成果上創(chuàng)新,如何判斷問題的重要性和研究價值,如何撰寫和展示論文,并與其他人進行有效的溝通。在這個過程中,我也學(xué)會了如何找到合適的問題并設(shè)計出簡單而有效的算法。
總的來說,我非常感激深圳市大數(shù)據(jù)研究院和香港中文大學(xué)(深圳)聯(lián)合培養(yǎng)項目,這個項目為我提供了許多寶貴的機會和經(jīng)驗,使我成為一個更好的研究人員。我希望這個項目能夠繼續(xù)發(fā)展下去,為更多的人提供類似的機會,以推動數(shù)據(jù)科學(xué)和人工智能的發(fā)展。


劉洋,2017年于東北大學(xué)自動化專業(yè)獲得學(xué)士學(xué)位,2019年于哈爾濱工業(yè)大學(xué)控制科學(xué)與工程專業(yè)獲得碩士學(xué)位,同年9月加入香港中文大學(xué)(深圳)理工學(xué)院攻讀博士學(xué)位,并參與深圳市大數(shù)據(jù)研究院聯(lián)合培養(yǎng)博士生項目,研究興趣是自然語言處理,信息抽取,小樣本學(xué)習(xí)。曾在領(lǐng)域內(nèi)頂級會議(ACL、NAACL等)上發(fā)表文章3篇。
科研感想:
香港中文大學(xué)(深圳)和深圳市大數(shù)據(jù)研究院有著優(yōu)秀的師資力量和多樣的合作項目,這些都為我們提供了一個良好的科研平臺和濃厚的學(xué)術(shù)氛圍。我的研究方向是自然語言處理,在博士期間也參與了一些醫(yī)學(xué)信息抽取相關(guān)的合作項目,這使得我的寫代碼能力,思考問題的能力都有所提升。
轉(zhuǎn)眼間,我在深圳市大數(shù)據(jù)研究院已學(xué)習(xí)了四年的時間。從剛?cè)雽W(xué)的時候經(jīng)常不知道從哪方面著手去研究問題、英文寫作磕磕絆絆、復(fù)現(xiàn)一個實驗要很長時間到現(xiàn)在建立了自己的一套讀論文發(fā)現(xiàn)問題、尋找改進點、進行實驗的科研方式,這期間要感謝老師和同學(xué)對我的激勵、建議和幫助。
在科研上,我覺得動起手來對于研究是很重要的。當(dāng)發(fā)現(xiàn)了一個未解決的問題或是一個還可以進一步改進的問題的時候,可能腦海中對這個問題會產(chǎn)生各種各樣的想法。這時候,我們就要動手開始復(fù)現(xiàn)之前的工作,之后將自己腦海中的想法付諸于實踐,寫代碼通過實驗來驗證其正確性。此外,也要注重提升自己的寫作和展示能力。
?


劉正鋒,2018年于南京大學(xué)獲得工學(xué)學(xué)士學(xué)位,2021年獲得工業(yè)工程專業(yè)碩士學(xué)位。同年9月加入香港中文大學(xué)深圳理工學(xué)院攻讀博士學(xué)位,并入選深圳市大數(shù)據(jù)研究院聯(lián)合培養(yǎng)項目。
科研感想:
非常榮幸深圳市大數(shù)據(jù)研究院能夠提供這樣一個平臺,讓我們有機會與業(yè)界龍頭企業(yè)展開合作,并且能夠得到大牛老師的親身指導(dǎo),將平時所學(xué)習(xí)到的理論和算法與實際業(yè)務(wù)場景結(jié)合起來,提供真實的實踐數(shù)據(jù),做到真正的學(xué)有所用。
我在深圳市大數(shù)據(jù)研究院中已度過一年半時間,期間主要參與了與華為公司合作的分包業(yè)務(wù)智能調(diào)度項目。該項目通過提供標(biāo)準(zhǔn)程序數(shù)據(jù),考慮分包商與分包隊伍包含關(guān)系,基于分包隊伍工作效率,利用匈牙利算法,遺傳算法等算法思想匹配任務(wù)與分包隊伍。從而精細化地刻畫業(yè)務(wù)站點的項目管理場景,達到完工時間最小化。相對于傳統(tǒng)方法,大量節(jié)省分配時間,提升管理效率。
個人認為,只有通過實踐與理論的有效結(jié)合,才能真正做到個人能力的提升。而在真實業(yè)務(wù)場景中,如何面對多變的需求也是在算法設(shè)計過程中值得考慮的重要問題,同時只有將業(yè)務(wù)場景抽象為自己的科研創(chuàng)意,才能做出有意義的研究。