“破壁英才” 2023 年春季招募計劃

????文末查看簡歷投遞方式?
OpenBMB 在 2022 年 7 月發(fā)起了面向高校博士生、碩士生和優(yōu)秀本科生的?“破壁英才” 實習(xí)生項目。項目由面壁智能公司和清華大學(xué)自然語言處理實驗室共同發(fā)起,旨在培養(yǎng)大模型相關(guān)的高水平研究與工程人才。
在項目中,我們?yōu)閷嵙?xí)生同學(xué)提供?良好的工作氛圍、豐富的交流機(jī)會、舒適的辦公環(huán)境、豐厚的工作待遇,并希望每一位實習(xí)生都能夠?qū)W有所用、不斷進(jìn)步,勇攀科學(xué)與技術(shù)的高峰。項目發(fā)起以來,我們陸續(xù)接收了來自國內(nèi)外 10 多所高校的實習(xí)生,他們有的仍然留在這里深耕大模型領(lǐng)域,有的繼續(xù)去高校深造相關(guān)學(xué)業(yè),但都坦言這是一次有意義的經(jīng)歷。
春回大地,萬物復(fù)蘇,我們期待與你一同在春天耕耘。今天,我們正式發(fā)布“破壁英才”實習(xí)生項目的?2023 年春季招募計劃,招募計劃包括?團(tuán)隊介紹、收獲預(yù)期、職位介紹、上崗要求、實習(xí)生感想、投遞方式?六大部分,詳情如下:

01?關(guān)于我們
—
OpenBMB 全稱為 Open Lab for Big Model Base,宗旨為?“讓大模型飛入千家萬戶”。團(tuán)隊目前主要由清華大學(xué)自然語言處理實驗室成員組成,致力于?大模型核心技術(shù)研發(fā)與創(chuàng)新應(yīng)用構(gòu)建,推動大模型技術(shù)標(biāo)準(zhǔn)化,降低大模型使用門檻,構(gòu)建智能時代大模型基礎(chǔ)設(shè)施。我們的團(tuán)隊特色:
??????開源信仰堅定?
團(tuán)隊具有豐富的自然語言處理技術(shù)的開源經(jīng)驗,團(tuán)隊成員前期曾參與發(fā)布了 OpenKE、OpenNRE、OpenNE 等一系列有世界影響力的工具包,在 GitHub 上累計獲得?超過5.8萬星標(biāo),位列?全球機(jī)構(gòu)第142位
OpenBMB 開源社區(qū)參與發(fā)起的所有項目在 GitHub 收獲了?4k+星標(biāo),為國內(nèi)開發(fā)者提供了良好服務(wù)體驗,吸引了一大批感興趣的開發(fā)者參與其中,目前有超過2000名?開發(fā)者加入 OpenBMB 開源社區(qū)微信群
??????研發(fā)實力雄厚?
創(chuàng)始團(tuán)隊來自于清華大學(xué)計算機(jī)系自然語言處理與社會人文計算實驗室,由知名清華大學(xué)教授擔(dān)任技術(shù)顧問,成員包括?國家獎學(xué)金獲獎?wù)?、全國信息學(xué)競賽金牌得主等
核心團(tuán)隊成員均具有知名大學(xué)博士和碩士學(xué)歷,在國際國內(nèi)權(quán)威期刊發(fā)表論文百余篇,獲得十余項專利授權(quán),科研和技術(shù)實力處于國內(nèi)領(lǐng)先水平
曾開源發(fā)布多個有學(xué)術(shù)與業(yè)界影響力的大模型,其中包括?國內(nèi)首個?中文大模型 CPM-1、高效易用大模型 CPM-2、可控持續(xù)大模型 CPM-3、國內(nèi)首個?法律領(lǐng)域大模型 Lawformer、生物醫(yī)學(xué)領(lǐng)域大模型 KV-PLM(論文入選Nature Communications Spotlight)等
????? 業(yè)務(wù)場景豐富?
面壁智能公司成立初期完成?近千萬種子輪融資,并與國內(nèi)知名機(jī)構(gòu)與公司達(dá)成戰(zhàn)略合作
目前公司已達(dá)成?數(shù)百萬元?訂單并得到客戶廣泛認(rèn)可,具有豐富的業(yè)務(wù)場景
????♂??? 倡導(dǎo)交流分享?
團(tuán)隊在智源社區(qū)、B站等平臺開展?相關(guān)技術(shù)交流與分享十余場
團(tuán)隊推出國內(nèi)首門大模型課程,在各大平臺持續(xù)積累關(guān)注度,B站賬號播放量達(dá)?6w+次,知乎播放量近?50w次

02?你將獲得
—
????? 難得的機(jī)會?
在這里,你將獲得下列寶貴與難得的機(jī)會:
零距離參與當(dāng)前?AI領(lǐng)域最火熱研究課題——大規(guī)模預(yù)訓(xùn)練模型的研究與應(yīng)用
了解與參與一家AI創(chuàng)業(yè)公司?從0到1?的發(fā)展歷程
??????豐富的交流?
我們將為熱愛計算機(jī)、熱愛大模型的同學(xué)們提供豐富的交流活動:
我們會每月組織領(lǐng)域?大牛學(xué)術(shù)分享會,為每一位同學(xué)提供和領(lǐng)域大牛面對面交流機(jī)會,共同探索最前沿的工作
我們還會安排實習(xí)生與?科學(xué)家導(dǎo)師一對一交流,就關(guān)于如何做好科研、如何選定方向、未來職業(yè)規(guī)劃等問題進(jìn)行探討
????? 豐厚的報酬?
我們將為每一位加入面壁智能的同學(xué)提供?具有競爭力的報酬:
工作上,我們?yōu)榇蠹覝?zhǔn)備了?MacBook Pro、4K顯示器
生活上,我們將為實習(xí)生提供具有市場競爭力的?薪資與餐補(bǔ),不間斷供應(yīng)豐富的?零食、水果與下午茶
????? 光明的未來?
我們希望每一位實習(xí)的同學(xué)都能找到適合自己的發(fā)展道路:
實習(xí)結(jié)束后,我們將為每一位同學(xué)提供由面壁智能和 THUNLP?聯(lián)合認(rèn)證實習(xí)證明,表現(xiàn)優(yōu)異的同學(xué)更有機(jī)會拿到科學(xué)家導(dǎo)師的?推薦信
同時,我們也將為表現(xiàn)優(yōu)異的同學(xué)提供?全職留用?的機(jī)會

03?職位介紹
—
????? 技術(shù)類崗位?
???NLP系統(tǒng)實習(xí)生
工作內(nèi)容
開發(fā)大規(guī)模預(yù)訓(xùn)練語言模型訓(xùn)練、部署、微調(diào)系統(tǒng),主要涉及功能實現(xiàn)、性能優(yōu)化、系統(tǒng)調(diào)優(yōu)、硬件適配等工作;
在工作的過程中,需要根據(jù)具體任務(wù)的需求,查閱相關(guān)資料和文獻(xiàn),并結(jié)合實際情況實現(xiàn)相應(yīng)技術(shù)。
任職要求
熟練掌握 C語言和 Python;
熟悉 CUDA 計算架構(gòu),擁有 CUDA 相關(guān)編程經(jīng)驗;
了解 NLP領(lǐng)域重要任務(wù)、主流模型結(jié)構(gòu);
熟練使用 Pytorch 深度學(xué)習(xí)框架;
能夠熟練閱讀外文文獻(xiàn)、文檔和相關(guān)社區(qū)論壇內(nèi)容,可以針對自己的需要檢索并學(xué)習(xí)相關(guān)知識;
有良好的溝通能力,工作積極主動,對大模型的應(yīng)用感興趣,能夠與團(tuán)隊其他成員協(xié)作。
???NLP應(yīng)用實習(xí)生
工作內(nèi)容
參與算法落地及對接工作,利用已有系統(tǒng)實現(xiàn)大規(guī)模語言模型在具體任務(wù)上的應(yīng)用,并與相關(guān)開發(fā)人員完成相應(yīng)的功能對接和調(diào)整工作;
在工作的過程中,能夠根據(jù)自己對算法的理解,主動探索或提出新的應(yīng)用場景,并進(jìn)行原型的實現(xiàn);
參與?文生圖、智能對話?等創(chuàng)新應(yīng)用的研究與開發(fā)。
任職要求
熟練掌握 C語言和 Python;
有 NLP領(lǐng)域相關(guān)開發(fā)或科研經(jīng)驗,了解 NLP領(lǐng)域重要任務(wù)和主流模型,對預(yù)訓(xùn)練語言模型有深入了解;
能夠根據(jù)自己的想法,自主檢索相關(guān)文獻(xiàn),并設(shè)計合理技術(shù)路線;
有良好的溝通能力,工作積極主動,對大模型的應(yīng)用感興趣,能夠與團(tuán)隊其他成員協(xié)作。
???NLP數(shù)據(jù)實習(xí)生
工作內(nèi)容
根據(jù)研發(fā)人員的需求,收集、處理大規(guī)模文本數(shù)據(jù),并構(gòu)建相應(yīng)數(shù)據(jù)集,用于支撐大模型的訓(xùn)練與應(yīng)用;
在工作過程中,能夠主動挖掘數(shù)據(jù)價值,并能對數(shù)據(jù)進(jìn)行一些基礎(chǔ)特征的分析;
對接標(biāo)注平臺與公司,負(fù)責(zé)數(shù)據(jù)標(biāo)注的質(zhì)量管理與監(jiān)督。
任職要求
熟練掌握 C語言和 Python;
能夠完成常見的數(shù)據(jù)處理工作,例如:去重、去噪、HTML解析等;
對 NLP 領(lǐng)域有所了解,包括常用工具、常見算法等;
有良好的溝通能力,工作積極主動,對大模型的應(yīng)用感興趣,能夠與團(tuán)隊其他成員協(xié)作
???JAVA后端實習(xí)生
工作內(nèi)容
參與項目設(shè)計及功能開發(fā);
參與制定、調(diào)整、完善現(xiàn)有項目開發(fā)及新功能的需求分析。
任職要求
計算機(jī)或相關(guān)專業(yè)在校生;
Java 基礎(chǔ)扎實,包括 JVM、IO、多線程、并發(fā)、網(wǎng)絡(luò),理解面向?qū)ο?、設(shè)計原則、封裝抽象等;
熟悉常用的 Java 技術(shù)框架,如 spring;
熟悉分布式系統(tǒng)的設(shè)計和應(yīng)用,熟悉數(shù)據(jù)庫、緩存、消息隊列、RPC 等內(nèi)部機(jī)制者優(yōu)先。
???Web前端實習(xí)生
工作內(nèi)容
參與前端項目的功能設(shè)計、技術(shù)開發(fā)、調(diào)試和維護(hù);
參與跨部門的需求溝通、數(shù)據(jù)交互聯(lián)調(diào)與接口討論設(shè)計,獨立完成開發(fā)任務(wù)。
任職要求
計算機(jī)或相關(guān)專業(yè)在校生;
有良好的編碼習(xí)慣 ,熟悉W3C規(guī)范,熟悉 HTML5/CSS/JavaScript/ES6+/Typescript 等前端基本技能;
了解Vue框架,并有實際使用經(jīng)驗者優(yōu)先。
????? 非技術(shù)類崗位?
???產(chǎn)品實習(xí)生
工作內(nèi)容
參與技術(shù)轉(zhuǎn)化為落地產(chǎn)品的全流程,包括需求調(diào)研、競品分析、產(chǎn)品設(shè)計、項目管理等工作內(nèi)容。
任職要求
對AI與NLP技術(shù)有興趣,技術(shù)相關(guān)背景優(yōu)先;
有相關(guān)產(chǎn)品從0到1開發(fā)經(jīng)驗者優(yōu)先。
???戰(zhàn)略實習(xí)生
工作內(nèi)容
參與公司戰(zhàn)略制定、融資、產(chǎn)品推進(jìn)與營銷的各環(huán)節(jié),完成相關(guān)調(diào)研與分析報告。
任職要求
對于創(chuàng)業(yè)與公司運營感興趣,具有經(jīng)濟(jì)學(xué)、金融等學(xué)科背景優(yōu)先;
具有風(fēng)投、基金、咨詢公司經(jīng)驗者優(yōu)先。

04?上崗要求
—
????? 實習(xí)地點?
北京市海淀區(qū)清華科技園威盛大廈

????? 實習(xí)要求??
為了保證工作的連續(xù)性以及能夠產(chǎn)出足夠?qū)懭牒啔v的成果,我們希望你能有?至少 3個月的實習(xí)期,每周至少實習(xí) 4天
為了保持溝通的順暢與高效的工作效率,對于能夠現(xiàn)場辦公的同學(xué),我們鼓勵盡量?線下實習(xí)

05?實習(xí)生感想
—
?????白同學(xué)—清華大學(xué)深圳國際研究生院研究生?
在之前同學(xué)的介紹下,我有幸來到 ModelBest 團(tuán)隊,并開始參與到大模型預(yù)訓(xùn)練的任務(wù)中去。任務(wù)初期,由于對上手流程的不熟悉,經(jīng)常請教團(tuán)隊里的各位學(xué)長與同學(xué),而大家也會非常熱心地指導(dǎo)我在工作中遇到的各個問題,幫助我快速融入到團(tuán)隊中。在實習(xí)的四個月中,從剛開始確定模型訓(xùn)練目標(biāo),搭建模型框架,數(shù)據(jù)處理,到后期的模型訓(xùn)練與測試,每一步的工作都需要及時核驗效果、分析結(jié)果。雖然之前在大模型訓(xùn)練領(lǐng)域的經(jīng)驗較少,但在?每個環(huán)節(jié)都有團(tuán)隊成員嚴(yán)謹(jǐn)?shù)闹笇?dǎo)與核驗,而且團(tuán)隊中也積累了相當(dāng)?shù)募夹g(shù)基礎(chǔ)如 BMTrain 和 Model Center 等,我可以在快速熟悉團(tuán)隊工作的基礎(chǔ)上,擴(kuò)展自己的任務(wù)。在這個過程中我收獲到的不僅是科研經(jīng)驗,更多的是一種?認(rèn)真務(wù)實的科研精神。在任務(wù)后期,針對模型訓(xùn)練中出現(xiàn)的各種結(jié)果與問題,團(tuán)隊成員都會共同分析原因,進(jìn)行下一步工作的規(guī)劃,在這個過程中也能夠?qū)W習(xí)到最新的前沿工作,并思考與自身工作可以進(jìn)行結(jié)合的地方,對自己的工程能力與科研能力都有很大的幫助與提升。
非常感謝團(tuán)隊中的學(xué)長與同學(xué)對我的幫助,讓我能夠在這一份收獲滿滿的實習(xí)經(jīng)歷中?得到快速的成長,也希望之后自己可以繼續(xù)擴(kuò)展自己的知識廣度與深度,在這個領(lǐng)域持續(xù)做出貢獻(xiàn)。
?????黃同學(xué)—北京航空航天大學(xué)研究生?
在機(jī)緣巧合之下,我有幸加入到 ModelBest 這個優(yōu)秀的團(tuán)隊中來,并與各位優(yōu)秀的老師、學(xué)長、同事共同開展大模型相關(guān)的工作。在這里,我能感受到大家作為?頂級科研團(tuán)隊的責(zé)任與擔(dān)當(dāng),也能體會到對工作中?每個環(huán)節(jié)的細(xì)致與嚴(yán)謹(jǐn),獲益良多。大模型的工作是一項復(fù)雜的大工程,數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、模型推理等各方面環(huán)環(huán)相扣,微小的錯誤也可能導(dǎo)致任務(wù)的失敗。但是在以上方面團(tuán)隊中早已有了對應(yīng)的技術(shù)積累(包括但不限于 BMTrain、BMInf 等開源工具包),顯著提高了各項工作的效率。再加上學(xué)長們及時的答疑解惑,讓這項工程能夠穩(wěn)步推進(jìn)。感謝劉導(dǎo)與團(tuán)隊大家的指導(dǎo),期待后續(xù)能在大模型領(lǐng)域內(nèi)收獲更多的成果。
?????張同學(xué)—清華大學(xué)本科生?
通過實驗室老師的介紹成為了 ModelBest 的實習(xí)生。這是我的第一份實習(xí)工作,剛開始的時候每天都在問各種問題,好在各位前輩們都非常耐心地做出了解答,我也很快地融入了團(tuán)隊。實習(xí)的三個月中,我從學(xué)長給我提供的上手任務(wù)(一個服務(wù)器用戶訪問的記錄系統(tǒng))開始熟悉了前后端的框架,然后開始負(fù)責(zé) Delta Center 的開發(fā),主要完成了網(wǎng)站的原型設(shè)計,實現(xiàn)了 delta 對象的云端儲存以及信息展示并且在前端提供了定制的 markdown 渲染功能。
ModelBest 是一個?非常年輕開放的團(tuán)隊,每一位成員都有機(jī)會在自己擅長的領(lǐng)域上主導(dǎo)一些工作,這對于個人的成長是非常有益的。內(nèi)部的學(xué)習(xí)氛圍也非常濃厚,我大約有 1/3 的時間用在學(xué)習(xí)前后端的相關(guān)知識,從一個菜鳥逐漸成長為可以獨當(dāng)一面的工程師。最后也非常感謝劉老師對我的支持和幫助,讓我獲得寶貴的實習(xí)機(jī)會,并且還為我提供了推薦信,使我順利拿到了 UCSD 的深造 Offer。
?????張同學(xué)—北京郵電大學(xué)研究生?
非常幸運加入到面壁智能這樣一個優(yōu)秀、年輕、充滿活力的團(tuán)隊。遇到技術(shù)問題可以和大家一塊討論,有新的收獲大家組會可以一起分享,除了嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)外,關(guān)于人生的規(guī)劃也可以找到老師和同事進(jìn)行探討。在過去實習(xí)的將近 6個月的時間里,讓我印象最深刻的是看到大家對于自然語言處理相關(guān)技術(shù)的熱愛,以及基于這種熱愛而衍生的想讓更多人了解大模型或者讓相關(guān)技術(shù)服務(wù)于更多群體的目標(biāo)。
正是基于這樣的初衷,團(tuán)隊開發(fā)了 BMTrain、BMInf、BMCenter 等相關(guān)套件,讓服務(wù)離用戶更近、讓技術(shù)的部署不再局限于昂貴的硬件、讓更多的開發(fā)者凝聚到一起來推動大模型的進(jìn)步。在這里做的第一個任務(wù)是基于 CPM3 的文本壓縮,經(jīng)常會遇到生成文本長度不滿足要求,或者長度滿足但是文本關(guān)鍵信息丟失等情況,針對每種情況通過與同事不斷的探討去改進(jìn)到解決。到后面獨立負(fù)責(zé)文本修正和廣告處理等任務(wù),因為有很多優(yōu)秀的同事一起去探討和指導(dǎo),所以在這個過程中積累豐富的訓(xùn)練模型的經(jīng)驗,對數(shù)據(jù)有了更深刻的理解,對大模型的能力有了新的認(rèn)識。
大模型能做的事情有很多,需要去為大模型做的事也有很多,很幸運加入到面壁智能這樣做大模型的團(tuán)隊以及 OpenBMB 這樣開放的大模型社區(qū)。
?????孫同學(xué)—山西大學(xué)研究生?
在面壁智能實習(xí)的這幾個月,在各位同學(xué),同事的指導(dǎo)與合作下,我有幸為 BMTrain、ModelCenter 等開源工具包開發(fā)了一些新的特色功能。在這里,我能感受到大家對?最新的AI科研技術(shù)的蓬勃熱情,在看到其他同學(xué)和同事的PR時,我意識到我們不僅追求做到一件事,更想要把事情做好。
在這里,標(biāo)準(zhǔn)的工作流程和高效的協(xié)作使得開發(fā)事半功倍,同時也?沒有傳統(tǒng)職場的交流壓力,對各種新的技術(shù)與科研成果,都可以暢所欲言。導(dǎo)師制的實習(xí)培養(yǎng)方案,使得我能夠快速的掌握領(lǐng)域現(xiàn)狀,積累研究經(jīng)驗,并即時得到反饋,從而快速迭代自己的知識庫。
最后,感謝各位老師和同事,為我提供了這樣的實習(xí)機(jī)會,后面我將繼續(xù)在大模型領(lǐng)域深耕鉆研。

06?簡歷投遞
—
發(fā)送個人簡歷至電子郵箱?openbmb@gmail.com,標(biāo)題為?“姓名-學(xué)校-崗位”?。
????? 一些額外的Tips?
每一份簡歷我們都會認(rèn)真對待,如果您不符合我們的要求,我們認(rèn)為這僅僅是您的能力目前暫時不匹配我們的崗位需求,我們會給出具體的拒絕理由以及我們認(rèn)為可行的個人發(fā)展建議,我們也非常歡迎能夠大家能夠隔一段時間再次投遞
想要參與但擔(dān)心缺乏相關(guān)的專業(yè)知識?沒關(guān)系,只要你?展現(xiàn)出強(qiáng)烈的興趣與快速學(xué)習(xí)能力,我們會為你提供相應(yīng)的機(jī)會
沒有合適的崗位?不妨先投遞簡歷!我們完全支持?針對你的專長設(shè)定合適的崗位職責(zé)

? 傳送門 |官方網(wǎng)站?
?? https://www.openbmb.org
? 傳送門 |GitHub 主頁?
??? https://github.com/OpenBMB
?? 加社群/ 提建議/ 有疑問?
請找 OpenBMB 萬能小助手:

?? 關(guān)注我們
微信搜索關(guān)注 “OpenBMB開源社區(qū)”
后臺回復(fù)“CPM-Live” 即可加入CPM-Live加油群
還可獲取更多大模型干貨知識和前沿資訊!?

