直播預(yù)告 | 8月10日 長序列建模技術(shù)
長序列建模技術(shù)在自然語言生成領(lǐng)域具有重要意義,對(duì)于需要參考較長對(duì)話歷史信息、處理復(fù)雜問題的大語言模型來說更是如此。傳統(tǒng)序列建模技術(shù)在處理超長序列時(shí),往往面臨難以捕捉長距離依賴關(guān)系、內(nèi)存消耗過大和計(jì)算效率低下等問題,而長序列建模賦予模型理解較長上下文的能力,進(jìn)而生成更加連貫且合理的內(nèi)容。在大語言模型時(shí)代,哪些長序列技術(shù)經(jīng)受住大模型的考驗(yàn)成為領(lǐng)域的常青樹?又有哪些新的長序列技術(shù)涌現(xiàn)而出?
本期報(bào)告將圍繞上述問題展開,介紹長序列建模技術(shù)的發(fā)展歷程和關(guān)鍵技術(shù),思考長序列技術(shù)在大語言模型發(fā)展過程中的應(yīng)用與挑戰(zhàn)。首先,我們將介紹長序列建模的主流技術(shù)方法和思想。其次,詳細(xì)介紹大語言模型采用的長序列建模相關(guān)技術(shù),并思考其未來的發(fā)展與挑戰(zhàn)。本次報(bào)告例舉了建模超長序列的主流技術(shù),旨在為大語言模型的研究者帶來些許啟發(fā)。
本期報(bào)告將于8月10日線上舉辦,屆時(shí)由來自東北大學(xué)自然語言處理實(shí)驗(yàn)室的劉新宇為我們帶來《長序列建模技術(shù)》報(bào)告,具體流程如下:

本次直播將分為兩部分進(jìn)行,第一部分為報(bào)告分享環(huán)節(jié),第二部分為Q&A環(huán)節(jié)。在直播過程中,小伙伴可以把問題發(fā)送到直播間中,并在Q&A環(huán)節(jié)與本期嘉賓深入探討;未被回復(fù)的問題也可私信留言,在直播結(jié)束后我們會(huì)進(jìn)行解答。
本系列直播作為公益知識(shí)分享活動(dòng),由東北大學(xué)自然語言處理實(shí)驗(yàn)室、小牛翻譯聯(lián)合推出,感謝AI科技評(píng)論、PaperWeekly、機(jī)器之心、并行科技對(duì)本次直播的大力支持,本次直播向所有聽眾免費(fèi)開放,無需注冊(cè)和報(bào)名繳費(fèi)。參會(huì)觀眾可以在【視頻號(hào)(ID:??小牛翻譯云平臺(tái))、微博(ID:小牛翻譯)、嗶哩嗶哩(ID:小牛翻譯)、知乎(ID:小牛翻譯云平臺(tái))、機(jī)器翻譯學(xué)堂(https://school.niutrans.com/live)】觀看直播,關(guān)注【機(jī)器翻譯學(xué)堂、小牛翻譯云平臺(tái)視頻號(hào)】即可觀看直播回放。
誠邀所有關(guān)注自然語言處理與大模型技術(shù)發(fā)展的朋友走進(jìn)直播間,2023年8月10日(周四)18:30,我們期待與您的相遇!
