Talk預告 | 清華大學在讀博士生詹靖濤:基于聯(lián)合優(yōu)化編碼和索引的高效向量檢索模型

本期為TechBeat人工智能社區(qū)第403期線上Talk。北京時間5月5日(周四)20:00,清華大學在讀博士生——詹靖濤的Talk將準時在TechBeat人工智能社區(qū)開播!
他與大家分享的主題是: “基于聯(lián)合優(yōu)化編碼和索引的高效向量檢索模型”,屆時將介紹目前基于聯(lián)合優(yōu)化來提升向量檢索有效性的相關研究。
Talk·信息
主題:基于聯(lián)合優(yōu)化編碼和索引的高效向量檢索模型
嘉賓:?清華大學在讀博士生詹靖濤
時間:北京時間?5月5日?(周四) 20:00
地點:TechBeat人工智能社區(qū)
http://www.techbeat.net/

完整版怎么看?
掃描下方二維碼,或復制鏈接https://datayi.cn/w/QReKddno至瀏覽器,一鍵完成預約!上線后會在第一時間收到通知哦
Talk·提綱
近年來,稠密向量檢索技術(shù)逐漸成為重要的第一階段檢索的技術(shù)。通過把查詢和文檔表征為稠密向量,這一技術(shù)取得了比傳統(tǒng)檢索方法更好的召回結(jié)果。然而,基于稠密向量的暴力搜索會導致巨大的存儲和計算開銷,使得這一檢索技術(shù)較為低效。本次Talk介紹目前基于聯(lián)合優(yōu)化來提升向量檢索有效性的相關研究。這些研究對表征進行乘積量化,從而提升了存儲和計算的效率。同時,編碼器和乘積量化算法會進行聯(lián)合優(yōu)化,這使得檢索性能不會因為量化而損失。研究表明,這種方法可以在大大提升檢索效率的同時幾乎不損害檢索性能。
具體分享提綱如下:
1. 背景知識:雙塔模型,PQ
2. RepCONC模型:第一階段的聯(lián)合訓練(側(cè)重可導的優(yōu)化),第二階段的聯(lián)合訓練(側(cè)重端到端的優(yōu)化)
3. 實驗結(jié)果
4. 總結(jié)
5. 未來工作
Talk·提問交流
通過以下兩種方式提問都將獲得微信現(xiàn)金紅包獎勵哦!
方式 ①
在Talk界面下的【交流區(qū)】參與互動!留下你的打call??和問題??,和更多小伙伴們共同討論,被講者直接翻牌解答!
你的每一次貢獻,我們都會給予你相應的i豆積分,還會有驚喜獎勵哦!
方式 ②
在本文留言區(qū)直接提出你的問題,或掃描下方二維碼提問!

Talk·嘉賓介紹

詹靖濤目前為清華大學計算機系的在讀博士生,于2020年獲得清華大學學士學位。他的研究方向是信息檢索,目前專注于提升稠密向量檢索模型的有效性、效率和可解釋性。他在頂級IR會議上發(fā)表了若干篇論文,包括SIGIR、theWebConf、WSDM和CIKM,曾獲得WSDM 2022最佳論文獎。
個人主頁:
https://jingtaozhan.github.io/


關于TechBeat人工智能社區(qū)
TechBeat (www.techbeat.net) 是一個薈聚全球華人AI精英的成長社區(qū)。 我們希望為AI人才打造更專業(yè)的服務和體驗,加速并陪伴其學習成長。 期待這里可以成為你學習AI前沿知識的高地,分享自己最新工作的沃土,在AI進階之路上的升級打怪的根據(jù)地!
更多詳細介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ