極市直播預(yù)告|大模型時代目標(biāo)檢測的三點嘗試
|極市線上分享第118期 |
一直以來,為讓大家更好地了解學(xué)界業(yè)界優(yōu)秀的論文和工作,極市已邀請了超過100位技術(shù)大咖嘉賓,并完成了117?期極市線上直播分享。
往期分享請前往bbs.cvmart.net/topics/149,也歡迎各位小伙伴自薦或推薦更多優(yōu)秀的技術(shù)嘉賓到極市進(jìn)行技術(shù)分享,與大家一起交流學(xué)習(xí)~~
本次分享我們邀請到了香港大學(xué)的博士生孫培澤,為大家介紹他們的一些探索工作:
Learning Object-Language Alignments for Open-Vocabulary Object Detection(ICLR2023)
Going Denser with Open-Vocabulary Part Segmentation(ICCV2023)
Semantic-SAM: Segment and Recognize Anything at Any Granularity.
GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest
01
直播信息
時間
2023年8月3日(周四):21:00-22:00
主題
大模型時代目標(biāo)檢測的三點嘗試
直播
極市平臺視頻號
B站也將同步進(jìn)行
http://live.bilibili.com/3344545
02
嘉賓介紹

孫培澤
香港大學(xué)博士生,指導(dǎo)老師為羅平副教授。研究方向為計算機視覺和深度學(xué)習(xí),包括目標(biāo)檢測分割追蹤和視覺語言多模態(tài)模型。
03
關(guān)于分享
?分享大綱
1.回顧目標(biāo)檢測的發(fā)展歷程
2.目標(biāo)檢測的三點嘗試
- 從封閉環(huán)境到開放世界
- 從單一模型到交互系統(tǒng)
- 從視覺感知到多模態(tài)推理
3. 目標(biāo)檢測的新展望:多模態(tài)大模型
?論文
Learning Object-Language Alignments for Open-Vocabulary Object Detection(ICLR2023)
論文地址:
https://openreview.net/pdf?id=mjHlitXvReu
項目地址:
https://github.com/clin1223/VLDet
Going Denser with Open-Vocabulary Part Segmentation(ICCV2023)
論文地址:
https://arxiv.org/abs/2305.11173
項目地址:
https://github.com/facebookresearch/VLPart
Semantic-SAM: Segment and Recognize Anything at Any Granularity
論文地址:
https://arxiv.org/abs/2307.04767
項目地址:
https://github.com/UX-Decoder/Semantic-SAM
GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest
論文地址:
https://arxiv.org/abs/2307.03601
項目地址:
https://github.com/jshilong/GPT4RoI
