【VALSE2023】0611《Workshop :圍繞手機(jī)的計(jì)算影像學(xué)》
2023-08-14 15:50 作者:墨天明-MoreTiming | 我要投稿

當(dāng)A(學(xué)術(shù))遇到I(工業(yè))
?00:03?
00:03
?略
?
28:12
?A和I的距離和沖突
本質(zhì)上是數(shù)據(jù)和度量的問(wèn)題:
- 學(xué)術(shù)界訓(xùn)練數(shù)據(jù)和實(shí)際情況不是同分布的,導(dǎo)致泛化出bug
- 合成數(shù)據(jù)(人造退化)與真實(shí)數(shù)據(jù)之間的gap
- 真實(shí)數(shù)據(jù)采集的困境(去噪已有系統(tǒng)的解決方案)
- 學(xué)術(shù)界和工業(yè)界的度量評(píng)價(jià)指標(biāo)不一致,優(yōu)化方向不同
- 現(xiàn)有的客觀指標(biāo)無(wú)法準(zhǔn)確描述主觀視覺質(zhì)量
- 學(xué)術(shù)界的度量方式在工業(yè)界略顯naive(指不實(shí)用,不是說(shuō)不夠復(fù)雜)





?34:07?
34:07
?展望

- 實(shí)用高效小模型
- 本人在做的就是這個(gè)方向的工作,只不過(guò)我主攻的是數(shù)據(jù)不是模型
- 網(wǎng)絡(luò)結(jié)構(gòu)還是讓工業(yè)界自己優(yōu)化吧,小網(wǎng)絡(luò)對(duì)算子的要求太高了,脫離生產(chǎn)搞不出來(lái)能實(shí)用的東西,太貼近生產(chǎn)又很難升華出能發(fā)paper的東西……
- 底層視覺大模型
- 個(gè)人認(rèn)為,復(fù)原式生成大模型有的搞,生成式復(fù)原大模型要求太高了,人眼到現(xiàn)在都還有視錯(cuò)覺呢。
- 我其實(shí)一直也想搞生成式復(fù)原,但一是資源不夠,二是沒想清楚怎么合理地優(yōu)雅地解決這個(gè)任務(wù)。
- 暴力的解法其實(shí)挺多的了(不過(guò)生成模型普遍在實(shí)戰(zhàn)中會(huì)遇到更嚴(yán)重的OOD問(wèn)題
標(biāo)簽: