9月13、14日,手握二十多篇頂會論文的Paul老師,帶大家解讀最新多模態(tài)頂會論文。
在各種科幻大片里,我們似乎可以照見科技發(fā)展的趨勢與目標。
比如,與真人無二的Ai機器人;
會讓人產(chǎn)生,為科研,掉再多頭發(fā)都值得的錯覺(不是)。

人工智能的發(fā)展其實是一個不斷模擬人類,逐漸向人類智能逼近的過程。
在現(xiàn)實世界中,數(shù)據(jù)天然以“多模態(tài)”的形式存在,人類通過綜合運用視覺、聽覺、觸覺、嗅覺等多種感官,來接觸和理解大千世界。因此,要探索實現(xiàn)通用人工智能(AGI)的路徑,人工智能(AI)從單模態(tài)走向多模態(tài)必然是大勢所趨。
當我們把目光從未來拉向當前,“多模態(tài)”的落地應用場景也非常廣泛——
借助多模態(tài)技術,AI實現(xiàn)了圖像、視頻、音頻、語義文本等多維度資源的融合互補,不僅決策更加精準,還在行為和智商上更接近人類。
深藏多種黑科技的AI虛擬主播,同樣是基于多模態(tài)技術的快速演進,成為感知智能邁向認知智能階段的重要探索。
我們需要從多個粒度去理解內(nèi)容,而關注多模態(tài)技術的發(fā)展已經(jīng)是當今學界和工業(yè)界的共識。
9月13、14日,私信進群免費看直播
聽亞馬遜 Applied Scientist 聊大火的多模態(tài)
(免費領取多模態(tài)必讀論文合集)

說到挑戰(zhàn),多模態(tài)仍然存在一些待解決的挑戰(zhàn)——
如何解決?“語義鴻溝”?
如何掌握大量匹配的多模態(tài)數(shù)據(jù)?
如何確定多模態(tài)預訓練的有效架構?
……
而作為已入坑多模態(tài)方向的研究生,多模態(tài)面臨的挑戰(zhàn)以及未來的可創(chuàng)新方向,天然的吸引著關注。畢竟不論是為了畢業(yè)還是申博亦或是未來的就業(yè)機會。論文都是繞不開的永恒話題,而沒有創(chuàng)新,就沒有好的論文。
面前擺放著多模態(tài)這盤“當紅辣子雞”,剩下的工作就是如何找創(chuàng)新點、get idea,寫好論文了。寫出好的論文,才是硬道理~
為了找到創(chuàng)新方向,大量精讀前沿論文是必不可少的一步。
但其實,精讀論文只是第一步。
后面更重要的是,通過精讀進行論文復現(xiàn)、從優(yōu)秀的工作中找到靈感、為自己的工作提供營養(yǎng)……
更可怕的是,在第一步就被卡住。
不免感慨,如果有一位科研過硬的前輩指導,天下哪還有難讀的論文……
畢竟導師總是放養(yǎng),師哥師姐也總是忙……
9月13、14日,沃恩智慧金牌講師、手握二十多篇頂會論文的Paul老師,帶大家解讀最新多模態(tài)頂會論文。通過前沿論文精讀,講解基礎多模態(tài)學習概念、多模態(tài)數(shù)據(jù)的融合策略、AutoML的基礎概念及其在多模態(tài)中的結(jié)合……
Paul老師目前已經(jīng)發(fā)表二十多篇頂會論文!
二十多篇頂會!??!是什么概念?
這大概是頂會收割機吧!大概就是從入學開始一直都在不斷的發(fā)頂會吧!大概就是年紀輕輕發(fā)頂會的數(shù)量已經(jīng)超過了大多數(shù)人一輩子的數(shù)量!
Paul老師強調(diào),這次公開課尤其適合對AI有一定了解,但是沒有明確選題目標;或者已經(jīng)明確自己選題,但是找不到改進方向的同學;當然也適合或者對多模態(tài)感興趣的從業(yè)者。
所以,如果你對自己的選題和研究方向還有疑問,這節(jié)課你一定不能錯過。作為有這么強悍的頂會論文經(jīng)驗的老師,一定能給出你專業(yè)的意見和指導。
如果你足夠運氣,還可以在直播中抽中與導師一對一meeting的機會!
大牛導師手把手指點,還有什么迷霧是撥不開的嗎?