最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

實(shí)時(shí)追蹤科研動(dòng)態(tài)丨7.11精選新論文,附ChatPaper綜述

2023-07-12 10:33 作者:AMiner科技  | 我要投稿

作為科研人員,每天需要檢索和瀏覽大量的學(xué)術(shù)文獻(xiàn),以獲取最新的科技進(jìn)展和研究成果。然而,傳統(tǒng)的檢索和閱讀方式已經(jīng)無法滿足科研人的需求。ChatPaper,一款集檢索、閱讀、知識(shí)問答于一體的文獻(xiàn)知識(shí)工具。幫助你快提高檢索、閱讀論文效率,獲取最新領(lǐng)域研究動(dòng)態(tài),讓科研工作更加游刃有余。

結(jié)合前沿動(dòng)態(tài)訂閱功能,精選arXiv當(dāng)日熱門新論文,形成論文綜述,讓大家更加快速了解前沿動(dòng)態(tài)。如果想要對(duì)某篇論文進(jìn)行深入對(duì)話,可以直接復(fù)制論文鏈接到瀏覽器上或者直達(dá)ChatPaper頁(yè)面:https://www.aminer.cn/chat/g/


2023年7月11日精選新論文列表:

1.CAME: Confidence-guided Adaptive Memory Efficient Optimization

鏈接:https://www.aminer.cn/pub/64a63bddd68f896efaec6604/

ChatPaper綜述:在訓(xùn)練大型語言模型時(shí),自適應(yīng)梯度方法需要維護(hù)每個(gè)參數(shù)梯度的二階矩估計(jì),從而增加了額外的內(nèi)存開銷。為了解決這個(gè)問題,提出了幾種內(nèi)存高效的優(yōu)化器,但會(huì)導(dǎo)致性能損失。本文研究了一種自信度引導(dǎo)策略來降低現(xiàn)有內(nèi)存高效優(yōu)化器的不穩(wěn)定性,并基于該策略提出了CAME,以同時(shí)實(shí)現(xiàn)傳統(tǒng)自適應(yīng)方法的快速收斂和內(nèi)存高效方法的低內(nèi)存使用。廣泛的實(shí)驗(yàn)表明,CAME在BERT和GPT-2等各種NLP任務(wù)的訓(xùn)練中具有穩(wěn)定的性能和卓越的性能。值得注意的是,對(duì)于大批量32,768的BERT預(yù)訓(xùn)練,我們提出的優(yōu)化器比Adam優(yōu)化器具有更快的收斂速度和更高的準(zhǔn)確性。CAME的實(shí)現(xiàn)是公開可用的。所以摘要說明了在大型語言模型的訓(xùn)練中,自適應(yīng)梯度方法需要更多的內(nèi)存開銷,而提出的CAME優(yōu)化器可以同時(shí)實(shí)現(xiàn)快速收斂和低內(nèi)存使用的目標(biāo)。

2.Do Androids Laugh at Electric Sheep? Humor “Understanding” Benchmarks from The New Yorker Caption Contest

鏈接:https://www.aminer.cn/pub/632297f390e50fcafdc87aa9/

ChatPaper綜述:研究人員使用《紐約客》的漫畫比賽作為研究對(duì)象,開發(fā)了三個(gè)具體任務(wù),要求模型理解圖像與字幕之間的潛在復(fù)雜關(guān)系,以及對(duì)人類體驗(yàn)的復(fù)雜和出人意料的引用。研究人員調(diào)查了直接處理圖像像素和字幕的視覺-語言模型,以及通過提供圖像的文本描述來避免圖像處理的語言模型。即使在提供了豐富的多方面注釋的情況下,研究人員發(fā)現(xiàn)高質(zhì)量的機(jī)器學(xué)習(xí)模型(例如,一個(gè)微調(diào)的,具有1750億個(gè)參數(shù)的語言模型)與人類之間存在性能差距。他們還公開發(fā)布了包括描述圖像位置/實(shí)體、場(chǎng)景的異常之處以及笑話解釋的語料庫(kù)。

3.What the DAAM: Interpreting Stable Diffusion Using Cross Attention

鏈接:https://www.aminer.cn/pub/6344dee690e50fcafd24e90b/

ChatPaper綜述:這篇論文解決了大規(guī)模擴(kuò)散神經(jīng)網(wǎng)絡(luò)在文本到圖像生成中缺乏解釋性分析的問題。它通過對(duì)最近公開的模型“穩(wěn)定擴(kuò)散”進(jìn)行文本-圖像歸因分析來產(chǎn)生像素級(jí)歸因圖。作者將這種方法稱為DAAM,并評(píng)估了它在名詞的語義分割能力以及所有詞性的廣義歸因質(zhì)量。然后,作者應(yīng)用DAAM來研究語法在像素空間中的作用,通過表征十種常見依賴關(guān)系的頭部-依賴熱圖交互模式。最后,作者使用DAAM來研究幾種語義現(xiàn)象,重點(diǎn)關(guān)注特征交織,發(fā)現(xiàn)共同上位詞會(huì)降低生成質(zhì)量,而描述性形容詞的關(guān)注范圍過廣。據(jù)作者所知,這是首次從視覺語言的角度解釋大規(guī)模擴(kuò)散模型,為未來的研究提供了新的方向。

4.From Pretraining Data to Language Models to Downstream Tasks: Tracking the Trails of Political Biases Leading to Unfair NLP Models

鏈接:https://www.aminer.cn/pub/6462f133d68f896efa9118a5/

ChatPaper綜述:研究著眼于大型語言模型(LMs)的預(yù)訓(xùn)練數(shù)據(jù),探討其在社交導(dǎo)向任務(wù)中的公平性問題。研究發(fā)現(xiàn),預(yù)訓(xùn)練的LMs存在政治傾向,這會(huì)加劇預(yù)訓(xùn)練語料庫(kù)中的極化現(xiàn)象,并將社交偏見傳播到仇恨言論預(yù)測(cè)和媒體偏見檢測(cè)中。研究討論了這些發(fā)現(xiàn)對(duì)自然語言處理(NLP)研究的影響,并提出了減少不公平性的未來方向。

5.Shelving, Stacking, Hanging: Relational Pose Diffusion for Multi-modal Rearrangement

鏈接:https://www.aminer.cn/pub/64acd41c3fda6d7f06b366f7/

ChatPaper綜述:論文提出了一個(gè)系統(tǒng),用于將場(chǎng)景中的物體重新排列以實(shí)現(xiàn)所需的物體-場(chǎng)景放置關(guān)系。該系統(tǒng)可以推廣到場(chǎng)景和物體的新幾何形狀、姿態(tài)和布局,并通過從示范中進(jìn)行訓(xùn)練直接對(duì)3D點(diǎn)云進(jìn)行操作。該系統(tǒng)克服了給定場(chǎng)景存在許多幾何上相似的重新排列解決方案所帶來的挑戰(zhàn)。通過利用迭代姿態(tài)去噪訓(xùn)練過程,我們可以擬合多模態(tài)示范數(shù)據(jù)并生成多模態(tài)輸出,同時(shí)保持精確和準(zhǔn)確。我們還展示了在忽略對(duì)通用化和精確性都有害的無關(guān)全局結(jié)構(gòu)的同時(shí),以相關(guān)局部幾何特征為條件的優(yōu)勢(shì)。我們?cè)谀M和真實(shí)世界中展示了我們的方法在處理多模態(tài)和物體形狀和姿態(tài)的推廣上的三個(gè)不同的重新排列任務(wù)。

6.AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning

鏈接:https://www.aminer.cn/pub/64acd41c3fda6d7f06b366dd/

ChatPaper綜述:介紹了一種實(shí)用的框架,可以將現(xiàn)有的個(gè)性化文本轉(zhuǎn)圖模型動(dòng)畫化,避免了針對(duì)特定模型的調(diào)整工作。該框架的核心是在凍結(jié)的文本轉(zhuǎn)圖模型中插入一個(gè)新初始化的運(yùn)動(dòng)建模模塊,并將其訓(xùn)練在視頻剪輯上,以提取合理的運(yùn)動(dòng)先驗(yàn)知識(shí)。一旦訓(xùn)練完成,通過簡(jiǎn)單地注入這個(gè)運(yùn)動(dòng)建模模塊,所有從相同基礎(chǔ)T2I派生的個(gè)性化版本都可以成為以文本驅(qū)動(dòng)的模型,產(chǎn)生多樣化和個(gè)性化的動(dòng)畫圖像。作者對(duì)幾個(gè)公開代表性的個(gè)性化文本轉(zhuǎn)圖模型進(jìn)行了評(píng)估,包括動(dòng)漫圖片和真實(shí)照片,并證明了他們的框架能夠幫助這些模型生成時(shí)間上平滑的動(dòng)畫剪輯,同時(shí)保留了其輸出的領(lǐng)域和多樣性。

7.Semantic-SAM: Segment and Recognize Anything at Any Granularity

鏈接:https://www.aminer.cn/pub/64acd41c3fda6d7f06b36707/

ChatPaper綜述:論文介紹了Semantic-SAM這一通用的圖像分割模型,可以在任何所需的粒度上分割和識(shí)別任何物體。該模型具有兩個(gè)關(guān)鍵優(yōu)勢(shì):語義感知和粒度豐富性。為了實(shí)現(xiàn)語義感知,我們整合了三個(gè)粒度上的多個(gè)數(shù)據(jù)集,并引入了對(duì)象和部分的解耦分類。這使得我們的模型能夠捕捉豐富的語義信息。對(duì)于多粒度能力,我們?cè)谟?xùn)練過程中提出了一種多選擇學(xué)習(xí)方案,使每次點(diǎn)擊可以生成與多個(gè)標(biāo)準(zhǔn)掩膜相對(duì)應(yīng)的多個(gè)級(jí)別的掩膜。值得注意的是,這項(xiàng)工作是首次嘗試在SA-1B、通用和部分分割數(shù)據(jù)集上聯(lián)合訓(xùn)練模型。實(shí)驗(yàn)結(jié)果和可視化展示表明,我們的模型成功實(shí)現(xiàn)了語義感知和粒度豐富性。此外,將SA-1B訓(xùn)練與其他分割任務(wù)(如全景和部分分割)結(jié)合起來可以提高性能。我們將提供代碼和演示以進(jìn)行進(jìn)一步的探索和評(píng)估。

8.VampNet: Music Generation via Masked Acoustic Token Modeling

鏈接:https://www.aminer.cn/pub/64acd41c3fda6d7f06b366b5/

ChatPaper綜述:論文介紹了VampNet,一種通過應(yīng)用不同掩碼方法進(jìn)行推理的掩碼聲學(xué)標(biāo)記建模方法在音樂合成、壓縮、修復(fù)和變異等方面的應(yīng)用。在訓(xùn)練過程中,使用可變的掩碼計(jì)劃,允許我們通過應(yīng)用各種掩碼方法(稱為提示)在模型中采樣連貫的音樂。VampNet是非自回歸的,利用雙向變壓器架構(gòu),在前向傳遞中關(guān)注所有標(biāo)記。只需36個(gè)采樣傳遞,VampNet就能生成連貫的高保真音樂波形。我們展示了通過以各種方式提示VampNet,我們可以將其應(yīng)用于音樂壓縮、修復(fù)、擴(kuò)展、延續(xù)和循環(huán)的多個(gè)任務(wù)中。適當(dāng)?shù)奶崾鞠?,VampNet能夠保持音樂的風(fēng)格、類型、樂器和其他高層次的特征。這種靈活的提示功能使VampNet成為一個(gè)強(qiáng)大的音樂共創(chuàng)工具。代碼和音頻示例可以在網(wǎng)絡(luò)上找到。

9.Sketch-A-Shape: Zero-Shot Sketch-to-3D Shape Generation

鏈接:https://www.aminer.cn/pub/64acd41c3fda6d7f06b36373/

ChatPaper綜述:說明了將預(yù)訓(xùn)練模型應(yīng)用于從草圖生成3D形狀的挑戰(zhàn)。由于草圖與形狀配對(duì)的數(shù)據(jù)集有限且草圖的抽象程度各不相同,因此在過去很難有效地利用這些預(yù)訓(xùn)練模型來生成3D形狀。然而,通過在訓(xùn)練過程中使用來自凍結(jié)的大型預(yù)訓(xùn)練視覺模型的特征(從合成渲染中獲得),我們發(fā)現(xiàn)可以有效地從草圖中生成3D形狀。這表明大型預(yù)訓(xùn)練視覺模型的特征具有魯棒的語義信號(hào),能夠在推理時(shí)將這些信號(hào)應(yīng)用于僅使用RGB渲染的草圖上。通過進(jìn)行一系列的實(shí)驗(yàn)研究不同的設(shè)計(jì)因素,我們證明了我們簡(jiǎn)單的方法的有效性,無論輸入草圖的抽象程度如何,都可以生成多個(gè)3D形狀,并且在訓(xùn)練過程中不需要任何配對(duì)數(shù)據(jù)集。

10.RLTF: Reinforcement Learning from Unit Test Feedback

鏈接:https://www.aminer.cn/pub/64acd41c3fda6d7f06b3655e/

ChatPaper綜述:說明了在程序合成或代碼生成中的一個(gè)問題,即當(dāng)前使用強(qiáng)化學(xué)習(xí)方法的研究往往只使用離線框架,限制了對(duì)新樣本空間的探索。此外,當(dāng)前利用單元測(cè)試信號(hào)的方法較為簡(jiǎn)單,沒有考慮代碼中具體的錯(cuò)誤位置。為了解決這些問題,作者提出了RLTF框架,即基于單元測(cè)試反饋的強(qiáng)化學(xué)習(xí),這是一個(gè)在線強(qiáng)化學(xué)習(xí)框架,通過多粒度的單元測(cè)試反饋來優(yōu)化代碼生成。大量實(shí)驗(yàn)證明,RLTF在APPS和MBPP基準(zhǔn)測(cè)試上取得了最先進(jìn)的性能。

11.Large Language Models for Supply Chain Optimization

鏈接:https://www.aminer.cn/pub/64acd41c3fda6d7f06b36379/

ChatPaper綜述:說明了傳統(tǒng)的供應(yīng)鏈運(yùn)營(yíng)涉及多種復(fù)雜的決策問題,并且在過去幾十年中,由于計(jì)算能力的提升,供應(yīng)鏈得到了很大的好處,實(shí)現(xiàn)了從手工處理到自動(dòng)化和成本效益優(yōu)化的過渡。然而,業(yè)務(wù)運(yùn)營(yíng)商仍然需要付出大量努力來解釋和解讀優(yōu)化結(jié)果給相關(guān)利益相關(guān)者。作者針對(duì)最近大型語言模型(LLMs)的進(jìn)展,研究了這一顛覆性技術(shù)如何幫助彌合供應(yīng)鏈自動(dòng)化和人類理解與信任之間的差距。他們?cè)O(shè)計(jì)了一個(gè)名為\\name{}的框架,該框架接受純文本的查詢作為輸入,并輸出關(guān)于底層優(yōu)化結(jié)果的洞察。該框架不放棄最先進(jìn)的組合優(yōu)化技術(shù),而是利用該技術(shù)定量地回答假設(shè)情境(例如,如果我們對(duì)給定需求使用供應(yīng)商B而不是供應(yīng)商A,成本將如何變化?)。重要的是,他們的設(shè)計(jì)不需要將專有數(shù)據(jù)發(fā)送給LLMs,這在某些情況下可能引起隱私問題。他們還在Microsoft的云供應(yīng)鏈中的真實(shí)服務(wù)器放置方案上證明了他們框架的有效性。在此過程中,他們還開發(fā)了一個(gè)通用的評(píng)估基準(zhǔn),可用于評(píng)估LLMs在其他場(chǎng)景中輸出的準(zhǔn)確性。

12.VoxPoser: Composable 3D Value Maps for Robotic Manipulation with Language Models

鏈接:https://www.aminer.cn/pub/64abee0f286e8b4b6fcd5c84

ChatPaper綜述:論文指出了機(jī)器人操作中的一個(gè)主要瓶頸,即大多數(shù)模型仍依賴預(yù)定義的運(yùn)動(dòng)原語來進(jìn)行與環(huán)境的物理交互。然而,通過觀察到大型語言模型(LLMs)擅長(zhǎng)于根據(jù)自由形式的語言指令推斷能力和約束,可以利用其編碼能力與視覺語言模型(VLM)相互作用,以組合三維值地圖來將知識(shí)落實(shí)到代理的觀察空間中。這些組合的值地圖然后在基于模型的規(guī)劃框架中使用,以零演示方式合成具有對(duì)動(dòng)態(tài)擾動(dòng)的魯棒性的閉環(huán)機(jī)器人軌跡。作者進(jìn)一步展示了該框架如何通過高效學(xué)習(xí)動(dòng)力學(xué)模型來從在線經(jīng)驗(yàn)中受益,特別是在涉及接觸豐富交互的場(chǎng)景中。作者在模擬和真實(shí)機(jī)器人環(huán)境中進(jìn)行了大規(guī)模的研究,展示了該方法能夠執(zhí)行超過30個(gè)以自由形式的自然語言指定的日常操作任務(wù)的能力。


如何使用ChatPaper?

使用ChatPaper的方法很簡(jiǎn)單,打開AMiner首頁(yè),從頁(yè)面頂部導(dǎo)航欄或者右下角便可進(jìn)入ChatPaper頁(yè)面。

在ChatPaper頁(yè)面中,可以選擇基于單篇文獻(xiàn)進(jìn)行對(duì)話和基于全庫(kù)(個(gè)人文獻(xiàn)庫(kù))對(duì)話,可選擇上傳本地PDF或者直接在AMiner上檢索文獻(xiàn)。

如果您有任何問題或建議,歡迎隨時(shí)聯(lián)系我們。

實(shí)時(shí)追蹤科研動(dòng)態(tài)丨7.11精選新論文,附ChatPaper綜述的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
梁山县| 德安县| 井陉县| 蒙山县| 乌什县| 苗栗市| 大埔县| 衡南县| 霍邱县| 韶山市| 万安县| 临汾市| 郁南县| 寿宁县| 淮北市| 大连市| 依安县| 阿瓦提县| 土默特右旗| 东兴市| 博湖县| 墨江| 武宣县| 黑河市| 宜君县| 德清县| 墨竹工卡县| 普兰店市| 永年县| 泽库县| 崇阳县| 潞城市| 南皮县| 乐都县| 无为县| 和硕县| 玛纳斯县| 安远县| 绥芬河市| 巨鹿县| 高邑县|