實(shí)時(shí)追蹤科研動(dòng)態(tài)丨7.26精選新論文,附ChatPaper綜述

作為科研人員,每天需要檢索和瀏覽大量的學(xué)術(shù)文獻(xiàn),以獲取最新的科技進(jìn)展和研究成果。然而,傳統(tǒng)的檢索和閱讀方式已經(jīng)無法滿足科研人的需求。
ChatPaper,一款集檢索、閱讀、知識(shí)問答于一體的文獻(xiàn)知識(shí)工具。幫助你快提高檢索、閱讀論文效率,獲取最新領(lǐng)域研究動(dòng)態(tài),讓科研工作更加游刃有余。

結(jié)合前沿動(dòng)態(tài)訂閱功能,精選arXiv當(dāng)日熱門新論文,形成論文綜述,讓大家更加快速了解前沿動(dòng)態(tài)。
如果想要對(duì)某篇論文進(jìn)行深入對(duì)話,可以直接復(fù)制論文鏈接到瀏覽器上或者直達(dá)ChatPaper頁(yè)面:https://www.aminer.cn/chat/g/
2023年7月26日精選新論文列表:
1.Contrastive Example-Based Control
https://www.aminer.cn/pub/64a29620d68f896efa28f818/
論文討論了強(qiáng)化學(xué)習(xí)中的挑戰(zhàn),即實(shí)際問題很少符合馬爾可夫決策過程(MDP)的模型,與環(huán)境的交互往往很昂貴,并且指定獎(jiǎng)勵(lì)函數(shù)也很具挑戰(zhàn)性。為了應(yīng)對(duì)這些挑戰(zhàn),先前的研究提出了從轉(zhuǎn)移動(dòng)力學(xué)樣本和高回報(bào)狀態(tài)示例中完全學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)方法。這些方法通常從高回報(bào)狀態(tài)學(xué)習(xí)獎(jiǎng)勵(lì)函數(shù),使用該獎(jiǎng)勵(lì)函數(shù)標(biāo)記轉(zhuǎn)移,并將離線強(qiáng)化學(xué)習(xí)算法應(yīng)用于這些轉(zhuǎn)移中。雖然這些方法在許多任務(wù)上可以取得良好結(jié)果,但它們可能很復(fù)雜,通常需要正則化和時(shí)差更新。本文提出了一種離線的、基于示例的控制方法,該方法學(xué)習(xí)多步轉(zhuǎn)移的隱式模型,而不是獎(jiǎng)勵(lì)函數(shù)。我們展示了這個(gè)隱式模型可以表示基于示例的控制問題的Q值。在一系列基于狀態(tài)和基于圖像的離線控制任務(wù)中,我們的方法優(yōu)于使用學(xué)習(xí)獎(jiǎng)勵(lì)函數(shù)的基線方法;額外的實(shí)驗(yàn)表明改進(jìn)了魯棒性和數(shù)據(jù)集大小的擴(kuò)展能力。
2.LoraHub: Efficient Cross-Task Generalization via Dynamic LoRA Composition
https://www.aminer.cn/pub/64c09a963fda6d7f06e3e219/
論文介紹了一個(gè)名為L(zhǎng)oraHub的框架,旨在通過組合使用不同任務(wù)上訓(xùn)練的LoRA模塊,實(shí)現(xiàn)對(duì)未見任務(wù)的可調(diào)適應(yīng)性。該論文指出,使用LoraHub,只需要從新任務(wù)中獲得一些示例,就可以流暢地組合多個(gè)LoRA模塊,無需人類專業(yè)知識(shí)。這種組合既不需要額外的模型參數(shù),也不需要梯度。實(shí)驗(yàn)結(jié)果表明,LoraHub可以在少量示例的情況下有效地模擬在上下文學(xué)習(xí)中的性能,不需要每個(gè)推理輸入旁邊提供上下文示例。該研究的一個(gè)重要貢獻(xiàn)是建立了一個(gè)LoRA社區(qū),用戶可以分享他們訓(xùn)練的LoRA模塊,以促進(jìn)其應(yīng)用到新任務(wù)中。這一資源預(yù)計(jì)將擴(kuò)大對(duì)通用智能和生產(chǎn)中的LLMs的應(yīng)用和推進(jìn)。
3.ARB: Advanced Reasoning Benchmark for Large Language Models
https://www.aminer.cn/pub/64c09a9c3fda6d7f06e3e9dd/
盡管大型語言模型在各種定量推理和知識(shí)基準(zhǔn)測(cè)試中表現(xiàn)出令人矚目的性能,但許多基準(zhǔn)測(cè)試在語言模型得分越來越高的情況下逐漸失去了實(shí)用性,盡管它們尚未達(dá)到專家水平。為了解決這個(gè)問題,研究人員引入了一個(gè)名為ARB的新的基準(zhǔn)測(cè)試,其中包含了數(shù)學(xué)、物理、生物學(xué)、化學(xué)和法律等多個(gè)領(lǐng)域的高級(jí)推理問題。他們?cè)u(píng)估了最新的模型(如GPT-4和Claude)在ARB上的表現(xiàn),并發(fā)現(xiàn)當(dāng)前的模型在更具挑戰(zhàn)性的任務(wù)上得分遠(yuǎn)低于50%。為了改進(jìn)自動(dòng)和輔助評(píng)估能力,他們引入了基于評(píng)分標(biāo)準(zhǔn)的評(píng)估方法,允許GPT-4對(duì)自己的中間推理步驟進(jìn)行評(píng)分。此外,他們對(duì)ARB的符號(hào)子集進(jìn)行了人工評(píng)估,并發(fā)現(xiàn)注釋者和GPT-4的評(píng)分存在一定程度的一致性。
4.Predicting Code Coverage without Execution
https://www.aminer.cn/pub/64c09a9c3fda6d7f06e3e898/
論文針對(duì)計(jì)算代碼覆蓋率的問題,指出了計(jì)算代碼覆蓋率所需的資源較大,并且需要整個(gè)程序的上下文才能計(jì)算代碼片段的覆蓋率。為了降低計(jì)算代碼覆蓋率的成本,作者提出使用機(jī)器學(xué)習(xí)來預(yù)測(cè)代碼覆蓋率,只需要源代碼的上下文即可。作者提出了一種名為“Code Coverage Prediction for Large Language Models (LLMs)”的新的評(píng)估任務(wù),旨在評(píng)估LLMs在理解代碼執(zhí)行方面的能力。作者通過執(zhí)行測(cè)試和收集代碼覆蓋信息,創(chuàng)建了一個(gè)名為COVERAGEEVAL的數(shù)據(jù)集,并報(bào)告了四種用于代碼相關(guān)任務(wù)的最先進(jìn)的LLMs的性能。最后,作者還論證了代碼覆蓋率作為指標(biāo)和預(yù)訓(xùn)練數(shù)據(jù)源對(duì)于LLMs在軟件工程任務(wù)的整體性能是有價(jià)值的。
5.Decision-Focused Learning: Foundations, State of the Art, Benchmark and Future Opportunities
https://www.aminer.cn/pub/64c09a9c3fda6d7f06e3e956/
論文主要討論了決策導(dǎo)向?qū)W習(xí)(Decision-focused learning, DFL)這一新興的機(jī)器學(xué)習(xí)范式。DFL旨在訓(xùn)練模型以優(yōu)化決策,在一個(gè)端到端系統(tǒng)中整合了預(yù)測(cè)和優(yōu)化。這一范式有望在許多面臨不確定性的現(xiàn)實(shí)世界應(yīng)用中改變決策制定方式,其中對(duì)于這些決策模型中未知參數(shù)的估計(jì)經(jīng)常成為一個(gè)重要障礙。本論文全面回顧了DFL,并深入分析了各種用于整合機(jī)器學(xué)習(xí)和優(yōu)化模型的技術(shù),提出了一個(gè)根據(jù)其特點(diǎn)進(jìn)行分類的DFL方法分類法,并對(duì)這些方法進(jìn)行了廣泛的實(shí)證評(píng)估,提出了適用于DFL的基準(zhǔn)數(shù)據(jù)集和任務(wù)。最后,該研究為DFL研究的當(dāng)前和潛在未來方向提供了有價(jià)值的見解。
6.Group Activity Recognition in Computer Vision: A Comprehensive Review, Challenges, and Future Perspectives
https://www.aminer.cn/pub/64c09a9c3fda6d7f06e3e93c/
文主要討論了計(jì)算機(jī)視覺中的群體活動(dòng)識(shí)別的問題。群體活動(dòng)識(shí)別通過識(shí)別群體關(guān)系來有效地模擬場(chǎng)景中的層次關(guān)系,并從群體中準(zhǔn)確提取有區(qū)別的時(shí)空特征,具有廣泛的應(yīng)用前景。論文首先綜述了相關(guān)文獻(xiàn)和不同的群體活動(dòng)識(shí)別方法,包括傳統(tǒng)方法和基于空間結(jié)構(gòu)、描述符、非深度學(xué)習(xí)、分層循環(huán)神經(jīng)網(wǎng)絡(luò)、關(guān)系模型和注意機(jī)制的最新方法。接著,論文介紹了每個(gè)模塊的關(guān)系網(wǎng)絡(luò)和關(guān)系架構(gòu)。然后,論文探討了群體活動(dòng)識(shí)別方法,并將其性能與最先進(jìn)的技術(shù)進(jìn)行了比較。論文總結(jié)了現(xiàn)有的挑戰(zhàn),并為新來者提供了全面的指導(dǎo),以了解群體活動(dòng)識(shí)別。最后,論文還回顧了群體活動(dòng)識(shí)別的新方向和可能性。
7.FacTool: Factuality Detection in Generative AI -- A Tool Augmented Framework for Multi-Task and Multi-Domain Scenarios
https://www.aminer.cn/pub/64c09a9c3fda6d7f06e3e92d/
論文指出了生成預(yù)訓(xùn)練模型在合成高質(zhì)量文本方面的優(yōu)勢(shì),但也提出了在生成的文本中識(shí)別事實(shí)錯(cuò)誤的挑戰(zhàn)。具體而言,論文指出了以下幾個(gè)問題:(1)隨著生成模型處理越來越多樣化的任務(wù),包含事實(shí)錯(cuò)誤的風(fēng)險(xiǎn)也越來越高。(2)生成的文本往往很長(zhǎng),并且缺乏對(duì)個(gè)別事實(shí)的明確定義的細(xì)粒度。(3)在事實(shí)檢查過程中缺乏明確的證據(jù)。在考慮到以上挑戰(zhàn)的情況下,該論文提出了FacTool,一個(gè)用于檢測(cè)大型語言模型生成文本中事實(shí)錯(cuò)誤的任務(wù)和領(lǐng)域無關(guān)的框架(例如ChatGPT)。通過在基于知識(shí)的問答、代碼生成、數(shù)學(xué)推理和科學(xué)文獻(xiàn)回顧等四個(gè)不同任務(wù)上進(jìn)行實(shí)驗(yàn),論文展示了所提方法的有效性。
8.Analyzing Chain-of-Thought Prompting in Large Language Models via Gradient-based Feature Attributions
https://www.aminer.cn/pub/64c09a9c3fda6d7f06e3e869/
論文指出了生成式預(yù)訓(xùn)練模型在產(chǎn)生高質(zhì)量文本的同時(shí),也帶來了鑒別生成文本中事實(shí)錯(cuò)誤的挑戰(zhàn)。具體問題有:(1)更多種類的任務(wù)由生成模型處理時(shí),存在包含事實(shí)錯(cuò)誤的風(fēng)險(xiǎn)增加。(2)生成的文本往往較長(zhǎng),缺乏明確定義的事實(shí)粒度。(3)在事實(shí)核查過程中缺乏明確的證據(jù)。鑒于上述問題,本文提出了一個(gè)面向任務(wù)和領(lǐng)域的框架FacTool,用于檢測(cè)大型語言模型(如ChatGPT)生成的文本中的事實(shí)錯(cuò)誤。對(duì)四個(gè)不同任務(wù)(基于知識(shí)的問答、代碼生成、數(shù)學(xué)推理和科學(xué)文獻(xiàn)綜述)進(jìn)行的實(shí)驗(yàn)證明了該方法的有效性。
9.Strivec: Sparse Tri-Vector Radiance Fields
https://www.aminer.cn/pub/64c09a963fda6d7f06e3e1eb/
論文提出了一種名為Strivec的新型神經(jīng)表示方法,用于以稀疏分布和緊湊因子分解的本地張量特征網(wǎng)格,將3D場(chǎng)景建模為輻射場(chǎng)。該方法利用張量分解來建模張量網(wǎng)格,與最近的TensoRF方法不同,TensoRF方法使用全局張量并側(cè)重于矢量-矩陣分解,而Strivec方法則利用一組局部張量,并應(yīng)用經(jīng)典的CANDECOMP/PARAFAC (CP)分解將每個(gè)張量分解為能夠沿空間軸表示本地特征分布并緊湊地編碼本地神經(jīng)場(chǎng)的三個(gè)向量。同時(shí),作者還應(yīng)用多尺度的張量網(wǎng)格來發(fā)現(xiàn)幾何和外觀的共性,并利用多尺度三向量分解的空間相干性。最終,輻射場(chǎng)的屬性通過聚合多尺度上多個(gè)局部張量的神經(jīng)特征進(jìn)行回歸得出。這些三向量張量在實(shí)際場(chǎng)景表面周圍是稀疏分布的,通過快速粗略重建發(fā)現(xiàn),利用了3D場(chǎng)景的稀疏性。實(shí)驗(yàn)證明,相較于先前的方法,包括TensoRF和Instant-NGP,我們的模型在使用參數(shù)明顯較少的情況下可以實(shí)現(xiàn)更好的渲染質(zhì)量。