最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

實(shí)時(shí)追蹤科研動態(tài)丨7.20精選新論文,附ChatPaper綜述

2023-07-21 14:42 作者:AMiner科技  | 我要投稿

作為科研人員,每天需要檢索和瀏覽大量的學(xué)術(shù)文獻(xiàn),以獲取最新的科技進(jìn)展和研究成果。然而,傳統(tǒng)的檢索和閱讀方式已經(jīng)無法滿足科研人的需求。

ChatPaper,一款集檢索、閱讀、知識問答于一體的文獻(xiàn)知識工具。幫助你快提高檢索、閱讀論文效率,獲取最新領(lǐng)域研究動態(tài),讓科研工作更加游刃有余。

結(jié)合前沿動態(tài)訂閱功能,精選arXiv當(dāng)日熱門新論文,形成論文綜述,讓大家更加快速了解前沿動態(tài)。

如果想要對某篇論文進(jìn)行深入對話,可以直接復(fù)制論文鏈接到瀏覽器上或者直達(dá)ChatPaper頁面:

ChatPaper入口:https://www.aminer.cn/chat/g/

2023年7月20日精選新論文列表:

1.On the Origin of LLMs: An Evolutionary Tree and Graph for 15,821 Large Language Models

鏈接:aminer.cn/pub/64b8b1bd3

ChatPaper綜述:研究指出了一個(gè)問題,即由于大型語言模型(LLMs)的廣泛使用,了解哪些LLM背景、設(shè)置、訓(xùn)練方法和家族受到歡迎或趨勢的問題變得非常重要。然而,目前沒有一個(gè)綜合的LLM索引可供使用。因此,該研究利用Hugging Face LLMs的系統(tǒng)命名規(guī)則,使用n-grams和詞頻-逆文檔頻率進(jìn)行層次聚類,并識別LLMs之間的關(guān)聯(lián)性,從而解決了這個(gè)問題。該研究還開發(fā)了一個(gè)公共網(wǎng)絡(luò)應(yīng)用程序,名為Constellation,用于瀏覽和探索15,821個(gè)LLM的地圖,并提供了多種可視化工具來幫助理解數(shù)據(jù)。

2.DNA-Rendering: A Diverse Neural Actor Repository for High-Fidelity Human-centric Rendering

鏈接:aminer.cn/pub/64b8b1c13

ChatPaper綜述:說明了當(dāng)前的人類中心渲染數(shù)據(jù)集和基準(zhǔn)測試在多樣性方面相對匱乏,并且這種多樣性對于渲染效果至關(guān)重要。現(xiàn)有數(shù)據(jù)集限制了研究人員在當(dāng)前數(shù)據(jù)集上探索和評估少量渲染問題,而實(shí)際應(yīng)用需要方法能夠在不同場景下穩(wěn)健地工作。為了解決這個(gè)問題,作者提出了DNA-Rendering,一個(gè)大規(guī)模、高保真度的人類表現(xiàn)數(shù)據(jù)存儲庫,用于神經(jīng)演員渲染。該數(shù)據(jù)集包含1500多個(gè)人類主體、5000個(gè)動作序列和6750萬幀的數(shù)據(jù)量。此外,作者還為每個(gè)主體提供了豐富的資源,包括2D/3D人體關(guān)鍵點(diǎn)、前景掩膜、SMPLX模型、服裝/配飾材料、多視圖圖像和視頻。這些資源提高了當(dāng)前方法在下游渲染任務(wù)上的準(zhǔn)確性。此外,作者構(gòu)建了一個(gè)專業(yè)的多視圖系統(tǒng)來捕捉數(shù)據(jù),其中包含60個(gè)同步攝像機(jī),最大分辨率4096 x 3000,15幀/秒的速度和嚴(yán)格的相機(jī)校準(zhǔn)步驟,確保了高質(zhì)量的資源用于任務(wù)訓(xùn)練和評估。除了數(shù)據(jù)集之外,作者還提供了一個(gè)大規(guī)模的定量基準(zhǔn)測試,包括多個(gè)任務(wù),用于評估新穎視圖合成、新穎姿勢動畫合成和新穎身份渲染方法的進(jìn)展??傊?,該研究描述了DNA-Rendering的努力,揭示了人類中心渲染的新觀察、挑戰(zhàn)和未來方向。

3.Android in the Wild: A Large-Scale Dataset for Android Device Control

鏈接:aminer.cn/pub/64b8b1c13

ChatPaper綜述:論文說明了在設(shè)備控制系統(tǒng)中存在一種對人類自然語言指令進(jìn)行解釋和在數(shù)字設(shè)備上直接控制其用戶界面執(zhí)行的興趣的增長。作者提出了一個(gè)用于設(shè)備控制研究的數(shù)據(jù)集Android in the Wild(AITW),該數(shù)據(jù)集比當(dāng)前數(shù)據(jù)集大幾個(gè)數(shù)量級。該數(shù)據(jù)集包含設(shè)備交互的人類演示,包括屏幕和操作,并包含相應(yīng)的自然語言指令。它包含了715k個(gè)情節(jié),涵蓋了30k個(gè)唯一指令,四個(gè)Android版本(v10-13)和八種設(shè)備類型(從Pixel 2 XL到Pixel 6),具有不同的屏幕分辨率。它包含了需要對語言和視覺環(huán)境進(jìn)行語義理解的多步任務(wù)。這個(gè)數(shù)據(jù)集提出了一個(gè)新的挑戰(zhàn):必須從它們的視覺外觀中推斷出用戶界面中的操作。而且,動作空間不是簡單的基于UI元素的動作,而是精確的手勢(例如,水平滾動以操作輪播小部件)。作者組織了數(shù)據(jù)集,以促進(jìn)設(shè)備控制系統(tǒng)的魯棒性分析,即系統(tǒng)在面對新的任務(wù)描述、新的應(yīng)用程序或新的平臺版本時(shí)的表現(xiàn)如何。作者開發(fā)了兩個(gè)代理并報(bào)告了在整個(gè)數(shù)據(jù)集上的性能。

4.FABRIC: Personalizing Diffusion Models with Iterative Feedback

鏈接:aminer.cn/pub/64b8b1c13

ChatPaper綜述:探討了在生成模型中如何將人類反饋整合到擴(kuò)散性的文字到圖像模型的生成過程中。通過在最常用的架構(gòu)中利用自注意層來將擴(kuò)散過程與一組反饋圖像相關(guān)聯(lián),我們提出了一種適用于各種流行擴(kuò)散模型的無需訓(xùn)練的方法,名為FABRIC。為了確保對我們方法的嚴(yán)格評估,我們引入了一種全面的評估方法學(xué),提供了一種強(qiáng)大的機(jī)制來量化整合人類反饋的生成視覺模型的性能。通過詳盡的分析,我們展示了隨著多輪迭代反饋,生成結(jié)果的改進(jìn),從而隱式地優(yōu)化了任意用戶偏好。這些發(fā)現(xiàn)的潛在應(yīng)用領(lǐng)域包括個(gè)性化內(nèi)容創(chuàng)建和定制。

5.Text2Layer: Layered Image Generation using Latent Diffusion Model

鏈接:aminer.cn/pub/64b8b1bd3

ChatPaper綜述:現(xiàn)有的圖像編輯工作流程中,圖層合成是一種非常流行的方法。然而,現(xiàn)有方法中,生成圖像和生成圖層蒙版是分開進(jìn)行的。為了改進(jìn)這一過程,并產(chǎn)生更高質(zhì)量的圖層合成結(jié)果,作者提出了一種新的方法,即利用潛在擴(kuò)散模型進(jìn)行分層圖像生成。他們通過訓(xùn)練一個(gè)自動編碼器來重構(gòu)分層圖像,并在潛在表示上訓(xùn)練擴(kuò)散模型,從而同時(shí)生成背景、前景、圖層蒙版和合成圖像。這樣的方法不僅能夠產(chǎn)生高質(zhì)量的分層圖像,還能改善圖層合成工作流程并提供更高質(zhì)量的圖層蒙版。實(shí)驗(yàn)結(jié)果表明,該方法能夠產(chǎn)生高質(zhì)量的分層圖像,并為未來的工作提供了一個(gè)基準(zhǔn)。

6.DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection for Conversational AI

鏈接:aminer.cn/pub/64b8b1c13

ChatPaper綜述:指出了當(dāng)前對話AI領(lǐng)域面臨的挑戰(zhàn):語言模型在處理多樣化對話任務(wù)時(shí)遇到困難,現(xiàn)有的對話數(shù)據(jù)集缺乏多樣性和全面性。為了解決這些問題,作者介紹了DialogStudio,這是一個(gè)最大和最豐富的對話數(shù)據(jù)集合,統(tǒng)一采用一致的格式,同時(shí)保留其原始信息。該數(shù)據(jù)集合包括來自開放域?qū)υ?、面向任?wù)的對話、自然語言理解、推薦對話、對話摘要和知識為基礎(chǔ)的對話的數(shù)據(jù),使其成為對話研究和模型訓(xùn)練的非常豐富和多樣化的資源。為了進(jìn)一步提高DialogStudio的效用,作者確定了每個(gè)數(shù)據(jù)集的許可證,并為選定對話設(shè)計(jì)了領(lǐng)域感知的提示,以便于指導(dǎo)意識微調(diào)。此外,作者使用該數(shù)據(jù)集合開發(fā)了對話AI模型,實(shí)驗(yàn)在零樣本學(xué)習(xí)和少樣本學(xué)習(xí)情景下展示了DialogStudio的優(yōu)越性能。

7.Challenges and Applications of Large Language Models

鏈接:aminer.cn/pub/64b8b1c13

ChatPaper綜述:論文旨在解決大型語言模型(LLMs)領(lǐng)域中存在的挑戰(zhàn)和已經(jīng)成功應(yīng)用的問題。由于這個(gè)領(lǐng)域發(fā)展迅速,很難確定還存在哪些挑戰(zhàn)和已經(jīng)取得了成果的應(yīng)用領(lǐng)域。因此,該論文的目標(biāo)是提出一系列系統(tǒng)性的開放性問題,并介紹應(yīng)用方面的成功案例,以便機(jī)器學(xué)習(xí)研究人員能夠更快地了解該領(lǐng)域的現(xiàn)狀并提高生產(chǎn)力。

8.Towards A Unified Agent with Foundation Models

鏈接:aminer.cn/pub/64b8b1bd3

ChatPaper綜述:文章說明了在強(qiáng)化學(xué)習(xí)(RL)代理中,語言模型和視覺語言模型的能力可以被嵌入和利用。這些模型在理解人類意圖、推理、場景理解和規(guī)劃行為等方面表現(xiàn)出前所未有的能力。文章探索了將語言作為核心推理工具的框架,探討如何通過這種方式使代理能夠解決一系列基礎(chǔ)RL挑戰(zhàn),例如高效的探索、重用經(jīng)驗(yàn)數(shù)據(jù)、調(diào)度技能和從觀察中學(xué)習(xí),這些傳統(tǒng)上需要單獨(dú)設(shè)計(jì)的垂直算法。作者在一個(gè)稀疏獎勵的模擬機(jī)器人操作環(huán)境中測試了他們的方法,其中機(jī)器人需要堆疊一組物體。結(jié)果表明,在探索效率和能夠從離線數(shù)據(jù)集中重用數(shù)據(jù)方面,與基準(zhǔn)方法相比,該方法取得了顯著的性能改進(jìn),并展示了如何重用學(xué)到的技能來解決新任務(wù)或模仿人類專家的視頻。


如何使用ChatPaper?

使用ChatPaper的方法很簡單,打開AMiner首頁,從頁面頂部導(dǎo)航欄或者右下角便可進(jìn)入ChatPaper頁面。

在ChatPaper頁面中,可以選擇基于單篇文獻(xiàn)進(jìn)行對話和基于全庫(個(gè)人文獻(xiàn)庫)對話,可選擇上傳本地PDF或者直接在AMiner上檢索文獻(xiàn)。

如果您有任何問題或建議,歡迎隨時(shí)聯(lián)系我們。

實(shí)時(shí)追蹤科研動態(tài)丨7.20精選新論文,附ChatPaper綜述的評論 (共 條)

分享到微博請遵守國家法律
台东市| 柯坪县| 衡南县| 庄浪县| 丹江口市| 定南县| 佳木斯市| 克东县| 沈阳市| 眉山市| 大安市| 西青区| 仲巴县| 叙永县| 光山县| 文水县| 同心县| 阳曲县| 安塞县| 涟源市| 灵石县| 福贡县| 新干县| 城步| 托里县| 肃南| 昭苏县| 奈曼旗| 察哈| 五莲县| 邛崃市| 沭阳县| 清徐县| 尼玛县| 石柱| 隆回县| 讷河市| 大庆市| 交口县| 阳原县| 罗田县|