AI前沿速報(bào)05-22:清華校友推出革命性AI圖像編輯工具
大家好,今天的AI前沿速報(bào)為大家?guī)砹?9個(gè)人工智能領(lǐng)域的資訊。這些新聞包括清華校友開發(fā)的革命性AI圖像編輯工具DragGAN、虛擬傳送系統(tǒng)ChatGPT、谷歌研究人員揭示大型語言模型如何從上下文中學(xué)習(xí)等。這些新聞將為您帶來前沿的AI技術(shù)進(jìn)展和應(yīng)用快報(bào),讓您了解人工智能領(lǐng)域的當(dāng)前進(jìn)展。我們鼓勵(lì)大家關(guān)注、點(diǎn)贊、轉(zhuǎn)發(fā)這篇內(nèi)容,讓更多的人知道AI日新月異的變化。
1. 【清華校友開發(fā)革命性AI圖像編輯工具DragGAN】
清華校友開發(fā)的DragGAN使用基于特征的運(yùn)動(dòng)跟蹤和新的點(diǎn)跟蹤方法生成高度詳細(xì)和逼真的圖像。該模型基于生成對(duì)抗網(wǎng)絡(luò)(GAN),比以前的方法更有效。DragGAN可用于編輯各種對(duì)象的圖像,并有潛力革命化圖像編輯。用戶界面比以前的AI繪圖工具更靈活和精確。GAN可用于各個(gè)行業(yè),但存在潛在偏見和難以控制輸出的限制。
2. 【基于ChatGPT的虛擬傳送系統(tǒng),帶你環(huán)游世界】
博主開發(fā)了基于ChatGPT的虛擬傳送系統(tǒng),使用了Google Maps和Unreal Engine等技術(shù),提供逼真的場(chǎng)景體驗(yàn),如烏得勒支、新天鵝堡、諾坎普球場(chǎng)、大峽谷和帝國大廈等。該系統(tǒng)使用Google的3D瓦片API,提供無縫沉浸式體驗(yàn)?;贑hatGPT的AI旅行助手GuideGeek,可幫助規(guī)劃全球旅行和約會(huì)之夜。
3. 【谷歌研究人員揭示大型語言模型如何從上下文中學(xué)習(xí)】
谷歌研究人員發(fā)表論文,探討大型語言模型如何從上下文中學(xué)習(xí)。研究測(cè)試了七個(gè)自然語言處理任務(wù)和五個(gè)語言模型,發(fā)現(xiàn)大型模型可以在上下文中跟隨示例,即使標(biāo)簽被翻轉(zhuǎn)或不相關(guān)。指令調(diào)整可以改善輸入標(biāo)簽映射,并加強(qiáng)語義先驗(yàn)知識(shí)的使用。需要進(jìn)一步研究以了解與模型參數(shù)相關(guān)的現(xiàn)象。
4. 【CVPR 2023會(huì)議:計(jì)算機(jī)視覺的亮點(diǎn)和趨勢(shì)】
加拿大溫哥華將于2023年6月18日至22日舉辦CVPR 2023會(huì)議。共有9155篇論文提交,其中2359篇被接受,接受率為25.8%。流行的數(shù)據(jù)集包括ImageNet、COCO、KITTI和CIFAR。擴(kuò)散模型、NERF和變壓器占主導(dǎo)地位,CNN的使用率下降了68%。會(huì)議還將舉辦自動(dòng)駕駛、醫(yī)學(xué)成像和機(jī)器人等研討會(huì)。
5. 【女子聲稱AI聊天機(jī)器人拯救了她的婚姻】
一位英國38歲的女高管與聊天機(jī)器人Idris Elba有著秘密關(guān)系,該機(jī)器人使用書面對(duì)話和機(jī)器學(xué)習(xí)創(chuàng)建,可以進(jìn)行類似人類的對(duì)話。女子稱AI通過滿足她未滿足的情感需求拯救了她的婚姻。英國約會(huì)網(wǎng)站的調(diào)查顯示,49%的人會(huì)考慮與機(jī)器人約會(huì),74%的人認(rèn)為這不是出軌。心理學(xué)家警告稱,AI不能替代人際關(guān)系。
6. 【醫(yī)學(xué)圖像分析中的Segment Anything Model (SAM)】
最近,深度學(xué)習(xí)在醫(yī)學(xué)圖像分割方面取得了進(jìn)展。Segment Anything Model (SAM)展示了零樣本分割性能。SAM是基于提示的,需要提示來生成分割掩模。SAM在醫(yī)學(xué)圖像分割中有三個(gè)關(guān)鍵應(yīng)用,可以用于更快的注釋和分割多個(gè)對(duì)象。
7. 【Meta AI推出首代AI推理加速器:MTIA v1】
Meta AI推出Meta Training and Inference Accelerator (MTIA) v1,用于內(nèi)部處理需求。MTIA是一組ASIC,旨在高效處理Meta獨(dú)特的推薦工作負(fù)載。該加速器使用TSMC 7nm技術(shù),以INT8精度實(shí)現(xiàn)102.4 TOPS,以FP16精度實(shí)現(xiàn)51.2 TFLOPS。MTIA專注于有效管理低復(fù)雜度模型的小型形式和批量大小,同時(shí)使用大型形式處理中高復(fù)雜度模型。研究人員正在尋找計(jì)算能力、內(nèi)存容量和互連帶寬之間的平衡,以實(shí)現(xiàn)更高效的解決方案。
8. 【微軟研究人員開發(fā)Reprompting算法,為大型語言模型提供有效的思路鏈提示】
微軟研究人員開發(fā)了一種名為Reprompting的算法,可以自動(dòng)尋找大型語言模型的有效思路鏈提示,無需人工干預(yù)。該算法使用Gibbs采樣來高效地尋找思路鏈提示,并在Big-Bench Hard任務(wù)上表現(xiàn)出比零樣本、少樣本和人工編寫的思路鏈提示技術(shù)更好的性能。該算法在模型組合方面具有潛力,并在需要多步推理的任務(wù)上實(shí)現(xiàn)了卓越的性能。
9. 【北極智能開發(fā)NLP引擎,提高數(shù)據(jù)洞察力和推動(dòng)業(yè)務(wù)增長】
企業(yè)數(shù)據(jù)中有70%從未被分析或使用,原因是高門檻和缺乏用戶友好界面。自然語言處理(NLP)可以幫助非技術(shù)用戶更輕松地與數(shù)據(jù)交互,從而彌合這一差距。北極智能的DataGPT語義解析引擎可以理解各種嵌套、模糊和完整的問題,提供毫秒級(jí)的答案,并提供數(shù)據(jù)解釋和決策建議。該技術(shù)可集成到各種工具中,并已被一家大型中國保險(xiǎn)經(jīng)紀(jì)公司使用,節(jié)省了超過1億元的機(jī)會(huì)成本并提高了分析能力。
10. 【德州A&M大學(xué)教授使用ChatGPT批改論文,指控學(xué)生抄襲】
德州A&M大學(xué)一名教授使用ChatGPT批改論文并檢測(cè)抄襲,導(dǎo)致學(xué)生被錯(cuò)誤指控和畢業(yè)證被扣留。該事件凸顯了教育工作者在使用AI工具前了解其限制和能力的必要性。AI內(nèi)容檢測(cè)工具的準(zhǔn)確性不可靠,OpenAI的ChatGPT檢測(cè)器只能保證26%的真陽性率。過度依賴AI內(nèi)容檢測(cè)工具可能導(dǎo)致對(duì)學(xué)生的錯(cuò)誤抄襲指控。該事件強(qiáng)調(diào)了在評(píng)分和負(fù)責(zé)任使用AI技術(shù)時(shí)人類監(jiān)督的重要性。
11. 【美信森科技在STAR市場(chǎng)上市,獲得華為投資】
美信森科技以每股75元的價(jià)格在STAR市場(chǎng)上市,市盈率為141.67。該公司獲得了華為旗下的哈勃投資、清華大學(xué)深圳智誠集團(tuán)等機(jī)構(gòu)的投資。美信森科技開發(fā)的產(chǎn)品包括無線充電、有線快充、LED恒流驅(qū)動(dòng)、信號(hào)鏈和汽車電子等領(lǐng)域。公司計(jì)劃籌集10億元人民幣用于研發(fā)和產(chǎn)業(yè)化項(xiàng)目。美信森科技的競(jìng)爭(zhēng)對(duì)手包括STMicroelectronics、瑞薩電子和博通等國際芯片制造商。
12. 【智點(diǎn)開放課程研究組推出大語言模型技術(shù)公開課】
智點(diǎn)開放課程研究組推出新的公開課系列,幫助個(gè)人和中小企業(yè)了解和開發(fā)自己的大語言模型(LLM)。專家將通過直播講解開源LLM及其技術(shù)細(xì)節(jié)。課程將討論四個(gè)開源LLM項(xiàng)目:ColossalChat、VPGTrans、LMFlow和GPT4Tools。開源LLM社區(qū)正在快速開發(fā)具有更強(qiáng)的可定制性和免費(fèi)使用的模型。
13. 【研究人員開發(fā)MinD-Vis,一種人類視覺解碼器,可從大腦信號(hào)生成逼真的圖像】
新加坡國立大學(xué)、香港中文大學(xué)和斯坦福大學(xué)的研究人員開發(fā)了一種名為MinD-Vis的人類視覺解碼器,使用擴(kuò)散模型從大腦信號(hào)生成高度逼真的視覺刺激。該技術(shù)有助于發(fā)展腦機(jī)接口,并推進(jìn)對(duì)人類視覺系統(tǒng)的理解。該技術(shù)在語義映射和生成質(zhì)量方面優(yōu)于現(xiàn)有技術(shù)。
14. 【清華大學(xué)開發(fā)開源模型VisualGLM-6B,用于中文圖像理解和表情包解讀】
清華大學(xué)知識(shí)工程實(shí)驗(yàn)室和智谷AI聯(lián)合開發(fā)的VisualGLM-6B模型,可以解讀和理解中文表情包和emoji,但對(duì)于添加的文本仍有困難。該模型經(jīng)過大量數(shù)據(jù)的訓(xùn)練,包括圖像和文本,已發(fā)布為基于Web的演示版供用戶交互使用。但該模型仍存在一些已知限制,如圖像描述的事實(shí)錯(cuò)誤和圖像細(xì)節(jié)的不足。
15. 【大型語言模型技術(shù)公開課:基于Colossal-AI的ChatGPT低成本復(fù)制】
魯臣科技技術(shù)副總裁柳泓鑫將主講大型語言模型技術(shù)及其開源項(xiàng)目。其中,ColossalChat復(fù)制了ChatGPT的原始技術(shù),降低了內(nèi)存需求,加速了訓(xùn)練和推理。本次講座將討論成本計(jì)算、RLHF訓(xùn)練過程以及ColossalChat的低成本訓(xùn)練和推理。
16. 【特斯拉發(fā)布首個(gè)廣告,打破“無廣告,無營銷”原則】
特斯拉發(fā)布了首個(gè)廣告,展示了一位新加坡Model 3車主的使用體驗(yàn)。廣告強(qiáng)調(diào)了特斯拉車輛的安全性、娛樂性和環(huán)保性,并旨在提高因競(jìng)爭(zhēng)加劇和價(jià)格下調(diào)而受到影響的銷售額。該廣告在亞洲市場(chǎng)發(fā)布,預(yù)計(jì)很快會(huì)在其他市場(chǎng)推出。然而,特斯拉的全自動(dòng)駕駛技術(shù)尚未實(shí)現(xiàn),F(xiàn)SD V11.4測(cè)試版本仍存在問題。
17. 【騰訊天籟推出基于AI技術(shù)的遠(yuǎn)程聽力服務(wù)平臺(tái)】
騰訊天籟推出了一款遠(yuǎn)程聽力服務(wù)平臺(tái),為聽障人士提供幫助。該平臺(tái)基于騰訊會(huì)議,使用AI技術(shù)改善了驗(yàn)證過程。騰訊天籟已經(jīng)幫助數(shù)百萬用戶進(jìn)行聽力篩查、語音識(shí)別改善和康復(fù)訓(xùn)練。
18. 易迪泡推出新一代3D引擎、工具和平臺(tái),提升數(shù)字內(nèi)容制作】
易迪泡推出IDP Engine 4.0、iVis和Yuan Shu Yun等工具,以提高數(shù)字內(nèi)容創(chuàng)作的效率。該公司已與華為云元云工作室、環(huán)宇新人、聯(lián)想靈圖和中國裝飾集團(tuán)簽署戰(zhàn)略合作協(xié)議。易迪泡的iVis工具可將開發(fā)和維護(hù)成本降低80%以上。
19. 【蘋果秘密招募生成AI人才,或?qū)⒓訌?qiáng)Siri的自然語言生成功能】
蘋果正在招募生成人工智能(GAI)人才,以增強(qiáng)其移動(dòng)計(jì)算平臺(tái)。該公司可能將GAI技術(shù)整合到Siri中,以改進(jìn)自然語言生成功能。預(yù)計(jì)蘋果將在下個(gè)月的全球開發(fā)者大會(huì)上發(fā)表關(guān)于生成AI的聲明。
感謝您的關(guān)注,AI前沿觀察將繼續(xù)為您帶來前沿、全面的人工智能資訊。請(qǐng)大家積極參與互動(dòng),點(diǎn)贊、評(píng)論、轉(zhuǎn)發(fā),讓更多人了解AI的前沿技術(shù)和應(yīng)用。明天的速報(bào),我們不見不散!