AI視野:多模態(tài)ChatGPT即將上線;抖音“AI美式證件照”走紅;

??????AI新鮮事
多模態(tài)ChatGPT即將上線 會(huì)看圖、聽(tīng)聲音、說(shuō)話
OpenAI在美東時(shí)間9月25日宣布對(duì)ChatGPT進(jìn)行重磅升級(jí),實(shí)現(xiàn)了看圖、聽(tīng)聲音、輸出語(yǔ)音內(nèi)容的三大功能,為通用人工智能(AGI)邁出重要一步。

AiBase提要:
?? ChatGPT實(shí)現(xiàn)多模態(tài)功能,支持看圖、聽(tīng)聲音、說(shuō)話
??? 新語(yǔ)音功能能生成人類(lèi)音頻,圖片理解功能提供多種應(yīng)用
?? OpenAI重視安全,逐步推出功能,防范風(fēng)險(xiǎn)
?? Spotify和Be My Eyes已經(jīng)使用新功能,拓寬應(yīng)用領(lǐng)域
DeepMind研究:LLMs在圖像和音頻壓縮方面出色表現(xiàn)
Google旗下的DeepMind研究人員發(fā)現(xiàn),大型語(yǔ)言模型(LLMs)除了在文本領(lǐng)域表現(xiàn)出色,還在圖像和音頻數(shù)據(jù)的壓縮方面具備出色能力,超越了專(zhuān)用的壓縮算法如PNG和FLAC。
AiBase提要:
?? 研究人員發(fā)現(xiàn)LLMs不僅在文本上表現(xiàn)出色,還在圖像和音頻壓縮上取得顯著成功。
?? 這項(xiàng)研究將LLMs視為強(qiáng)大的數(shù)據(jù)壓縮器,提供了新的理解模型能力的視角。
?? LLMs的性能與數(shù)據(jù)集大小相關(guān),壓縮率成為評(píng)估模型學(xué)習(xí)數(shù)據(jù)集信息的指標(biāo)。
SambaNova發(fā)布全新AI芯片SN40L,可運(yùn)行5萬(wàn)億參數(shù)模型
SambaNova發(fā)布了一款新型AI芯片SN40L,支持運(yùn)行高達(dá)5萬(wàn)億參數(shù)的大模型,提升模型質(zhì)量和推理速度,降低總體擁有成本。
AiBase提要
?? SambaNova的新AI芯片SN40L支持單節(jié)點(diǎn)上運(yùn)行5萬(wàn)億參數(shù)模型,大大提升了模型質(zhì)量和推理速度。
?? SN40L采用先進(jìn)設(shè)計(jì),同時(shí)支持HBM和DRAM內(nèi)存,算法可以根據(jù)需要選擇合適的內(nèi)存類(lèi)型。
?? SN40L集成到SambaNova的全棧大語(yǔ)言模型平臺(tái),幫助客戶訓(xùn)練和部署大模型如GPT-4。
SK電訊宣布AI金字塔戰(zhàn)略,力爭(zhēng)成為全球AI巨頭
SK電訊宣布AI金字塔戰(zhàn)略,加速創(chuàng)新與投資,重點(diǎn)聚焦AI基礎(chǔ)設(shè)施、轉(zhuǎn)型和服務(wù),力爭(zhēng)成為全球AI巨頭。
AiBase提要:
SK電訊未來(lái)5年AI相關(guān)投資將從12%大幅提升至33%
AI基礎(chǔ)設(shè)施包括數(shù)據(jù)中心、AI芯片和多語(yǔ)言模型,是SK電訊AI能力的集中體現(xiàn)
SK電訊正式推出個(gè)人AI助手A.,并計(jì)劃帶入全球市場(chǎng)
Snap 與微軟合作在其「My AI」聊天機(jī)器人對(duì)話中投放廣告
Snapchat 與微軟合作,將在其 AI 產(chǎn)品 My AI 中插入廣告。這個(gè)合作意味著用戶與 AI 聊天機(jī)器人對(duì)話時(shí),可能會(huì)收到與他們的查詢相關(guān)的贊助商鏈接建議。這個(gè)廣告形式類(lèi)似于與對(duì)話相關(guān)的 Sponsored Links,而微軟的廣告業(yè)務(wù)正取得新的進(jìn)展,與其他科技公司競(jìng)爭(zhēng)合作伙伴。Snapchat 表示這一功能還處于早期實(shí)驗(yàn)階段,但他們計(jì)劃與更多合作伙伴合作,以增強(qiáng) My AI。
?? AiBase提要:
1. Snapchat 與微軟合作,為 My AI 聊天機(jī)器人插入廣告,提供用戶相關(guān)的贊助商鏈接建議。
2. 微軟的廣告業(yè)務(wù)取得進(jìn)展,與超過(guò)7500個(gè)合作伙伴品牌合作,在 AI 聊天機(jī)器人中插入廣告。
3. Snap 表示這一功能仍在早期實(shí)驗(yàn)階段,計(jì)劃與更多合作伙伴合作,以增強(qiáng) My AI。
哈佛研究發(fā)現(xiàn)GPT-4使得企業(yè)員工績(jī)效提升了40%
哈佛大學(xué)領(lǐng)導(dǎo)的研究發(fā)現(xiàn),使用生成式人工智能的波士頓咨詢集團(tuán)顧問(wèn)的任務(wù)完成質(zhì)量、速度和頻率均有顯著提升,相較不使用AI的同行,提高了40%的績(jī)效。
AiBase提要
??研究發(fā)現(xiàn)GPT-4使波士頓咨詢集團(tuán)顧問(wèn)的績(jī)效提高了40%
??這是首次大規(guī)模研究企業(yè)中生成式AI的實(shí)際應(yīng)用效果
??部分顧問(wèn)采用“Cyborg”和“Centaur”方式使用AI,為未來(lái)應(yīng)用提供啟示
抖音網(wǎng)友用AI生成各國(guó)版蜘蛛俠獲贊6.7萬(wàn)
一位抖音網(wǎng)友使用AI軟件生成不同國(guó)家風(fēng)格的蜘蛛俠形象,獲得了大量好評(píng)和點(diǎn)贊。這些蜘蛛俠形象充滿了各國(guó)的特色和代表性元素,例如中國(guó)風(fēng)格的武俠風(fēng)、冰島冰霜?dú)庀ⅰ⒀蕾I(mǎi)加的紅黃綠經(jīng)典三色以及沙特的富裕感。目前,該系列作品已獲得6.7萬(wàn)點(diǎn)贊。

AiBase提要:
???♂? 一位抖音網(wǎng)友使用AI軟件生成不同國(guó)家風(fēng)格的蜘蛛俠形象。
??這些蜘蛛俠形象融入了各國(guó)的文化特色,獲得了6.7萬(wàn)的點(diǎn)贊。
?? AI軟件生成熱門(mén)IP形象成為獲得更高曝光的趨勢(shì)。
抖音上線“亞運(yùn)加油盲盒”AI特效
抖音官方在杭州亞運(yùn)會(huì)期間推出了“亞運(yùn)加油盲盒”AI特效,可以給用戶照片添加卡通化的亞運(yùn)造型,已有超過(guò)147萬(wàn)人使用。

AiBase提要:
?? 亞運(yùn)加油盲盒AI特效可以為用戶照片生成卡通化的亞運(yùn)造型,衣服可變?yōu)檫\(yùn)動(dòng)裝
???特效可能使用了ControlNet等技術(shù)來(lái)分析人物動(dòng)作和體態(tài)
?? 本屆亞運(yùn)還展示了多項(xiàng)AI技術(shù)應(yīng)用,如修復(fù)老照片、數(shù)字人點(diǎn)燃火炬等
抖音“AI美式證件照”走紅 相關(guān)話題播放量過(guò)億
AI生成的證件照模板越來(lái)越受歡迎,抖音上AI美式證件照話題播放量過(guò)億,但部分網(wǎng)友認(rèn)為生成效果不太像。

AiBase提要:
?? AI證件照走紅,抖音相關(guān)話題播放過(guò)億
?? 剪映AI美式證件照受歡迎,但部分網(wǎng)友認(rèn)為生成效果不像
?? 相比抖音,AI寫(xiě)真軟件生成效果更好,門(mén)檻更高
富士通推出新技術(shù)保護(hù)對(duì)話型AI免受幻覺(jué)和對(duì)抗性攻擊
富士通推出兩項(xiàng)新技術(shù)可檢測(cè)對(duì)話型AI中的幻覺(jué)和網(wǎng)絡(luò)釣魚(yú)網(wǎng)址,以提高對(duì)話型AI的可靠性和安全性。
AiBase提要:
?? 富士通推出技術(shù)可檢測(cè)對(duì)話AI回復(fù)中的幻覺(jué),提高檢測(cè)準(zhǔn)確率約22%。
?? 富士通開(kāi)發(fā)技術(shù)可檢測(cè)對(duì)話AI中植入的網(wǎng)絡(luò)釣魚(yú)網(wǎng)址,防止用戶受到欺騙。
?? 兩項(xiàng)新技術(shù)將集成到富士通AI平臺(tái),有助保護(hù)企業(yè)用戶免受各種威脅。
DeepMind利用無(wú)監(jiān)督學(xué)習(xí)開(kāi)發(fā)AlphaMissense,預(yù)測(cè)7100萬(wàn)種基因突變
DeepMind開(kāi)發(fā)AlphaMissense,利用AlphaFold模型預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),再結(jié)合無(wú)監(jiān)督學(xué)習(xí)對(duì)7100萬(wàn)種基因錯(cuò)義突變進(jìn)行預(yù)測(cè),在多個(gè)數(shù)據(jù)集上的預(yù)測(cè)正確率達(dá)90%以上。
論文地址:https://www.science.org/doi/10.1126/science.adg7492
AiBase提要
?? 利用AlphaFold分析蛋白質(zhì)結(jié)構(gòu),基于此開(kāi)發(fā)AlphaMissense模型
?? 訓(xùn)練數(shù)據(jù)集包括已知的良性和預(yù)測(cè)的致病錯(cuò)義突變
?? 在多個(gè)數(shù)據(jù)集上表現(xiàn)優(yōu)異,總體預(yù)測(cè)正確率達(dá)90%以上
??????聚焦開(kāi)發(fā)者
Rerender A Video源代碼放出!解決AI視頻閃爍問(wèn)題
Rerender A Video項(xiàng)目通過(guò)零訓(xùn)練的文本引導(dǎo)視頻到視頻翻譯框架,實(shí)現(xiàn)了低成本的時(shí)間一致性,解決了AI視頻閃爍問(wèn)題。

項(xiàng)目地址:https://github.com/williamyang1991/Rerender_A_Video
AiBase提要:
?? 通過(guò)交叉幀約束實(shí)現(xiàn)時(shí)間一致性
?? 無(wú)需訓(xùn)練即可應(yīng)用于各類(lèi)視頻翻譯任務(wù)
?? 支持結(jié)合現(xiàn)有圖像生成模型進(jìn)行自定義翻譯
高效開(kāi)源LLM框架Haystack 助力打造高效應(yīng)用程序
Haystack是一個(gè)端到端的自然語(yǔ)言處理框架,能夠幫助構(gòu)建由大型語(yǔ)言模型、Transformer模型、向量搜索等驅(qū)動(dòng)的應(yīng)用程序。

項(xiàng)目地址:https://github.com/deepset-ai/haystack
AiBase提要
?? Haystack的核心功能包括流水線、節(jié)點(diǎn)、代理、工具和文檔存儲(chǔ)。
?? Haystack支持多種文檔存儲(chǔ),包括ElasticSearch、Opensearch、Weaviate等。
?? Haystack可以幫助使用最先進(jìn)的NLP模型構(gòu)建端到端的NLP應(yīng)用程序。
萬(wàn)能AI編程工具包插件Sidekick 提供個(gè)性化編程幫助
文章介紹了微軟開(kāi)發(fā)的萬(wàn)能AI編程工具包插件Sidekick,通過(guò)GPT-4引擎提供支持,根據(jù)用戶編程習(xí)慣提供個(gè)性化編程幫助,提高編程效率。

體驗(yàn)地址:
https://marketplace.visualstudio.com/items?itemName=InvisibleTools.sidekickai&%3Butm_source=9527ai&utm_source=talkingdev.uwl.me
AiBase 提要:
Sidekick AI能根據(jù)用戶編程需求提供個(gè)性化編程幫助
Sidekick AI具有快速聊天、代碼附加等功能幫助開(kāi)發(fā)
Sidekick AI通過(guò)GPT-4提高編碼效率,重新定義AI編程工具
EmoPP模型開(kāi)源:一款基于情感感知的韻律短語(yǔ)生成模型
EmoPP-Demo是一款基于情感感知的韻律短語(yǔ)生成模型,通過(guò)預(yù)測(cè)短語(yǔ)分隔符來(lái)提升端到端文本轉(zhuǎn)語(yǔ)音的自然度和情感表達(dá)能力,開(kāi)源代碼在GitHub。

地址:https://ai-s2-lab.github.io/EmoPP/
AiBase提要:
?? EmoPP-Demo可以自動(dòng)識(shí)別話語(yǔ)中的情感線索,并生成韻律短語(yǔ)分隔符。
?? 經(jīng)過(guò)評(píng)估,EmoPP-Demo在情感表達(dá)方面表現(xiàn)出色,優(yōu)于基線模型。
?? EmoPP-Demo提供語(yǔ)音演示,驗(yàn)證其在人類(lèi)感知中的優(yōu)越性。
??????AI應(yīng)用
Getty Images與Nvidia合作開(kāi)發(fā)生成式AI圖片工具
圖片庫(kù)巨頭Getty Images與芯片制造商N(yùn)vidia宣布合作,共同開(kāi)發(fā)生成式AI圖片工具,這引發(fā)了有關(guān)創(chuàng)作者應(yīng)獲取創(chuàng)作權(quán)的爭(zhēng)議,將推動(dòng)思考AI如何影響文化創(chuàng)意產(chǎn)業(yè)。

AiBase提要:
?? Getty推出基于自有圖庫(kù)訓(xùn)練的生成AI,為AI藝術(shù)品提供版權(quán)保障
?? 該技術(shù)為藝術(shù)家提供新的創(chuàng)作工具,也帶來(lái)創(chuàng)作靈感和資源
?? 合作引發(fā)版權(quán)和創(chuàng)作者權(quán)益保護(hù)等爭(zhēng)議,需要找到平衡
Spotify 將使用 OpenAI 人工智能技術(shù)克隆播客聲音
Spotify正在測(cè)試使用OpenAI的語(yǔ)音生成技術(shù),讓播客主持人用自己的聲音模擬不同語(yǔ)言版本,以方便觸達(dá)其他語(yǔ)言區(qū)的聽(tīng)眾。
AiBase提要:
?? Spotify與部分播客主持人合作,用AI技術(shù)把他們的英語(yǔ)內(nèi)容翻譯成其他語(yǔ)言。
?? Spotify表示該技術(shù)來(lái)自O(shè)penAI,可以保留播客獨(dú)特的語(yǔ)音特征。
?? 這種新技術(shù)被稱為“語(yǔ)音翻譯”,已在西班牙推出,其他語(yǔ)言版本也將陸續(xù)推出。
????????大模型動(dòng)態(tài)
百度智能云發(fā)布交通行業(yè)大模型“ACE3.0”
百度智能云在全球可持續(xù)交通高峰論壇上,發(fā)布了基于大模型重構(gòu)的智能交通解決方案ACE3.0,利用大模型的知識(shí)壓縮能力,實(shí)現(xiàn)對(duì)交通行業(yè)的AI原生重構(gòu)。
AiBase提要:
??百度表示,ACE3.0利用大模型強(qiáng)大的知識(shí)壓縮能力,將車(chē)、路、云、圖的基本能力進(jìn)行了聚合和泛化升級(jí),打造交通大模型。
??模型層即交通行業(yè)大模型,基于語(yǔ)言、視覺(jué)和跨模態(tài)大模型構(gòu)成;應(yīng)用層則包含智慧網(wǎng)聯(lián)、智慧交管等智能交通場(chǎng)景。
??百度智能交通已聯(lián)合140多家生態(tài)伙伴,為200多個(gè)城市提供智能交通服務(wù)。未來(lái)還將依托行業(yè)大模型,繼續(xù)推動(dòng)交通智能化。
什么值得買(mǎi)開(kāi)發(fā)大模型
值得買(mǎi)表示,大數(shù)據(jù)和大模型是公司非常關(guān)注的領(lǐng)域,公司已經(jīng)在該領(lǐng)域加大了投入。在大數(shù)據(jù)層面,目前隨著公司逐步沉淀來(lái)自于消費(fèi)內(nèi)容業(yè)務(wù)板塊和營(yíng)銷(xiāo)服務(wù)業(yè)務(wù)板塊等的更多數(shù)據(jù)資源,已形成一個(gè)能夠涵蓋人、貨、場(chǎng)等多種維度的底層數(shù)據(jù)體系。
AiBase提要
?? 公司關(guān)注大數(shù)據(jù)和大模型領(lǐng)域,加大投入
?? 積累多維度數(shù)據(jù)資源,包括人、貨、場(chǎng)
?? 開(kāi)發(fā)“值得買(mǎi)消費(fèi)內(nèi)容大模型”和應(yīng)用產(chǎn)品探索
聆心智能開(kāi)源定制角色對(duì)話交互模型CharacterGLM-6B
聆心智能發(fā)布了CharacterGLM-6B模型,用于定制化角色對(duì)話。該模型基于ChatGLM模型,有6B、12B和66B三個(gè)不同參數(shù)量的版本。聆心智能將開(kāi)放12B和66B模型的API訪問(wèn),并開(kāi)源CharacterGLM-6B模型,以促進(jìn)AI角色扮演和AI在心理學(xué)中的應(yīng)用。性能評(píng)估結(jié)果顯示,CharacterGLM在大多數(shù)類(lèi)別和話題下表現(xiàn)優(yōu)于競(jìng)爭(zhēng)對(duì)手,并提供了不同類(lèi)別角色的對(duì)話交互效果示例。
開(kāi)源地址:
https://huggingface.co/LingxinAI/CharacterGLM-6b
API調(diào)用地址:
CharacterGLM API: https://bigmodel.cn/dev/api#characterglm
AiBase提要
?? 聆心智能發(fā)布CharacterGLM-6B,定制角色對(duì)話交互模型
?? 基于ChatGLM模型,包括6B、12B和66B版本
?? 開(kāi)源CharacterGLM-6B,推動(dòng)AI角色扮演和心理學(xué)應(yīng)用