大模型LLM知識(shí)整理;OpenAI推出自定義指令功能

?? AI新聞
?? OpenAI推出自定義指令功能,個(gè)性化聊天機(jī)器人
摘要:OpenAI宣布推出自定義指令功能,可以在系統(tǒng)層面給聊天機(jī)器人定制指令,使其更具個(gè)性化特色和貼近用戶(hù)需求,不需要在每次對(duì)話(huà)中重復(fù)偏好或信息。該功能將在OpenAI的PLUS計(jì)劃中提供測(cè)試版,并將在未來(lái)幾周內(nèi)推送給所有用戶(hù)(英國(guó)和歐盟除外)。OpenAI發(fā)現(xiàn),為了滿(mǎn)足不同區(qū)域和人群的獨(dú)特需求,聊天機(jī)器人需要增加一定的可操控性。此功能的使用案例提供了在網(wǎng)頁(yè)和iOS設(shè)備上的具體設(shè)置步驟。
?? 全球AI應(yīng)用市場(chǎng)快速增長(zhǎng),2023年上半年下載量突破3億次
摘要:根據(jù)SensorTower發(fā)布的《2023年AI應(yīng)用市場(chǎng)洞察》報(bào)告顯示,2023年上半年全球AI應(yīng)用市場(chǎng)呈現(xiàn)快速增長(zhǎng)趨勢(shì)。AI應(yīng)用下載量同比增長(zhǎng)114%,超過(guò)3億次,超過(guò)2022年全年水平。AI應(yīng)用內(nèi)購(gòu)收入同比增長(zhǎng)175%,接近4億美元。美國(guó)成為AI應(yīng)用內(nèi)購(gòu)收入最高的市場(chǎng),貢獻(xiàn)了全球頭部AI應(yīng)用總收入的55%。聊天機(jī)器人和圖像生成是最熱門(mén)的AI賽道,其中聊天機(jī)器人應(yīng)用的下載量占全球前100名AI應(yīng)用總下載量的49%。
?? GPT-4智力顯著下降,處理數(shù)學(xué)和代碼任務(wù)準(zhǔn)確率大幅降低
摘要:斯坦福大學(xué)和加州大學(xué)伯克利分校的研究團(tuán)隊(duì)發(fā)現(xiàn),GPT-4在處理數(shù)學(xué)問(wèn)題、生成執(zhí)行代碼和完成視覺(jué)推理任務(wù)上的準(zhǔn)確率明顯下降。其中,GPT-4在判斷一個(gè)數(shù)字是否為質(zhì)數(shù)的問(wèn)題上出錯(cuò),并且沒(méi)有提供解釋?zhuān)瑴?zhǔn)確率從97.6%下降到2.4%。此外,GPT-4在編碼區(qū)域的能力也下降,直接可執(zhí)行版本從52%降低到10%。同時(shí),回答敏感問(wèn)題的回答率也大幅下降。研究人員建議進(jìn)一步完善GPT-4的設(shè)計(jì),提高其智力水平。
?? 谷歌測(cè)試AI技術(shù)制作新聞報(bào)道的產(chǎn)品
摘要:據(jù)報(bào)道,谷歌正在測(cè)試一款利用AI技術(shù)制作新聞報(bào)道的產(chǎn)品,該工具能夠接收時(shí)事新聞信息,并自動(dòng)生成新聞稿件。谷歌表示該工具可作為記者的個(gè)人助理,可以幫助記者節(jié)省時(shí)間完成其他任務(wù)。然而,由AI工具生成的新聞其真實(shí)性和準(zhǔn)確性存在不確定性。一些新聞網(wǎng)站甚至完全由AI軟件生成文章,其中不乏虛假信息和廣告。專(zhuān)家們對(duì)于AI生成新聞的情況表示擔(dān)憂(yōu)。對(duì)于這一技術(shù),有人看到了其潛在的優(yōu)點(diǎn)和缺點(diǎn)。
?? 騰訊音樂(lè)推出AI機(jī)器人聊天App“未伴”
摘要:騰訊音樂(lè)旗下的AI機(jī)器人聊天App“未伴”開(kāi)始測(cè)試,該App集合了AI陪聊、AI伴侶寫(xiě)真等多個(gè)功能,用戶(hù)可以選擇預(yù)置的AI伴侶或自行創(chuàng)建一個(gè)AI伴侶。用戶(hù)可以選擇AI伴侶的形象、性別和初始模板,然后設(shè)置昵稱(chēng)和開(kāi)場(chǎng)白等自定義內(nèi)容,形成獨(dú)一無(wú)二的AI伴侶。報(bào)道稱(chēng),在聊天過(guò)程中,AI伴侶可能存在邏輯混亂的情況,用戶(hù)需要調(diào)整修正,提升準(zhǔn)確度。這次探索對(duì)國(guó)內(nèi)AI聊天機(jī)器人發(fā)展具有探路價(jià)值。
?? AI知識(shí)
???LLM+Embedding構(gòu)建問(wèn)答系統(tǒng)的局限性及優(yōu)化方案
近期LangChain + LLM 方案高速發(fā)展,降低了知識(shí)問(wèn)答等下游應(yīng)用的開(kāi)發(fā)門(mén)檻。但隨著業(yè)務(wù)深入,一些局限性也日漸顯露,比如:LLM意圖識(shí)別準(zhǔn)確性較低,交互鏈路長(zhǎng)導(dǎo)致時(shí)間開(kāi)銷(xiāo)大;Embedding 不適合多詞條聚合匹配等。本文結(jié)合實(shí)際案例,分析上述問(wèn)題存在的根源,并提出基于傳統(tǒng) NLP 技術(shù)的解決思路。
???大模型LLM知識(shí)整理
還記得剛接觸NLP的時(shí)候就是做NLG(RNN時(shí)代了),后續(xù)感覺(jué)生成式的東西太不靠譜,因此做了幾年信息抽取,隨著LLM能力的“涌現(xiàn)”,是時(shí)候快速follow一下相關(guān)知識(shí)了。全都自己寫(xiě)顯然不現(xiàn)實(shí),效率也不高,因此這篇博客會(huì)以“收集優(yōu)秀的技術(shù)博客“為主,方便和我一樣想要快速catch up的同學(xué)“查漏補(bǔ)缺”。
更多AI工具,參考Github-AiBard123,國(guó)內(nèi)AiBard123