面向未來的智能對(duì)話新體驗(yàn)—Claude2
Anthropic 公司是由OpenAI前研究副總裁帶領(lǐng)10名OpenAI前員工于2021年成立的。這里面既有GPT-3首席工程師Tom Brown,也有OpenAI安全和政策副總裁Daniela Amodei,可以說是帶走了相當(dāng)一批核心人才。出走成立新公司的原因之一,自然是對(duì)OpenAI現(xiàn)狀并不滿意。 從前幾年開始,微軟頻頻給OpenAI注資,隨后又要求他們使用Azure超算來搞研究,而且將技術(shù)授權(quán)給微軟,甚至為微軟自己的投資活動(dòng)籌集資金。這與OpenAI創(chuàng)立的初衷相悖,一批員工便想到了離職創(chuàng)業(yè)。當(dāng)然,還有一部分原因是這群人想做能控制、可解釋的AI,說白了就是先搞明白AI模型背后的原理,從而在提供工具的同時(shí)設(shè)計(jì)更多可解釋的AI模型。于是,在OpenAI徹底變成“微軟攬錢機(jī)器”后,他們便從這家公司離開,創(chuàng)辦了Anthropic。Claude目標(biāo)是成為一個(gè)安全、接近人類價(jià)值觀且合乎道德規(guī)范的AI系統(tǒng)。目前(2023年4月)Anthropic目前團(tuán)隊(duì)大約80人,融資額超過13億美元,估值達(dá)到41億美元。Claude是在Anthropic自主研發(fā)的大型語(yǔ)言模型Create基礎(chǔ)上設(shè)計(jì)打造而成。Create使用Anthropic自行收集的巨大多樣化訓(xùn)練集進(jìn)行訓(xùn)練,并采用了原創(chuàng)性的自監(jiān)督學(xué)習(xí)方法。相較于ChatGPT背后的GPT模型采用的監(jiān)督學(xué)習(xí)方式,這種方法更能促進(jìn)模型對(duì)各種場(chǎng)景的泛化理解,強(qiáng)化常識(shí)推理能力,更好地學(xué)會(huì)人類交互模式。經(jīng)過持續(xù)迭代優(yōu)化,Claude助手已經(jīng)發(fā)布了多版本,當(dāng)前最新版本集成了Create的最新能力,可以提供流暢、知識(shí)豐富、上下文關(guān)聯(lián)的英文語(yǔ)音交互體驗(yàn)。模型方面,Anthropic宣稱其規(guī)模已經(jīng)超過175億參數(shù),相當(dāng)于GPT-3的1.5倍。
Claude功能更新
體驗(yàn)網(wǎng)址:https://claude.ai/
- 一次記憶10萬token,相當(dāng)于75000個(gè)單詞
- Claude 的訓(xùn)練數(shù)據(jù)主要是英語(yǔ),但 Claude 2 的訓(xùn)練數(shù)據(jù)中非英語(yǔ)數(shù)據(jù)比例已經(jīng)明顯增加。經(jīng)測(cè)試發(fā)現(xiàn)claude對(duì)中文的理解能力相對(duì)于chatgpt要好很多。
- Claude 2 的訓(xùn)練數(shù)據(jù)包括 2022 年和 2023 年初更新的數(shù)據(jù)。這意味著它在互聯(lián)網(wǎng)新聞等方面了解的更多。
在標(biāo)準(zhǔn)基準(zhǔn)上評(píng)估測(cè)試了 Claude 2、Claude Instant 1.1 和 Claude 1.3,包括用于 python 函數(shù)合成的 Codex HumanEval、用于解決小學(xué)數(shù)學(xué)問題的 GSM8k、用于多學(xué)科問答的 MMLU、針對(duì)長(zhǎng)故事問答的 QuALITY、用于科學(xué)問題的 ARC-Challenge、用于閱讀理解的 TriviaQA 和用于中學(xué)水平閱讀理解與推理的 RACE-H,具體的評(píng)估結(jié)果如下表所示:
綜上,我們可以看出,在人工智能領(lǐng)域,Claude 2憑借其卓越的自然語(yǔ)言理解能力、豐富知識(shí)問答以及友好交互,已成為一個(gè)不可忽視的強(qiáng)力新競(jìng)爭(zhēng)者,在許多方面領(lǐng)先于當(dāng)前最熱門的ChatGPT。Claude 2的出現(xiàn)給人機(jī)交互帶來新的思考和可能。相信未來隨著其能力的不斷提升,它必將給我們帶來更加智能、更加人性化的語(yǔ)音交互體驗(yàn)。面向未來的智能對(duì)話新體驗(yàn)—Claude2