散文網(wǎng) » 生活 »日常 » 聊天機(jī)器人評(píng)分榜（Bard、Claude、GPT、Newbing）

聊天機(jī)器人評(píng)分榜（Bard、Claude、GPT、Newbing）

2023-06-25 18:04 作者:來(lái)自夜月神器的達(dá)人 0人讀過(guò) | 我要投稿

自從ChatGPT在去年11月份風(fēng)靡以來(lái)，更多不同語(yǔ)言模型(LLMs)、定價(jià)、用戶界面、互聯(lián)網(wǎng)接入等的聊天機(jī)器人一一展露，這就讓用戶很難直接確定哪個(gè)才是更好的聊天機(jī)器人。

由加州大學(xué)伯克利分校的學(xué)生和教師共同創(chuàng)立的開放研究組織Large Model Systems Organization（LMYSY Org）創(chuàng)建了聊天機(jī)器人競(jìng)技場(chǎng)，這是一個(gè)語(yǔ)言模型基準(zhǔn)平臺(tái)，用戶可以通過(guò)輸入提示并選擇最佳答案來(lái)對(duì)兩個(gè)隨機(jī)模型進(jìn)行測(cè)試。根據(jù)LMSYS Org的說(shuō)法，用戶評(píng)級(jí)結(jié)果將根據(jù)Elo評(píng)級(jí)系統(tǒng)在排行榜上對(duì)LLMs進(jìn)行排名（Elo評(píng)級(jí)系統(tǒng)是國(guó)際象棋中廣泛使用的評(píng)級(jí)系統(tǒng)）。

過(guò)程就不多說(shuō)，直接給大家看結(jié)果，如圖：

聊天機(jī)器人評(píng)分排行榜

實(shí)際如何，各位可以根據(jù)自己的實(shí)際情況去嘗試。

可以看到，GPT-4毫無(wú)疑問(wèn)是目前最好的選擇，排名第二的Claude目前還不對(duì)公眾開放，但有一個(gè)排隊(duì)名單，可以嘗試申請(qǐng)以獲得訪問(wèn)權(quán)限（通過(guò)poe也可以體驗(yàn)）。?

排行榜上排名第八的是PaLM-Chat-Bison-001，這是Google Bard背后的PaLM 2的一個(gè)子模型。這個(gè)排名與對(duì)Bard的普遍觀點(diǎn)相符，不是最差的，但也不是最好的。

標(biāo)簽：

聊天機(jī)器人評(píng)分榜（Bard、Claude、GPT、Newbing）的評(píng)論 (共條)

愛情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩(shī)歌空間日志經(jīng)典語(yǔ)句愛情句子作文大全

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

聊天機(jī)器人評(píng)分榜（Bard、Claude、GPT、Newbing）

聊天機(jī)器人評(píng)分榜（Bard、Claude、GPT、Newbing）的評(píng)論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

聊天機(jī)器人評(píng)分榜（Bard、Claude、GPT、Newbing）

本文作者的其他文章

聊天機(jī)器人評(píng)分榜（Bard、Claude、GPT、Newbing）的評(píng)論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

聊天機(jī)器人評(píng)分榜（Bard、Claude、GPT、Newbing）

聊天機(jī)器人評(píng)分榜（Bard、Claude、GPT、Newbing）的評(píng)論 (共條)