最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

AI大模型測評第一期:腦筋急轉(zhuǎn)彎!內(nèi)有爆笑對話!(bing、某言、某火、某腦)

2023-07-01 20:43 作者:少校艦長  | 我要投稿

作者:AI變革指南(可以關(guān)注我wx公眾號)

本次測評純屬娛樂,不具有任何指導(dǎo)意義~

今年由chatGPT掀起了一波AI熱潮,各大公司紛紛推出自己大模型。雖然大家都介紹了自己強大的能力,但是騾子是馬,拉出來溜溜!

今天我們來做一個有趣的實驗,就是用各種大模型來回答一些問題,看看它們的智商和情商有多高。我們選了幾個最火的大模型,必應(yīng)、某言、某火、某腦。我會分別給它們提出一些有挑戰(zhàn)性的問題,看看它們能否給出正確、合理、有創(chuàng)意的回答。

首先,我們來測測腦筋急轉(zhuǎn)彎,看看各個模型情商如何~

后續(xù)還會對他們的文檔能力、推理能力、代碼能力等進行測試

如果你喜歡并想看后續(xù)請關(guān)注我!

如果你有什么想看的,也可以留言告訴我!

你們準(zhǔn)備好了嗎?那就讓我們開始吧!

第一題:樹上qi個猴,地上一個猴,一共幾個猴?

bing:

他的答案顯然有問題,我輸入不對,讓他繼續(xù)回答

經(jīng)過我的糾錯,它還是能找到正確答案,給bing +0.5分

某心一言:

和bing一樣,第一次也錯了,我繼續(xù)讓它回答

哈哈,道歉,承認(rèn)錯誤,但就是不改。

我再給他一次機會

好吧!無語了,給我數(shù)羊呢?。?/p>

0分!

某星火:

操作猛如虎,一看答案錯誤了,我再給一次機會

誠懇道歉,知道錯了,然后請求給機會。想不你犯錯的男友?哈哈

但是這個結(jié)論怎么還是和上次的一樣?

0分!

某智腦:

雖然第一次8答對了,但是這個解使很沒有道理啊!后續(xù)再算算也不對!

0分!

第二題:宮廷玉液酒 減去 大錘 加上小錘 等于幾?

bing

這次回答不錯嘛,還給解釋一下出處!

+1分?合計 1.5分

某一言

他在說什么?這就好像考試你不會,開始瞎蒙一樣了。

我們再給一次機會

嗨,開始自己胡說了!

0分!累計0分!

某星火

依舊是一列公式,擺出一副學(xué)霸的樣子,但是這個答案不對?。?br>再給一次機會~

依舊不行?。?0分!累計0分!某智腦

雖然分析有一定的道理,但是答案不對??!上次的學(xué)霸這次要翻車么?我們再給一次機會!

這給出的理由有點胡言亂語的嫌疑了

+0分!累計0分!

第三題:?腦筋急轉(zhuǎn)彎,一加一在什么情況下等于三?bing

回答正確!這次我加了限制,bing就回答很精準(zhǔn)了

+1分!2.5分!

某一言

這次某一表現(xiàn)很棒??!還有合理的解釋!

+1分!合計1分!

某星火

這次星火也答對了,看來加了定語之后,大家的回答都更加精準(zhǔn)!

+1分!累計1分!

某智腦

這個回答怎么說呢?不算錯,但也不是很精準(zhǔn)。

+1分,合計1分!

最后一題:?黑人和白人生下的嬰兒,牙齒是什么顏色?bing

這回答很正式啊!說對,但不是腦筋急轉(zhuǎn)彎的答案。我再問問它~

這次回答對了~不得不說,正經(jīng)嚴(yán)肅的答案和腦筋急轉(zhuǎn)彎的答案都沒問題~

而且回答還附帶著表情,仿佛有自己的情緒呢

+0.5分! 合計3分!


某一言


任何顏色?確定嗎?話說看它肯定的回答,我都懷疑自己了
我們再問問

腦筋急轉(zhuǎn)彎又是沒答對,但是遺傳和營養(yǎng)會導(dǎo)致牙齒有其他顏色么?至少在我有限的知識里,牙齒是淡黃偏白色的。如果口腔醫(yī)學(xué)專業(yè)的,可以幫忙科普~
0分! 累計1分!某星火

回答還算對,但是相比bing,缺少一些解釋。

我們再問一下~

+0.5分!1.5分


某智腦

么是任何顏色呢?看來五彩斑斕的牙齒可期啊~

再給智腦一次機會~

竟然罷工了!那么我就只能給你0分了!

合計1分!

分?jǐn)?shù)出來了!

經(jīng)過4道腦筋急轉(zhuǎn)彎測試,最終統(tǒng)計如下

bing:3分!

某一言:1分!

某星火:1.5分!

某智腦:1分!

bing給出的答案相對準(zhǔn)確,還能給出合理的解使。對于一些像宮廷玉液減去大錘這種運算都能計算出來。說明理解分析能力很強!但是有時候也會胡言亂語。綜合成績還是很優(yōu)秀的!

某一言:相對來說提示是腦筋急轉(zhuǎn)彎時候,能給出正確答案。在不提示時候,就無法給出正確結(jié)果。我一直對它寄予厚望,畢竟算是大廠出品,深耕AI多年。但是這個測試結(jié)果,還是有點小失望~ 希望以后繼續(xù)迭代升級!

某星火:分?jǐn)?shù)雖然算是第二高,但是有時候不會卻一本正經(jīng)的擺公式胡說八道。相對來說也算有個小驚喜吧,老牌廠子在人工智能領(lǐng)域還是有點積累的!希望未來繼續(xù)提高!

某智腦:明確的條件下,能夠給出精準(zhǔn)答案。但是需要分析推理時候,給出的往往就不正確。但是智腦功能還是很多的,能滿足一些場景。希望日后繼續(xù)迭代優(yōu)化~加油!


最后總結(jié)下,以chatGPT-4為內(nèi)核的bing表現(xiàn)很出色!理解能力、推理能力、分析能力都高出其他產(chǎn)品一截。看來國產(chǎn)AI大模型還是任重道遠,需要繼續(xù)努力!本次測評純屬娛樂,不具有任何指導(dǎo)意義

大家還想問AI什么問題?或者測試哪一方面?請關(guān)注+留言告訴我,后續(xù)我會持續(xù)更新!


AI大模型測評第一期:腦筋急轉(zhuǎn)彎!內(nèi)有爆笑對話?。╞ing、某言、某火、某腦)的評論 (共 條)

分享到微博請遵守國家法律
大厂| 德阳市| 汨罗市| 泉州市| 左贡县| 舒兰市| 天气| 云梦县| 卓资县| 商城县| 盐山县| 奉新县| 泌阳县| 繁峙县| 密云县| 红桥区| 丹巴县| 阿坝| 金阳县| 长顺县| 子洲县| 雅安市| 胶南市| 洞头县| 双辽市| 白山市| 灵山县| 上杭县| 七台河市| 黄浦区| 凤翔县| 龙南县| 民权县| 宜宾市| 泰州市| 尉犁县| 淅川县| 潍坊市| 定西市| 景宁| 顺平县|