國內(nèi)首個(gè) ChatGPT 檢測器發(fā)布,它是如何區(qū)別人類與 AI 的?我們還能做什么?

有了人類跟ChatGPT的對比數(shù)據(jù)之后,我們就可以做很多有趣的事兒了,訓(xùn)練ChatGPT檢測器只是有了數(shù)據(jù)以后一個(gè)不錯(cuò)白不做的事兒,用我們的數(shù)據(jù)訓(xùn)練分類器即可,但是鑒于廣大群眾其實(shí)挺關(guān)注檢測器這個(gè)東西,所以我們先做了幾個(gè)版本的檢測器,既有機(jī)器學(xué)習(xí)方法的,也有深度學(xué)習(xí)方法的,在1月11號放出了幾個(gè)demo,也就是題目中的報(bào)道。既然講到這兒了,我也大概說一下我們的ChatGPT檢測器使用的方法:深度學(xué)習(xí)方法,思路比較簡單,我們嘗試了兩種方式:一個(gè)是Single-Text版本,也是大家可能最容易使用的版本,就是直接輸入一段文本,然后判斷是否是ChatGPT。那么就可以使用我們現(xiàn)成的數(shù)據(jù),訓(xùn)練一個(gè)二分類模型;另一種是QA版本,比方對于知乎、Quora這種平臺(tái),我們判斷某個(gè)回答是否是ChatGPT寫的,還可以同時(shí)參考對應(yīng)的問題是什么,加入問題這個(gè)元素,可能分類就會(huì)更加準(zhǔn)確,所以這是一個(gè)輸入sentence pair的二分類模型。當(dāng)然,實(shí)際訓(xùn)練的時(shí)候,我們還需要考慮做一些數(shù)據(jù)的清洗,比如ChatGPT或者人會(huì)有一些明顯pattern詞匯,那我們就會(huì)對這些pattern進(jìn)行清理,實(shí)驗(yàn)也證明這個(gè)可以一定程度提升泛化性能。然后我們還試驗(yàn)了使用不用粒度的數(shù)據(jù)來訓(xùn)練,因?yàn)槲覀儼l(fā)現(xiàn)如果僅僅在全文上訓(xùn)練,在單個(gè)句子上的泛化性能就比較差。所以這么一來,就涉及很多種不同模型設(shè)置。
自O(shè)penAi發(fā)布ChatGPT-4以來,目前國內(nèi)最好用最穩(wěn)定的仍然是新智能Ai,新智能Ai已經(jīng)和OpenAi簽約商業(yè)合作,也是國內(nèi)唯一的ChatGPT4鏡像版,它的速度非???、延遲率非常低、并且永遠(yuǎn)不封號,而且還支持Ai繪畫,Ai對話和Ai繪畫對我們的工作助助很大;特別強(qiáng)調(diào)的是,新智能Ai和ChatGPT-4.0共用一個(gè)服務(wù)器、共享一個(gè)Api端口、所有得到ChatGPT4.0的回答也是相同的;通俗易懂的說,你在國內(nèi)使用新智能Ai的ChatGPT-4,等同于你在美國當(dāng)?shù)厥褂?,就是這么個(gè)意思。大家可以學(xué)習(xí)一下~
