多么行|讓人人都能訓(xùn)練模型
2023年為AIGC爆發(fā)的元年,有人將ChatGPT這類的LLM稱之為改變?nèi)祟惖陌l(fā)明,據(jù)瑞銀發(fā)布的一份研究報告顯示,自ChatGPT推出兩個月后,月活躍用戶已達(dá)約1億,成為歷史上增長最快的消費(fèi)應(yīng)用。ChatGPT的功能強(qiáng)大這點(diǎn)毋庸置疑,但GPT模型該如何落地使用,是很多企業(yè)正在遇到的問題。
很多企業(yè)已經(jīng)意識到,AIGC在內(nèi)部辦公、客服、市場的應(yīng)用前景,對內(nèi)提高人效,對外為業(yè)務(wù)賦能,目標(biāo)很明確,但難在最后一步,AIGC如何落地?AIGC能否提供安全、合規(guī)、可控的服務(wù)?
基于這些問題,多么行給出了答案。
多么行推出了無代碼的模型訓(xùn)練平臺,基于向量搜索+LLM 線性問答的模式,構(gòu)建與模型對應(yīng)的知識庫,并通過在線輸入或?qū)胛募确绞綄⒅R添加到其中。平臺會自動對您的知識庫進(jìn)行訓(xùn)練和處理,讓模型基于知識庫中的內(nèi)容去理解和回答問題。這樣就解決了GPT應(yīng)用難、管控難的問題。
為了讓大家更深入地了解構(gòu)建知識庫的原理,以及如何利用知識庫更好地訓(xùn)練模型,我們給大家?guī)砹艘稽c(diǎn)使用小技巧。
先創(chuàng)建應(yīng)用
專屬AI機(jī)器人有知識庫
和應(yīng)用
兩部分組成,應(yīng)用可以被理解為AI機(jī)器人的學(xué)習(xí)能力、表達(dá)能力、表達(dá)風(fēng)格和表達(dá)方式等。

再創(chuàng)建知識庫
知識庫可以被比喻為一個AI的大腦。這個知識庫是一個存儲和整理知識的地方,就像我們的大腦記住了很多知識和經(jīng)驗(yàn),AI的知識庫也存儲了大量的數(shù)據(jù),當(dāng)我們與AI對話時,AI將會結(jié)合您創(chuàng)建的知識庫內(nèi)容進(jìn)行檢索。
打開應(yīng)用界面,并點(diǎn)擊側(cè)欄上方的
知識庫
選項(xiàng)。

在知識庫界面中,點(diǎn)擊右上方的
+
圖標(biāo),以展開操作界面。導(dǎo)入知識庫數(shù)據(jù),系統(tǒng)會自動訓(xùn)練數(shù)據(jù)。當(dāng)下方出現(xiàn)數(shù)據(jù),代表已經(jīng)訓(xùn)練成果了。此時在應(yīng)用中將數(shù)據(jù)庫與應(yīng)用關(guān)聯(lián)了!

請注意,確保導(dǎo)入的知識庫內(nèi)容準(zhǔn)確、完整,并符合您的應(yīng)用需求。建議在導(dǎo)入數(shù)據(jù)前對數(shù)據(jù)進(jìn)行整理,檢查錯別字、語法錯誤、過期信息等。
可以導(dǎo)入的數(shù)據(jù)類型:
點(diǎn)擊
導(dǎo)入
按鈕,提供三種導(dǎo)入方式:手動輸入:可以手動輸入知識庫的內(nèi)容,包括問題和回答。
文本/文件拆分:如果知識庫內(nèi)容已經(jīng)以文本或文件的形式存在,選擇此選項(xiàng)進(jìn)行導(dǎo)入。系統(tǒng)將自動將文本或文件拆分成問題和回答,并展示在下方。
CSV問答對導(dǎo)入:如果已經(jīng)準(zhǔn)備好了CSV格式的問答對數(shù)據(jù),可以選擇此選項(xiàng)進(jìn)行導(dǎo)入。
訓(xùn)練效果調(diào)試:
搜索測試界面:

在搜索測試界面,可以對知識庫進(jìn)行檢索測試。
輸入問題或關(guān)鍵詞后,右側(cè)將顯示檢索結(jié)果。
可以點(diǎn)擊每個知識點(diǎn),直接進(jìn)入編輯界面,對內(nèi)容進(jìn)行修改。
數(shù)據(jù)微調(diào):
如回復(fù)不準(zhǔn)確,可以對數(shù)據(jù)進(jìn)行微調(diào)。點(diǎn)擊數(shù)據(jù)管理界面
。

導(dǎo)入知識庫后,下方將顯示已拆分和訓(xùn)練好的知識點(diǎn)??梢渣c(diǎn)擊每個知識點(diǎn),進(jìn)入編輯界面進(jìn)行修改。
在編輯界面中,可以設(shè)置“匹配的知識點(diǎn)”,這些知識點(diǎn)將用于對話和回復(fù)時的內(nèi)容檢索。同時,還可以在“補(bǔ)充知識”中添加內(nèi)容,這些內(nèi)容不會被檢索,但會作為參考回答時使用。
如果需要導(dǎo)出整個知識庫的內(nèi)容,可以點(diǎn)擊
導(dǎo)出CSV
按鈕,將數(shù)據(jù)庫導(dǎo)出為CSV格式。
如何管理知識庫內(nèi)容:
在基本信息界面,我們可以對每個知識庫進(jìn)行自定義知識庫的頭像、名稱和分類標(biāo)簽。
