散文網(wǎng) » 科技 »學(xué)習(xí) » [懶人包]AI對(duì)話懶人包發(fā)布解壓即用(text-generation-webui)可加載chatglm/rwkv/vicu

[懶人包]AI對(duì)話懶人包發(fā)布解壓即用(text-generation-webui)可加載chatglm/rwkv/vicu

2023-05-06 00:10 作者:coyude 0人讀過 | 我要投稿

1.前言

5月18日更新:V1版正式發(fā)布，啟動(dòng)程序改成圖形化界面了，v1版視頻教程請(qǐng)看我最新視頻?[AI對(duì)話]懶人包v1發(fā)布圖形化啟動(dòng)界面(oobabooga/text-generation-webui)可用chatglm/rwkv/vicuna

前天做了個(gè)text-generation-webui的懶人包，為了節(jié)省空間，并沒有內(nèi)置任何模型。

因?yàn)槭?span style="text-decoration: line-through;">第一次做這種懶人包，所以我也不確定懶人包的穩(wěn)定性。因此如果成功運(yùn)行了或運(yùn)行失敗請(qǐng)?jiān)谠u(píng)論區(qū)反饋一下，感激不盡！

如果看不懂圖文教程，在網(wǎng)盤里有視頻教程，可以查閱。

本地跑模型最少也要6G顯存左右(7b量化模型)，如果顯存不夠，可以查閱文章最后部分的pre_layer選項(xiàng)，即讓一部分運(yùn)算交給顯卡，一部分運(yùn)算交給CPU。

如果你顯存不足6G，或者是A卡/者核顯用戶可以使用llama.cpp，text-generation-webui內(nèi)置了llama.cpp，只需要下載對(duì)應(yīng)的ggml格式模型即可使用cpu推理。

至于怎么加載ggml模型，這里有個(gè)教程視頻

沒有N卡怎么進(jìn)行AI對(duì)話?(加載ggml模型/llama.cpp)使用text-generation-webui

2.下載鏈接

網(wǎng)盤我附帶了一些量化模型，如果hugging face下載的速度過慢，可以從網(wǎng)盤下載解壓。

夸克網(wǎng)盤鏈接：

我用夸克網(wǎng)盤分享了「[懶人包@coyude]text-generation-webui」，點(diǎn)擊鏈接即可保存。打開「夸克APP」，無(wú)需下載在線播放視頻，暢享原畫5倍速，支持電視投屏。
鏈接：https://pan.quark.cn/s/27ec3cde648a

百度網(wǎng)盤鏈接：

鏈接：https://pan.baidu.com/s/1AXwX7U2RAdV10H8YEitBwA?pwd=1e2r?
提取碼：1e2r

3.啟動(dòng)器界面展示(丑

4.可能出現(xiàn)的錯(cuò)誤

①下載模型的時(shí)候，給的用戶名+倉(cāng)庫(kù)名不對(duì)，導(dǎo)致無(wú)法下載。

例如我輸入114514(，會(huì)提示requests.exceptions.HTTPError: 401 Client Error: Unauthorized for url: 錯(cuò)誤，這是請(qǐng)?jiān)贖ugging face上復(fù)制正確的用戶名+倉(cāng)庫(kù)名

②加載模型的時(shí)候爆顯存

例如出現(xiàn)“CUDA out of memory.”

選擇加載量化模型或加載更小參數(shù)的模型。比如加載的是原版13B模型，那就嘗試加載13B 4bit模型，或者7B模型

還有一種方法，如果你加載的是GPTQ量化模型的話，請(qǐng)調(diào)GPTQ parameters參數(shù)的pre_layer參數(shù)

這個(gè)70的意思是，有70%的運(yùn)算是在你顯卡進(jìn)行運(yùn)行，剩下30%的運(yùn)算在你的CPU上。

或者....你可以使用CPU推理，但是速度很慢。也可以使用下載ggml模型進(jìn)行cpu推理。

當(dāng)然，最有用的方法是花錢升級(jí)顯卡(

大致教程已經(jīng)結(jié)束，目前懶人包還算是出于測(cè)試階段，有問題請(qǐng)及時(shí)反饋，非常感謝！

③如果你加載的是vicuna等llama衍生模型，最好使用英文對(duì)話，因?yàn)檫@些模型的中文能力并不強(qiáng)。

④chat模式使用時(shí)最好在下方gallery選擇example的角色卡進(jìn)行對(duì)話。當(dāng)然如果你要玩角色扮演的話，肯定要自己去捏角色的。

這篇專欄的第三步介紹了一個(gè)捏角色網(wǎng)站，可以查看[AI對(duì)話]使用KoboldAI和tavernai進(jìn)行無(wú)限制對(duì)話(數(shù)據(jù)私有化/可以NSFW)

⑤如果要拿來(lái)玩角色扮演，最好使用agn-ai或tavernai來(lái)調(diào)用tgwebui的api（啟動(dòng)tgwebui的時(shí)候選擇模式2或4，或者自定義啟動(dòng)參數(shù)的時(shí)候加上--api）

如何部署agn-ai和tavernai？我這里也有兩篇專欄

agn-ai:[Agn-AI]用Agn-AI與AI老婆對(duì)話(調(diào)用openai/claude/text-generation-webui/kob

tavernai:[AI對(duì)話]使用KoboldAI和tavernai進(jìn)行無(wú)限制對(duì)話(數(shù)據(jù)私有化/可以NSFW)

5.更新日志

懶人包V1.3.2++版本更新[6.6]：

1.給SillyTavern補(bǔ)上角色卡。

2.添加“打開懶人包環(huán)境.bat”文件，方便在啟動(dòng)器無(wú)法啟動(dòng)懶人包環(huán)境的用戶激活懶人包環(huán)境

啟動(dòng)器V1.6版本更新[6.6]:?

1.修改啟動(dòng)參數(shù)關(guān)于GPTQ參數(shù)和Bitsandbytes參數(shù)設(shè)置

2.更新管理處新增“打開環(huán)境”按鈕，方便用戶對(duì)懶人包環(huán)境進(jìn)行修改。

懶人包V1.3.2版本更新[6.3]：

1.更新text-generation-webui和環(huán)境依賴。 2.給懶人包安裝上AutoGPTQ。一種新的加載GPTQ量化模型方式(以前的方法是GPTQ-for-LLaMa)。經(jīng)過測(cè)試使用AutoGPTQ加載模型比GPTQ-for-LLaMa加載的文本生成速度要快。目前不清楚使用AutoGPTQ加載模型能不能解決帕斯卡架構(gòu)顯卡使用GPTQ-for-LLaMa加載模型出現(xiàn)亂碼(胡言亂語(yǔ))的問題？??有興趣的可以嘗試一下。?

啟動(dòng)器V1.5版本更新[6.3]:?

1.啟動(dòng)參數(shù)中新增啟用AutoGPTQ選項(xiàng) 2.激活conda環(huán)境改為cd conda+call .\\Scripts\\activate.bat

懶人包V1.3.0更新[6.1]：?

1.將內(nèi)置的TavernAI替換成SillyTavern。另外為了保證可移植性，在首次使用SillyTavern或Agn-ai前都必須先點(diǎn)擊更新按鈕(安裝依賴)，方能運(yùn)行使用。?

PS：為了方便各位調(diào)用openai的api(gpt模型)，我依舊將SillyTavern TavernAI和Agn-AI的openai的api服務(wù)器都自動(dòng)修改成我用vercel搭建的反代理服務(wù)器 (點(diǎn)擊更新按鈕即可觸發(fā))?

2.懶人包中GPTQ環(huán)境重新配置，使用了tgwebui的readme上建議的 precompiled wheels(GPTQ-for-LLaMa-Wheels)?

啟動(dòng)器V1.4更新[6.1]：?

?1.將內(nèi)置的TavernAI替換成SillyTavern。 2.刪除QtCore.QCoreApplication.setAttribute(QtCore.Qt.AA_EnableHighDpiScaling) 因?yàn)樵谀承└逥PI屏幕下窗口過大。

懶人包V1.2.0更新[5.28]：

1.內(nèi)置了TavernAI和Agn-AI，均存放在tools文件夾中

PS：為了方便各位調(diào)用openai的api(gpt模型)，我將TavernAI和Agn-AI的openai的api服務(wù)器都設(shè)置成我用vercel搭建的反代理服務(wù)器

2.懶人包環(huán)境改conda環(huán)境

1.重新編輯功能合集頁(yè)面，新增TavernAI和Agn-AI的對(duì)應(yīng)功能選擇以及有用網(wǎng)站。

2.添加QtCore.QCoreApplication.setAttribute(QtCore.Qt.AA_EnableHighDpiScaling)

解決在高分辨率+高縮放比下的排版錯(cuò)誤問題（應(yīng)該）

舊版啟動(dòng)程序在4K屏幕下字體顯示不全(尤其是API那個(gè)選項(xiàng)）

新版啟動(dòng)程序在4K屏幕下字體顯示完整

懶人包V1.0.8更新[5.21]：

將bitsandbytes中的libbitsandbytes_cuda116.dll更改為libbitsandbytes_cuda117.dll
tgwebui內(nèi)置了幾張tavernai上推薦的角色卡(主要都是碧藍(lán)檔案)以及自己寫的一張貓貓卡(neko)

啟動(dòng)器V1.1更新[5.21]：

啟動(dòng)參數(shù)新增兩個(gè)選項(xiàng)：①是自動(dòng)分配 ②是讓用戶選擇啟動(dòng)環(huán)境，可以選擇懶人包環(huán)境/本機(jī)環(huán)境/Conda環(huán)境。這樣即使用戶不使用懶人版環(huán)境，也可以使用這個(gè)啟動(dòng)器來(lái)調(diào)用自己的python環(huán)境或conda環(huán)境（用tgwebui的一鍵安裝腳本安裝的conda環(huán)境）來(lái)啟動(dòng)。增強(qiáng)啟動(dòng)程序的泛用性(bushi

③將自定義參數(shù)修改為追加參數(shù)，設(shè)置該選項(xiàng)不再導(dǎo)致當(dāng)前設(shè)置頁(yè)面的所有設(shè)置失效。

????

2.更新管理處新增兩個(gè)選項(xiàng)：①更新依賴，即進(jìn)行pip install -r requirements.txt操作 ②版本回退，用于版本更新后遇到兼容問題時(shí)，進(jìn)行版本回退(每次只回退上一個(gè)版本)??

3.新增功能合集頁(yè)面，點(diǎn)擊即可打開對(duì)應(yīng)網(wǎng)頁(yè)，不過目前還沒有想好加什么(?

標(biāo)簽：

[懶人包]AI對(duì)話懶人包發(fā)布解壓即用(text-generation-webui)可加載chatglm/rwkv/vicu的評(píng)論 (共條)

愛情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩(shī)歌空間日志經(jīng)典語(yǔ)句愛情句子作文大全

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

[懶人包]AI對(duì)話懶人包發(fā)布解壓即用(text-generation-webui)可加載chatglm/rwkv/vicu

[懶人包]AI對(duì)話懶人包發(fā)布解壓即用(text-generation-webui)可加載chatglm/rwkv/vicu的評(píng)論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

[懶人包]AI對(duì)話懶人包發(fā)布 解壓即用(text-generation-webui)可加載chatglm/rwkv/vicu

本文作者的其他文章

[懶人包]AI對(duì)話懶人包發(fā)布 解壓即用(text-generation-webui)可加載chatglm/rwkv/vicu的評(píng)論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

[懶人包]AI對(duì)話懶人包發(fā)布解壓即用(text-generation-webui)可加載chatglm/rwkv/vicu

[懶人包]AI對(duì)話懶人包發(fā)布解壓即用(text-generation-webui)可加載chatglm/rwkv/vicu的評(píng)論 (共條)