元象通用大模型XVERSE-13B發(fā)布Chat版本
元象多語(yǔ)言通用大模型?XVERSE-13B 自 8 月 7 日開源以來(lái)廣受關(guān)注,為促進(jìn)大模型在垂直領(lǐng)域和特定任務(wù)的應(yīng)用,方便開發(fā)者快速高效地定制化調(diào)優(yōu),元象宣布推出 XVERSE-13B-Chat 版,繼續(xù)開源,并可免費(fèi)商用。
開源信息
Github:https://github.com/xverse-ai/XVERSE-13B
Hugging Face:https://huggingface.co/xverse/XVERSE-13B-Chat
聯(lián)系郵箱:opensource@xverse.cn
XVERSE-13B 是同尺寸中效果最好的多語(yǔ)言大模型系列,性能超越 Llama-2-13B、Baichuan-13B-Chat 等國(guó)內(nèi)外開源代表(圖一),憑借高性能、全開源、可商用等優(yōu)勢(shì),是國(guó)產(chǎn)替代和中文應(yīng)用的更佳選擇。

此次 Chat 版通過底座指令精調(diào)(Supervised Fine-tuning,簡(jiǎn)稱 SFT ),使大模型在語(yǔ)言理解和生成上更加精準(zhǔn)流暢,基礎(chǔ)性能顯著提升,比如 MMLU英文(+9%)、 AGIEval 中英(+17%)、GAOKAO-En 英文(+21%)等數(shù)據(jù)集效果優(yōu)異。它還補(bǔ)齊了多個(gè)指令場(chǎng)景能力,用途更廣,包括角色扮演、知識(shí)問答、文本生成、編程、數(shù)學(xué)解答和安全性等。
多場(chǎng)景示例
角色扮演

知識(shí)問答

文本生成

語(yǔ)言理解

安全性

環(huán)境安裝
1. 下載本倉(cāng)庫(kù):
git clone https://github.com/xverse-ai/XVERSE-13B cd XVERSE-13B
2. 使用 pip 安裝依賴:
pip install -r requirements.txt
Transformers 加載方式
可通過以下代碼加載 Chat 版對(duì)話:
>>>import torch
通過以下代碼啟動(dòng)一個(gè)web server,在瀏覽器輸入訪問地址后,可使用 Chat 版對(duì)話:
python chat_demo.py --port='port' --model_path='/path/to/model/' --tokenizer_path='/path/to/tokenizer/'
模型量化
支持 INT8 和 INT4 類型量化,可以大幅降低模型加載所需顯存。
INT8 量化:
model = AutoModelForCausalLM.from_pretrained("xverse/XVERSE-13B-Chat", torch_dtype=torch.bfloat16, trust_remote_code=True)
model = model.quantize(8).cuda()
INT4 量化:
model = AutoModelForCausalLM.from_pretrained("xverse/XVERSE-13B-Chat", torch_dtype=torch.bfloat16, trust_remote_code=True)
model = model.quantize(4).cuda()
Chat 版在不同量化等級(jí)下,模型顯存占用及 MMLU 準(zhǔn)確率:

加入元象大模型團(tuán)隊(duì)
簡(jiǎn)歷發(fā)送至:join@xverse.cn
商業(yè)合作
請(qǐng)微信添加:muyixuanlin
媒體溝通
請(qǐng)聯(lián)系:萬(wàn)琳 linwan@xverse.cn
關(guān)于我們
元象 XVERSE 于 2021 年初在深圳成立,是國(guó)內(nèi)領(lǐng)先的 AI 與 3D 技術(shù)服務(wù)公司,致力于打造 AI 驅(qū)動(dòng)的 3D 內(nèi)容生產(chǎn)與消費(fèi)一站式平臺(tái),愿景為“定義你的世界”。
元象累計(jì)融資金額超過 1.6 億美元,投資機(jī)構(gòu)包括騰訊、高榕資本、五源資本、高瓴創(chuàng)投、紅杉中國(guó)、淡馬錫和CPE源峰等。元象創(chuàng)始人姚星是前騰訊副總裁和騰訊 AI Lab 創(chuàng)始人、國(guó)家科技部新一代人工智能戰(zhàn)略咨詢委員會(huì)成員。
在 3D 與 AI 技術(shù)領(lǐng)域,元象擁有深厚積累與完整布局(見下圖),已自主研發(fā)出行業(yè)引領(lǐng)性的“端云協(xié)同” 3D 互動(dòng)技術(shù),開創(chuàng)零門檻(輕)、一站式(快)、高品質(zhì)(美)全新 3D 體驗(yàn);還開源百億參數(shù)多語(yǔ)言通用大模型,為同尺寸效果最佳,并可免費(fèi)商用,旨在推動(dòng)大模型國(guó)產(chǎn)可替代與行業(yè)應(yīng)用發(fā)展。文本語(yǔ)音?圖片3D場(chǎng)3D人3D物大模型空間音頻文生圖大世界視頻動(dòng)捕物體生成歌聲合成圖生圖路網(wǎng)AI編舞NeRF手勢(shì)生成。
元象已為多家龍頭企業(yè)提供一站式技術(shù)服務(wù),包括:澳門大三巴、南京大報(bào)恩寺、騰訊音樂、央視、一汽大眾、阿迪達(dá)斯、郵儲(chǔ)銀行等。官網(wǎng):http://www.XVERSE.cn
官微:元象 XVERSE