AIGC應(yīng)用實(shí)踐 GPT 生成 PPT(一) : 簡介與技術(shù)選型
?AIGC應(yīng)用簡介
> "AIGC"通常指的是由人工智能(AI)系統(tǒng)自動生成內(nèi)容,如文本、圖像、音頻等。這是使用深度學(xué)習(xí)和自然語言處理等技術(shù)的一種應(yīng)用。(~~這段也是ai生成的哦!~~ )筆者在今年的AIGC應(yīng)用開發(fā)也耕耘了一段時間了,對于大多數(shù)人而言也只能算先跑半步
?我的項(xiàng)目
點(diǎn)擊前往 [GitHub](https://github.com/limaoyi1/Auto-PPT) 支持我就給我點(diǎn)個星星吧
試用網(wǎng)址 [點(diǎn)擊試用](http://www.limaoyi.top:4399/#)
?技術(shù)選型
*磨刀不誤砍柴工,讓我們準(zhǔn)備好了再出發(fā)往往比直接做更有效率*
?LLM 使用方式
> 一般來說我們有兩種方式來使用LLM來生成內(nèi)容
> - 調(diào)用官方大模型的接口
> - 本地化部署模型生成文本內(nèi)容
> 考慮到學(xué)習(xí)成本和服務(wù)器成本,我們一版會選取調(diào)用官方大模型的接口. 因?yàn)?/p>
> - 第一: LLM大模型運(yùn)行的機(jī)器成本高,并發(fā)能力差
> - 第二: 學(xué)習(xí)成本高,你需要學(xué)習(xí)機(jī)器學(xué)習(xí),深度學(xué)習(xí),TensorFlow,PyTorch...對一個想要做AIGC應(yīng)用的程序員來說,學(xué)習(xí)成本和機(jī)器成本是難以接受的(~~這條路雖然難以走下去,但是一定是需要人走下去的~~ )
LLM 的選取
一般來說,我們會選取OPENAI的GPT-3.5接口來作為我們aigc的基石. 如果需要考慮到數(shù)據(jù)安全,我建議使用百度的千帆大模型作為應(yīng)用的基礎(chǔ)(百度的千帆大模型是布局最早,開發(fā)接口較為豐富的國產(chǎn)廠商).
查看OPENAI的[接口文檔](https://platform.openai.com/docs/introduction)和多次實(shí)踐:?
?**gpt-3.5-turbo**在價格上有很大的優(yōu)勢和優(yōu)秀的性能
?**gpt-3.5-turbo-16k** 在長文和記憶方面有強(qiáng)大的性能,但是相比于gpt-3.5-turbo蠢一點(diǎn)(~~長期實(shí)踐~~ )
**gpt-4** 有極為優(yōu)勢的性能和更快的響應(yīng),唯一的缺點(diǎn)是相對20倍的價格.
因?yàn)槲倚枰獙ι舷挛倪M(jìn)行緩存,并且輸出文檔,考慮到成本我選取的是**gpt-3.5-turbo-16k**
服務(wù)器選擇
有兩種方案
因?yàn)槲倚枰L問OPENAI的接口,所以我需要能夠直接訪問openai官網(wǎng)的服務(wù)器.
1. 使用國內(nèi)服務(wù)器+科學(xué)上網(wǎng)的方式進(jìn)行訪問,缺點(diǎn)是不穩(wěn)定
2. 使用國外服務(wù)器進(jìn)行部署.(**注意國內(nèi)的云服務(wù)廠商是的國外服務(wù)器是不能直接訪問OPENAI的接口的**)
開發(fā)者電腦使用科學(xué)上網(wǎng)即可
語言選擇
只推薦python. 至少AIGC的核心模塊使用Python. AIGC的各個語言生態(tài)圈中.只有PYTHON 最豐富,最齊全. 畢竟大部分的科學(xué)家的工作語言都是PYTHON,自然而然,大部分ai相關(guān)包也是用PYTHON寫的.并且難以替代.
?常用框架
**Langchain** 使用Langchain 作為aigc流程的載體,極大的簡化了開發(fā)人員和各個組件的交互.Langchain封裝了海量的平臺和組件,能夠輕而易舉的打通各個環(huán)節(jié).我個人認(rèn)為是今年最牛X的開源項(xiàng)目之一
**Flask** 常用的后端輕量化服務(wù)框架,開箱即用型的服務(wù)框架.非常簡單易用. PYTHON后端對于一個JAVA工程師來說過于沒有吸引力,所以我這里使用最簡單的服務(wù)框架Flask.
?Feature
>1. 我會持續(xù)將之前的項(xiàng)目經(jīng)驗(yàn)和心得整理成文檔.做成一個專欄
>2. 對我自己的開源項(xiàng)目進(jìn)行持續(xù)的更新,再次總結(jié)為文檔