大模型時代:ChatGPT拉開硅基文明序幕
鏈接:https://pan.baidu.com/s/1JH75YDOndld0a36_coCzbA?pwd=4wu2?
提取碼:4wu2

本書是2023年不可錯過的AIGC入門讀物,是介紹大語言模型時代ChatGPT的重要資料,由人工智能獨角獸企業(yè)硅基智能核心團隊編纂而成,結合生動的比喻和有趣的案例,從大模型的一個典型場景切入,詳細解讀了AIGC的由來及發(fā)展歷程,探討大模型在圖像視頻生成,短視頻、數(shù)字人制作,語音合成、克隆與變換等方面的應用。書中還涉及了一些經(jīng)典商業(yè)案例的解讀,不是單純的紙上談兵。這樣一本理論與實踐相結合的書,讀起來饒有趣味。
作者簡介
司馬華鵬,80后連續(xù)創(chuàng)業(yè)者,畢業(yè)于南京航空航天大學,復旦青騰未來文創(chuàng)學堂在讀,民革黨員。任南京硅基智能科技有限公司創(chuàng)始人、董事長、CEO,中國青年企業(yè)家協(xié)會會員、南京市雨花臺區(qū)政協(xié)常委、南京市工商聯(lián)執(zhí)委、南京市青年商會常務副會長、雨花臺區(qū)青年商會會長、南京文化協(xié)會副理事長、南京市創(chuàng)新型企業(yè)家、南京市金梧桐年度貢獻人物獎、南京市科技創(chuàng)新先鋒人物、江蘇省2020年度互聯(lián)網(wǎng)十大新銳人物 。于2017年創(chuàng)立硅基智能,公司5年內(nèi)成為國家級專精特新小巨人,獲得騰訊投資、招銀國際、國新央企、海松資本、紅杉資本、奇虎中財?shù)?輪融資,估值超過60億,擁有授權發(fā)明專利80項,注冊商標100多項。
目錄
第1章 AIGC的由來及發(fā)展歷程
1.1 人工智能發(fā)展的歷程 // 003
1.2 什么是AIGC // 009
1.3 AIGC的發(fā)展歷程 // 011
1.4 AIGC涉及的技術 // 012
1.5 AIGC技術的優(yōu)點 // 013
1.6 AIGC技術的應用 // 014
第2章 硅之手——圖像視頻生成
2.1 圖像生成方向 // 020
2.1.1 發(fā)揮創(chuàng)造力 // 021
2.1.2 激發(fā)靈感 // 026
2.1.3 可控創(chuàng)作 // 032
2.1.4 編輯圖像 // 040
2.1.5 微調模型 // 046
2.2 視頻生成方向 // 049
2.2.1 AI換臉 // 049
2.2.2 構建數(shù)字人 // 052
2.2.3 用文本生成視頻 // 053
2.2.4 可控編輯現(xiàn)有視頻 // 054
2.2.5 視頻超分 // 056
2.3 3D模型方向 // 058
2.3.1 文本生成人體模型 // 058
2.3.2 文本生成3D模型 // 060
2.3.3 圖像生成3D模型 // 061
2.3.4 草圖生成3D模型 // 062
2.3.5 文本生成人體動作 // 063
第3章 硅之身——短視頻、數(shù)字人時代
3.1 揭示短視頻走紅的原因 // 068
3.2 探究短視頻的商業(yè)價值 // 070
3.2.1 沉浸式的廣告呈現(xiàn) // 071
3.2.2 靈活隱式的內(nèi)容植入 // 072
3.2.3 爆發(fā)增長的內(nèi)容帶貨 // 072
3.2.4 異軍突起的網(wǎng)紅 // 073
3.2.5 繁榮發(fā)展的短視頻生態(tài) // 074
3.3 內(nèi)容生產(chǎn)者的困境 // 075
3.3.1 需求與供給的矛盾 // 075
3.3.2 門檻阻礙了內(nèi)容生產(chǎn)與創(chuàng)新 // 077
3.4 數(shù)字人產(chǎn)業(yè) // 078
3.4.1 通過數(shù)字人實現(xiàn)AIGC // 079
3.4.2 數(shù)字人助力AIGC,將開拓更大的商業(yè)空間 // 081
3.4.3 AI互動,數(shù)字人24小時直播 // 082
3.4.4 為創(chuàng)作者定制的基于數(shù)字人的AI短視頻生成
平臺 // 082
第4章 硅之腦——大語言模型時代
4.1 自然語言處理技術的歷史沿革 // 088
4.1.1 詞袋模型 // 088
4.1.2 詞嵌入 // 090
4.2 生成式預訓練模型 // 095
4.2.1 什么是生成模型 // 095
4.2.2 什么是預訓練模型 // 096
4.2.3 從ELMo模型到Transformer模型 // 098
4.2.4 后Transformer模型時代 // 105
4.2.5 基于 Transformer 的預訓練語言模型 // 107
4.3 GPT系列比較 // 122
4.3.1 三代GPT對比 // 124
4.3.2 提示詞學習 // 131
4.4 ChatGPT的由來 // 139
4.4.1 從GPT-3到ChatGPT的發(fā)展歷程 // 139
4.4.2 思維鏈提示—引出復雜推理能力 // 141
4.4.3 InstructGPT—與人類對齊,引出ChatGPT // 142
4.4.4 ChatGPT的出現(xiàn) // 147
4.5 注釋 // 147
第5章 硅之聲——語音合成、克隆與變換
5.1 語音合成系統(tǒng)與模型 // 153
5.1.1 聲學模型 // 155
5.1.2 聲碼器 // 158
5.2 語音合成相關技術 // 159
5.2.1 聲音克隆 // 160
5.2.2 聲音變換 // 166
5.3 注釋 // 168
第6章 底層核心技術
6.1 擴散模型 // 173
6.1.1 去噪擴散概率模型 // 175
6.1.2 擴散模型改進 // 184
6.1.3 擴散模型應用 // 200
6.2 生成對抗網(wǎng)絡 // 214
6.2.1 什么是GAN // 215
6.2.2 GAN的發(fā)展及應用 // 217
6.2.3 GAN訓練 // 226
6.3 注釋 // 231
第7章 經(jīng)典商業(yè)案例
7.1 AIGC+影視傳媒:拓展空間,提升質量 // 237
7.1.1 新聞采集 // 238
7.1.2 新聞生成 // 238
7.1.3 視頻編輯 // 238
7.1.4 劇本生成 // 239
7.1.5 擴展影視角色和場景的創(chuàng)作空間 // 240
7.1.6 賦能影視剪輯 // 241
7.2 AIGC+電商:智能化電商,改變購物模式 // 242
7.2.1 商品3D建模 // 243
7.2.2 天貓家裝城3D版 // 244
7.2.3 鹿班 // 245
7.2.4 虛擬主播 // 245
7.3 AIGC+教育:賦能教育,引領教育變革 // 246
7.3.1 個性化學習 // 246
7.3.2 智能化評估 // 247
7.3.3 教學輔助工具 // 247
7.4 AIGC+醫(yī)療:智能醫(yī)療,診療新勢 // 248
7.4.1 疾病診斷和治療 // 249
7.4.2 藥物研發(fā) // 249
7.4.3 精準醫(yī)療 // 250
7.5 AIGC+金融:大數(shù)據(jù)與人工智能革新 // 251
7.5.1 風險評估 // 252
7.5.2 投資組合管理 // 253
7.5.3 反欺詐 // 253
7.5.4 市場預測 // 254
7.6 AIGC+農(nóng)業(yè):革新農(nóng)業(yè),未來可期 // 255
7.6.1 農(nóng)作物種植和管理 // 255
7.6.2 農(nóng)業(yè)物流和供應鏈管理 // 256
7.6.3 農(nóng)業(yè)機器人和自動化 // 256
7.7 OpenAI // 257
7.7.1 概述 // 257
7.7.2 技術與研究 // 258
7.7.3 商業(yè)應用 // 262
7.7.4 OpenAI的影響 // 263
7.8 注釋 // 264
第8章 AIGC的風險與展望
8.1 AIGC的風險與不足 // 268
8.1.1 關鍵技術仍然不夠成熟 // 268
8.1.2 監(jiān)管難度加大 // 269
8.1.3 AIGC的其他負面影響 // 270
8.2 對AIGC的展望 // 271
8.2.1 AI技術的持續(xù)發(fā)展 // 271
8.2.2 AIGC產(chǎn)品的不斷豐富 // 272
8.2.3 AIGC生態(tài)的逐步完善 // 273
查看全部↓
前言/序言
前言
我們站在一個美麗新世界的入口。這是一個令人興奮的,同時充滿了不確定性的世界,而你們是先行者。
—霍金
每一次技術革新帶來的沖擊都是令人震撼的。還記得上一次人工智能讓人們驚嘆的時刻,是AlphaGo(谷歌的人工智能程序)出現(xiàn)的時候。之后,人們堅信人工智能一定會爆發(fā)。但究竟會在哪一天爆發(fā),以怎樣的形式爆發(fā),人們無法預測。隨著時間的流逝,人們對人工智能爆發(fā)的預期已經(jīng)逐漸淡漠了。時光荏苒,轉機出現(xiàn)在2022年。Stable Diffusion 模型與ChatGPT的橫空出世,猶如驚雷炸響在人工智能領域。
2022年8月,英國開源人工智能公司(Stability AI)發(fā)布了 Stable Diffusion 模型。該模型可以根據(jù)用戶輸入的文字描述自動生成圖像,生成的效果可達到專業(yè)畫師水平。AI 繪畫領域的“戰(zhàn)爭”一觸即發(fā)。
2022年11月, 美國人工智能研究實驗室(OpenAI)推出了其最新作品—ChatGPT。它是一款AI驅動的自然語言處理工具,能夠通過學習和理解人類的語言與人進行對話,還能根據(jù)聊天的上下文與人進行互動,像人類一樣聊天交流,甚至能完成撰寫郵件、視頻腳本、文案、代碼等任務。ChatGPT的出現(xiàn)為AIGC這股熱潮又添了一把新柴。