小Dream哥 ChatGPT原理與實戰(zhàn)
ChatGPT簡介
ChatGPT技術路徑介紹
GPT系列模型與GPT1模型和論文詳解
GPT2模型與論文講解
GPT3模型及論文講解
GPT模型整體結構和模型輸入
自注意力機制介紹
Masked-self-attention
multi-head-self-attention和FFN
GPT模型參數量計算邏輯詳解
分布式訓練簡介與數據并行原理詳解
模型并行中的Embedding層并行原理及代碼詳解
張量并行-矩陣乘法并行原理及代碼講解
分布式計算原理講解張量并行之交叉熵層并行原理及代碼講解
OFFLOAD和ZERO理論講解
模型并行之流水線并行和顯存占用分析
Zero論文講解
prompt-learning詳解
有監(jiān)督微調詳解
lora-fine實戰(zhàn)之lora理論詳解
lora-finetune-chatglm代碼詳解
chatGLM-lora訓練過程演示
chatGLM-算數能力推理效果演示
大模型應用概述
思維鏈概念詳解
大模型應用框架介紹
標簽: