最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

量化交易軟件:赫茲量化系統(tǒng)自 GPT 獲取的探索

2023-10-10 14:47 作者:大牛啊呢  | 我要投稿

在 2018 年 6 月,OpenAI 提出了 GPT 神經(jīng)網(wǎng)絡模型,該模型立即在多種語言類測試中展現(xiàn)出極佳結果。 GDP-2 于 2019 年出現(xiàn),而 GPT-3 則于 2020 年 5 月提出。 這些模型展示了神經(jīng)網(wǎng)絡生成相關文本的能力。 尚有其他實驗涉及生成音樂和圖像的能力。 這一模型的主要缺點與它們涉及的計算資源相關。 在配備 8 顆 GPU 的計算機上訓練第一個 GPT 花費了一個月的時間。 為了解決新問題,使用預先訓練的模型,可部分彌補這一缺陷。 但考慮到模型的規(guī)模,需要大量資源來維持模型的運行。


1. 理解 GPT 模型

從概念來講,GPT 模型是在之前研究的變換器基礎上構建的。 主要思路是基于大數(shù)據(jù)針對模型進行無監(jiān)督預訓練,然后再依據(jù)相對少量的標記數(shù)據(jù)進行微調。

分兩步訓練的原因在于模型規(guī)模。 像 GPT 這樣的現(xiàn)代深度機器學習模型涉及大量參數(shù),可多達數(shù)億個。 因此,這種神經(jīng)網(wǎng)絡的訓練需要大量的訓練樣本。 當采用監(jiān)督學習時,創(chuàng)建帶標記的訓練樣本集合是件勞動密集型工作。 與此同時,網(wǎng)站上有許多不同的數(shù)字化和無標記文本,這些文本非常適合模型的無監(jiān)督訓練。 然而,統(tǒng)計數(shù)據(jù)表明,無監(jiān)督學習相較監(jiān)督學習,其結果要差很多。 因此,在無監(jiān)督訓練之后,可依據(jù)相對少量的標記數(shù)據(jù)樣本針對模型進行微調。

無監(jiān)督學習可令 GPT 學習語言類模型,而針對特定任務,可依據(jù)標記數(shù)據(jù)進一步訓練,從而調整模型。 因此,為了執(zhí)行不同的語言類任務,可以復制并微調一個預訓練的模型。 該限制基于采用無監(jiān)督學習的原始語言集合。

實踐表明,這種方法對于廣泛的語言問題能產(chǎn)生良好的效果。 例如,GPT-3 模型能夠針對給定主題生成連貫流暢的文本。 不過,請注意,指定的模型包含 1750 億個參數(shù),按順序依據(jù) 570GB 的數(shù)據(jù)集合上進行了預訓練。

盡管 GPT 模型是為處理自然語言類而開發(fā)的,但它們在音樂和圖像生成任務中也表現(xiàn)出色。

理論上,GPT 模型可與任何數(shù)字化數(shù)據(jù)序列配合使用。 唯一的前置需求是無監(jiān)督的預學習需要足夠的數(shù)據(jù)和資源。

2. GPT 與之前研究的變換器之間的區(qū)別

我們來研究 GPT 模型與之前研究的變換器有何區(qū)別。 首先,GPT 模型未使用編碼器,因為它們僅使用解碼器。 當沒有編碼器時,模型不再擁有“編碼器 - 解碼器自關注”內層。 下圖展示了 GPT 變換器模塊。


與經(jīng)典的變換器相似,GPT 模型中的模塊在彼此之上構建。 每個模塊針對關注機制都有自己的權重矩陣,并具有完全連接的前饋層。 模塊的數(shù)量決定了模型的規(guī)模。 模塊堆??赡軙荦嫶?。 GPT-1 和最小的 GPT-2(小型 GPT-2)有 12 個模塊;GPT-2 特大型有 48 個,而 GPT-3 則有 96 個模塊。

與傳統(tǒng)語言類模型類似,GPT 僅能夠發(fā)現(xiàn)與序列中先前元素的關系,但無法窺視未來。 但它與變換器不同,GPT 不使用元素的掩碼 — 代之,它更改了計算過程。 GPT 會重置 Score 矩陣中后續(xù)元素的關注比率。

同時,GPT 可被歸類為自回歸模型。 每次迭代都會生成一個序列令牌。 生成的令牌會被添加到輸入序列中,并饋入模型進行下一次迭代。

與經(jīng)典變換器一樣,自關注機制內的每個令牌都會生成三個向量:一個 query,一個 key,和一個 value。 在自回歸模型當中,在每次新迭代里,輸入序列僅能由 1 個令牌更改,因此每個令牌無需重新計算向量。 因此,GPT 中的每一層只在序列有新元素時計算向量。 每個變換器模塊都保存其向量,以備后用。

這種方式令模型能夠在接收最終令牌之前逐詞生成文本。

當然,GPT 模型采用多目擊者關注機制。


量化交易軟件:赫茲量化系統(tǒng)自 GPT 獲取的探索的評論 (共 條)

分享到微博請遵守國家法律
南岸区| 怀集县| 开远市| 什邡市| 凤翔县| 巩义市| 罗江县| 南康市| 山西省| 利辛县| 铜山县| 齐齐哈尔市| 冕宁县| 吴江市| 灵璧县| 林芝县| 罗平县| 湘潭县| 共和县| 安龙县| 遂川县| 霍山县| 万源市| 平阴县| 白河县| 竹溪县| 和静县| 望江县| 万州区| 梅州市| 陆河县| 胶州市| 无棣县| 卓资县| 抚州市| 隆尧县| 昭平县| 五华县| 双柏县| 哈巴河县| 广丰县|