最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

百度文心:一個符合預(yù)期的起點

2023-03-21 10:37 作者:BFT白芙堂機器人  | 我要投稿

原創(chuàng) | 文BFT機器人


核心觀點


3 月 16 日,百度正式發(fā)布了文心一言,能夠與人對話互動,回答問題,協(xié)助創(chuàng)作。

  • 一些 NLP 人機對話中基礎(chǔ)的問答、總結(jié)、推理、創(chuàng)作能力基本具備;?


  • 部分特定場景的中文理解可能超過了 GPT;


  • 具備了初步的數(shù)理邏輯能力;


  • 有特色的多模態(tài)生成能力,某幾個功能點很實用。


但同時,相比 GPT4 功能文心一言仍有較大差距,目前水平約在 GPT3 左右。


發(fā)布會中有部分體現(xiàn)大模型強大指出的核心功能尚未充分展示。包括多輪對話、代碼能力、長文本理解等 GPT-4 具有的能力,文心一言未進(jìn)行展示。同時目前文心一言仍未全面公測,企業(yè)和個人用戶可以在官網(wǎng)申請邀請后試用。


整體來看,文心一言展示出的水平符合我們預(yù)期。


即從參數(shù)量、迭代路徑看,國內(nèi) NLP大模型水平介于 BERT 和 GPT-3 之間,與海外差距在 2-3 年。2021 年 GPT-3 推出時,代碼、長文本、語境等能力也較弱。在此后 1 年中,OPEN AI 快速迭代增加了 codex、RLHF 等嘗試,并繼續(xù)優(yōu)化了 PPO,在 2022 年推出 instructGPT,其后能力才出現(xiàn)較大提升。本文認(rèn)為百度文心已經(jīng)初步具備 LLM 底座,期待后續(xù)迭代。


技術(shù)上,本文分析了百度 NLP 大模型 ERNIE 1.0-3.0 迭代。優(yōu)勢總結(jié)如下:

  • ERNIE 1.0到 3.0 完整迭代,截至 3.0 已是相對可用狀態(tài),3.0 模型結(jié)構(gòu)便于下游二次開發(fā)部署;

  • 強大的百度內(nèi)部特色中文語料庫;

  • 基于 BERT 結(jié)構(gòu)基礎(chǔ)加上了知識圖譜等特色功能,在部分規(guī)則訓(xùn)練場景有更好可控性;

  • 國內(nèi)領(lǐng)先的開源 AI 訓(xùn)練框架,較強的算力基礎(chǔ)設(shè)施。


但同時,我們也看到現(xiàn)階段 ERNIE 底座的一些不足:


  • 模型結(jié)構(gòu)仍然基于 BERT,但目前海外巨頭主流結(jié)構(gòu)轉(zhuǎn)變?yōu)?GPT 為代表的 decoder-only,未來百度是否會在模型結(jié)構(gòu)上繼續(xù)迭代?

  • 根據(jù) 3 月 16 日百度文心一言發(fā)布會,目前百度在 Prompt 和 RLHF 已經(jīng)掌握方法論,但實際訓(xùn)練量仍然有待提升;

  • 百度都使用了有特色是知識圖譜訓(xùn)練,這一方式可以有效降低訓(xùn)練模型所需要消耗的算力。但當(dāng)大語言模型達(dá)到千億或者更高參數(shù)級別時,似乎自然具備了知識圖譜訓(xùn)練下的能力。

  • ERNIE 使用了百度內(nèi)部特色中文數(shù)據(jù),提升模型中文能力。但是百度體系內(nèi)高質(zhì)量語料庫相比龐大的英文互聯(lián)網(wǎng)語料庫仍然不足。


計算機行業(yè):建議重點關(guān)注跨模態(tài)應(yīng)用,包括多模態(tài)應(yīng)用


  • 文生圖:虹軟科技(基于stable diffusion 的多種 2B 圖像應(yīng)用)、新國都、中科創(chuàng)達(dá)(移動端文生圖工具部署);

  • 機器人:三花智控等;

  • 其他應(yīng)用:潤達(dá)醫(yī)療(申萬醫(yī)藥、醫(yī)療診斷 AI)、福昕軟件、萬興科技;視頻、圖像、文本素材:大華股份(工業(yè)場景視頻素材和標(biāo)注),AI 領(lǐng)軍、當(dāng)虹科技;視覺和跨模態(tài)算法:商湯(港股)、云從科技、科大訊飛。


百度“文心”大模型:純 NLP 能力國內(nèi)領(lǐng)先,跨模態(tài)也有較多布局。


應(yīng)用場景涵蓋:NLP 大模型、CV?大模型、跨模態(tài)大模型、生物計算大模型、行業(yè)大模型。API 包括了:

  • ERNIE3.0 文本理解與創(chuàng)作:預(yù)置作文生成、文案創(chuàng)作、情感分析等任務(wù)提示;

  • ERNIE-ViLGAI 作畫大模型;

  • PLATO 大模型開放域?qū)υ挿?wù)。


圖 1 百度文心大模型和多行業(yè)工具平臺



01


從 NLP 基礎(chǔ)底座 ERNIE 看文心一言核心能力NLP 是百度能力核心,也是本次文心一言的基礎(chǔ)。目前百度已有多個針對不同任務(wù)的優(yōu)化預(yù)訓(xùn)練模型:

  • ERNIE 3.0:具備語言理解能力以及寫小說、歌詞、詩歌、對聯(lián)等文學(xué)創(chuàng)作能力;

  • ERNIE 3.0 Zeus:基于知識增強的千億模型;

  • 鵬城-百度·文心:參數(shù)規(guī)模達(dá)到 2600 億的知識增強大模型;

  • ERNIE 3.0-Tiny:首個基于多任務(wù)知識注入的下游無關(guān)蒸餾模型。


圖 2 百度 NLP 預(yù)訓(xùn)練大模型底座


此外,百度 NLP 大模型有大量下游應(yīng)用。


包括醫(yī)療、金融、跨語言、代碼、搜索等領(lǐng)域都有布局。百度 NLP 核心能力是 ERNIE 大模型,類似 GPT 之于 open AI。


特點是基于知識圖譜強化,基于中文訓(xùn)練。另外需要關(guān)注百度在模型結(jié)構(gòu)上的選擇、和對于是否人類反饋(prompt 和 RLHF)的選擇,以及百度使用的中文語料庫高質(zhì)量數(shù)據(jù)是否足夠。


NLP大模型 ERNIE 2019年開始多輪迭代,起點是 2019年的1.0,受到google BERT的較大啟發(fā)。ERNIE 1.0 1 在 2019 年 4 月推出,模型結(jié)構(gòu)基于 BERT 模型的進(jìn)一步優(yōu)化,在中文的 NLP 任務(wù)上得到了當(dāng)時較好的結(jié)果。


ERNIE1.0 選擇的模型結(jié)構(gòu)是類似 BERT 的 encoder-only。ERNIE 1.0 類似 BERT,使用了多層編碼器結(jié)構(gòu)的 transformer,模型大小也與 BERT 相同,12 個編碼器層,768個隱單元,12 個注意力頭(12 encoder layers, 768 hidden units and 12 attention heads)。


圖 3 ERNIE 1.0 使用了 encoder-only 的結(jié)構(gòu),和 BERT 類似


但這一結(jié)構(gòu)區(qū)別于GPT,且目前 google 也開始從 encoder-only 過渡到encoder-decoder 再到 decoder-only,所以后續(xù)百度是否仍然沿用這一模型結(jié)構(gòu)迭代,值得關(guān)注。


  • 此前在 2018-2021 年,谷歌路線為 encoder-only ( 只 有 編 碼 器 )或encoder-decoder(編碼解碼器),而同一時期,Open AI一直基于 decoder-only(只有解碼器)路線迭代自己的 AGI 生成式大模型。

  • 直到 2021 年 10 月,Google 推出 FLAN(1370 億參數(shù)),并從此開始重新轉(zhuǎn)向只有 decoder-only 模型,還提出了 ChatGPT 用到的 Instruction Tuning 概念。2023 年Google 的最新跨模態(tài)大模型 palm-e 在 NLP 部分也使用了 decoder-only 結(jié)構(gòu)。

  • 即中間有約 20 個月時間,Google 并未使用 decoder-only 結(jié)構(gòu),部分 AI 學(xué)者認(rèn)為這是 Google 在 AGI 產(chǎn)品上暫時落后于 Open AI 的原因之一。區(qū)別于 BERT 的特在在于“先驗知識”和“異構(gòu)數(shù)據(jù)整合”。


特點一:ERNIE 1.0 區(qū)別于 BERT,在 mask 上采取不同做法,特點是“先驗知識”的學(xué)習(xí)。


在絕大多數(shù)的研究中,僅僅通過上下文來預(yù)測丟失的單詞并對其進(jìn)行建模。這些模型沒有考慮句子中的先驗知識。如下圖案例,在句子“哈利·波特是由羅琳(J. K. Rowling)創(chuàng)作的一系列幻想小說”中。哈利·波特(Harry Potter)是小說的名字,而羅琳(J. K.Rowling)是作家。


BERT 可以通過實體內(nèi)部的單詞搭配來預(yù)測實體 Harry Potter 的缺失單詞,而無需借助較長的上下文。


ERNIE 則假設(shè)如果模型學(xué)習(xí)更多有關(guān)先驗知識的信息,則該模型可以獲得更可靠的語言表示。ERNIE 不是直接添加知識嵌入(knowledge embedding),而是隱式地學(xué)習(xí)有關(guān)知識和較長語義依賴性的信息,例如實體之間的關(guān)系,實體的屬性和事件的類型,以指導(dǎo)單詞嵌入學(xué)習(xí)。


圖 4 ERNIE1.0 和 BERT 在 mask時選取了不同方式


特點二:采用百度內(nèi)部的異構(gòu)語料庫進(jìn)行預(yù)訓(xùn)練。


收集百度貼吧、百度新聞、百度百科的混合語料,其中百度百科包含以正式語言撰寫的文章,是模型訓(xùn)練的強大基礎(chǔ);百度新聞提供了最新的電影名、演員名、球隊名等;百度貼吧中的每個帖子可以看作是對話,被用于 DLM 任務(wù)。


ERNIE 1.0 做到在多項中文任務(wù)上優(yōu)于 BERT。且通過消融研究(Ablation Studies)證實,知識整合和對異構(gòu)數(shù)據(jù)的預(yù)訓(xùn)練都能使模型獲得更好的語言表示。


圖 5 Results on 5 major Chinese NLP tasks


繼續(xù)迭代,目前版本 ERNIE 3.0 已在中文任務(wù)上取得較好效果。


2019 年 7 月百度推出 ERNIE 2.0 4 ,該框架通過不斷的多任務(wù)學(xué)習(xí)來逐步構(gòu)建和學(xué)習(xí)預(yù)訓(xùn)練任務(wù),最大限度地從訓(xùn)練語料庫中提取詞匯、句法和語義信息。2021 年 7 最新大版本是 ERNIE 3.0 5 。


特點一:模型結(jié)構(gòu)多層框架


ERNIE 3.0 在模型結(jié)構(gòu)上的思路渭:NLP 不同任務(wù)范式對底層特征提取要求一致,但對頂層具體特征要求不一致,其中 NLP 學(xué)習(xí)語義連貫性,而自然語言 NLP 生成則期望進(jìn)一步的語境信息。


如下圖,ERNIE 3.0 不同的任務(wù)范式能夠共享在一個共享網(wǎng)絡(luò)中學(xué)習(xí)的底層抽象特征,并分別利用在他們自己的特定任務(wù)網(wǎng)絡(luò)中學(xué)習(xí)的特定任務(wù)頂層具體特征。


圖 6 ERNIE 3.0 模型結(jié)構(gòu)


該框架還支持隨時引入各種定制任務(wù),因此可以更好的支持下游二次開發(fā)。當(dāng)給定一個新任務(wù)時,ERNIE3.0 框架可以根據(jù)以前的訓(xùn)練參數(shù)逐步訓(xùn)練分布式表征,而不需要從頭開始訓(xùn)練。


特點二:大規(guī)模知識圖譜學(xué)習(xí),通用知識-文本預(yù)測(UKTP)任務(wù)


百度 ERINE 3.0 認(rèn)為,google T5 和 open ai GPT-3 盡管很成功,但是在沒有引入語言知識和世界知識的情況下對普通文本進(jìn)行訓(xùn)練的。為了解決這一個問題,ERNIE 3.0 在一個由普通文本和大規(guī)模知識圖譜組成的 4TB 語料庫上用 100 億個參數(shù)訓(xùn)練該模型。


百度構(gòu)建中文文本語料庫,存儲量達(dá) 4TB,分 11 個不同類別。語料庫包含 ERNIE 2.0(包括百科、Feed 等)、百度搜索(包括百家號、知乎、貼吧、經(jīng)驗)、網(wǎng)絡(luò)文本、QA-long、QA-short、Poetry 2&Couplet 3、醫(yī)療、法律、金融等領(lǐng)域的特定數(shù)據(jù)以及百度知識圖譜(超過 5000 萬條事實)。


圖 7 通用知識-文本預(yù)測


特點三:既有有監(jiān)督的微調(diào)(fine-tuning),也有零樣本、少樣本學(xué)習(xí)。


在數(shù)學(xué)、翻譯等任務(wù)中使用了微調(diào)。在中文新聞分類、語義相似度等任務(wù)中零樣本學(xué)習(xí),也取得較好效果。最終經(jīng)驗結(jié)果表明,該模型在 54 個中文 NLP 任務(wù)上的表現(xiàn)優(yōu)于最先進(jìn)的模型,其英文版本在SuperGLUE 基準(zhǔn)測試中獲得第一名,比人類表現(xiàn)高出0.8%(90.6%對89.8%)。


百度底座的其他優(yōu)勢,paddlapaddle 國內(nèi)第一個開源神經(jīng)網(wǎng)絡(luò)框架。2016 年 8 月,百度在 Github 上 100%開源內(nèi)部使用多年的深度學(xué)習(xí)平臺 PaddlePaddle。paddlepaddle 中文環(huán)境下較多的優(yōu)勢:


  • 能夠應(yīng)用于自然語言處理、圖像識別、推薦引擎等多個領(lǐng)域,其優(yōu)勢在于開放的多個領(lǐng)先的預(yù)訓(xùn)練中文模型,適應(yīng)中文環(huán)境。

  • 模型庫豐富,來自百度各個業(yè)務(wù)部門貢獻(xiàn);

  • 較多企業(yè)級的包,可以直接在產(chǎn)業(yè)界落地使用;

  • 兼容大量國產(chǎn) AI 芯片。


超大規(guī)模集群分布式計算能力。


paddlepaddle 設(shè)計研發(fā)了具備更強擴展能力的端到端自適應(yīng)大規(guī)模分布式訓(xùn)練架構(gòu) 6 。該架構(gòu)可以針對不同的模型和硬件,抽象成統(tǒng)一的分布式計算視圖和資源視圖,并通過硬件感知細(xì)粒度切分和映射功能,搜索出最優(yōu)的模型切分和硬件組合策略,將模型參數(shù)、梯度、優(yōu)化狀態(tài)按照最優(yōu)策略分配到不同的計算卡上,達(dá)到節(jié)省存儲、負(fù)載均衡、提升訓(xùn)練性能的目的。


國內(nèi)領(lǐng)先的算力底座。在此前文心一言的壓力測試中,亞洲目前最大的單體智算中心山西陽泉百度智算中心,已經(jīng)將算力提升到每秒可以完成 400 億億次浮點運算。總結(jié)百度在 NLP 大模型上走出了特色道路,并且毫無疑問是國內(nèi)第一梯隊水平,優(yōu)勢總結(jié)如下:


  • ERNIE 1.0 到 3.0 完整迭代,截至 3.0 已是相對可用狀態(tài),3.0 模型結(jié)構(gòu)便于下游二次開發(fā)部署;

  • 強大的百度內(nèi)部特色中文語料庫;

  • 基于 BERT 結(jié)構(gòu)基礎(chǔ)加上了知識圖譜等特色功能,在部分規(guī)則訓(xùn)練場景有更好可控性;

  • 國內(nèi)領(lǐng)先的開源 AI 訓(xùn)練框架,較強的算力基礎(chǔ)設(shè)施。


但同時,我們也看到現(xiàn)階段 ERNIE 底座的一些不足:


  • 模型結(jié)構(gòu)上仍然基于 BERT,但目前海外巨頭主流結(jié)構(gòu)轉(zhuǎn)變?yōu)?GPT 為代表的decoder-only,未來百度是否會在模型結(jié)構(gòu)上繼續(xù)迭代?

  • 截至 3.0,百度仍然使用 fine-tuning 等傳統(tǒng)方法對細(xì)分任務(wù)微調(diào)。而國際常見做法是 Prompt 或者 RLHF(人類反饋強化學(xué)習(xí))。根據(jù) 3 月 16 日百度文心一言發(fā)布會,目前百度在后者已經(jīng)掌握方法論,但實際訓(xùn)練量仍然有待提升;

  • 從 1.0 到 3.0,百度都使用了有特色是知識圖譜訓(xùn)練,這一方式可以有效降低訓(xùn)練模型所需要消耗的算力(3 月 16 日文心一言發(fā)布會也提到了這一特點)。但當(dāng)大語言模型達(dá)到千億或者更高參數(shù)級別時,似乎自然具備了知識圖譜訓(xùn)練下的能力。是否“暴力出奇跡”才是 AI 大預(yù)言模型的最終答案?

  • 百度 ERNIE 使用了百度內(nèi)部特色中文數(shù)據(jù),提升模型中文能力。但是是否百度體系內(nèi)高質(zhì)量語料庫相比龐大的英文互聯(lián)網(wǎng)語料庫仍然不足?


盡管有以上不足,我們?nèi)匀徽J(rèn)為百度在 NLP 能力上屬于國內(nèi)第一梯隊,也期待后續(xù)模型的進(jìn)一步迭代提升。



02


如何看待百度文心一言發(fā)布


3 月 16 日,百度文心一言正式發(fā)布,發(fā)布會上百度展示了多項能力。本文認(rèn)為:一些?NLP 人機對話中基礎(chǔ)的問答、總結(jié)、推理、創(chuàng)作能力基本具備。


文學(xué)創(chuàng)作:總結(jié)和推理能力。


文言一心可以以問答式方式文學(xué)作品作者的詳細(xì)信息,總結(jié)概括文學(xué)作品的主要內(nèi)容,并可以連貫生成如何嘗試?yán)m(xù)寫《三體》。該 AI 采用了知識增強和檢索增強技術(shù),在訓(xùn)練過程中采用了 5500 億知識圖譜數(shù)據(jù)。


圖 8 要求文心一言總結(jié)和續(xù)寫《三體》


商業(yè)文案創(chuàng)作:表達(dá)和創(chuàng)作能力。


文言一心可以智能的給公司起名,提供公司的服務(wù)Slogan,可以根據(jù)具體需求創(chuàng)造數(shù)百字的新聞稿。創(chuàng)作基本連貫清晰,理解了提問者意圖。


圖 9 按照要求提供公司 slogan


部分特定場景的中文理解可能超過了 GPT。


發(fā)布會上展示了根據(jù)成語的白話理解反推詢問的成語,用成語寫藏頭詩。


圖 10 對文心一言要求寫藏頭詩
圖 11 GPT-4 無法理解藏頭詩含義


具備了初步的數(shù)理邏輯能力。


數(shù)學(xué)問題一直被認(rèn)為是 nlp 是否具有初級邏輯能力的考查標(biāo)準(zhǔn)。發(fā)布會中示范了一個簡單數(shù)學(xué)題,文心一言答案展示了部分思維鏈(chain ofthought)能力。


圖 12 文心一言解答數(shù)學(xué)問題


有特色的多模態(tài)生成能力,某幾個功能點很實用。


一心特色功能是對話中直接文生圖,根據(jù)一段簡單的文字生成視頻(可以在百家號中使用),根據(jù)內(nèi)容生成粵語、東北話、閩南話等相關(guān)方言的語音。以上跨模態(tài)功能是目前 GPT-4 未整合的。


圖 13 根據(jù)一段話直接生成視頻


但同時,我們認(rèn)為發(fā)布會中有部分體現(xiàn)大模型強大指出的核心功能尚未充分展示。包括多輪對話、代碼能力、長文本理解等 GPT-4 具有的能力,文心一言未進(jìn)行展示。



03


文心一言商業(yè)化:拉動百度搜索、小度、智能駕駛和云,賦能傳媒、軟件、金融等行業(yè)百度披露更多商業(yè)機會。


一方面,與現(xiàn)有的搜索、小度、智能駕駛、云、投資公司愛奇藝等業(yè)務(wù)結(jié)合,提升入口流量價值和云的份額;另一方面,文心一言通過牽手合作伙伴,建立產(chǎn)業(yè)生態(tài),相關(guān)接入公司為 AI 提供落地場景,也有望借助 AI 提升運營效率或產(chǎn)品體驗,尤其是在內(nèi)容(文本、影視、游戲、營銷等)生成、數(shù)字人、辦公、智能家居、金融等領(lǐng)域。


商業(yè)化-對內(nèi):文心一言將與百度多項業(yè)務(wù)結(jié)合。


百度搜索,提供交互和聊天體驗;微軟證明了搜索引擎+類 GPT 產(chǎn)品是可行路線。2023年 2 月 8 日,微軟發(fā)布基于 ChatGPT 的新版 EDGE 瀏覽器和 Bing 搜索引擎,在提供傳統(tǒng)搜索內(nèi)容的同時,用戶可以與搜索引擎進(jìn)行對話交流,獲得更全面的答案,3 月 8 日微軟宣布,在超過百萬的新 Bing 預(yù)覽用戶推動之下,Bing 每日活躍用戶已突破 1 億。


同時,他還坦言:在新版 Bing 的數(shù)百萬活躍用戶中,有大約三分之一是新用戶。雖然 ChatGPT或減少搜索廣告的加載率,對于谷歌而言是個風(fēng)險,但對于份額原來不高的微軟 Bing 而言反而是一個提升流量入口地位的機會。


百度始終在中國搜索引擎市場占據(jù)龍頭地位,但近年來移動端站內(nèi)搜索對傳統(tǒng)的搜索引擎有分流,文心一言與搜索引擎的結(jié)合有望加強搜索的入口低位。百度的搜索份額保持在 70%-80%之間;PC 時代,搜索引擎是互聯(lián)網(wǎng)的流量入口,行業(yè)競爭格局相對穩(wěn)固。


但移動互聯(lián)網(wǎng)時代,流量分散在各互聯(lián)網(wǎng)巨頭的頭部 App 中,流量相對分散,且各個 App均積極布局移動端的站內(nèi)搜索分流 PC 端搜索和手機百度搜索量,尤其是抖音、微信的站內(nèi)搜索。


圖 14 中國移動搜索引擎份額
表 1:騰訊和字節(jié)跳動對搜索的布局


小度:


小度將融合“文心一言”的全面能力,提升小度與用戶進(jìn)行多輪對話的體驗,打造針對智能設(shè)備場景的人工智能模型“小度靈機”,并應(yīng)用到小度全系產(chǎn)品。小度科技原是百度旗下智能生活事業(yè)群組業(yè)務(wù),后獨立融資,作為國內(nèi)市場規(guī)模最大的對話式人工智能操作系統(tǒng)和全球智能屏最大的出貨廠商,小度科技已發(fā)布多款小度人工智能產(chǎn)品,包括智能音箱、智能屏、智能耳機,以及語音車載支架、電視伴侶、智能燈泡、智能紅外遙控、智能按鈕等周邊產(chǎn)品,還擁有小度助手(DuerOS),小度與諸多智能設(shè)備廠商建立合作。


自動駕駛&智能座艙:


文心一言背后大模型應(yīng)用至自動駕駛將加深車輛對復(fù)雜城市路況的理解;文心的智能語音能力將搭載到 Apollo 智艙系列產(chǎn)品,提升人車語音交互體驗。集度接入文心一言大模型后,文心一言的車企朋友圈不斷擴大,嵐圖、紅旗、長城、東風(fēng)日產(chǎn)、愛馳、零跑、吉利汽車、海馬汽車等近 10 家車企加入文心一言的朋友圈。


愛奇藝:


雙方共同探索將 AIGC 技術(shù)應(yīng)用于愛奇藝內(nèi)容搜索、內(nèi)容宣發(fā)、內(nèi)容創(chuàng)作工具、小說創(chuàng)作等業(yè)務(wù)。此次合作將把愛奇藝豐富的在線視頻娛樂資源與百度的前沿技術(shù)相結(jié)合,進(jìn)一步賦能愛奇藝,拓展其在影視內(nèi)容創(chuàng)意、制作效率、用戶體驗等方面的生產(chǎn)能力。長視頻具有項目周期長、人力密集型的特點,AI 有望提升內(nèi)容生產(chǎn)的工業(yè)化程度。


商業(yè)化-對外:


結(jié)合垂直領(lǐng)域 Know-how,實現(xiàn)垂直領(lǐng)域賦能。將通過百度智能云對外提供服務(wù),目前已有各領(lǐng)多家企業(yè)進(jìn)入文心一言生態(tài)圈。涵蓋媒體內(nèi)容、智能設(shè)備、金融、汽車、軟件服務(wù)、智能家居等領(lǐng)域,涵蓋融媒體(游戲 營銷 影視 媒體)、智能設(shè)備、金融、汽車、軟件服務(wù)、數(shù)字人、金融等領(lǐng)域;其中融媒體類接入最多;包括傳媒上市公司藍(lán)色光標(biāo)、 風(fēng)語筑、愛奇藝、掌閱科技、華策影視、值得買、巨人網(wǎng)絡(luò)子公司世優(yōu)科技等。


表 2:文心一言生態(tài)圈(部分公司)


百度云在 AI 領(lǐng)域已經(jīng)積累多年,對外服務(wù)加速,將打開智能云業(yè)務(wù)收入及利潤空間。


2022 年,百度智能云推出“云 智一體 3.0”架構(gòu),涵蓋底層的芯片(昆侖芯片)-深度學(xué)習(xí)框架(飛槳 PaddlePaddle)-大模型(文心大模型)-應(yīng)用(搜索等)。


中國 AI 公有云服務(wù)市場增速均高于中國整體 AI 軟件市場的增速,主要玩家包括百度云,阿里云,華為云和騰訊云等,百度智能云連續(xù)四年居第一,并且在人臉人體、圖像視頻兩個規(guī)模最大的子市場繼續(xù)保持第一,百度云今年對百度的業(yè)務(wù)貢獻(xiàn)在增加。


百度核心非在線營銷收入保持正增長;通過復(fù)用標(biāo)準(zhǔn)化解決方案以及從低利潤率項目中轉(zhuǎn)移,百度智能云利潤率持續(xù)優(yōu)化,22Q4 利潤率提升。


展望后續(xù),隨著文心一言加速對外服務(wù),智能云有望從提供基礎(chǔ)的算力、存儲等業(yè)務(wù)向智能服務(wù)轉(zhuǎn)型,打開收入及利潤空間。



更多精彩內(nèi)容請關(guān)注公眾號:BFT機器人

本文為原創(chuàng)文章,版權(quán)歸BFT機器人所有,如需轉(zhuǎn)載請與我們聯(lián)系。若您對該文章內(nèi)容有任何疑問,請與我們聯(lián)系,將及時回應(yīng)。




百度文心:一個符合預(yù)期的起點的評論 (共 條)

分享到微博請遵守國家法律
禄劝| 六安市| 周口市| 鹤庆县| 钟祥市| 建始县| 高青县| 宕昌县| 金川县| 新泰市| 固阳县| 阿克陶县| 深圳市| 奉新县| 交口县| 合水县| 大埔区| 嫩江县| 原阳县| 连南| 高唐县| 大庆市| 凯里市| 理塘县| 商丘市| 南投县| 太和县| 成安县| 五华县| 平阴县| 太白县| 蛟河市| 肇东市| 卢湾区| 凤冈县| 泰宁县| 龙州县| 平顺县| 林甸县| 临桂县| 闻喜县|