我在AIGC和數(shù)字中臺方面的架構(gòu)升級設(shè)計
軟件工程師羅小東,多年平臺架構(gòu)和落地經(jīng)驗,大模型的出現(xiàn)讓通用型AI成為一種可能,針對數(shù)字化和平臺化的結(jié)合一直在考慮整合點(diǎn),讓超級自動化方面落地更成為可能。
注意這里假設(shè)部分材料可以公開,數(shù)據(jù)隱私性不強(qiáng)的情況下的設(shè)計運(yùn)用,比如規(guī)范
背景
整個研究的目標(biāo)點(diǎn)是為了針對于數(shù)字中臺層級的超級自動化,這個是在繼Ops架構(gòu)體系之后的一個突破點(diǎn),前兩年在Ops架構(gòu)突發(fā)和成熟,比如
DevOps/GitOps/DataOps等體系,在某個方面已經(jīng)具備一定的自動能力,進(jìn)而發(fā)展出數(shù)字中臺的基礎(chǔ)設(shè)施能力。
研究超級自動化的時間應(yīng)該是在20年左右,前期在Ops上已經(jīng)實踐多年,一直想找更優(yōu)的突破點(diǎn),而且Ops模型體系也已經(jīng)有了標(biāo)準(zhǔn)和完善,不管在微服務(wù)、中臺技術(shù)、運(yùn)維、數(shù)據(jù)治理上,這些都已經(jīng)集成了自動化和流水線的能力,開源的產(chǎn)品也比較多,但是在超級自動化和數(shù)字中臺整合方面上,目前市場和概念的意識還不夠成熟。前期也研究過一段時間AI能力融入,但是多方面的限制,始終無法得到比較好的效果,而大模型(GPT)的出現(xiàn),貌似把這超級自動化都變成了可能。
這里主要以落地結(jié)合實際為參考,基于數(shù)字中臺基礎(chǔ)設(shè)施上的進(jìn)一步架構(gòu)設(shè)計,從能力提升過程為維度進(jìn)行闡述:
微服務(wù)和DevOps架構(gòu)能力提升
數(shù)據(jù)治理能力的能力提升
服務(wù)治理和運(yùn)維架構(gòu)能力的提升
結(jié)合起來的建設(shè)的思路依然是大平臺、輕中臺、小前臺,整合思路設(shè)計思路如下:
建立完整的規(guī)范文檔,自定義大量的prompt前置庫
PromptOps(參考Ops)流水線體系的建設(shè)
結(jié)合數(shù)字中臺多產(chǎn)品線的融入和落地
這里的大平臺進(jìn)一步的下沉和強(qiáng)化新型基礎(chǔ)設(shè)施的概念和能力,更為突出層級的劃分和固化,這個是以GPT模型為能力設(shè)計,整體設(shè)計是基于有完善的數(shù)字中臺基礎(chǔ)設(shè)施的能力上進(jìn)行,這里主要給出參考,這里只是針對問題和解決問題思路來進(jìn)行說明,也是后期落地和建設(shè)的方面,經(jīng)驗不一,我有我思。
過程問題
這也是結(jié)合使用過程發(fā)現(xiàn)的一個特別大的問題點(diǎn),規(guī)范化和完善基礎(chǔ)設(shè)施是條件之一,而利用GPT的結(jié)合推薦,Prompt生成的整合,也是基于這個規(guī)范和基礎(chǔ)設(shè)計為主,而更好的結(jié)合實際,而不是僅僅參考,更多的是運(yùn)用,這個主要會更利于人員的成長和往更高一層的思考,將人的精力和學(xué)習(xí)能力更加的提升,這對于很多中小團(tuán)隊來說是致命的成本硬傷,以下是AIGC和數(shù)字中臺結(jié)合的整體架構(gòu):

目前主要設(shè)計到的超級自動化上構(gòu)建專家體系、自動化體系等。
微服務(wù)和DevOps架構(gòu)能力提升
有工具和會用是另一回事,在成熟的前提上更進(jìn)一步提升
這個可能是一個老生的話題,在過去的實踐中還有目前行業(yè)的發(fā)展中,這個是工程結(jié)構(gòu)的基礎(chǔ),也是面對于解決系統(tǒng)和架構(gòu)問題的進(jìn)一步架構(gòu)提升,在業(yè)務(wù)和各個組件能力上,規(guī)范上,還有基礎(chǔ)技術(shù)上的統(tǒng)一化和規(guī)范化等。解決這部分的能力,主要是在于后期服務(wù)治理能力、業(yè)務(wù)工程結(jié)構(gòu)能力、還有自定義業(yè)務(wù)創(chuàng)新(或者說自研)業(yè)務(wù)上提供一定的保障。
前期在這塊上體現(xiàn)可提升或者進(jìn)一步需要優(yōu)化的部分,過程遇到的體現(xiàn)在幾個方面:
工程結(jié)構(gòu)的規(guī)范、編碼能力、基礎(chǔ)編碼優(yōu)化等,比如針對于幾百個規(guī)范和文檔編寫;
技術(shù)債成本高,涉及過多的概述和技術(shù),比如往往需要多方面人才的指導(dǎo)才可以完整走下;
多組件溝通困難,針對于大量的組件和技術(shù)整合架構(gòu)不夠明確,比如場景無法更好的結(jié)合組件做架構(gòu)
結(jié)合解決方案困難,無法針對現(xiàn)有的能力,更好的組合出更好的解決方案,比如往往會出現(xiàn)很多輪子
技術(shù)問題解決思路,這個成本較高,比如一般初中級工程師無法提出針對性的技術(shù)思路
產(chǎn)品和市場信息產(chǎn)生偏差,無法形成合力,比如你做你的方案,我找我找方案
……
針對于以上種種,可能臨時可以解決或者”總會找到人”,但是這個如果項目PM在工時和項目經(jīng)驗上,做過精打細(xì)算經(jīng)驗的會發(fā)現(xiàn),會有一種溫水煮青蛙的感覺,無形中流失很多時間和問題在非業(yè)務(wù)功能需求上,雖然說在前期的基礎(chǔ)架構(gòu)上這些問題好像已經(jīng)有規(guī)劃和處理,但是在很多時候,自己一直得不到滿意的效果(即使管理流程和組織架構(gòu)上做優(yōu)化),還是感覺這一步是可以進(jìn)一步優(yōu)化。
主要是構(gòu)建專家體系、文檔體系、規(guī)范體系、學(xué)習(xí)體系,而原來的組織結(jié)構(gòu)會進(jìn)一步調(diào)整和優(yōu)化,從而更專注于業(yè)務(wù)場景需求和創(chuàng)新方面,培養(yǎng)業(yè)務(wù)專家體系(當(dāng)然業(yè)務(wù)專家也可以結(jié)合,這里不做闡述),集中精力在更具備價值的地方,在多個方面更好的實現(xiàn)業(yè)務(wù)能力和創(chuàng)新。
數(shù)據(jù)治理能力的能力提升
數(shù)據(jù)分析和挖掘會更一步精簡化,更專注于數(shù)據(jù)運(yùn)營效果
在應(yīng)用采集的數(shù)據(jù)挖掘能力上,GPT基本上比較容易整合,對于數(shù)據(jù)多層級的劃分,如ODS/DWD/APS等這些在前期使用過程中,基本上針對于系統(tǒng)會針對性的出一版本,這部分的處理一些方案和方向上已經(jīng)達(dá)到,這里不做過多的闡述,得益于SQL規(guī)范上,指定一定的指標(biāo)分析過程,只需要更好的結(jié)構(gòu)好模型,做出模型投喂等,出來的指標(biāo)一般來極具參數(shù)性的,這類型的可以參考Chat2DB,PhotoShop等,這部分的數(shù)據(jù)分析可能正向推、或者反向推都可以。
前期在這塊上體現(xiàn)的一些問題點(diǎn):
數(shù)據(jù)維度分析、指標(biāo)分析,這塊上需要較長的周期,無法快速給出參考,需要投入特定人員,比如一些初級的分析
數(shù)據(jù)計算上SQL編寫,無法和現(xiàn)有模型較好的整合,有一定的技術(shù)復(fù)雜度,比如kafka/flink/hive/clickhouse等
人員培訓(xùn)成本上,技術(shù)和數(shù)據(jù)概述有差異,過程需要特定的數(shù)據(jù)人員指導(dǎo)全程指導(dǎo)
技術(shù)債成本高,涉及過多的概述和技術(shù),業(yè)務(wù)、技術(shù)和數(shù)據(jù)的結(jié)合溝通成本上較高,比如數(shù)據(jù)總線概念和消息概念不一樣,但是技術(shù)操作上可能是一樣;
……
另一個是在數(shù)據(jù)生成API上,也一樣針對于第一章節(jié)提到的規(guī)范可以進(jìn)一步推出。比如一個簡單的實時例子,在維度分析和指標(biāo)分析上,會結(jié)合模型自動生成,同時另一個是也會輸出FlinkSQL,這個往數(shù)據(jù)開發(fā)工具上復(fù)制和調(diào)試即可(目前是這么處理)。
主要是構(gòu)建專家體系、文檔體系、規(guī)范體系、學(xué)習(xí)體系,從而更專注于數(shù)據(jù)挖掘場景需求和創(chuàng)新方面,在多個方面更好的實現(xiàn)業(yè)務(wù)能力和創(chuàng)新。
另一個是數(shù)據(jù)分級、元數(shù)據(jù)、主數(shù)據(jù)的分析的抽取上,數(shù)據(jù)清洗、元數(shù)據(jù)管理、數(shù)據(jù)模型管理等流程化的工作,這些都有比較好的能力整合,結(jié)合模型訓(xùn)練基本上會更合適(如基礎(chǔ)的數(shù)據(jù)模型算法)。
注意數(shù)據(jù)涉密的問題,這里只做模型提交處理,而且需要客戶溝通
新一代的AI技術(shù),讓此類工作門檻大幅降低,數(shù)據(jù)分析不再成為一個難點(diǎn),針對一般型的項目基本上是可以直接套過來,通過自然語言快速建表,包括自動生成維度表、建立范式模型和星型模型、自動分析表之間的邏輯關(guān)系、甚至提供建模建議,生成一定的SQL和腳本,更快的進(jìn)行數(shù)據(jù)采集分析。
服務(wù)治理和運(yùn)維架構(gòu)能力的提升
自動運(yùn)維能力的提升,更快速提供服務(wù)運(yùn)維質(zhì)量和范圍
這里的運(yùn)維包括監(jiān)控、管理、安全、自動化等,自己一直在研究和運(yùn)用的更多的是ChatOPS,以釘釘一類為代表的工具,一個是信息的交互,另一個是主動推送信息,這部分在某種模型上,會比較成熟,不過在運(yùn)用上還是比較不得意,大部分是集成中通知和互相上,集成起來的能力點(diǎn)是極度有限的,是在現(xiàn)有的工具模型上做的API,然后結(jié)合各個服務(wù)能力進(jìn)行一個窗口型的交互。
出于幾方面的處理,很多方面是webhook/定時/api幾個方面的能力結(jié)合,而這些操作過于通用而帶來一定的限制,主要在幾個方面:
webhook能力有限,需要定制很多api來結(jié)合,機(jī)器人的結(jié)合,缺少推理的能力,在這塊上學(xué)習(xí)成本和場景上依然會有很大的限制
技術(shù)債成本高,涉及過多的概述和技術(shù),業(yè)務(wù)、技術(shù)和數(shù)據(jù)的結(jié)合溝通成本上較高,學(xué)習(xí)成本很高;
技術(shù)問題解決思路,這個成本較高,比如一般初中級工程師有些可能根本無法接過自動化運(yùn)維這個內(nèi)容
運(yùn)維和數(shù)據(jù)挖掘的結(jié)合目前缺少一定的方案,技術(shù)方案突破存在一定的瓶頸,需要研究的成本很大
問題解決過程需要關(guān)聯(lián)大量的基礎(chǔ)設(shè)施信息,這個結(jié)合的成本需要特別熟悉的工程師才可以處理
問題分析模型創(chuàng)建困難,在海量的運(yùn)維數(shù)據(jù)中,需要高級算法工程師和計算人員才可以,中小團(tuán)隊招人成本極高
運(yùn)維/技術(shù)/數(shù)據(jù)整合起來困難,無法形成一體化的結(jié)合的能力,形成運(yùn)維/技術(shù)/數(shù)據(jù)各個層級孤島
相關(guān)過程問題沉淀效果不理想,重復(fù)問題參考效果未必能達(dá)到預(yù)期
……
前期一直有計劃結(jié)合AI能力來處理這個,需要突破很多限制和成本,這對于中小團(tuán)隊來說,不管是精力還是人才,基本上會有很難的實現(xiàn),特別是需要特別資深的工程師,而且甚至有可能做到半效果不理解,然后走到黑或者走到放棄的層面。
同樣是構(gòu)建專家體系、文檔體系、規(guī)范體系、客服體系,在處理上更專注于穩(wěn)定性和健壯性,提升問題預(yù)知和安全感知能力,促進(jìn)業(yè)務(wù)的穩(wěn)定性。確保系統(tǒng)、設(shè)備、應(yīng)用程序等IT資源運(yùn)轉(zhuǎn)正常,并維護(hù)它們的高可用性和可靠性。運(yùn)維人員通過對軟件、硬件、網(wǎng)絡(luò)等的監(jiān)控、維護(hù)、檢修、升級等工作來保證系統(tǒng)的穩(wěn)定性和完整性。
整合思路
這里能這么做的主要利益于數(shù)字中臺的規(guī)范性和完整的基礎(chǔ)設(shè)施能力提供,穩(wěn)定和成熟的中臺體系。這個是針對原有的平臺化的升級優(yōu)化,而不是重構(gòu)或者重建之類的,這個過程是沒有必要的,應(yīng)該來說以適當(dāng)當(dāng)前的任務(wù)平臺或者業(yè)務(wù)系統(tǒng)。
建立完整的規(guī)范文檔,自定義大量的prompt前置庫
建立專屬的Prompt庫,指令會有一定的字符限制
根據(jù)自己在接觸的平臺的這幾年,有一些經(jīng)驗和材料的沉淀,不管是文檔和腳本庫等,都有上千份,進(jìn)行進(jìn)一步的梳理和建立更好的資料庫,服務(wù)系統(tǒng)之前標(biāo)準(zhǔn)API的提取和標(biāo)準(zhǔn)的定義,更加明確多個節(jié)點(diǎn)的標(biāo)準(zhǔn)規(guī)范,比如接口規(guī)范、日志規(guī)范、數(shù)據(jù)規(guī)范等,形成大量的知識庫,而這些標(biāo)準(zhǔn)知識庫,形成Prompt的前置庫,為了形成更好的指令傳遞給GPT模型。從而結(jié)合實際的微服務(wù)技術(shù)、中臺技術(shù)等。
增加了模型能力的引入和團(tuán)隊能力提升的章節(jié)(可以理解成高級助手)
通過多個資料和材料的整合,形成多個專家體系,比如Java技術(shù)專家,數(shù)據(jù)分析專家,運(yùn)維專家,數(shù)據(jù)庫專家,產(chǎn)品專家等;
通過資料和規(guī)范,結(jié)合AI的推理能力,會更加結(jié)合形成結(jié)果,形成客服體系,進(jìn)而形成人員成長體系,解決人員的問題;
通過專家體系的融合,形成方案解決方案設(shè)計能力,針對場景和項目的不同,結(jié)合和搭配出不同的場景技術(shù)方案,提供更好的參考。
而整個過程需要達(dá)到的目標(biāo)依然是大平臺,沉淀形成新型基礎(chǔ)設(shè)施,將人力和精力更加的集成在更有價值的地方。這個階段的整合,更多是針對于文檔規(guī)范和調(diào)整,會有一定的調(diào)整,同時為了更好的區(qū)分和不影響當(dāng)前業(yè)務(wù),分離出GPT版本,進(jìn)行小規(guī)模的試行和驗證,推進(jìn)。
PromptOps(參考Ops)流水線體系的建設(shè)
建立更新機(jī)制和流程
這個主要得益于在DevOps/GitOps上的成熟和規(guī)范,效果等,在以前的經(jīng)驗中,這兩塊基本上達(dá)到了較高的自動化能力。
為了平臺化更好的優(yōu)化和更新,需要不斷的吸取新的知識和參考,同時獲取到更好的項目參考,比如包括同類競品項目,開源項目等,這個是一部分的集成能力,另一部分是本身Prompt庫的升級,更新等,這里主要是參考DevOps的思路,形成流水線和自動化的能力,建立多個輸入端,形成類似于人工智能標(biāo)注一樣的處理流程。
在原來的沉淀結(jié)構(gòu)上提一步的提升和規(guī)范,提升了每個章節(jié)內(nèi)容的建設(shè)范圍和邊界。
根據(jù)層級數(shù)據(jù)安全,做好一定的敏感詞定義和過濾,形成Prompt安全規(guī)范,避免敏感信息和層級數(shù)據(jù)外漏
根據(jù)結(jié)果和返回數(shù)據(jù)進(jìn)一步沉淀到數(shù)據(jù)平臺,過程進(jìn)一步的進(jìn)行優(yōu)化和維護(hù)
這個過程的主要目標(biāo)是形成流水線,減少在Prompt上的投入的運(yùn)維管理。
結(jié)合數(shù)字中臺多產(chǎn)品線的融入和落地
這是一個落地的問題
這里主要利益于產(chǎn)品的自研能力,為什么一直堅持自研也是這個考慮,這樣更好的創(chuàng)新和能力的整合。
在這里同樣的思路,如果一個事情過于復(fù)雜,需要想辦法讓它變得更簡單。在這塊上搜索和輸入的Prompt內(nèi)容,結(jié)合上面的專家體系和規(guī)范體系,結(jié)合產(chǎn)品工程中的特定卡點(diǎn)進(jìn)行嵌入,最終直接輸出結(jié)果。這個方式類似于Prometheus/ELK等,直接嵌入到每個工程運(yùn)行的卡點(diǎn)里面,直接點(diǎn)擊即可查看結(jié)果,或者輸入少量的提示詞即可直觀的看到。
通過找到每個產(chǎn)品服務(wù)的卡點(diǎn),進(jìn)行GPT產(chǎn)品線的埋點(diǎn),進(jìn)行產(chǎn)品整合,以獲取得到更好的反饋結(jié)果,這里主要以sdk埋點(diǎn)的形式
在工程師層面淡化AI的各種概念,形成無感切入,在后期中不斷的沉淀和優(yōu)化,以達(dá)到更好的效果,比如缺少某個關(guān)鍵詞,通過上面的流水線進(jìn)一步優(yōu)化
這個過程主要的目標(biāo)是落地運(yùn)用,達(dá)到原目標(biāo)的結(jié)果,這個在數(shù)據(jù)設(shè)計和規(guī)范編碼上已經(jīng)有一定的運(yùn)用,效果還是不錯的。
總結(jié)
對于數(shù)字中臺的升級上,結(jié)合GPT和超級自動化作為新的突破點(diǎn),提出了在數(shù)字中臺基礎(chǔ)設(shè)施上進(jìn)一步提升能力的架構(gòu)設(shè)計思路,并探討了落地建設(shè)方面的問題和解決思路。經(jīng)驗因人而異,每個人都有自己的思考和理解。這個是下一步升級架構(gòu)方案,當(dāng)前還在進(jìn)一步的優(yōu)化和思考中,同時也在初步的結(jié)合中。以上為升級的方案,期望可以給他人一些參考,也期望有興趣的朋友可以關(guān)注討論。
鳴謝
這里主要參考了一些開源項目研究和得到的思路,這里做鳴謝:
AutoGPT 為了目標(biāo)實現(xiàn)而實現(xiàn)的能力
阿里云運(yùn)維體系 運(yùn)維體系和客服體系相當(dāng)成熟
Chat2DB 基于規(guī)范(SQL語法)基礎(chǔ)實現(xiàn)的能力
Kuboard 多產(chǎn)品和結(jié)合落地的能力體現(xiàn)