騰訊云湯文軍:云原生分布式云 一朵云解決 IDC客戶上云困境 | GDCC 最強(qiáng)音
全球分布式云大會(huì)是分布式云技術(shù)和商業(yè)交流的旗艦級平臺,2023全球分布式云大會(huì)·北京站將于6月28日-29日正式召開,本次大會(huì)以“云智筑基”為主題,探究人工智能(AI)在大模型全新的發(fā)展風(fēng)口,構(gòu)建新型泛在算力網(wǎng)絡(luò)的趨勢,如何利用分布式云、分布式數(shù)據(jù)庫、分布式存儲(chǔ)、邊緣云等構(gòu)建新型算力網(wǎng)絡(luò),打造更強(qiáng)大的數(shù)字經(jīng)濟(jì)價(jià)值引擎。
本次大會(huì)來自騰訊云、火山引擎、阿里云、華為云、、百度智能云、螞蟻集團(tuán)等云計(jì)算數(shù)字科技服務(wù)商,以及中國電信、中國移動(dòng)、中國聯(lián)通三大運(yùn)營商等數(shù)技術(shù)專家,從分布式云行業(yè)前瞻性發(fā)展趨勢,底層云計(jì)算基礎(chǔ)設(shè)施突破性關(guān)鍵技術(shù),分享高尖精技術(shù)和實(shí)踐案例,共同打造云計(jì)算領(lǐng)域的饕餮技術(shù)盛宴。在2023年06月28日上午舉辦的分布式主題報(bào)告會(huì)上,騰訊云邊緣容器項(xiàng)目負(fù)責(zé)人湯文軍在大會(huì)上發(fā)表題為《云原生分布式云 一朵云解決?IDC客戶上云困境》的精彩演講。

云原生分布式云中的挑戰(zhàn)
分布式云本身包含多層面內(nèi)容,包括多種計(jì)算層面的產(chǎn)品、容器平臺層產(chǎn)品以及上層 SaaS 服務(wù)等各方面。《“云原生分布式云”,一朵云解決 IDC 客戶的上云困境》顧名思義,通過云原生的方式,讓分布式云的用戶輕松便利地使用云原生相關(guān)服務(wù)。

企業(yè)使用分布式云產(chǎn)品概括而言主要有兩個(gè)核心場景:
1. 企業(yè)希望將業(yè)務(wù)遷移至公有云,IDC服務(wù)器過保后才可進(jìn)行裁撤,這是一個(gè)企業(yè)信息化建設(shè)的過程。因此,用戶在上云過程中表現(xiàn)出的主要需求是盡可能利用未過保的基礎(chǔ)設(shè)施,并且希望遷移過程足夠平滑,能夠?qū)崿F(xiàn)低成本遷移。
2.部分企業(yè)會(huì)基于彈性、成本、穩(wěn)定性等因素長期保持云上資源和 IDC 資源統(tǒng)一管理的混合云架構(gòu)。

在這兩個(gè)場景中,企業(yè)都會(huì)面臨混合基礎(chǔ)設(shè)施管理和混合云應(yīng)用治理兩方面挑戰(zhàn)。
從混合基礎(chǔ)設(shè)施管理層面而言,用戶使用云的形態(tài)復(fù)雜,位置分散,環(huán)境多樣。企業(yè)有時(shí)延敏感型業(yè)務(wù)、也有本地計(jì)算等需求,算力資源分散在中心云、IDC和邊緣等各種位置。這類位置的網(wǎng)絡(luò)環(huán)境多樣,如專線連接,5G/公網(wǎng)等弱網(wǎng)環(huán)境。因此,為滿足用戶不同位置不同場景統(tǒng)一管理的需求,騰訊云提供TKE RegisterNode、TKE Connector和TKE Anywhere三個(gè)能力,并通過TDCC 提供統(tǒng)一使用入口。
而在混合云應(yīng)用治理層面,企業(yè)有彈性部署、安全合規(guī)、容災(zāi)和成本等方面考量,需按業(yè)務(wù)類型將業(yè)務(wù)分布在云上與云下,并實(shí)現(xiàn)成本最優(yōu)和業(yè)務(wù)的安全穩(wěn)定。穩(wěn)態(tài)業(yè)務(wù)部署在IDC,彈性業(yè)務(wù)部署在云上;數(shù)據(jù)敏感類業(yè)務(wù)會(huì)部署在IDC,創(chuàng)新型業(yè)務(wù)部署在云上,基于云上云下的成本與定價(jià)體系不同,將不同業(yè)務(wù)分別調(diào)度至云上或云下。針對該類需求,騰訊云基于騰訊開源的 CNCF 項(xiàng)目Clusternet實(shí)現(xiàn)分布式云中心TDCC就能夠支持多集群應(yīng)用治理能力,實(shí)現(xiàn)基于成本、穩(wěn)定性和利用率的多集群調(diào)度,最終達(dá)到穩(wěn)定性和成本最佳平衡。
云原生分布式云面向多云多集群和邊緣場景的應(yīng)用管理平臺,同時(shí)也實(shí)現(xiàn)公有云對IDC 1 比 1 輸出,一次構(gòu)建,處處運(yùn)行,可簡單概括為一個(gè)中心、三類服務(wù)、四種場景。
其中,TDCC 是云原生分布式云的核心,負(fù)責(zé)云上云下多集群的統(tǒng)一管理和運(yùn)維。三類服務(wù)從下往上分布,底層基礎(chǔ)設(shè)施層通過 TKE Anywhere、注冊節(jié)點(diǎn)及 Connector 三個(gè)產(chǎn)品覆蓋;中間 PaaS 服務(wù)層通過 TKE DataService滿足客戶需求;上層應(yīng)用層通過 TKE AppEngine 負(fù)責(zé),將多集群應(yīng)用分發(fā)至混合多云以及邊緣地域。
而四種場景指的是,資源利舊場景、云上交付場景、混合多云場景及云邊一體場景。在資源利舊場景中,將用戶IDC 中存量的服務(wù)器加入公有云統(tǒng)一運(yùn)維管理;云上交付場景中則通過公有云將容器集群交付至 IDC 和邊緣生產(chǎn)現(xiàn)場;混合多云場景能夠滿足用戶通過云上控制面,統(tǒng)一管理多云多集群;云邊一體場景中可滿足用戶對邊緣計(jì)算需求,實(shí)現(xiàn)云原生化的邊緣自治,多地域管控等能力
TKE系列產(chǎn)品組合,實(shí)現(xiàn)客戶視角一朵云

面對多種復(fù)雜基礎(chǔ)設(shè)施場景,騰訊云通過一系列產(chǎn)品組合,并由TDCC提供的統(tǒng)一入口,實(shí)現(xiàn)客戶視角一朵云。
a)?TKE RegisterNode:?主要針對存量IDC節(jié)點(diǎn)提供快速輕量上云能力,將控制面托管在公有云上,由云廠商進(jìn)行運(yùn)維管理;企業(yè)只需在IDC上運(yùn)行注冊腳本即可分鐘級實(shí)現(xiàn)集群的構(gòu)建。同時(shí)通過 CNCF 項(xiàng)目 SuperEdge 可以一鍵開啟邊緣能力,實(shí)現(xiàn)云邊/邊邊協(xié)同調(diào)度。
b)?TKE Connector:主要針對 IDC 已有K8S集群,客戶不想運(yùn)維或缺少部分運(yùn)維管理能力時(shí),可將集群連接至云上,由TKE統(tǒng)一管理,在云上實(shí)現(xiàn)多集群運(yùn)維管理,并可將標(biāo)準(zhǔn)的公有云云能力投遞到自建集群以補(bǔ)齊自建能力的不足。
c)?TKE Anywhere:主要針對期望云下有完整獨(dú)立集群,但又不想負(fù)責(zé)集群的創(chuàng)建及升級等基礎(chǔ)運(yùn)維管理的客戶??赏ㄟ^TKE控制臺在云上完成云下集群的搭建,在30分鐘內(nèi)完成從云上投遞生產(chǎn)可用集群和PaaS組件至云下,連接可運(yùn)維,斷開可自治。
TKE RegisterNode

騰訊云TKE注冊節(jié)點(diǎn)服務(wù)是針對混合云部署場景的全新升級節(jié)點(diǎn)產(chǎn)品形態(tài),允許用戶將非騰訊云的主機(jī)托管到容器服務(wù) TKE 集群,并由 TKE 負(fù)責(zé)集群生命周期管理。根據(jù)用戶 IDC 和云端連接方式不同,同時(shí)提供“專線版”和“邊緣版”兩種節(jié)點(diǎn)注冊方式。
“專線版”與“邊緣版”兩種方式分別解決用戶兩個(gè)不同的應(yīng)用場景。邊緣版本主要應(yīng)對邊緣計(jì)算場景,用戶想要通過 TKE 公有云納管多地域的邊緣節(jié)點(diǎn)和邊緣設(shè)備;專線版主要滿足用戶 IDC 節(jié)點(diǎn)無縫接入云上,實(shí)現(xiàn)云上云下統(tǒng)一調(diào)度
通過 TKE 注冊節(jié)點(diǎn),騰訊云可盡力解決用戶自研上云中遇到的 4 個(gè)難題:
1.實(shí)現(xiàn)資源利舊、利用率提升:注冊節(jié)點(diǎn)通過納管 IDC 節(jié)點(diǎn)實(shí)現(xiàn)基礎(chǔ)的資源利舊,同時(shí)提供 Request 推薦、動(dòng)態(tài)調(diào)度、節(jié)點(diǎn)超賣等能力以及 qGPU 能力,進(jìn)一步提升 IDC 資源利用率。
2.節(jié)點(diǎn)托管運(yùn)維:注冊節(jié)點(diǎn)將控制面運(yùn)維在云上,免去IDC 本地搭建集群成本,只需運(yùn)維節(jié)點(diǎn)服務(wù)即可,同時(shí)無縫集成云上的日志監(jiān)控、審計(jì)、安全等標(biāo)準(zhǔn)能力。
3.云上云下統(tǒng)一調(diào)度:支持在一個(gè)集群中同時(shí)調(diào)度云上 CVM 節(jié)點(diǎn)和 IDC 節(jié)點(diǎn),方便將云下業(yè)務(wù)擴(kuò)展至云上。
4.集群運(yùn)維與管理:通過注冊節(jié)點(diǎn)的邊緣版本實(shí)現(xiàn)用戶通過公有云將自由節(jié)點(diǎn)加入到 TKE 集群進(jìn)行運(yùn)維和管理。
此外,注冊節(jié)點(diǎn)還從云上無縫繼承多種增值服務(wù)能力,其中包括節(jié)點(diǎn)放大與動(dòng)態(tài)調(diào)度、全鏈路優(yōu)化能力、全鏈路可視化、成本優(yōu)化等。
TKE Anywhere

騰訊云云原生分布式云推出的 TKE Anywhere 產(chǎn)品可通過公有云云上服務(wù)將完整的 TKE 產(chǎn)品交付到用戶 IDC 現(xiàn)場,并通過 TKE Connector 產(chǎn)品可將此集群注冊到公有云,實(shí)現(xiàn)公有云管控本地容器平臺,提高交付和運(yùn)維效率。該產(chǎn)品主要針對兩種客戶應(yīng)用場景:第一種是云上交付輕量級容器平臺,另一重場景是 SaaS 客戶的多局點(diǎn)交付于管理。
TKE Anywhere 產(chǎn)品優(yōu)勢在于以下三點(diǎn):
1.免運(yùn)維:免去運(yùn)維 K8s 集群的成本,由騰訊云統(tǒng)一運(yùn)維管控;
2.公有云集群能力無縫接入:云上 TKE 集群能力交付至云下,快速獲取集群管理能力;
3.多種交付形式:TKE Anywhere 軟件交付或者通過一體機(jī)方式交付。
TKE Connector

TKE Connector 注冊集群產(chǎn)品是用戶將本地K8s 集群和其他云廠商 K8s 集群接入騰訊云容器服務(wù)平臺進(jìn)行統(tǒng)一管理的集群形態(tài)。該產(chǎn)品主要面向兩個(gè)場景:第一個(gè)場景是用戶在多家云廠商下使用容器服務(wù),需要進(jìn)行統(tǒng)一管理;第二個(gè)場景是用戶同時(shí)在云上和云線對 K8s 集群有統(tǒng)一管理的訴求。
通過 TKE Connector 注冊節(jié)點(diǎn)可屏蔽多集群之間 IaaS 層差異;同時(shí)基于 DNS 和全局流量調(diào)度技術(shù),實(shí)現(xiàn)統(tǒng)一的流量調(diào)度與接入;并通過感知都勻多集群的容量、成本以及性能差異,實(shí)現(xiàn)業(yè)務(wù)的單元化部署和智能切換,滿足夸云多活以及容災(zāi)的需求
通過 TKE Anywhere、TKE Connector產(chǎn)品可實(shí)現(xiàn)任意位置創(chuàng)建集群,納管任意 K8s 集群能力;適用于多云、混合云、IDC 上云以及云邊一體的場景;實(shí)現(xiàn)云上云下的統(tǒng)一管控、一致體驗(yàn)、靈活彈性等特性,同時(shí)通過CNCF 一致性認(rèn)證。
TDCC — 解決集群管理與統(tǒng)一應(yīng)用分發(fā)
DistributedCloud

基于TKE注冊集群能力,騰訊云不斷豐富云上 TDCC 產(chǎn)品以解決集群管理和統(tǒng)一應(yīng)用分發(fā)的痛點(diǎn)問題。
1.統(tǒng)一的集群管理:通過用戶集群反向注冊方式解決用戶集群ApiServer服務(wù)暴露的安全問題;
2.輕量的多集群管理:AA 方式管理和部署,不依賴額外的存儲(chǔ)和端口,支持PUSH,PULL兩種模式;
3.管控面高可用:公有云后臺依賴萬級集群規(guī)模管理經(jīng)驗(yàn),完全托管服務(wù)保證可靠性;
4.多集群應(yīng)用分發(fā)問題:應(yīng)用分發(fā)、差異化等策略配置能力支持應(yīng)用遷移、一鍵開區(qū)、灰度發(fā)布、批量發(fā)布復(fù)雜的業(yè)務(wù)場景;
5.完全兼容 Kubernetes 的標(biāo)準(zhǔn)API、Helm Chart 以及自定義的 CRD,原有K8s業(yè)務(wù)無需大規(guī)模改造,方便用戶業(yè)務(wù)接入 具備管理多集群的能力;
6.解除技術(shù)綁定:核心組件開源,Clusternet, TKEStack, SuperEdge等。

同時(shí) TDCC 和騰訊云公有云服務(wù)全線打通,支持將公有云核心能力延伸到用戶IDC集群以及其他多云環(huán)境中。
TDCC 和騰訊云完整賬號體系打通,能解決多集群場景下的統(tǒng)一認(rèn)證和權(quán)限分發(fā)問題,管理員可通過 TDCC為不同賬號進(jìn)行授權(quán)并生成訪問憑證,同時(shí)能夠進(jìn)行詳細(xì)的準(zhǔn)入控制和審計(jì)。
通過云聯(lián)網(wǎng)的能力,TDCC能夠解決多場景網(wǎng)絡(luò)互通和性能問題,同時(shí)支持單集群多網(wǎng)絡(luò)模式;在性能方面支持 ENI 直通 LB 實(shí)現(xiàn)全面呃零損耗網(wǎng)絡(luò),并且獨(dú)家支持網(wǎng)絡(luò)彈性限流能力。
在網(wǎng)絡(luò)的另一個(gè)方面,TDCC也支持多種環(huán)境下多種類型的 ingress controller,包括傳統(tǒng)的應(yīng)用型 CLB、Istio gateway 專用型網(wǎng)關(guān)以及標(biāo)準(zhǔn)的 nginx-ingress-controller。
最后,通過云上的監(jiān)控日志、容器安全、在離線混布以及成本大師等高階能力,可讓用戶在 IDC 側(cè)輕松擁有云上 TKE 的運(yùn)維管理經(jīng)驗(yàn)。
TKE for DataService

除TDCC 多集群管理以外,騰訊云針對分布式云環(huán)境中的中間件服務(wù)提供 TKE DataService產(chǎn)品。TKE for DataService 是分布式云環(huán)境中將騰訊云數(shù)據(jù)庫PaaS、SaaS產(chǎn)品能力,利用遠(yuǎn)程投遞、離線自治、服務(wù)納管等功能,為客戶提供多云、IDC、邊緣節(jié)點(diǎn)等多環(huán)境下一致的數(shù)據(jù)庫、中間件引擎及管理體驗(yàn)
為解決傳統(tǒng)的 PaaS 服務(wù)中存在的問題,如公有云和IDC 私有化的 PaaS 能力不一致,多云之間的 PaaS 能力無法統(tǒng)一,并且PaaS 的能力不夠彈性等,TKE DataService 通過云上投遞能力,遠(yuǎn)程在多云環(huán)境中部署統(tǒng)一的中間件服務(wù)并提供統(tǒng)一的交互體驗(yàn);同時(shí)能夠?qū)崿F(xiàn)離線自治,在和騰訊云 TDCC 斷網(wǎng)的情況下仍然能夠離線獨(dú)立運(yùn)維;此外,這類中間件服務(wù)都可對接云端 SaaS 服務(wù),提供容災(zāi)多活備份等高階能力,并以此滿足分布式云環(huán)境下用戶對中間件的核心需求。
TKE AppEngine

應(yīng)用部署層面的TKE AppEngine則可在多集群管理的基礎(chǔ)上,通過云端統(tǒng)一發(fā)布和管理多個(gè)云上的應(yīng)用服務(wù),同時(shí)實(shí)現(xiàn)應(yīng)用的跨云多活,故障遷移和容災(zāi)備份,并能實(shí)現(xiàn)多集群間彈性伸縮和按資源水位調(diào)度。
其主要特點(diǎn)包括:
1.獨(dú)立靈活的策略和應(yīng)用配置:支持多種分發(fā)策略和差異化策略,實(shí)現(xiàn)應(yīng)用一次部署處處運(yùn)行;
2.智能的流量管理:提供多種流量管理方案,按需調(diào)配接入流量,靈活控制應(yīng)用間調(diào)用策略;
3.安全管控能力:基于公有云安全能力,云上云下一體化認(rèn)證和授權(quán)管理,保障業(yè)務(wù)安全合規(guī);
4.業(yè)務(wù)零侵入:零學(xué)習(xí)和改造成本升級至多云多集群架構(gòu),完全兼容 K8s 的標(biāo)準(zhǔn) API、Helm Chart 以及自定義的 CRD,實(shí)現(xiàn)體驗(yàn)一致的多云混合資源、服務(wù)、應(yīng)用的統(tǒng)管能力,最小化多云運(yùn)營成本。
案例:某新能源汽車公司
