8個(gè)云成本優(yōu)化的最佳實(shí)踐

在《2022年云計(jì)算現(xiàn)狀報(bào)告》中,國(guó)際知名軟件資產(chǎn)管理商 Flexera 通過(guò)對(duì)近千家企業(yè)進(jìn)行調(diào)查得出數(shù)據(jù):企業(yè)平均浪費(fèi)32%的云業(yè)務(wù)支出。隨后,在2023年的報(bào)告中,F(xiàn)inOps 12年來(lái)首次超越安全,成為諸多企業(yè)關(guān)注的頭等大事。
?
本文我們將展開(kāi)聊聊企業(yè)乃至開(kāi)發(fā)人員如何進(jìn)行云成本優(yōu)化。
?
1、設(shè)置指標(biāo)洞察成本異常
查看云計(jì)算成本需要監(jiān)控工具以及預(yù)先定義好的指標(biāo)。以下列出了其中一些比較重要的云成本指標(biāo),供您參考:
Uptime:系統(tǒng)為用戶(hù)請(qǐng)求提供服務(wù)的時(shí)間
CPU 利用率:用于完成特定任務(wù)或處理用戶(hù)請(qǐng)求的所需算力的百分比
內(nèi)存使用:公有云、私有云及混合云環(huán)境中內(nèi)存的使用情況
每分鐘的請(qǐng)求數(shù)量:基于云的應(yīng)用每分鐘收到的用戶(hù)請(qǐng)求的數(shù)量
磁盤(pán)使用率:跟蹤某個(gè)節(jié)點(diǎn)上使用的磁盤(pán)容量,并確定存儲(chǔ)容量是否能夠滿(mǎn)足工作負(fù)載
平均確認(rèn)時(shí)間:系統(tǒng)響應(yīng)用戶(hù)請(qǐng)求所需要的時(shí)間
延遲:請(qǐng)求時(shí)間到響應(yīng)時(shí)間的間隔
平均故障間隔時(shí)間(MTBF):系統(tǒng)或應(yīng)用程序發(fā)生故障之間的平均間隔時(shí)間
平均修復(fù)時(shí)間(MTTR):在發(fā)生故障后系統(tǒng)恢復(fù)服務(wù)所需時(shí)間。MTTR 越短意味著宕機(jī)成本越小,有助于云成本優(yōu)化
?
2、借助熱力圖了解系統(tǒng)內(nèi)部正在發(fā)生什么
熱力圖是一種可視化工具,它可以展示計(jì)算需求的高峰和低谷。借助這一信息,你可以預(yù)估某項(xiàng)服務(wù)是否可以在特定時(shí)間關(guān)閉而不影響其他服務(wù)和業(yè)務(wù)。
?
借助熱力圖鑒別出此類(lèi)資源并配置調(diào)度,使其只在需要時(shí)才運(yùn)行,進(jìn)而無(wú)需對(duì)未使用的服務(wù)進(jìn)行支持,降低云計(jì)算成本。例如,熱力圖會(huì)告訴你在周末時(shí)你是否可以安全地關(guān)閉開(kāi)發(fā)服務(wù)器。
?
3、選擇預(yù)留實(shí)例或spot instance
在云計(jì)算中,如果企業(yè)愿意做出某些權(quán)衡,那么就能夠找到比按需資源(On-demand Resources)更便宜的替代方案。如果條件允許,可以考慮以下折扣方案:
預(yù)留實(shí)例:企業(yè)如果預(yù)先承諾在1到3年內(nèi)使用一定量的資源,那么可以通過(guò)預(yù)留實(shí)例來(lái)節(jié)省云資源。根據(jù)平臺(tái)和其他變量的不同,相比于按需資源,預(yù)留實(shí)例可以節(jié)省高達(dá)80%的費(fèi)用。主流的云廠商都會(huì)提供該定價(jià)模式。預(yù)留實(shí)例適合具有穩(wěn)定、可預(yù)測(cè)容量的工作負(fù)載。
Spot Instance:開(kāi)發(fā)人員可以以大幅折扣的低價(jià)獲得未使用的容量。是否能夠憑借這一定價(jià)模式節(jié)省費(fèi)用主要取決于所購(gòu)買(mǎi)的資源類(lèi)型以及購(gòu)買(mǎi)時(shí)的價(jià)格。Spot Instance 的缺陷是它們可能會(huì)被突然切斷,這主要由地區(qū)的整體容量需求確定。因此,此類(lèi)實(shí)例最好用于無(wú)狀態(tài)工作負(fù)載、批處理作業(yè)和其他可以允許中斷的任務(wù)。
?
4、合理調(diào)整計(jì)算服務(wù)
企業(yè)需要針對(duì)云服務(wù)的全局視圖以方便對(duì)其進(jìn)行合理調(diào)整,合理調(diào)整是一個(gè)重要的核心流程,涉及計(jì)算實(shí)例分析、識(shí)別閑置資源以及停用某些實(shí)例以?xún)?yōu)化云成本等。因此,可能需要對(duì) IT 去中心化或確保每個(gè)部門(mén)在云環(huán)境中使用的是同一個(gè)賬號(hào)。
?
借助細(xì)粒度的可見(jiàn)性,可以識(shí)別出超額配置或者閑置的資源。而當(dāng)成本在某個(gè)特定的時(shí)期內(nèi)超過(guò)預(yù)先設(shè)定的百分比時(shí),相關(guān)的觀測(cè)工具會(huì)向你發(fā)出通知。企業(yè)也可以配置該工具,如在某個(gè)時(shí)間點(diǎn)后終止未使用的資產(chǎn),這可以對(duì)云成本進(jìn)行進(jìn)一步優(yōu)化。
?
行之有效的調(diào)整可以節(jié)省高達(dá)70%的云成本。
?
5、SDLC 的每個(gè)階段都進(jìn)行成本優(yōu)化
云成本并不是在構(gòu)建和發(fā)布產(chǎn)品之后才需要考慮的問(wèn)題,而應(yīng)該將成本優(yōu)化納入整個(gè)軟件開(kāi)發(fā)生命周期。以下是是將云成本優(yōu)化集成到SDLC的4個(gè)步驟:
Plan:使用數(shù)據(jù)證明預(yù)算的合理性,并通過(guò)成本數(shù)據(jù)為技術(shù)債務(wù)相關(guān)決策和產(chǎn)品路線圖提供信息。這種做法有助于減少突發(fā)性的額外支出,并且可以根據(jù)需要靈活且迅速地調(diào)整預(yù)算。
部署和操作:迅速發(fā)現(xiàn)意外指出,并調(diào)整成本和預(yù)算
設(shè)計(jì)和搭建:記錄所有必要的數(shù)據(jù),以便在最佳資源使用的基礎(chǔ)上為架構(gòu)決策提供信息。
Review:按團(tuán)隊(duì)、功能和產(chǎn)品重新評(píng)估成本,以根據(jù)業(yè)務(wù)舉措報(bào)告業(yè)務(wù)支出和投資回報(bào)率(ROI)
將成本優(yōu)化左移到每個(gè)階段可以最大化云的投資回報(bào)率。
?
6、避免云蔓延(Cloud Sprawl)
云蔓延(Cloud sprawl)是指一種不受控制的云資源增殖的情況,是許多企業(yè)云計(jì)算賬單飆升的罪魁禍?zhǔn)?。?dāng)企業(yè)未能消除不再是其整體戰(zhàn)略一部分的云服務(wù)時(shí),他們就會(huì)繼續(xù)為這些服務(wù)付費(fèi)。
?
舉個(gè)例子,存儲(chǔ)實(shí)例會(huì)持續(xù)積累,特別是用于數(shù)據(jù)保護(hù)或從計(jì)算實(shí)例剝離出來(lái)時(shí)。此時(shí),如果云服務(wù)器實(shí)例沒(méi)有被刪除,那么相關(guān)的存儲(chǔ)可能會(huì)被忽視。因此,需要識(shí)別不再需要的存儲(chǔ)并且考慮與企業(yè)數(shù)據(jù)保留策略一致的刪除計(jì)劃。
?
想要最小化蔓延的風(fēng)險(xiǎn),需要通過(guò)基礎(chǔ)設(shè)施、應(yīng)用監(jiān)控和管理工具,對(duì)云環(huán)境構(gòu)建合理的可見(jiàn)性。另外,需要設(shè)置企業(yè)策略確定如何以及何時(shí)對(duì)不再需要的云資源進(jìn)行處理。并且使用自動(dòng)化配置來(lái)關(guān)閉舊的工作負(fù)載。
?
除了云策略外,密切監(jiān)控云賬單和合同以及時(shí)發(fā)現(xiàn)組織是否在為不需要的云服務(wù)付費(fèi)。
?
7、采用云原生設(shè)計(jì)
使用更具成本效益的系統(tǒng)來(lái)替代現(xiàn)有的云系統(tǒng)以充分利用云的獨(dú)特優(yōu)勢(shì)。例如,可以設(shè)計(jì)一個(gè)有自動(dòng)彈性伸縮功能的系統(tǒng)來(lái)確保你只為使用的服務(wù)器付費(fèi)。
?
你可以利用一些工具和專(zhuān)業(yè)文檔來(lái)幫助你設(shè)計(jì)系統(tǒng)并且使用云原生原則降低成本。云原生設(shè)計(jì)需要特殊技能,所以你可能需要一些指導(dǎo)才能實(shí)現(xiàn)它,而且一般情況下,企業(yè)只會(huì)修改現(xiàn)有的云基礎(chǔ)架構(gòu)而不會(huì)從頭開(kāi)始設(shè)計(jì)。
?
你的設(shè)計(jì)應(yīng)該平衡性能、云優(yōu)化以及基于企業(yè)優(yōu)先級(jí)和目標(biāo)的其他考慮因素。比如,云端中一個(gè)敏捷的 DevOps 流水線也許并不會(huì)降低成本。
?
8、消除影子IT(Shadow IT)
當(dāng)員工自行注冊(cè)并使用公司的云資源用于個(gè)人用途時(shí),這被稱(chēng)為影子IT,這在無(wú)意中大大增加了云成本。
?
影子IT除了增加成本外,還會(huì)導(dǎo)致不計(jì)其數(shù)的數(shù)據(jù)訪問(wèn),這會(huì)帶來(lái)巨大的安全風(fēng)險(xiǎn)。因此,培訓(xùn)員工了解影子IT的危險(xiǎn)是至關(guān)重要的,同時(shí)企業(yè)還應(yīng)該采取措施防止未經(jīng)授權(quán)的云訪問(wèn),例如,定期審計(jì)并阻止未經(jīng)批準(zhǔn)的應(yīng)用程序。
?
總結(jié)
云成本優(yōu)化并不是偷工減料和減少開(kāi)支,而是采用一種策略性的方法來(lái)創(chuàng)造價(jià)值并且提升業(yè)務(wù)表現(xiàn)。借助正確的工具和方法,企業(yè)可以節(jié)省大量的成本、優(yōu)化資源利用率并且交付更好的客戶(hù)體驗(yàn)。所以,無(wú)論是初創(chuàng)企業(yè)還是大型集團(tuán),將云成本優(yōu)化作為重中之重,將會(huì)看到業(yè)務(wù)在云計(jì)算的助力下展翅騰飛。