散文網(wǎng) » 科技 »學(xué)習(xí) » 18張圖揭秘高性能Linux服務(wù)器內(nèi)存池技術(shù)是如何實(shí)現(xiàn)的

18張圖揭秘高性能Linux服務(wù)器內(nèi)存池技術(shù)是如何實(shí)現(xiàn)的

2023-11-03 14:32 作者:補(bǔ)給站Linux內(nèi)核 0人讀過 | 我要投稿

大家生活中肯定都有這樣的經(jīng)驗(yàn)，那就是大眾化的產(chǎn)品都比較便宜，但便宜的大眾產(chǎn)品就是一個(gè)詞，普通；而可以定制的產(chǎn)品一般都價(jià)位不凡，這種定制的產(chǎn)品注定不會(huì)在大眾中普及，因此定制產(chǎn)品就是一個(gè)詞，獨(dú)特。

有的同學(xué)可能會(huì)有疑問，你不是要聊技術(shù)嗎？怎么又說起消費(fèi)了？

原來技術(shù)也有大眾貨以及定制品。

通用 VS 定制

作為程序員(C/C++)我們知道申請內(nèi)存使用的是malloc，malloc其實(shí)就是一個(gè)通用的大眾貨，什么場景下都可以用，但是什么場景下都可以用就意味著什么場景下都不會(huì)有很高的性能。

malloc性能不高的原因一在于其沒有為特定場景做優(yōu)化，除此之外還在于malloc看似簡單，但是其調(diào)用過程是很復(fù)雜的，一次malloc的調(diào)用過程可能需要經(jīng)過操作系統(tǒng)的配合才能完成。那么調(diào)用malloc時(shí)底層都發(fā)生了什么呢？簡單來說會(huì)有這樣典型的幾個(gè)步驟：

malloc開始搜索空閑內(nèi)存塊，如果能找到一塊大小合適的就分配出去
如果malloc找不到一塊合適的空閑內(nèi)存，那么調(diào)用brk等系統(tǒng)調(diào)用擴(kuò)大堆區(qū)從而獲得更多的空閑內(nèi)存
malloc調(diào)用brk后開始轉(zhuǎn)入內(nèi)核態(tài)，此時(shí)操作系統(tǒng)中的虛擬內(nèi)存系統(tǒng)開始工作，擴(kuò)大進(jìn)程的堆區(qū)，注意額外擴(kuò)大的這一部分內(nèi)存僅僅是虛擬內(nèi)存，操作系統(tǒng)并沒有為此分配真正的物理內(nèi)存
brk執(zhí)行結(jié)束后返回到malloc，從內(nèi)核態(tài)切換到用戶態(tài)，malloc找到一塊合適的空閑內(nèi)存后返回

以上就是一次內(nèi)存申請的完整過程，我們可以看到，一次內(nèi)存申請過程其實(shí)是非常復(fù)雜的，既然每次分配內(nèi)存都要經(jīng)過這么復(fù)雜的過程，那么如果程序大量使用malloc申請內(nèi)存那么該程序注定無法獲得高性能。幸好，除了大眾貨的malloc，我們還可以私人定制，也就是針對特定場景自己來維護(hù)內(nèi)存申請和分配，這就是高性能高并發(fā)必備的內(nèi)存池技術(shù)。

內(nèi)存池技術(shù)有什么特殊的嗎？

有的同學(xué)可能會(huì)說，等等，那malloc和這里提到的內(nèi)存池技術(shù)有什么區(qū)別呢？第一個(gè)區(qū)別在于我們所說的malloc其實(shí)是標(biāo)準(zhǔn)庫的一部分，位于標(biāo)準(zhǔn)庫這一層；而內(nèi)存池是應(yīng)用程序的一部分。

其次在于定位，我們自己實(shí)現(xiàn)的malloc其實(shí)也是定位通用性的，通用性的內(nèi)存分配器設(shè)計(jì)實(shí)現(xiàn)往往比較復(fù)雜，但是內(nèi)存池技術(shù)就不一樣了，內(nèi)存池技術(shù)專用于某個(gè)特定場景，以此優(yōu)化程序性能，但內(nèi)存池技術(shù)的通用性是很差的，在一種場景下有很高性能的內(nèi)存池基本上沒有辦法在其它場景也能獲得高性能，甚至根本就不能用于其它場景，這就是內(nèi)存池這種技術(shù)的定位。

那么內(nèi)存池技術(shù)是怎樣優(yōu)化性能的呢？

內(nèi)存池技術(shù)原理

簡單來說，內(nèi)存池技術(shù)一次性獲取到大塊內(nèi)存，然后在其之上自己管理內(nèi)存的申請和釋放，這樣就繞過了標(biāo)準(zhǔn)庫以及操作系統(tǒng)：

也就是說，通過內(nèi)存池，一次內(nèi)存的申請?jiān)僖膊挥萌ダ@一大圈了。除此之外，我們可以根據(jù)特定的使用模式來進(jìn)一步優(yōu)化，比如在服務(wù)器端，每次用戶請求需要?jiǎng)?chuàng)建的對象可能就那幾種，那么這時(shí)我們就可以在自己的內(nèi)存池上提前創(chuàng)建出這些對象，當(dāng)業(yè)務(wù)邏輯需要時(shí)就從內(nèi)存池中申請已經(jīng)創(chuàng)建好的對象，使用完畢后還回內(nèi)存池。因此我們可以看到，這種為某些應(yīng)用場景定制的內(nèi)存池相比通用的比如malloc內(nèi)存分配器會(huì)有大的優(yōu)勢。接下來我們就著手實(shí)現(xiàn)一個(gè)。

實(shí)現(xiàn)內(nèi)存池的考慮

值得注意的是，內(nèi)存池實(shí)際上有很多的實(shí)現(xiàn)方法，在這里我們還是以服務(wù)器端編程為例來說明。假設(shè)你的服務(wù)器程序非常簡單，處理用戶請求時(shí)只使用一種對象(數(shù)據(jù)結(jié)構(gòu))，那么最簡單的就是我們提前申請出一堆來，使用的時(shí)候拿出一個(gè)，使用完后還回去：

怎么樣，足夠簡單吧！這樣的內(nèi)存池只能分配特定對象(數(shù)據(jù)結(jié)構(gòu))，當(dāng)然這樣的內(nèi)存池需要自己維護(hù)哪些對象是已經(jīng)被分配出去的，哪些是還沒有被使用的。但是，在這里我們可以實(shí)現(xiàn)一個(gè)稍微復(fù)雜一些的，那就是可以申請不同大小的內(nèi)存，而且由于是服務(wù)器端編程，那么一次用戶請求過程中我們只申請內(nèi)存，只有當(dāng)用戶請求處理完畢后一次性釋放所有內(nèi)存，從而將內(nèi)存申請釋放的開銷降低到最小。因此，你可以看到，內(nèi)存池的設(shè)計(jì)都是針對特定場景的。現(xiàn)在，有了初步的設(shè)計(jì)，接下來就是細(xì)節(jié)了。

【文章福利】小編推薦自己的Linux內(nèi)核技術(shù)交流群:【749907784】整理了一些個(gè)人覺得比較好的學(xué)習(xí)書籍、視頻資料共享在群文件里面，有需要的可以自行添加哦?。。。ê曨l教程、電子書、實(shí)戰(zhàn)項(xiàng)目及代碼)? ??

零聲白金VIP體驗(yàn)卡（含基礎(chǔ)架構(gòu)/高性能存儲(chǔ)/golang/QT/音視頻/Linux內(nèi)核）課程：

數(shù)據(jù)結(jié)構(gòu)

為了能夠分配大小可變的對象，顯然我們需要管理空閑內(nèi)存塊，我們可以用一個(gè)鏈表把所有內(nèi)存塊鏈接起來，然后使用一個(gè)指針來記錄當(dāng)前空閑內(nèi)存塊的位置，如圖所示：

從圖中我們可以看到，有兩個(gè)空閑內(nèi)存塊，空閑內(nèi)存之間使用鏈表鏈接起來，每個(gè)內(nèi)存塊都是前一個(gè)的2倍，也就是說，當(dāng)內(nèi)存池中的空閑內(nèi)存不足以分配時(shí)我們就向malloc申請內(nèi)存，只不過其大小是前一個(gè)的2倍：

其次，我們有一個(gè)指針free_ptr，指向接下來的空閑內(nèi)存塊起始位置，當(dāng)向內(nèi)存池分配內(nèi)存時(shí)找到free_ptr并判斷當(dāng)前內(nèi)存池剩余空閑是否足夠就可以了，有就分配出去并修改free_ptr，否則向malloc再次成倍申請內(nèi)存。從這里的設(shè)計(jì)可以看出，我們的內(nèi)存池其實(shí)是不會(huì)提供類似free這樣的內(nèi)存釋放函數(shù)的，如果要釋放內(nèi)存，那么會(huì)一次性將整個(gè)內(nèi)存池釋放掉，這一點(diǎn)和通用的內(nèi)存分配器是不一樣?，F(xiàn)在，我們可以分配內(nèi)存了，還有一個(gè)問題是所有內(nèi)存池設(shè)計(jì)不得不考慮的，那就是線程安全。

線程安全

顯然，內(nèi)存池不應(yīng)該局限在單線程場景，那我們的內(nèi)存池要怎樣實(shí)現(xiàn)線程安全呢？有的同學(xué)可能會(huì)說這還不簡單，直接給內(nèi)存池一把鎖保護(hù)就可以了。

這種方法是不是可行呢？還是那句話，It depends，要看情況。如果你的程序有大量線程申請釋放內(nèi)存，那么這種方案下鎖的競爭將會(huì)非常激烈，線程這樣的場景下使用該方案不會(huì)有很好的性能。那么還有沒有一種更好的辦法嗎？答案是肯定的。

線程局部存儲(chǔ)

既然多線程使用線程池存在競爭問題，那么干脆我們?yōu)槊總€(gè)線程維護(hù)一個(gè)內(nèi)存池就好了，這樣多線程間就不存在競爭問題了。那么我們該怎樣為每個(gè)線程維護(hù)一個(gè)內(nèi)存池呢？線程局部存儲(chǔ)，Thread Local Storage正是用于解決這一類問題的，什么是線程局部存儲(chǔ)呢？簡單說就是，我們可以創(chuàng)建一個(gè)全局變量，因此所有線程都可以使用該全局變量，但與此同時(shí)，我們將該全局變量聲明為線程私有存儲(chǔ)，那么這時(shí)雖然所有線程依然看似使用同一個(gè)全局變量，但該全局變量在每個(gè)線程中都有自己的副本，變量指向的值是線程私有的，相互之間不會(huì)干擾。

假設(shè)這個(gè)全局變量是一個(gè)整數(shù)，變量名字為global_value，初始值為100，那么當(dāng)線程A將global_value修改為200時(shí)，線程B看到的global_value的值依然為100，只有線程A看到的global_value為200，這就是線程局部存儲(chǔ)的作用。

線程局部存儲(chǔ)+內(nèi)存池

有了線程局部存儲(chǔ)問題就簡單了，我們可以將內(nèi)存池聲明為線程局部存儲(chǔ)，這樣每個(gè)線程都只會(huì)操作屬于自己的內(nèi)存池，這樣就再也不會(huì)有鎖競爭問題了。

注意，雖然這里給出了線程局部存儲(chǔ)的設(shè)計(jì)，但并不是說加鎖的方案就比不上線程局部存儲(chǔ)方案，還是那句話，一切要看使用場景，如果加鎖的方案夠用，那么我們就沒有必要絞盡腦汁的去用其它方案，因?yàn)榧渔i的方案更簡單，代碼也更容易維護(hù)。還需要提醒的是，這里只是給出了內(nèi)存池的一種實(shí)現(xiàn)方法，并不是說所有內(nèi)存池都要這么設(shè)計(jì)，內(nèi)存池可以簡單也可復(fù)雜，一切要看實(shí)際場景，這一點(diǎn)也需要注意。

其它內(nèi)存池形式

到目前為止我們給出了兩種內(nèi)存池的設(shè)計(jì)方法，第一種是提前創(chuàng)建出一堆需要的對象(數(shù)據(jù)結(jié)構(gòu))，自己維護(hù)好哪些對象(數(shù)據(jù)結(jié)構(gòu))可用哪些已被分配；第二種可以申請任意大小的內(nèi)存空間，使用過程中只申請不釋放，最后一次性釋放。這兩種內(nèi)存池天然適用于服務(wù)器端編程。最后我們再來介紹一種內(nèi)存池實(shí)現(xiàn)技術(shù)，這種內(nèi)存池會(huì)提前申請出一大段內(nèi)存，然后將這一大段內(nèi)存切分為大小相同的小內(nèi)存塊：

然后我們自己來維護(hù)這些被切分出來的小內(nèi)存塊哪些是空閑的哪些是已經(jīng)被分配的，比如我們可以使用棧這種數(shù)據(jù)結(jié)構(gòu)，最初把所有空閑內(nèi)存塊地址push到棧中，分配內(nèi)存是就pop出來一個(gè)，用戶使用完畢后再push回棧里。

從這里的設(shè)計(jì)我們可以看出，這種內(nèi)存池有一個(gè)限制，這個(gè)限制就是說程序申請的最大內(nèi)存不能超過這里內(nèi)存塊的大小，否則不足以裝下用戶數(shù)據(jù)，這需要我們對程序所涉及的業(yè)務(wù)非常了解才可以。用戶申請到內(nèi)存后根據(jù)需要將其塑造成特定對象(數(shù)據(jù)結(jié)構(gòu))。關(guān)于線程安全的問題，可以同樣采用線程局部存儲(chǔ)的方式來實(shí)現(xiàn)：

一個(gè)有趣的問題

除了線程安全，這里還有一個(gè)非常有趣的問題，那就是如果線程A申請的對象被線程B拿去釋放，我們的內(nèi)存池該怎么處理呢？這個(gè)問題之所以有趣是因?yàn)槲覀?strong>必須知道該內(nèi)存屬于哪個(gè)線程的局部存儲(chǔ)，但申請的內(nèi)存本身并不能告訴你這樣的信息。有的同學(xué)可能會(huì)說這還不簡單，不就是一個(gè)指針到另一個(gè)指針的映射嗎，直接用map之類存起來就好了，但問題并沒有這么簡單，原因就在于如果我們切分的內(nèi)存塊很小，那么會(huì)存在大量內(nèi)存塊，這就需要存儲(chǔ)大量的映射關(guān)系，有沒有辦法改進(jìn)呢？改進(jìn)方法是這樣的，一般來說，我們申請到的大段內(nèi)存其實(shí)是會(huì)按照特定大小進(jìn)行內(nèi)存對齊，我們假設(shè)總是按照4K字節(jié)對齊，那么該大段內(nèi)存的起始地址后12個(gè)bit(4K = 2^12)為總是0，比如地址0x9abcd000，同時(shí)我們也假設(shè)申請到的大段內(nèi)存大小也是4K：

那么我們就能知道該大段內(nèi)存中的各個(gè)小內(nèi)存塊起始地址除了后12個(gè)bit位外都是一樣的：

這樣拿到任意一個(gè)內(nèi)存的地址我們就能知道對應(yīng)的大段內(nèi)存的起始地址，只需要簡單的將后12個(gè)bit置為0即可，有了大段內(nèi)存的起始地址剩下的就簡單了，我們可以在大段內(nèi)存中的最后保存對應(yīng)的線程局部存儲(chǔ)信息：

這樣我們對任意一個(gè)內(nèi)存塊地址進(jìn)行簡單的位運(yùn)算就可以得到對應(yīng)的線程局部存儲(chǔ)信息，大大減少了維護(hù)映射信息對內(nèi)存的占用。

總結(jié)

內(nèi)存池是高性能服務(wù)器中常見的一種優(yōu)化技術(shù)，在這里我們介紹了三種實(shí)現(xiàn)方法，值得注意的是，內(nèi)存池實(shí)現(xiàn)沒有統(tǒng)一標(biāo)準(zhǔn)，一切都要根據(jù)具體場景定制，因此我們可以看到內(nèi)存池設(shè)計(jì)是有針對性的，當(dāng)然其反面就是不具備通用性。

原文作者：碼農(nóng)的荒島求生

標(biāo)簽：