最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊

18張圖揭秘高性能Linux服務(wù)器內(nèi)存池技術(shù)是如何實(shí)現(xiàn)的

2023-11-03 14:32 作者:補(bǔ)給站Linux內(nèi)核  | 我要投稿

大家生活中肯定都有這樣的經(jīng)驗(yàn),那就是大眾化的產(chǎn)品都比較便宜,但便宜的大眾產(chǎn)品就是一個(gè)詞,普通;而可以定制的產(chǎn)品一般都價(jià)位不凡,這種定制的產(chǎn)品注定不會(huì)在大眾中普及,因此定制產(chǎn)品就是一個(gè)詞,獨(dú)特。

有的同學(xué)可能會(huì)有疑問,你不是要聊技術(shù)嗎?怎么又說起消費(fèi)了?

原來技術(shù)也有大眾貨以及定制品。


通用 VS 定制

作為程序員(C/C++)我們知道申請內(nèi)存使用的是malloc,malloc其實(shí)就是一個(gè)通用的大眾貨,什么場景下都可以用,但是什么場景下都可以用就意味著什么場景下都不會(huì)有很高的性能。

malloc性能不高的原因一在于其沒有為特定場景做優(yōu)化,除此之外還在于malloc看似簡單,但是其調(diào)用過程是很復(fù)雜的,一次malloc的調(diào)用過程可能需要經(jīng)過操作系統(tǒng)的配合才能完成。那么調(diào)用malloc時(shí)底層都發(fā)生了什么呢?簡單來說會(huì)有這樣典型的幾個(gè)步驟:

  1. malloc開始搜索空閑內(nèi)存塊,如果能找到一塊大小合適的就分配出去

  2. 如果malloc找不到一塊合適的空閑內(nèi)存,那么調(diào)用brk等系統(tǒng)調(diào)用擴(kuò)大堆區(qū)從而獲得更多的空閑內(nèi)存

  3. malloc調(diào)用brk后開始轉(zhuǎn)入內(nèi)核態(tài),此時(shí)操作系統(tǒng)中的虛擬內(nèi)存系統(tǒng)開始工作,擴(kuò)大進(jìn)程的堆區(qū),注意額外擴(kuò)大的這一部分內(nèi)存僅僅是虛擬內(nèi)存,操作系統(tǒng)并沒有為此分配真正的物理內(nèi)存

  4. brk執(zhí)行結(jié)束后返回到malloc,從內(nèi)核態(tài)切換到用戶態(tài),malloc找到一塊合適的空閑內(nèi)存后返回

以上就是一次內(nèi)存申請的完整過程,我們可以看到,一次內(nèi)存申請過程其實(shí)是非常復(fù)雜的,既然每次分配內(nèi)存都要經(jīng)過這么復(fù)雜的過程,那么如果程序大量使用malloc申請內(nèi)存那么該程序注定無法獲得高性能。幸好,除了大眾貨的malloc,我們還可以私人定制,也就是針對特定場景自己來維護(hù)內(nèi)存申請和分配,這就是高性能高并發(fā)必備的內(nèi)存池技術(shù)。

內(nèi)存池技術(shù)有什么特殊的嗎?

有的同學(xué)可能會(huì)說,等等,那malloc和這里提到的內(nèi)存池技術(shù)有什么區(qū)別呢?第一個(gè)區(qū)別在于我們所說的malloc其實(shí)是標(biāo)準(zhǔn)庫的一部分,位于標(biāo)準(zhǔn)庫這一層;而內(nèi)存池是應(yīng)用程序的一部分。

其次在于定位,我們自己實(shí)現(xiàn)的malloc其實(shí)也是定位通用性的,通用性的內(nèi)存分配器設(shè)計(jì)實(shí)現(xiàn)往往比較復(fù)雜,但是內(nèi)存池技術(shù)就不一樣了,內(nèi)存池技術(shù)專用于某個(gè)特定場景,以此優(yōu)化程序性能,但內(nèi)存池技術(shù)的通用性是很差的,在一種場景下有很高性能的內(nèi)存池基本上沒有辦法在其它場景也能獲得高性能,甚至根本就不能用于其它場景,這就是內(nèi)存池這種技術(shù)的定位。

那么內(nèi)存池技術(shù)是怎樣優(yōu)化性能的呢?

內(nèi)存池技術(shù)原理

簡單來說,內(nèi)存池技術(shù)一次性獲取到大塊內(nèi)存,然后在其之上自己管理內(nèi)存的申請和釋放,這樣就繞過了標(biāo)準(zhǔn)庫以及操作系統(tǒng)

也就是說,通過內(nèi)存池,一次內(nèi)存的申請?jiān)僖膊挥萌ダ@一大圈了。除此之外,我們可以根據(jù)特定的使用模式來進(jìn)一步優(yōu)化,比如在服務(wù)器端,每次用戶請求需要?jiǎng)?chuàng)建的對象可能就那幾種,那么這時(shí)我們就可以在自己的內(nèi)存池上提前創(chuàng)建出這些對象,當(dāng)業(yè)務(wù)邏輯需要時(shí)就從內(nèi)存池中申請已經(jīng)創(chuàng)建好的對象,使用完畢后還回內(nèi)存池。因此我們可以看到,這種為某些應(yīng)用場景定制的內(nèi)存池相比通用的比如malloc內(nèi)存分配器會(huì)有大的優(yōu)勢。接下來我們就著手實(shí)現(xiàn)一個(gè)。

實(shí)現(xiàn)內(nèi)存池的考慮

值得注意的是,內(nèi)存池實(shí)際上有很多的實(shí)現(xiàn)方法,在這里我們還是以服務(wù)器端編程為例來說明。假設(shè)你的服務(wù)器程序非常簡單,處理用戶請求時(shí)只使用一種對象(數(shù)據(jù)結(jié)構(gòu)),那么最簡單的就是我們提前申請出一堆來,使用的時(shí)候拿出一個(gè),使用完后還回去:

怎么樣,足夠簡單吧!這樣的內(nèi)存池只能分配特定對象(數(shù)據(jù)結(jié)構(gòu)),當(dāng)然這樣的內(nèi)存池需要自己維護(hù)哪些對象是已經(jīng)被分配出去的,哪些是還沒有被使用的。但是,在這里我們可以實(shí)現(xiàn)一個(gè)稍微復(fù)雜一些的,那就是可以申請不同大小的內(nèi)存,而且由于是服務(wù)器端編程,那么一次用戶請求過程中我們只申請內(nèi)存,只有當(dāng)用戶請求處理完畢后一次性釋放所有內(nèi)存,從而將內(nèi)存申請釋放的開銷降低到最小。因此,你可以看到,內(nèi)存池的設(shè)計(jì)都是針對特定場景的。現(xiàn)在,有了初步的設(shè)計(jì),接下來就是細(xì)節(jié)了。


【文章福利】小編推薦自己的Linux內(nèi)核技術(shù)交流群:【749907784】整理了一些個(gè)人覺得比較好的學(xué)習(xí)書籍、視頻資料共享在群文件里面,有需要的可以自行添加哦?。。。ê曨l教程、電子書、實(shí)戰(zhàn)項(xiàng)目及代碼)? ??

零聲白金VIP體驗(yàn)卡(含基礎(chǔ)架構(gòu)/高性能存儲(chǔ)/golang/QT/音視頻/Linux內(nèi)核)課程:


數(shù)據(jù)結(jié)構(gòu)

為了能夠分配大小可變的對象,顯然我們需要管理空閑內(nèi)存塊,我們可以用一個(gè)鏈表把所有內(nèi)存塊鏈接起來,然后使用一個(gè)指針來記錄當(dāng)前空閑內(nèi)存塊的位置,如圖所示:

從圖中我們可以看到,有兩個(gè)空閑內(nèi)存塊,空閑內(nèi)存之間使用鏈表鏈接起來,每個(gè)內(nèi)存塊都是前一個(gè)的2倍,也就是說,當(dāng)內(nèi)存池中的空閑內(nèi)存不足以分配時(shí)我們就向malloc申請內(nèi)存,只不過其大小是前一個(gè)的2倍:

其次,我們有一個(gè)指針free_ptr,指向接下來的空閑內(nèi)存塊起始位置,當(dāng)向內(nèi)存池分配內(nèi)存時(shí)找到free_ptr并判斷當(dāng)前內(nèi)存池剩余空閑是否足夠就可以了,有就分配出去并修改free_ptr,否則向malloc再次成倍申請內(nèi)存。從這里的設(shè)計(jì)可以看出,我們的內(nèi)存池其實(shí)是不會(huì)提供類似free這樣的內(nèi)存釋放函數(shù)的,如果要釋放內(nèi)存,那么會(huì)一次性將整個(gè)內(nèi)存池釋放掉,這一點(diǎn)和通用的內(nèi)存分配器是不一樣?,F(xiàn)在,我們可以分配內(nèi)存了,還有一個(gè)問題是所有內(nèi)存池設(shè)計(jì)不得不考慮的,那就是線程安全。

線程安全

顯然,內(nèi)存池不應(yīng)該局限在單線程場景,那我們的內(nèi)存池要怎樣實(shí)現(xiàn)線程安全呢?有的同學(xué)可能會(huì)說這還不簡單,直接給內(nèi)存池一把鎖保護(hù)就可以了。

這種方法是不是可行呢?還是那句話,It depends,要看情況。如果你的程序有大量線程申請釋放內(nèi)存,那么這種方案下鎖的競爭將會(huì)非常激烈,線程這樣的場景下使用該方案不會(huì)有很好的性能。那么還有沒有一種更好的辦法嗎?答案是肯定的。

線程局部存儲(chǔ)

既然多線程使用線程池存在競爭問題,那么干脆我們?yōu)槊總€(gè)線程維護(hù)一個(gè)內(nèi)存池就好了,這樣多線程間就不存在競爭問題了。那么我們該怎樣為每個(gè)線程維護(hù)一個(gè)內(nèi)存池呢?線程局部存儲(chǔ),Thread Local Storage正是用于解決這一類問題的,什么是線程局部存儲(chǔ)呢?簡單說就是,我們可以創(chuàng)建一個(gè)全局變量,因此所有線程都可以使用該全局變量,但與此同時(shí),我們將該全局變量聲明為線程私有存儲(chǔ),那么這時(shí)雖然所有線程依然看似使用同一個(gè)全局變量,但該全局變量在每個(gè)線程中都有自己的副本,變量指向的值是線程私有的,相互之間不會(huì)干擾。

假設(shè)這個(gè)全局變量是一個(gè)整數(shù),變量名字為global_value,初始值為100,那么當(dāng)線程A將global_value修改為200時(shí),線程B看到的global_value的值依然為100,只有線程A看到的global_value為200,這就是線程局部存儲(chǔ)的作用。

線程局部存儲(chǔ)+內(nèi)存池

有了線程局部存儲(chǔ)問題就簡單了,我們可以將內(nèi)存池聲明為線程局部存儲(chǔ),這樣每個(gè)線程都只會(huì)操作屬于自己的內(nèi)存池,這樣就再也不會(huì)有鎖競爭問題了。

注意,雖然這里給出了線程局部存儲(chǔ)的設(shè)計(jì),但并不是說加鎖的方案就比不上線程局部存儲(chǔ)方案,還是那句話,一切要看使用場景,如果加鎖的方案夠用,那么我們就沒有必要絞盡腦汁的去用其它方案,因?yàn)榧渔i的方案更簡單,代碼也更容易維護(hù)。還需要提醒的是,這里只是給出了內(nèi)存池的一種實(shí)現(xiàn)方法,并不是說所有內(nèi)存池都要這么設(shè)計(jì),內(nèi)存池可以簡單也可復(fù)雜,一切要看實(shí)際場景,這一點(diǎn)也需要注意。

其它內(nèi)存池形式

到目前為止我們給出了兩種內(nèi)存池的設(shè)計(jì)方法,第一種是提前創(chuàng)建出一堆需要的對象(數(shù)據(jù)結(jié)構(gòu)),自己維護(hù)好哪些對象(數(shù)據(jù)結(jié)構(gòu))可用哪些已被分配;第二種可以申請任意大小的內(nèi)存空間,使用過程中只申請不釋放,最后一次性釋放。這兩種內(nèi)存池天然適用于服務(wù)器端編程。最后我們再來介紹一種內(nèi)存池實(shí)現(xiàn)技術(shù),這種內(nèi)存池會(huì)提前申請出一大段內(nèi)存,然后將這一大段內(nèi)存切分為大小相同的小內(nèi)存塊:

然后我們自己來維護(hù)這些被切分出來的小內(nèi)存塊哪些是空閑的哪些是已經(jīng)被分配的,比如我們可以使用棧這種數(shù)據(jù)結(jié)構(gòu),最初把所有空閑內(nèi)存塊地址push到棧中,分配內(nèi)存是就pop出來一個(gè),用戶使用完畢后再push回棧里。

從這里的設(shè)計(jì)我們可以看出,這種內(nèi)存池有一個(gè)限制,這個(gè)限制就是說程序申請的最大內(nèi)存不能超過這里內(nèi)存塊的大小,否則不足以裝下用戶數(shù)據(jù),這需要我們對程序所涉及的業(yè)務(wù)非常了解才可以。用戶申請到內(nèi)存后根據(jù)需要將其塑造成特定對象(數(shù)據(jù)結(jié)構(gòu))。關(guān)于線程安全的問題,可以同樣采用線程局部存儲(chǔ)的方式來實(shí)現(xiàn):


一個(gè)有趣的問題

除了線程安全,這里還有一個(gè)非常有趣的問題,那就是如果線程A申請的對象被線程B拿去釋放,我們的內(nèi)存池該怎么處理呢?這個(gè)問題之所以有趣是因?yàn)槲覀?strong>必須知道該內(nèi)存屬于哪個(gè)線程的局部存儲(chǔ),但申請的內(nèi)存本身并不能告訴你這樣的信息。有的同學(xué)可能會(huì)說這還不簡單,不就是一個(gè)指針到另一個(gè)指針的映射嗎,直接用map之類存起來就好了,但問題并沒有這么簡單,原因就在于如果我們切分的內(nèi)存塊很小,那么會(huì)存在大量內(nèi)存塊,這就需要存儲(chǔ)大量的映射關(guān)系,有沒有辦法改進(jìn)呢?改進(jìn)方法是這樣的,一般來說,我們申請到的大段內(nèi)存其實(shí)是會(huì)按照特定大小進(jìn)行內(nèi)存對齊,我們假設(shè)總是按照4K字節(jié)對齊,那么該大段內(nèi)存的起始地址后12個(gè)bit(4K = 2^12)為總是0,比如地址0x9abcd000,同時(shí)我們也假設(shè)申請到的大段內(nèi)存大小也是4K:

那么我們就能知道該大段內(nèi)存中的各個(gè)小內(nèi)存塊起始地址除了后12個(gè)bit位外都是一樣的:

這樣拿到任意一個(gè)內(nèi)存的地址我們就能知道對應(yīng)的大段內(nèi)存的起始地址,只需要簡單的將后12個(gè)bit置為0即可,有了大段內(nèi)存的起始地址剩下的就簡單了,我們可以在大段內(nèi)存中的最后保存對應(yīng)的線程局部存儲(chǔ)信息:

這樣我們對任意一個(gè)內(nèi)存塊地址進(jìn)行簡單的位運(yùn)算就可以得到對應(yīng)的線程局部存儲(chǔ)信息,大大減少了維護(hù)映射信息對內(nèi)存的占用。

總結(jié)

內(nèi)存池是高性能服務(wù)器中常見的一種優(yōu)化技術(shù),在這里我們介紹了三種實(shí)現(xiàn)方法,值得注意的是,內(nèi)存池實(shí)現(xiàn)沒有統(tǒng)一標(biāo)準(zhǔn),一切都要根據(jù)具體場景定制,因此我們可以看到內(nèi)存池設(shè)計(jì)是有針對性的,當(dāng)然其反面就是不具備通用性。


原文作者:碼農(nóng)的荒島求生


18張圖揭秘高性能Linux服務(wù)器內(nèi)存池技術(shù)是如何實(shí)現(xiàn)的的評(píng)論 (共 條)

分享到微博請遵守國家法律
微山县| 宽城| 广水市| 乌兰察布市| 青阳县| 山丹县| 德昌县| 中西区| 博野县| 鱼台县| 城步| 岳阳市| 大足县| 佛教| 昌黎县| 闽清县| 重庆市| 镇沅| 包头市| 涟水县| 荆州市| 抚远县| 福清市| 永福县| 泗阳县| 长兴县| 太仓市| 化州市| 德令哈市| 获嘉县| 普陀区| 定襄县| 蓬安县| 汝阳县| 中宁县| 吴桥县| 龙里县| 司法| 玛纳斯县| 万山特区| 治县。|