最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

深入講解內(nèi)存分配函數(shù) malloc 原理及實現(xiàn)

2023-09-08 16:14 作者:補(bǔ)給站Linux內(nèi)核  | 我要投稿

任何一個用過或?qū)W過C的人對 malloc 都不會陌生。大家都知道m(xù)alloc可以分配一段連續(xù)的內(nèi)存空間,并且在不再使用時可以通過free釋放掉。但是,許多程序員對malloc背后的事情并不熟悉,許多人甚至把malloc當(dāng)做操作系統(tǒng)所提供的系統(tǒng)調(diào)用或C的關(guān)鍵字。

實際上,malloc只是C的標(biāo)準(zhǔn)庫中提供的一個普通函數(shù),而且實現(xiàn)malloc的基本思想并不復(fù)雜,任何一個對C和操作系統(tǒng)有些許了解的程序員都可以很容易理解。

這篇文章通過實現(xiàn)一個簡單的 malloc 來描述 malloc 背后的機(jī)制。當(dāng)然與現(xiàn)有 C 的標(biāo)準(zhǔn)庫實現(xiàn)(例如glibc)相比,我們實現(xiàn)的 malloc 并不是特別高效,但是這個實現(xiàn)比目前真實的 malloc 實現(xiàn)要簡單很多,因此易于理解。重要的是,這個實現(xiàn)和真實實現(xiàn)在基本原理上是一致的。

這篇文章將首先介紹一些所需的基本知識,如操作系統(tǒng)對進(jìn)程的內(nèi)存管理以及相關(guān)的系統(tǒng)調(diào)用,然后逐步實現(xiàn)一個簡單的malloc。為了簡單起見,這篇文章將只考慮x86_64 體系結(jié)構(gòu),操作系統(tǒng)為Linux。

1 什么是malloc

在實現(xiàn)malloc之前,先要相對正式地對malloc做一個定義。

根據(jù)標(biāo)準(zhǔn)C庫函數(shù)的定義,malloc具有如下原型:

這個函數(shù)要實現(xiàn)的功能是在系統(tǒng)中分配一段連續(xù)的可用的內(nèi)存,具體有如下要求:

  • malloc分配的內(nèi)存大小至少為size參數(shù)所指定的字節(jié)數(shù)

  • malloc的返回值是一個指針,指向一段可用內(nèi)存的起始地址

  • 多次調(diào)用malloc所分配的地址不能有重疊部分,除非某次malloc所分配的地址被釋放掉

  • malloc應(yīng)該盡快完成內(nèi)存分配并返回(不能使用NP-hard[1]的內(nèi)存分配算法)

  • 實現(xiàn)malloc時應(yīng)同時實現(xiàn)內(nèi)存大小調(diào)整和內(nèi)存釋放函數(shù)(即realloc和free)

對于malloc更多的說明可以在命令行中鍵入以下命令查看:

2 預(yù)備知識

在實現(xiàn)malloc之前,需要先解釋一些Linux系統(tǒng)內(nèi)存相關(guān)的知識。

2.1 Linux內(nèi)存管理

2.1.1 虛擬內(nèi)存地址與物理內(nèi)存地址

為了簡單,現(xiàn)代操作系統(tǒng)在處理內(nèi)存地址時,普遍采用虛擬內(nèi)存地址技術(shù)。即在匯編程序(或機(jī)器語言)層面,當(dāng)涉及內(nèi)存地址時,都是使用虛擬內(nèi)存地址。采用這種技術(shù)時,每個進(jìn)程仿佛自己獨享一片2N字節(jié)的內(nèi)存,其中N是機(jī)器位數(shù)。例如在64位CPU和64位操作系統(tǒng)下,每個進(jìn)程的虛擬地址空間為264Byte。

這種虛擬地址空間的作用主要是簡化程序的編寫及方便操作系統(tǒng)對進(jìn)程間內(nèi)存的隔離管理,真實中的進(jìn)程不太可能(也用不到)如此大的內(nèi)存空間,實際能用到的內(nèi)存取決于物理內(nèi)存大小。

由于在機(jī)器語言層面都是采用虛擬地址,當(dāng)實際的機(jī)器碼程序涉及到內(nèi)存操作時,需要根據(jù)當(dāng)前進(jìn)程運(yùn)行的實際上下文將虛擬地址轉(zhuǎn)換為物理內(nèi)存地址,才能實現(xiàn)對真實內(nèi)存數(shù)據(jù)的操作。這個轉(zhuǎn)換一般由一個叫MMU[2](Memory Management Unit)的硬件完成。

2.1.2 頁與地址構(gòu)成

在現(xiàn)代操作系統(tǒng)中,不論是虛擬內(nèi)存還是物理內(nèi)存,都不是以字節(jié)為單位進(jìn)行管理的,而是以頁(Page)為單位。一個內(nèi)存頁是一段固定大小的連續(xù)內(nèi)存地址的總稱,具體到Linux中,典型的內(nèi)存頁大小為4096Byte(4K)。

所以內(nèi)存地址可以分為頁號和頁內(nèi)偏移量。下面以64位機(jī)器,4G物理內(nèi)存,4K頁大小為例,虛擬內(nèi)存地址和物理內(nèi)存地址的組成如下:

上面是虛擬內(nèi)存地址,下面是物理內(nèi)存地址。由于頁大小都是4K,所以頁內(nèi)偏移都是用低12位表示,而剩下的高地址表示頁號。

MMU映射單位并不是字節(jié),而是頁,這個映射通過查一個常駐內(nèi)存的數(shù)據(jù)結(jié)構(gòu)頁表[3]來實現(xiàn)。現(xiàn)在計算機(jī)具體的內(nèi)存地址映射比較復(fù)雜,為了加快速度會引入一系列緩存和優(yōu)化,例如TLB[4]等機(jī)制。

下面給出一個經(jīng)過簡化的內(nèi)存地址翻譯示意圖,雖然經(jīng)過了簡化,但是基本原理與現(xiàn)代計算機(jī)真實的情況是一致的。

2.1.3 內(nèi)存頁與磁盤頁

我們知道一般將內(nèi)存看做磁盤的的緩存,有時MMU在工作時,會發(fā)現(xiàn)頁表表明某個內(nèi)存頁不在物理內(nèi)存中,此時會觸發(fā)一個缺頁異常(Page Fault),此時系統(tǒng)會到磁盤中相應(yīng)的地方將磁盤頁載入到內(nèi)存中,然后重新執(zhí)行由于缺頁而失敗的機(jī)器指令。關(guān)于這部分,因為可以看做對malloc實現(xiàn)是透明的,所以不再詳細(xì)講述,有興趣的可以參考《深入理解計算機(jī)系統(tǒng)》相關(guān)章節(jié)。

最后附上一張在維基百科找到的更加符合真實地址翻譯的流程供大家參考,這張圖加入了TLB和缺頁異常的流程。


2.2 Linux進(jìn)程級內(nèi)存管理

2.2.1 內(nèi)存排布

明白了虛擬內(nèi)存和物理內(nèi)存的關(guān)系及相關(guān)的映射機(jī)制,下面看一下具體在一個進(jìn)程內(nèi)是如何排布內(nèi)存的。

以Linux 64位系統(tǒng)為例。理論上,64bit內(nèi)存地址可用空間為0x0000000000000000 ~ 0xFFFFFFFFFFFFFFFF,這是個相當(dāng)龐大的空間,Linux實際上只用了其中一小部分(256T)。

根據(jù)Linux內(nèi)核相關(guān)文檔[6]描述,Linux64位操作系統(tǒng)僅使用低47位,高17位做擴(kuò)展(只能是全0或全1)。所以,實際用到的地址為空間為0x0000000000000000 ~ 0x00007FFFFFFFFFFF和0xFFFF800000000000 ~ 0xFFFFFFFFFFFFFFFF,其中前面為用戶空間(User Space),后者為內(nèi)核空間(Kernel Space)。圖示如下:

對用戶來說,主要關(guān)注的空間是User Space。將User Space放大后,可以看到里面主要分為如下幾段:

  • Code:這是整個用戶空間的最低地址部分,存放的是指令(也就是程序所編譯成的可執(zhí)行機(jī)器碼)

  • Data:這里存放的是初始化過的全局變量

  • BSS:這里存放的是未初始化的全局變量

  • Heap:堆,這是我們本文重點關(guān)注的地方,堆自低地址向高地址增長,后面要講到的brk相關(guān)的系統(tǒng)調(diào)用就是從這里分配內(nèi)存

  • Mapping Area:這里是與mmap系統(tǒng)調(diào)用相關(guān)的區(qū)域。大多數(shù)實際的malloc實現(xiàn)會考慮通過mmap分配較大塊的內(nèi)存區(qū)域,本文不討論這種情況。這個區(qū)域自高地址向低地址增長

  • Stack:這是棧區(qū)域,自高地址向低地址增長

下面我們主要關(guān)注Heap區(qū)域的操作。對整個Linux內(nèi)存排布有興趣的同學(xué)可以參考其它資料。

2.2.2 Heap內(nèi)存模型

一般來說,malloc所申請的內(nèi)存主要從Heap區(qū)域分配(本文不考慮通過mmap申請大塊內(nèi)存的情況)。

由上文知道,進(jìn)程所面對的虛擬內(nèi)存地址空間,只有按頁映射到物理內(nèi)存地址,才能真正使用。受物理存儲容量限制,整個堆虛擬內(nèi)存空間不可能全部映射到實際的物理內(nèi)存。Linux對堆的管理示意如下:

Linux維護(hù)一個break指針,這個指針指向堆空間的某個地址。從堆起始地址到break之間的地址空間為映射好的,可以供進(jìn)程訪問;而從break往上,是未映射的地址空間,如果訪問這段空間則程序會報錯。

2.2.3 brk與sbrk

由上文知道,要增加一個進(jìn)程實際的可用堆大小,就需要將break指針向高地址移動。Linux通過brk和sbrk系統(tǒng)調(diào)用操作break指針。兩個系統(tǒng)調(diào)用的原型如下:


brk將break指針直接設(shè)置為某個地址,而sbrk將break從當(dāng)前位置移動increment所指定的增量。brk在執(zhí)行成功時返回0,否則返回-1并設(shè)置errno為ENOMEM;sbrk成功時返回break移動之前所指向的地址,否則返回(void *)-1。

一個小技巧是,如果將increment設(shè)置為0,則可以獲得當(dāng)前break的地址。

另外需要注意的是,由于Linux是按頁進(jìn)行內(nèi)存映射的,所以如果break被設(shè)置為沒有按頁大小對齊,則系統(tǒng)實際上會在最后映射一個完整的頁,從而實際已映射的內(nèi)存空間比break指向的地方要大一些。但是使用break之后的地址是很危險的(盡管也許break之后確實有一小塊可用內(nèi)存地址)。

2.2.4 資源限制與rlimit

系統(tǒng)對每一個進(jìn)程所分配的資源不是無限的,包括可映射的內(nèi)存空間,因此每個進(jìn)程有一個rlimit表示當(dāng)前進(jìn)程可用的資源上限。

這個限制可以通過getrlimit系統(tǒng)調(diào)用得到,下面代碼獲取當(dāng)前進(jìn)程虛擬內(nèi)存空間的rlimit:

其中rlimit是一個結(jié)構(gòu)體:


每種資源有軟限制和硬限制,并且可以通過setrlimit對rlimit進(jìn)行有條件設(shè)置。其中硬限制作為軟限制的上限,非特權(quán)進(jìn)程只能設(shè)置軟限制,且不能超過硬限制。


【文章福利】小編推薦自己的Linux內(nèi)核技術(shù)交流群:【749907784】整理了一些個人覺得比較好的學(xué)習(xí)書籍、視頻資料共享在群文件里面,有需要的可以自行添加哦?。。。ê曨l教程、電子書、實戰(zhàn)項目及代碼)? ? ? ?



3 實現(xiàn)malloc

3.1 玩具實現(xiàn)

在正式開始討論malloc的實現(xiàn)前,我們可以利用上述知識實現(xiàn)一個簡單但幾乎沒法用于真實的玩具malloc,權(quán)當(dāng)對上面知識的復(fù)習(xí):

這個malloc每次都在當(dāng)前break的基礎(chǔ)上增加size所指定的字節(jié)數(shù),并將之前break的地址返回。這個malloc由于對所分配的內(nèi)存缺乏記錄,不便于內(nèi)存釋放,所以無法用于真實場景。

3.2 正式實現(xiàn)

下面嚴(yán)肅點討論malloc的實現(xiàn)方案。

3.2.1 數(shù)據(jù)結(jié)構(gòu)

首先我們要確定所采用的數(shù)據(jù)結(jié)構(gòu)。一個簡單可行方案是將堆內(nèi)存空間以塊(Block)的形式組織起來,每個塊由meta區(qū)和數(shù)據(jù)區(qū)組成,meta區(qū)記錄數(shù)據(jù)塊的元信息(數(shù)據(jù)區(qū)大小、空閑標(biāo)志位、指針等等),數(shù)據(jù)區(qū)是真實分配的內(nèi)存區(qū)域,并且數(shù)據(jù)區(qū)的第一個字節(jié)地址即為malloc返回的地址。

可以用如下結(jié)構(gòu)體定義一個block:

由于我們只考慮64位機(jī)器,為了方便,我們在結(jié)構(gòu)體最后填充一個int,使得結(jié)構(gòu)體本身的長度為8的倍數(shù),以便內(nèi)存對齊。示意圖如下:

3.2.2 尋找合適的block

現(xiàn)在考慮如何在block鏈中查找合適的block。一般來說有兩種查找算法:

  • First fit:從頭開始,使用第一個數(shù)據(jù)區(qū)大小大于要求size的塊所謂此次分配的塊

  • Best fit:從頭開始,遍歷所有塊,使用數(shù)據(jù)區(qū)大小大于size且差值最小的塊作為此次分配的塊

兩種方法各有千秋,best fit具有較高的內(nèi)存使用率(payload較高),而first fit具有更好的運(yùn)行效率。這里我們采用first fit算法。

find_block從frist_block開始,查找第一個符合要求的block并返回block起始地址,如果找不到這返回NULL。

這里在遍歷時會更新一個叫l(wèi)ast的指針,這個指針始終指向當(dāng)前遍歷的block。這是為了如果找不到合適的block而開辟新block使用的,具體會在接下來的一節(jié)用到。

3.2.3 開辟新的block

如果現(xiàn)有block都不能滿足size的要求,則需要在鏈表最后開辟一個新的block。這里關(guān)鍵是如何只使用sbrk創(chuàng)建一個struct:

3.2.4 分裂block

First fit有一個比較致命的缺點,就是可能會讓很小的size占據(jù)很大的一塊block,此時,為了提高payload,應(yīng)該在剩余數(shù)據(jù)區(qū)足夠大的情況下,將其分裂為一個新的block,示意如下:

實現(xiàn)代碼:

3.2.5 malloc的實現(xiàn)

有了上面的代碼,我們可以利用它們整合成一個簡單但初步可用的malloc。注意首先我們要定義個block鏈表的頭first_block,初始化為NULL;另外,我們需要剩余空間至少有BLOCK_SIZE + 8才執(zhí)行分裂操作。

由于我們希望malloc分配的數(shù)據(jù)區(qū)是按8字節(jié)對齊,所以在size不為8的倍數(shù)時,我們需要將size調(diào)整為大于size的最小的8的倍數(shù):

3.2.6 calloc的實現(xiàn)

有了malloc,實現(xiàn)calloc只要兩步:

  1. malloc一段內(nèi)存

  2. 將數(shù)據(jù)區(qū)內(nèi)容置為0

由于我們的數(shù)據(jù)區(qū)是按8字節(jié)對齊的,所以為了提高效率,我們可以每8字節(jié)一組置0,而不是一個一個字節(jié)設(shè)置。我們可以通過新建一個size_t指針,將內(nèi)存區(qū)域強(qiáng)制看做size_t類型來實現(xiàn)。



3.2.7 free的實現(xiàn)

free的實現(xiàn)并不像看上去那么簡單,這里我們要解決兩個關(guān)鍵問題:

  1. 如何驗證所傳入的地址是有效地址,即確實是通過malloc方式分配的數(shù)據(jù)區(qū)首地址

  2. 如何解決碎片問題

首先我們要保證傳入free的地址是有效的,這個有效包括兩方面:

  • 地址應(yīng)該在之前malloc所分配的區(qū)域內(nèi),即在first_block和當(dāng)前break指針范圍內(nèi)

  • 這個地址確實是之前通過我們自己的malloc分配的

第一個問題比較好解決,只要進(jìn)行地址比較就可以了,關(guān)鍵是第二個問題。

這里有兩種解決方案:一是在結(jié)構(gòu)體內(nèi)埋一個magic number字段,free之前通過相對偏移檢查特定位置的值是否為我們設(shè)置的magic number,另一種方法是在結(jié)構(gòu)體內(nèi)增加一個magic pointer,這個指針指向數(shù)據(jù)區(qū)的第一個字節(jié)(也就是在合法時free時傳入的地址),我們在free前檢查magic pointer是否指向參數(shù)所指地址。這里我們采用第二種方案:

首先我們在結(jié)構(gòu)體中增加magic pointer(同時要修改BLOCK_SIZE):


然后我們定義檢查地址合法性的函數(shù):

當(dāng)多次malloc和free后,整個內(nèi)存池可能會產(chǎn)生很多碎片block,這些block很小,經(jīng)常無法使用,甚至出現(xiàn)許多碎片連在一起,雖然總體能滿足malloc要求,但是由于分割成了多個小block而無法fit,這就是碎片問題。

一個簡單的解決方式是當(dāng)free某個block時,如果發(fā)現(xiàn)它相鄰的block也是free的,則將block和相鄰block合并。為了滿足這個實現(xiàn),需要將s_block改為雙向鏈表。

修改后的block結(jié)構(gòu)如下:

合并方法如下:

有了上述方法,free的實現(xiàn)思路就比較清晰了:首先檢查參數(shù)地址的合法性,如果不合法則不做任何事;否則,將此block的free標(biāo)為1,并且在可以的情況下與后面的block進(jìn)行合并。

如果當(dāng)前是最后一個block,則回退break指針釋放進(jìn)程內(nèi)存,如果當(dāng)前block是最后一個block,則回退break指針并設(shè)置first_block為NULL。實現(xiàn)如下:

3.2.8 realloc的實現(xiàn)

為了實現(xiàn)realloc,我們首先要實現(xiàn)一個內(nèi)存復(fù)制方法。如同calloc一樣,為了效率,我們以8字節(jié)為單位進(jìn)行復(fù)制:

然后我們開始實現(xiàn)realloc。一個簡單(但是低效)的方法是malloc一段內(nèi)存,然后將數(shù)據(jù)復(fù)制過去。但是我們可以做得更高效,具體可以考慮以下幾個方面:

  • 如果當(dāng)前block的數(shù)據(jù)區(qū)大于等于realloc所要求的size,則不做任何操作

  • 如果新的size變小了,考慮split

  • 如果當(dāng)前block的數(shù)據(jù)區(qū)不能滿足size,但是其后繼block是free的,并且合并后可以滿足,則考慮做合并

下面是realloc的實現(xiàn):

3.3 遺留問題和優(yōu)化

以上是一個較為簡陋,但是初步可用的malloc實現(xiàn)。還有很多遺留的可能優(yōu)化點,例如:

  • 同時兼容32位和64位系統(tǒng)

  • 在分配較大塊內(nèi)存時,考慮使用mmap而非sbrk,這通常更高效

  • 可以考慮維護(hù)多個鏈表而非單個,每個鏈表中的block大小均為一個范圍內(nèi),例如8字節(jié)鏈表、16字節(jié)鏈表、24-32字節(jié)鏈表等等。此時可以根據(jù)size到對應(yīng)鏈表中做分配,可以有效減少碎片,并提高查詢block的速度

  • 可以考慮鏈表中只存放free的block,而不存放已分配的block,可以減少查找block的次數(shù),提高效率

原文作者:一起學(xué)嵌入式



深入講解內(nèi)存分配函數(shù) malloc 原理及實現(xiàn)的評論 (共 條)

分享到微博請遵守國家法律
永寿县| 南宫市| 获嘉县| 聂荣县| 乐至县| 临夏县| 惠东县| 惠州市| 宜章县| 洛宁县| 泸西县| 灌南县| 渝北区| 会东县| 巴塘县| 鄯善县| 韶关市| 博罗县| 通江县| 白玉县| 浦城县| 桂平市| 皮山县| 翁源县| 改则县| 日土县| 保德县| 四子王旗| 邻水| 沂南县| 济源市| 达拉特旗| 鹤峰县| 双鸭山市| 铅山县| 密云县| 友谊县| 涿鹿县| 黔江区| 宣武区| 邳州市|