最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

獨(dú)一無(wú)二的,linux內(nèi)存管理源碼分析-頁(yè)框分配器

2022-02-25 22:14 作者:補(bǔ)給站Linux內(nèi)核  | 我要投稿

分段和分頁(yè)

先看一幅圖


  • 也就是我們實(shí)際中編碼時(shí)遇到的內(nèi)存地址并不是對(duì)應(yīng)于實(shí)際內(nèi)存上的地址,我們編碼中使用的地址是一個(gè)邏輯地址,會(huì)通過(guò)分段和分頁(yè)這兩個(gè)機(jī)制把它轉(zhuǎn)為物理地址。而由于linux使用的分段機(jī)制有限,可以認(rèn)為,linux下的邏輯地址=線性地址。也就是,我們編碼使用的是線性地址,之后只需要經(jīng)過(guò)一個(gè)分頁(yè)機(jī)制就可以把這個(gè)地址轉(zhuǎn)為物理地址了。所以我們更重要的可能是去說(shuō)明一下linux的分頁(yè)模型。

  • 系統(tǒng)會(huì)將整個(gè)物理內(nèi)存分為多個(gè)頁(yè)框,每個(gè)頁(yè)框大小一般是4K(硬件允許的擴(kuò)展分頁(yè)(PSE)情況下也可設(shè)置為4M,不過(guò)linux并不使用PSE,而可能使用PAE),也就是如果我們有1GB的物理內(nèi)存,系統(tǒng)就會(huì)將這個(gè)物理內(nèi)存分為262144個(gè)頁(yè)框。當(dāng)我們提供一個(gè)線性地址時(shí),系統(tǒng)就會(huì)通過(guò)分頁(yè)機(jī)制將這個(gè)線性地址轉(zhuǎn)換為對(duì)應(yīng)于某個(gè)物理頁(yè)中的某個(gè)內(nèi)存地址。下圖是linux的分頁(yè)模型


  • linux采用四級(jí)分頁(yè)模型,這四種頁(yè)表是:頁(yè)全局目錄(PGD)、頁(yè)上級(jí)目錄(PUD)、頁(yè)中間目錄(PMD)、頁(yè)表(PTE)。這里的所有頁(yè)全局目錄、頁(yè)上級(jí)目錄、頁(yè)中間目錄、頁(yè)表,它們的大小都是一個(gè)頁(yè)。linux下各個(gè)硬件上并不一定都是使用四級(jí)目錄的,當(dāng)使用于沒(méi)有啟動(dòng)物理地址擴(kuò)展(PAE)的32位系統(tǒng)上時(shí),只使用二級(jí)頁(yè)表,linux會(huì)把頁(yè)上級(jí)目錄和頁(yè)中間目錄置空。而在啟用了物理地址擴(kuò)展的32位系統(tǒng)上時(shí),linux使用的是三級(jí)頁(yè)表,頁(yè)上級(jí)目錄被置空。而在64位系統(tǒng)上,linux根據(jù)硬件的情況會(huì)選擇三級(jí)頁(yè)表或者四級(jí)頁(yè)表。這個(gè)整個(gè)由線性地址轉(zhuǎn)換到物理地址的過(guò)程,是由CPU自動(dòng)進(jìn)行的。

  • 每個(gè)進(jìn)程都有它自己的頁(yè)全局目錄,當(dāng)進(jìn)程運(yùn)行時(shí),系統(tǒng)會(huì)將該進(jìn)程的頁(yè)全局目錄基地址保存到cr3寄存器中;而當(dāng)進(jìn)程被換出時(shí),會(huì)將這個(gè)cr3保存的頁(yè)全局目錄地址保存到進(jìn)程描述符中。之后我們還會(huì)介紹一個(gè)cr2寄存器,用于缺頁(yè)異常處理的。當(dāng)進(jìn)程運(yùn)行時(shí),它使用的是它自己的一套頁(yè)表,當(dāng)它通過(guò)系統(tǒng)調(diào)用或陷入內(nèi)核態(tài)時(shí),使用的是內(nèi)核頁(yè)表,實(shí)際上,對(duì)于所有的進(jìn)程頁(yè)表來(lái)說(shuō),它們的線性地址0xC0000000以上所涉及到的頁(yè)表都是主內(nèi)核頁(yè)全局目錄(保存在init_mm.pgd),它們的內(nèi)容等于主內(nèi)核頁(yè)全局目錄的相應(yīng)表項(xiàng),這樣就實(shí)現(xiàn)了所有進(jìn)程的進(jìn)程空間相互隔離,但是內(nèi)核空間相互共享的情況。當(dāng)某個(gè)進(jìn)程修改了內(nèi)核頁(yè)表的一些映射情況后,系統(tǒng)只會(huì)相應(yīng)的修改主內(nèi)核頁(yè)全局目錄中的表項(xiàng)(只能修改高端內(nèi)存中非連續(xù)內(nèi)存區(qū)的映射),當(dāng)其他進(jìn)程訪問(wèn)這些線性地址時(shí),會(huì)出現(xiàn)缺頁(yè)異常,然后修改該進(jìn)程的頁(yè)表項(xiàng)重新映射該地址。

  • 因?yàn)檎f(shuō)到每個(gè)進(jìn)程都有它自己的頁(yè)全局目錄,如果有100個(gè)進(jìn)程,內(nèi)存中就要保存100個(gè)進(jìn)程的整個(gè)頁(yè)表集,看起來(lái)會(huì)耗費(fèi)相當(dāng)多的內(nèi)存。實(shí)際上,只有進(jìn)程使用到的情況下系統(tǒng)才會(huì)分配給進(jìn)程一條路徑,比如我們要求訪問(wèn)一個(gè)線性地址,但是這個(gè)地址可能對(duì)應(yīng)的頁(yè)上級(jí)目錄、頁(yè)中間目錄、頁(yè)表和頁(yè)都不存在的,這時(shí)系統(tǒng)會(huì)產(chǎn)生一個(gè)缺頁(yè)異常,在缺頁(yè)異常處理中再給進(jìn)程的這個(gè)線性地址分配頁(yè)上級(jí)目錄、頁(yè)中間目錄、頁(yè)表和頁(yè)所需的物理頁(yè)框。

地址空間

  • 一個(gè)線性地址經(jīng)過(guò)分頁(yè)機(jī)制轉(zhuǎn)為一個(gè)對(duì)應(yīng)的物理地址,我們稱之為映射,比如我們的一個(gè)線性地址0x00000001經(jīng)過(guò)分頁(yè)機(jī)制處理后,對(duì)應(yīng)的物理地址可能是0xffffff01。

  • 在linux系統(tǒng)中分兩個(gè)地址空間,一個(gè)是進(jìn)程地址空間,一個(gè)是內(nèi)核地址空間。對(duì)于每個(gè)進(jìn)程來(lái)說(shuō),他們都有自己的大小為3G的進(jìn)程地址空間,這些進(jìn)程地址空間是相互隔離的,也就是進(jìn)程A的0x00000001線性地址和進(jìn)程B的0x00000001線性地址并不是同一個(gè)地址,進(jìn)程A也不能通過(guò)自己的進(jìn)程空間直接訪問(wèn)進(jìn)程B的進(jìn)程地址空間。而當(dāng)線性地址大于3G時(shí)(也就是0xC0000000),這里的線性地址屬于內(nèi)核空間,內(nèi)核地址空間的大小為1G,地址從0xC0000000到0xFFFFFFFF。在內(nèi)核地址空間中,內(nèi)核會(huì)把前896MB的線性地址直接與物理地址的前896MB進(jìn)行映射,也就是說(shuō),內(nèi)核地址空間的線性地址0xC0000001所對(duì)應(yīng)的物理地址為0x00000001,它們之間相差一個(gè)0xC0000000。

  • linux內(nèi)核會(huì)將物理內(nèi)存分為3個(gè)管理區(qū),分別是:

  1. ZONE_DMA:包含0MB~16MB之間的內(nèi)存頁(yè)框,可以由老式基于ISA的設(shè)備通過(guò)DMA使用,直接映射到內(nèi)核的地址空間。

  2. ZONE_NORMAL:包含16MB~896MB之間的內(nèi)存頁(yè)框,常規(guī)頁(yè)框,直接映射到內(nèi)核的地址空間。

  3. ZONE_HIGHMEM:包含896MB以上的內(nèi)存頁(yè)框,不進(jìn)行直接映射,可以通過(guò)永久映射和臨時(shí)映射進(jìn)行這部分內(nèi)存頁(yè)框的訪問(wèn)。

整個(gè)結(jié)構(gòu)如下圖


  • 對(duì)于ZONE_DMA和ZONE_NORMAL這兩個(gè)管理區(qū),內(nèi)核地址都是進(jìn)行直接映射,只有ZONE_HIGHMEM管理區(qū)系統(tǒng)在默認(rèn)情況下是不進(jìn)行直接映射的,只有在需要使用的時(shí)候進(jìn)行映射(臨時(shí)映射或者永久映射)。

結(jié)點(diǎn)和管理區(qū)描述符

為了用于NUMA架構(gòu),使用了node用來(lái)描述一個(gè)地方的內(nèi)存。對(duì)于我們PC來(lái)說(shuō),一臺(tái)PC就是一個(gè)node。node用struct pglist_data結(jié)構(gòu)表示:

  • 系統(tǒng)中所有的結(jié)點(diǎn)描述符都保存在node_data這個(gè)數(shù)組中。在pg_data_t這個(gè)結(jié)點(diǎn)描述符中,node_zones數(shù)組中保存了這個(gè)結(jié)點(diǎn)中所有的管理區(qū)描述符,雖然系統(tǒng)將物理內(nèi)存分為三個(gè)區(qū),但是在邏輯上,系統(tǒng)分為了四個(gè)管理區(qū),多出的一個(gè)是ZONE_MOVABLE,這個(gè)區(qū)是一個(gè)虛擬的管理區(qū),它并沒(méi)有對(duì)應(yīng)于內(nèi)存的某個(gè)區(qū)域,它的主要目的就是為了避免內(nèi)存碎片化,它的內(nèi)存要么全部來(lái)自ZONE_HIGHMEM區(qū),要么全部來(lái)自ZONE_NORMAL區(qū)。這些我們?cè)诤竺娴某跏蓟瘮?shù)中將會(huì)看到。

  • 每個(gè)結(jié)點(diǎn)都有一個(gè)內(nèi)核線程kswapd,它的作用就是將進(jìn)程或內(nèi)核持有的,但是不常用的頁(yè)交換到磁盤上,以騰出更多可用內(nèi)存。

我們?cè)倏纯垂芾韰^(qū)描述符:

  • 此管理區(qū)描述符中的實(shí)際把所有屬于該管理區(qū)的頁(yè)框保存在兩個(gè)地方:struct free_area free_area[MAX_ORDER]和struct per_cpu_pageset __percpu * pageset。free_area是這個(gè)管理區(qū)的伙伴系統(tǒng),而pageset是這個(gè)區(qū)的每CPU頁(yè)框高速緩存。對(duì)管理區(qū)的理解需要結(jié)合伙伴系統(tǒng)和每CPU頁(yè)框高速緩存

管理區(qū)頁(yè)框分配器(管理所有物理內(nèi)存頁(yè)框)

  • ZONE_NORMAL和ZONE_DMA的地址直接映射到了內(nèi)核地址空間,但是也不代表內(nèi)核的代碼可以隨心所欲的通過(guò)線性地址直接訪問(wèn)物理地址。內(nèi)核通過(guò)一個(gè)管理區(qū)頁(yè)框分配器管理著物理內(nèi)存上所有的頁(yè)框,在管理區(qū)分配器里的核心系統(tǒng)就是伙伴系統(tǒng)和每CPU頁(yè)框高速緩存(不是硬件上的高速緩存,只是名稱一樣)。在linux系統(tǒng)中,管理區(qū)頁(yè)框分配器管理著所有物理內(nèi)存,無(wú)論你是內(nèi)核還是進(jìn)程,需要將一些內(nèi)存占為己有時(shí),都需要請(qǐng)求管理區(qū)頁(yè)框分配器,這時(shí)才會(huì)分配給你應(yīng)該獲得的物理內(nèi)存頁(yè)框。當(dāng)你所擁有的頁(yè)框不再使用時(shí),你必須釋放這些頁(yè)框,讓這些頁(yè)框回到管理區(qū)頁(yè)框分配器當(dāng)中。特別的,對(duì)于高端內(nèi)存,即使從管理區(qū)頁(yè)框分配器中獲得了相應(yīng)的頁(yè)框,我們還需要進(jìn)行映射才能夠使用。

  • 有時(shí)候目標(biāo)管理區(qū)不一定有足夠的頁(yè)框去滿足分配,這時(shí)候系統(tǒng)會(huì)從另外兩個(gè)管理區(qū)中獲取要求的頁(yè)框,但這是按照一定規(guī)則去執(zhí)行的,如下:

  1. 如果要求從DMA區(qū)中獲取,就只能從ZONE_DMA區(qū)中獲取。

  2. 如果沒(méi)有規(guī)定從哪個(gè)區(qū)獲取,就按照順序從 ZONE_NORMAL -> ZONE_DMA 獲取。

  3. 如果規(guī)定從HIGHMEM區(qū)獲取,就按照順序從 ZONE_HIGHMEM -> ZONE_NORMAL -> ZONE_DMA 獲取。

  • 注意系統(tǒng)是不允許在一次分配中從不同的兩個(gè)管理區(qū)獲取頁(yè)框的,并且當(dāng)請(qǐng)求多個(gè)頁(yè)框時(shí),從伙伴系統(tǒng)中分配給目標(biāo)的頁(yè)框是連續(xù)的,并且請(qǐng)求的頁(yè)數(shù)必須是2的次方個(gè)數(shù)。


  • 管理區(qū)分配器主要做的事情就是將頁(yè)框通過(guò)伙伴系統(tǒng)或者每CPU頁(yè)框高速緩存分配出去,這里涉及到三個(gè)結(jié)構(gòu),頁(yè)描述符,伙伴系統(tǒng),每CPU高速緩存。

  • 我們先說(shuō)說(shuō)頁(yè)描述符,頁(yè)描述符實(shí)際上并不專屬于描述頁(yè)框,它還用于描述一個(gè)SLAB分配器和SLUB分配器,這個(gè)之后再說(shuō),我們先說(shuō)關(guān)于頁(yè)的:

  • 在struct page描述一個(gè)頁(yè)框時(shí),我們比較關(guān)注的成員變量有unsigned long flags、struct list_head lru和atomic_t _count。

  1. flags:包含有很多信息,包括此頁(yè)框?qū)儆诘膎ode結(jié)點(diǎn)號(hào),此頁(yè)框?qū)儆诘膠one號(hào)和此頁(yè)框的屬性。

  2. lru:用于將此頁(yè)描述符放入相應(yīng)的鏈表,比如伙伴系統(tǒng)或者每CPU頁(yè)框高速緩存。

  3. _count:代表頁(yè)框的引用計(jì)數(shù),0代表此頁(yè)框空閑,大于0代表此頁(yè)框分配給了多少個(gè)進(jìn)程使用(共享)。

  • linux為了防止內(nèi)存中產(chǎn)生過(guò)多的碎片,一般把頁(yè)的類型分為三種:

  1. 不可移動(dòng)頁(yè):在內(nèi)存中有固定位置,不能移動(dòng)到其他地方。內(nèi)核中使用的頁(yè)大部分是屬于這種類型。

  2. 可回收頁(yè):不能直接移動(dòng),但可以刪除,頁(yè)中的內(nèi)容可以從某些源中重新生成。例如,頁(yè)內(nèi)容是映射到文件數(shù)據(jù)的頁(yè)就屬于這種類型。對(duì)于這種類型,在內(nèi)存短缺(分配失敗)時(shí),會(huì)發(fā)起內(nèi)存回收,將這類型頁(yè)進(jìn)行回寫釋放。

  3. 可移動(dòng)頁(yè):可隨意移動(dòng),用戶空間的進(jìn)程使用的沒(méi)有映射具體磁盤文件的頁(yè)就屬于這種類型(比如堆、棧、shmem共享內(nèi)存、匿名mmap共享內(nèi)存),它們是通過(guò)進(jìn)程頁(yè)表映射的,把這些頁(yè)復(fù)制到新位置時(shí),只要更新進(jìn)程頁(yè)表就可以了。一般這些頁(yè)是從高端內(nèi)存管理區(qū)獲取。

伙伴系統(tǒng)

  • 伙伴系統(tǒng)的主要作用就是減少物理內(nèi)存的外部碎片(SLAB/SLUB減少頁(yè)框的內(nèi)部碎片),它實(shí)際上是一個(gè)struct free_area的數(shù)組,數(shù)組長(zhǎng)度是MAX_ORDER,也就是11,代表著每個(gè)數(shù)組元素中鏈表上保存的連續(xù)頁(yè)框長(zhǎng)度是2的order次方。free_area[0]中鏈表保存的是長(zhǎng)度為1的頁(yè)框,free_area[1]中鏈表上保存的是物理上連續(xù)的兩個(gè)頁(yè)框的首頁(yè)框鏈表,free_area[2]中鏈表上保存的是物理上連續(xù)4個(gè)頁(yè)框的首頁(yè)框鏈表,free_area[10]中鏈表上保存的是物理上連續(xù)1024個(gè)頁(yè)框的首頁(yè)框鏈表,所以整個(gè)伙伴系統(tǒng)中將管理區(qū)中的頁(yè)框分為連續(xù)的1,2,4,8,16,32,64,128,256,512,1024頁(yè)框放入不同鏈表中保存起來(lái)。而因?yàn)榛锇橄到y(tǒng)中每個(gè)鏈表保存的頁(yè)框都是連續(xù)的,所以只有第一個(gè)頁(yè)框會(huì)加入到鏈表中,因?yàn)橛衞rder,也可以知道此頁(yè)框之后的多少個(gè)頁(yè)框是屬于這一小塊連續(xù)頁(yè)框的。當(dāng)需要在普通內(nèi)存區(qū)申請(qǐng)4個(gè)頁(yè)框大小的內(nèi)存時(shí),系統(tǒng)會(huì)到普通內(nèi)存管理區(qū)的伙伴系統(tǒng)中的free_area[2]中的第一個(gè)鏈表結(jié)點(diǎn),這個(gè)結(jié)點(diǎn)的頁(yè)框及其之后3個(gè)頁(yè)框都是空閑的,然后把首頁(yè)框返回給申請(qǐng)者。

在伙伴系統(tǒng)中,因?yàn)轫?yè)的分類關(guān)系,在每種長(zhǎng)度相同的連續(xù)頁(yè)框中又會(huì)分出多個(gè)不同類型的鏈表,如下,

  • 保存連續(xù)2個(gè)頁(yè)框的free_area[2]的結(jié)構(gòu)如下:


  • 在從伙伴系統(tǒng)中申請(qǐng)頁(yè)框時(shí),有可能會(huì)遇到一種情況,就是當(dāng)前需求的連續(xù)頁(yè)框鏈表上沒(méi)有可用的空閑頁(yè)框,這時(shí)后,伙伴系統(tǒng)會(huì)從下一級(jí)獲取一個(gè)連續(xù)長(zhǎng)度的頁(yè)框塊,將其拆分放入這級(jí)列表;當(dāng)然在擁有者釋放連續(xù)頁(yè)框時(shí)伙伴系統(tǒng)也會(huì)適當(dāng)?shù)剡M(jìn)行連續(xù)頁(yè)框的合并,并放入下一級(jí)中。比如:我需要申請(qǐng)4個(gè)頁(yè)框,但是長(zhǎng)度為4個(gè)連續(xù)頁(yè)框塊鏈表沒(méi)有空閑的頁(yè)框塊,伙伴系統(tǒng)會(huì)從連續(xù)8個(gè)頁(yè)框塊的鏈表獲取一個(gè),并將其拆分為兩個(gè)連續(xù)4個(gè)頁(yè)框塊,放入連續(xù)4個(gè)頁(yè)框塊的鏈表中。釋放時(shí)道理也一樣,會(huì)檢查釋放的這幾個(gè)頁(yè)框的之前和之后的物理頁(yè)框是否空閑,并且能否組成下一級(jí)長(zhǎng)度的塊。

每CPU頁(yè)框高速緩存

  • 每CPU頁(yè)框高速緩存也是一個(gè)分配器,配合著伙伴系統(tǒng)進(jìn)行使用,這個(gè)分配器是專門用于分配單個(gè)頁(yè)框的,它維護(hù)一個(gè)單頁(yè)框的雙向鏈表,為什么需要這個(gè)分配器,原因主要有兩點(diǎn):

  1. 因?yàn)槊總€(gè)CPU都有自己的硬件高速緩存,當(dāng)對(duì)一個(gè)頁(yè)進(jìn)行讀取寫入時(shí),首先會(huì)把這個(gè)頁(yè)裝入硬件高速緩存,而如果進(jìn)程對(duì)這個(gè)處于硬件高速緩存的頁(yè)進(jìn)行操作后立即釋放掉,這個(gè)頁(yè)有可能還保存在硬件高速緩存中,這樣我另一個(gè)進(jìn)程需要請(qǐng)求一個(gè)頁(yè)并立即寫入數(shù)據(jù)的話,分配器將這個(gè)處于硬件高速緩存中的頁(yè)分配給它,系統(tǒng)效率會(huì)大大增加。

  2. 減少鎖的競(jìng)爭(zhēng),假設(shè)單頁(yè)框都是使用free_area來(lái)管理,那么多個(gè)CPU同時(shí)頻繁訪問(wèn)時(shí),每次都是只能單CPU獲取到頁(yè)框,其他CPU等待,這會(huì)造成大量的鎖競(jìng)爭(zhēng),導(dǎo)致分配效率降低。

  • 在每CPU頁(yè)框高速緩存中用一個(gè)鏈表來(lái)維護(hù)一個(gè)單頁(yè)框的雙向鏈表,每個(gè)CPU都有自己的鏈表(因?yàn)槊總€(gè)CPU有自己的硬件高速緩存),那些比較可能處于硬件高速緩存中的頁(yè)被稱為“熱頁(yè)”,比較不可能處于硬件高速緩存中的頁(yè)稱為“冷頁(yè)”。其實(shí)系統(tǒng)判斷是否為熱頁(yè)還是冷頁(yè)很簡(jiǎn)單,越最近釋放的頁(yè)就比較可能是熱頁(yè),所以在雙向鏈表中,從鏈表頭插入可能是熱頁(yè)的單頁(yè)框,在鏈表尾插入可能是冷頁(yè)的單頁(yè)框。分配時(shí)熱頁(yè)就從鏈表頭獲取,冷頁(yè)就從鏈表尾獲取。

  • 在每CPU頁(yè)框高速緩存中也可能會(huì)遇到?jīng)]有空閑的頁(yè)框(被分配完了),這時(shí)候每CPU頁(yè)框高速緩存會(huì)從伙伴系統(tǒng)中拿出頁(yè)框放入每CPU頁(yè)框高速緩存中,相反,如果每CPU頁(yè)框高速緩存中頁(yè)框過(guò)多,也會(huì)將一些頁(yè)框放回伙伴系統(tǒng)。

  • 在內(nèi)核中使用struct per_cpu_pageset結(jié)構(gòu)描述一個(gè)每CPU頁(yè)框高速緩存,其中的struct per_cpu_pages是核心結(jié)構(gòu)體,如下:

關(guān)于頁(yè)框回收

  • 內(nèi)存中并非所有物理頁(yè)面都是可以進(jìn)行回收的,內(nèi)核占用的頁(yè)不會(huì)被換出,只有與用戶空間建立了映射關(guān)系的物理頁(yè)面才會(huì)被換出??偟膩?lái)說(shuō),以下這些種物理頁(yè)面可以被 Linux 操作系統(tǒng)回收:

  1. 進(jìn)程映射所占的頁(yè)面,包括代碼段,數(shù)據(jù)段,堆棧以及動(dòng)態(tài)分配的“存儲(chǔ)堆”(malloc分配的)。

  2. 用戶空間中通過(guò)mmap()把文件內(nèi)容映射到內(nèi)存所占的頁(yè)面。

  3. 匿名頁(yè)面(沒(méi)有映射到文件的都是匿名映射,用戶空間的堆和棧):進(jìn)程用戶模式下的堆棧以及是使用 mmap 匿名映射的內(nèi)存區(qū)(共享內(nèi)存區(qū))。注:堆棧所占頁(yè)面一般不被換出。

  4. 特殊的用于 slab 分配器的緩存,比如用于緩存文件目錄結(jié)構(gòu) dentry 的 cache,以及用于緩存索引節(jié)點(diǎn) inode 的 cache

  5. tmpfs文件系統(tǒng)使用的頁(yè)。

  • Linux 操作系統(tǒng)使用如下這兩種機(jī)制檢查系統(tǒng)內(nèi)存的使用情況,從而確定可用的內(nèi)存是否太少?gòu)亩枰M(jìn)行頁(yè)面回收。

  • 周期性的檢查:這是由后臺(tái)運(yùn)行的守護(hù)進(jìn)程 kswapd 完成的。該進(jìn)程定期檢查當(dāng)前系統(tǒng)的內(nèi)存使用情況,當(dāng)發(fā)現(xiàn)系統(tǒng)內(nèi)空閑的物理頁(yè)面數(shù)目少于特定的閾值時(shí),該進(jìn)程就會(huì)發(fā)起頁(yè)面回收的操作。

  • “內(nèi)存嚴(yán)重不足”事件的觸發(fā):在某些情況下,比如,操作系統(tǒng)忽然需要通過(guò)伙伴系統(tǒng)為用戶進(jìn)程分配一大塊內(nèi)存,或者需要?jiǎng)?chuàng)建一個(gè)很大的緩沖區(qū),而當(dāng)時(shí)系統(tǒng)中 的內(nèi)存沒(méi)有辦法提供足夠多的物理內(nèi)存以滿足這種內(nèi)存請(qǐng)求,這時(shí)候,操作系統(tǒng)就必須盡快進(jìn)行頁(yè)面回收操作,以便釋放出一些內(nèi)存空間從而滿足上述的內(nèi)存請(qǐng)求。 這種頁(yè)面回收方式也被稱作“直接頁(yè)面回收”。

  • 如果操作系統(tǒng)在進(jìn)行了內(nèi)存回收操作之后仍然無(wú)法回收到足夠多的頁(yè)面以滿足上述內(nèi)存要求,那么操作系統(tǒng)只有最后一個(gè)選擇,那就是使用 OOM( out of memory )killer,它從系統(tǒng)中挑選一個(gè)最合適的進(jìn)程殺死它,并釋放該進(jìn)程所占用的所有頁(yè)面。

結(jié)尾

  • 下篇再說(shuō)slab了,內(nèi)容太多。到這里,記住對(duì)于物理內(nèi)存來(lái)說(shuō),系統(tǒng)都是以頁(yè)框作為最小的分配單位,而分配時(shí)必定是要通過(guò)管理區(qū)分配器進(jìn)行分配的,在管理區(qū)分配器中又必定是通過(guò)伙伴系統(tǒng)或每CPU頁(yè)框分配器進(jìn)行分配的,而我們編程使用到的malloc或者內(nèi)核中使用的分配小額內(nèi)存的情況,是使用slab實(shí)現(xiàn)的,slab的作用就是將一個(gè)頁(yè)框細(xì)分為多個(gè)小塊內(nèi)存。


獨(dú)一無(wú)二的,linux內(nèi)存管理源碼分析-頁(yè)框分配器的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
潞城市| 咸阳市| 柯坪县| 勐海县| 嘉兴市| 南木林县| 鹿邑县| 房产| 衡阳县| 大埔区| 富源县| 蓝山县| 佛坪县| 淮安市| 南投市| 错那县| 嘉荫县| 二手房| 普洱| 武义县| 南宫市| 河源市| 霍州市| 安宁市| 鞍山市| 靖安县| 马公市| 独山县| 曲阜市| 常熟市| 玛多县| 增城市| 普兰店市| 建宁县| 威信县| 称多县| 南投市| 崇信县| 大荔县| 裕民县| 吴忠市|