詳細講解Linux物理內存初始化
說明:
Kernel版本:4.14
ARM64處理器,Contex-A53,雙核
使用工具:Source Insight 3.5, Visio
1. 介紹
讓我們思考幾個樸素的問題?
系統是怎么知道物理內存的?
在內存管理真正初始化之前,內核的代碼執(zhí)行需要分配內存該怎么處理?
我們先來嘗試回答第一個問題,看過dts
文件的同學應該見過memory
的節(jié)點,以arch/arm64/boot/dts/freescale/fsl-ls208xa.dtsi
為例:
這個節(jié)點描述了內存的起始地址及大小,事實上內核在解析dtb
文件時會去讀取該memory
節(jié)點的內容,從而將檢測到的內存注冊進系統。
那么新的問題又來了?Uboot會將kernel image
和dtb
拷貝到內存中,并且將dtb物理地址
告知kernel
,kernel
需要從該物理地址上讀取到dtb
文件并解析,才能得到最終的內存信息,dtb
的物理地址需要映射到虛擬地址上才能訪問,但是這個時候paging_init
還沒有調用,也就是說物理地址的映射還沒有完成,那該怎么辦呢?沒錯,Fixed map
機制出現了。
第二個問題答案:當所有物理內存添加進系統后,在mm_init
之前,系統會使用memblock
模塊來對內存進行管理。
開啟探索之旅吧!
2. early_fixmap_init
簡單來說,Fixed map
指的是虛擬地址中的一段區(qū)域,在該區(qū)域中所有的線性地址是在編譯階段就確定好的,這些虛擬地址需要在boot
階段去映射到物理地址上。?
來張圖片看看虛擬地址空間:

圖中fixed: 0xffffffbefe7fd000 - 0xffffffbefec00000
,描述的就是Fixed map
的區(qū)域。
那么這段區(qū)域中的詳細一點的布局是怎樣呢?看看arch/arm64/include/asm/fixmap.h
中的enum fixed_address
結構就清晰了,圖來了:

從圖中可以看出,如果要訪問DTB
所在的物理地址,那么需要將該物理地址映射到Fixed map
中的區(qū)域,然后訪問該區(qū)域中的虛擬地址即可。訪問IO
空間也是一樣的道理,下文也會講述到。
那么來看看early_fixmap_init
函數的關鍵代碼吧:
關鍵點:
FIXADDR_START
,定義了Fixed map
區(qū)域的起始地址,位于arch/arm64/include/asm/fixmap.h
中;pgd_offset_k(addr)
,獲取addr
地址對應pgd全局頁表中的entry
,而這個pgd全局頁表正是swapper_pg_dir
全局頁表;將
bm_pud
的物理地址寫到pgd全局頁目錄表中;將
bm_pmd
的物理地址寫到pud頁目錄表中;將
bm_pte
的物理地址寫到pmd頁表目錄表中;
bm_pud/bm_pmd/bm_pte
是三個全局數組,相當于是中間的頁表,存放各級頁表的entry
,定義如下:
事實上,early_fixmap_init
只是建立了一個映射的框架,具體的物理地址和虛擬地址的映射沒有去填充,這個是由使用者具體在使用時再去填充對應的pte entry
。比如像fixmap_remap_fdt()
函數,就是典型的填充pte entry
的過程,完成最后的一步映射,然后才能讀取dtb
文件。
來一張圖片就懂了,是透徹的懂了:

【文章福利】小編推薦自己的Linux內核技術交流群:【749907784】整理了一些個人覺得比較好的學習書籍、視頻資料共享在群文件里面,有需要的可以自行添加哦!?。。ê曨l教程、電子書、實戰(zhàn)項目及代碼)? ??


3. early_ioremap_init
如果在boot早期需要操作IO設備
的話,那么ioremap
就用上場了,由于跟實際的內存管理關系不太大,不再太深入的分析。

簡單來說,ioremap
的空間為7 * 256K
的區(qū)域,保存在slot_vir[]
數組中,當需要進行IO操作的時候,最終會調用到__early_ioremap
函數,在該函數中去填充對應的pte entry
,從而完成最終的虛擬地址和物理地址的映射。
4. memblock
上文講的內容都只是鋪墊,為了能正確訪問DTB
文件并且解析得到物理地址信息。從入口到最終添加的調用過程如下圖:

所以,這個章節(jié)的重點就是memblock
模塊,這個是早期的內存分配管理器,我不禁想起了之前在Nuttx
中的內存池實現了,細節(jié)已然不太清晰了,但是框架性的思維都大同小異。
4.1 結構體

總共由三個數據結構來描述:
struct memblock
定義了一個全局變量,用來維護所有的物理內存;struct memblock_type
代表系統中的內存類型,包括實際使用的內存和保留的內存;struct memblock_region
用來描述具體的內存區(qū)域,包含在struct memblock_type
中的regions
數組中,最多可以存放128個。
直接上個代碼吧:
定義的memblock
為全局變量,在定義的時候就進行了初始化。初始化的時候,regions
指向的也是靜態(tài)全局的數組,其中數組的大小為INIT_MEMBLOCK_REGIONS
,也就是128個,限制了這些內存塊的個數了,實際在代碼中可以看到,當超過這個數值時,數組會以2倍的速度動態(tài)擴大。
初始化完了后,大體是這個樣子的:

4.2 memblock_add/memblock_remove
memblock
子模塊,基本的邏輯都是圍繞內存的添加和移除操作來展開,最終是通過調用memblock_add_range/memblock_remove_range
來實現的。
memblock_add_range
:

圖中的左側是函數的執(zhí)行流程圖,執(zhí)行效果是右側部分。右側部分畫的是一個典型的情況,實際的情況可能有多種,但是核心的邏輯都是對插入的region
進行判斷,如果出現了物理地址范圍重疊的部分,那就進行split
操作,最終對具有相同flag
的region
進行merge
操作。
memblock_remove_range

該函數執(zhí)行的一個典型case效果如下圖所示:假如現在需要移除掉一片區(qū)域,而該區(qū)域跨越了多個region
,則會先調用memblock_isolate_range
來對這片區(qū)域進行切分,最后再調用memblock_isolate_range
對區(qū)域范圍內的region
進行移除操作。
當調用memblock_alloc
函數進行地址分配時,最后也是調用memblock_add_range
來實現的,申請的這部分內存最終會添加到reserved
類型中,畢竟已經分配出去了,其他人也不應該使用了。
5. arm64_memblock_init
當物理內存都添加進系統之后,arm64_memblock_init
會對整個物理內存進行整理,主要的工作就是將一些特殊的區(qū)域添加進reserved
內存中。函數執(zhí)行完后,如下圖所示:

其中淺綠色的框表示的都是保留的內存區(qū)域, 剩下的部分就是可以實際去使用的內存了。
物理內存大體面貌就有了,后續(xù)就需要進行內存的頁表映射,完成實際的物理地址到虛擬地址的映射了。
原文著作者:LoyenWang
