深入聊聊 top 命令中的 CPU 使用率(超詳細(xì))
平常我們使用 top 命令來查看系統(tǒng)的性能情況,在 top 命令中可以看到很多不同類型的 CPU 使用率,如下圖紅框中標(biāo)出部分:

下面,我們來介紹一下這些 CPU 使用率的意義:
us:user time,表示 CPU 執(zhí)行用戶進(jìn)程的時(shí)間,包括 nice 時(shí)間。通常都是希望用戶空間CPU越高越好。
sy:system time,表示 CPU 在內(nèi)核運(yùn)行的時(shí)間,包括 IRQ 和 softirq。系統(tǒng) CPU 占用越高,表明系統(tǒng)某部分存在瓶頸。通常這個(gè)值越低越好。
ni:nice time,具有優(yōu)先級的用戶進(jìn)程執(zhí)行時(shí)占用的 CPU 利用率百分比。
id:idle time,表示系統(tǒng)處于空閑期,等待進(jìn)程運(yùn)行。
wa:waiting time,表示 CPU 在等待 IO 操作完成所花費(fèi)的時(shí)間。系統(tǒng)不應(yīng)該花費(fèi)大量的時(shí)間來等待 IO 操作,否則就說明 IO 存在瓶頸。
hi:hard IRQ time,表示系統(tǒng)處理硬中斷所花費(fèi)的時(shí)間。
si:soft IRQ time,表示系統(tǒng)處理軟中斷所花費(fèi)的時(shí)間。
st:steal time,被強(qiáng)制等待(involuntary wait)虛擬 CPU 的時(shí)間,此時(shí) Hypervisor 在為另一個(gè)虛擬處理器服務(wù)。
當(dāng)然,單靠上面的解釋來理解它們的意義還是比較困難的。所以,本文主要從源碼的角度來分析它們到底代表什么。
【文章福利】小編推薦自己的Linux內(nèi)核技術(shù)交流群:【891587639】整理了一些個(gè)人覺得比較好的學(xué)習(xí)書籍、視頻資料共享在群文件里面,有需要的可以自行添加哦?。?!前100名進(jìn)群領(lǐng)取,額外贈(zèng)送一份價(jià)值699的內(nèi)核資料包(含視頻教程、電子書、實(shí)戰(zhàn)項(xiàng)目及代碼)?
?


首先,我們要知道統(tǒng)計(jì) CPU 使用情況在什么地方執(zhí)行的。在分析之前,我們先來了解下 時(shí)鐘中斷:
時(shí)鐘中斷:是一種硬中斷,由時(shí)間硬件(系統(tǒng)定時(shí)器,一種可編程硬件)產(chǎn)生。當(dāng) CPU 接收到時(shí)鐘中斷信號后,會在處理完當(dāng)前指令后調(diào)用 時(shí)鐘中斷處理程序 來完成更新系統(tǒng)時(shí)間、執(zhí)行周期性任務(wù)等。
可以發(fā)現(xiàn),統(tǒng)計(jì) CPU 使用情況是在 時(shí)鐘中斷處理程序 中完成的。
每個(gè) CPU 的使用情況通過 cpu_usage_stat 結(jié)構(gòu)來記錄,我們來看看其定義:
從 cpu_usage_stat 結(jié)構(gòu)的定義可以看出,其每個(gè)字段與 top 命令的 CPU 使用率類型一一對應(yīng)。在內(nèi)核初始化時(shí),會為每個(gè) CPU 創(chuàng)建一個(gè) cpu_usage_stat 結(jié)構(gòu),用于統(tǒng)計(jì) CPU 的使用情況。
OK,現(xiàn)在我們來分析下內(nèi)核是怎么統(tǒng)計(jì) CPU 的使用情況的。
每次執(zhí)行 時(shí)鐘中斷處理程序 都會調(diào)用 account_process_tick 函數(shù)進(jìn)行 CPU 使用情況統(tǒng)計(jì),我們來分析一下 account_process_tick 函數(shù)的實(shí)現(xiàn):
account_process_tick 函數(shù)主要分 3 種情況進(jìn)行統(tǒng)計(jì),如下:
如果 CPU 在執(zhí)行用戶程序,那么調(diào)用 account_user_time 進(jìn)行統(tǒng)計(jì)。
如果 CPU 在執(zhí)行內(nèi)核代碼,那么調(diào)用 account_system_time 進(jìn)行統(tǒng)計(jì)。
否則說明 CPU 在執(zhí)行 idle 進(jìn)程(也就是處于空閑狀態(tài)),那么調(diào)用 account_idle_time 進(jìn)行統(tǒng)計(jì)。
CPU 使用情況統(tǒng)計(jì)
下面我們分別對這 3 種統(tǒng)計(jì)進(jìn)行分析。
1. 統(tǒng)計(jì)用戶程序執(zhí)行時(shí)間
統(tǒng)計(jì)用戶程序的執(zhí)行時(shí)間是通過 account_user_time 函數(shù)來完成的,我們來看看其實(shí)現(xiàn):
account_user_time 函數(shù)主要分兩種情況統(tǒng)計(jì):
如果進(jìn)程的 nice 值大于0,那么將會增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 nice 字段中。
如果進(jìn)程的 nice 值小于等于0,那么增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 user 字段中。
這里說明一下進(jìn)程 nice 值的作用,nice 值越大,說明進(jìn)程的優(yōu)先級越低。所以,nice 統(tǒng)計(jì)值主要用來統(tǒng)計(jì)低優(yōu)先級進(jìn)程的占使用 CPU 的情況。也說明了,user 和 nice 統(tǒng)計(jì)值都屬于執(zhí)行用戶程序的 CPU 時(shí)間。
2. 統(tǒng)計(jì)內(nèi)核代碼執(zhí)行時(shí)間
如果在發(fā)生時(shí)鐘中斷前,CPU 處于內(nèi)核態(tài),也就是說在執(zhí)行內(nèi)核代碼。那么將會調(diào)用 account_system_time 函數(shù)進(jìn)行統(tǒng)計(jì),account_system_time 函數(shù)實(shí)現(xiàn)如下:
account_system_time 函數(shù)主要分 3 種情況進(jìn)行統(tǒng)計(jì):
如果當(dāng)前處于硬中斷執(zhí)行上下文,那么增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 irq 字段中。
如果當(dāng)前處于軟中斷執(zhí)行上下文,那么增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 softirq 字段中。
否則增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 system 字段中。
從上面代碼可以看出,irq 和 softirq 統(tǒng)計(jì)值也算是內(nèi)核代碼執(zhí)行時(shí)間。
3. idle 進(jìn)程執(zhí)行時(shí)間統(tǒng)計(jì)
當(dāng)系統(tǒng)中沒有可運(yùn)行的進(jìn)程時(shí),將會執(zhí)行 idle 進(jìn)程。也就是說,當(dāng)系統(tǒng)執(zhí)行 idle 進(jìn)程時(shí),表示系統(tǒng)正處于空閑狀態(tài)。
idle 進(jìn)程執(zhí)行時(shí)間統(tǒng)計(jì)由 account_idle_time 函數(shù)完成,其實(shí)現(xiàn)如下:
account_idle_time 函數(shù)也分兩種情況進(jìn)行統(tǒng)計(jì):
如果系統(tǒng)中有正在等待 I/O 操作完成的進(jìn)程,那么增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 iowait 字段中。
否則增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 idle 字段中。
從上面的分析可以看出,iowait 統(tǒng)計(jì)值也屬于空閑時(shí)間的一種。
top 命令的 CPU 使用率
通過源碼分析,我們知道 top 命令中 CPU 使用率各種類型的意思,現(xiàn)在我們來介紹一下 top 命令是怎么計(jì)算各種類型的 CPU 使用率。
要獲取各個(gè) CPU 的使用情況信息,可以通過讀取 /proc/stat 文件獲取,如下:
上面的結(jié)果顯示了 CPU 的使用情況信息,第一行代表所有 CPU 的總和,而第二行開始表示每個(gè) CPU 核心的使用情況信息。因?yàn)槲业碾娔X只有一個(gè)核,所以只有一條數(shù)據(jù)。
下面說說這些數(shù)據(jù)的意義,從第一個(gè)數(shù)值開始分別代表:user ,nice,system,idle,iowait, irq,softirq,steal。
所以,top 命令的 CPU 使用率計(jì)算公式如下:
