linux 超級塊和inode 詳解
一、inode塊,Unix文件的核心
首先需要明白的是,在Unix操作系統(tǒng)中的任何資源都被當作文件來管理。如目錄、光驅(qū)、終端設備等等,都被當作是一種文件。從這方面來說,Unix操作系統(tǒng)中的所有的目錄、硬件設備跟普通文件一樣,具有共同的屬性。而這些屬性的話,就是保存在inode塊中。
Inode塊中保存了一個文件系統(tǒng)中的全部Inode節(jié)點。也就是說,當系統(tǒng)創(chuàng)建了一個文件(或者添加了一個新設備)時,系統(tǒng)就會從這個塊中給 這個文件分配一個Inode結(jié)點。在這個結(jié)點中存儲了這個文件的大部分屬性,如創(chuàng)建、修改時間等等。但是需要注意的是,有兩個屬性不包含在這個inode結(jié)點中,分別為文件名與結(jié)點號。這主要是因為inode節(jié)點按順序排列,所以系統(tǒng)內(nèi)核就可以采用簡單的算法,就可以得出inode節(jié)點號。通過系統(tǒng)提供的ls命令顯示文件或者目錄信息的時候,就需要用到這個結(jié)點中的信息。Ls命令為了確定一個文件的Inode節(jié)點需要查找它所在的目錄,然后讀取它的Inode結(jié)點,并根據(jù)inode節(jié)點得到文件的屬性。正常情況下,這個節(jié)點號不會出現(xiàn)什么問題。但是如果由于意外斷電或者其他原因的話,有可能會發(fā)生一些故障。如 可能一個inode結(jié)點在系統(tǒng)中已經(jīng)被創(chuàng)建,但是其沒有被正常使用,或者可能塊號超出了范圍。這些故障會給操作系統(tǒng)留下安全隱患。為此當出現(xiàn)意外關(guān)機或者 其他意外事件時,最好系統(tǒng)工程師能夠利用fsck系統(tǒng)命令來修復inode結(jié)點中的錯誤。
另外需要注意的是,在inode結(jié)點中還存儲著一個重要的信息,就是保存了一個包含13-15位指針元素的數(shù)組,這些指針是磁盤塊區(qū)的地址。這 些指針非常的重要。操作系統(tǒng)就是依靠這些指針在硬盤上定位相關(guān)的文件,并讀取它。如上所述,因為一些意外的操作也會使得這個指針地址出現(xiàn)錯誤。有時候這會 非常的嚴重。如一些文件無法讀取等等。如果這些文件不幸的是系統(tǒng)的一些配置文件,那么就會導致系統(tǒng)的崩潰。如果這些指針地址出現(xiàn)錯誤,則文件名仍然會顯示 在操作系統(tǒng)中。但是如果用戶試著去打開這些文件時,系統(tǒng)卻會告知無法打開這些文件。如果遇到這種情況該這么辦呢?此時系統(tǒng)工程師就需要手工運行fsck命 令。如果這個文件損壞的不是很嚴重,那么操作系統(tǒng)內(nèi)內(nèi)核會為其再建立一個鏈接。但是如果原文件損壞的比較厲害了,無法再重新讀取。則系統(tǒng)會建立用戶刪除這 個文件(從硬盤中刪除)。
由于一些文件的屬性(如建立修改時間等等)都保存在Inode結(jié)點中,為此一些命令在獲取這些屬性的時候,是不需要打開文件的。如現(xiàn)在系統(tǒng)工程 師在編寫一個文件備份程序,就需要用到inode節(jié)點中的修改時間截這個屬性。此時可以利用相關(guān)的命令直接從inode結(jié)點中去獲取,而不需要打開對應的 文件去得知這個信息。為此在Unix操作系統(tǒng)中文件備份程序的執(zhí)行效率會比較高,實現(xiàn)起來也相對簡單一點。
從上面的這些分析中可以看到,inode結(jié)點是Unix操作系統(tǒng)中文件的核心,也是操作系統(tǒng)與硬盤中存儲的數(shù)據(jù)打交道的一個中介者。如果這個結(jié) 點信息出現(xiàn)錯誤的話,那么硬盤中存儲的數(shù)據(jù)塊就好像是無主的流浪者,無法被用戶所采用。另外我們平時刪除文件,其實只是刪除了這個聯(lián)系。所以通過一線恢復 工具仍然可以恢復被刪除了的文件。如果需要真正刪除文件的話,就需要格式化硬盤(低格)或者復制大文件把其覆蓋掉。只有如此硬盤中存儲的數(shù)據(jù)塊才會被真正 的刪除掉。最后需要說明的是,按照正常的關(guān)機程序來關(guān)閉Unix操作系統(tǒng),是保護inode結(jié)點信息的最好措施。突然斷電或者其他意外事故,是inode結(jié)點的最大殺手。
二、超級塊,文件系統(tǒng)的心臟
如果說inode塊是Unix操作系統(tǒng)中文件的核心,那么超級塊就是文件系統(tǒng)的心臟。啟動Unix操作系統(tǒng)后,發(fā)現(xiàn)某個文件系統(tǒng)無法使用,很有 可能就是超級塊出現(xiàn)了問題。為什么這個超級塊有這么大的作用呢?主要是因為在超級塊中保存了全局文件信息,如硬盤已用空間、數(shù)據(jù)塊可用空間、inode結(jié) 點信息等等。做一個形象的比喻,這個超級塊就好像是企業(yè)的資產(chǎn)負債表,一個文件系統(tǒng)中有哪些資源都記錄在這個表中。
當操作系統(tǒng)啟動后,系統(tǒng)內(nèi)核會把超級塊中的內(nèi)容復制到內(nèi)存中,并周期性的利用內(nèi)存里的最新內(nèi)容去更新硬盤上的超級塊中的內(nèi)容。由于這個更新存在 一個時間差,為此內(nèi)存中的超級塊信息與硬盤中的超級塊信息往往只有在開機與關(guān)機的某個特定時刻是同步的;而在其他時間都是不同步的。假設當操作系統(tǒng)意外當 機或者因為斷電而造成的意外事故時,內(nèi)存中的超級塊信息沒有及時保存到硬盤中,此時文件系統(tǒng)的完整性就會受到破壞。輕者導致剛建立的丟失,重則的話會導致 文件系統(tǒng)癱瘓。遇到這種情況時,系統(tǒng)工程師往往需要利用系統(tǒng)提供的sync命令在系統(tǒng)出現(xiàn)故障的那一刻把內(nèi)存里的內(nèi)容復制到磁盤上。這個過程往往操作系統(tǒng) 會自動完成,這也正是因為為什么Unix操作系統(tǒng)要比Windows操作系統(tǒng)穩(wěn)定的一個重要原因。當操作系統(tǒng)重新啟動的過程中,系統(tǒng)內(nèi)核會對兩者進行比 較,根據(jù)他們之間的差異,給文件系統(tǒng)打上干凈或者臟的標簽。這個信息也是存儲在文件系統(tǒng)的超級塊中。
可見超級塊如果發(fā)生損壞的話,對于文件系統(tǒng)的破壞性非常的大。輕者的話導致某個文件系統(tǒng)無法掛載,重則的話導致整個操作系統(tǒng)崩潰。在Unix操 作系統(tǒng)中,除了可以利用sync命令來保證硬盤上的內(nèi)容決不會比內(nèi)存里的內(nèi)容更新之外,還提供了一個很有利的措施來保證其的安全性。其實,這個技術(shù)很早就 有,只是一開始并沒有用在超級塊的管理中。這個技術(shù)就是跟磁盤陣列類似。操作系統(tǒng)會將多個超級塊內(nèi)容保存到硬盤中的不同區(qū)域。當其中一個超級塊出現(xiàn)問題 時,操作系統(tǒng)會自動采用另外一個超級塊。等到系統(tǒng)運行正常后,系統(tǒng)內(nèi)容就會把可用的超級塊去替換那個故障的超級塊。為此除非所有的超級塊都損壞了,否則的 話,只要有一個超級塊是可用的,那么文件系統(tǒng)與操作系統(tǒng)就可以正常掛載與啟動。這種安全機制在很大程度上提高了超級塊的安全性,系統(tǒng)了Unix操作系統(tǒng)的 穩(wěn)定性?,F(xiàn)在大部分的Unix操作系統(tǒng)(包括Linux操作系統(tǒng))已經(jīng)實現(xiàn)了類似的安全機制。
另外系統(tǒng)工程師需要了解在超級塊中到底保存了哪些信息。這對于以后遇到問題時查找問題原因有一定的故障。根據(jù)筆者的了解,在超級塊中保存了如下有用的信 息。一是保存了文件系統(tǒng)的大小以及所用酷塊的大小;二是保存了可用數(shù)據(jù)庫的數(shù)量和部分可以及時分配的空閑數(shù)據(jù)塊列表;三是最近一次的更新時間與文件系統(tǒng)的 狀態(tài);四是空閑Inode結(jié)點的個數(shù)和部分可以及時使用的inode結(jié)點列表。有時候在Unix操作系統(tǒng)上進行應用程序開發(fā)也需要用到這些信息。
最后筆者需要強調(diào)一點,超級塊損壞的最大殺手仍然是意外斷電或者其他原因的意外當機。因為此時內(nèi)存中的超級塊信息無法及時更新到硬盤中。為此 就出現(xiàn)了內(nèi)存與超級塊中內(nèi)容不一致的地方,從而會導致系統(tǒng)啟動時的一系列故障。為此在Unix服務器上部署一個UPS是非常重要的。這雖然是一個老生常談 的方法,但是卻非常有效。
Linux內(nèi)核學習群:973961276
