分類:分析的基本步驟
????????分類是對信息進(jìn)行歸類的過程。【在情報研究和分析中,信息經(jīng)常被劃分為不同等級,依據(jù)即是其在未經(jīng)批準(zhǔn)情況下泄露可能對國家安全造成危險的程度,這也許是該詞(分類,classification在情報分析中最為人熟知的含義】“在涉及大量調(diào)查、需要制作許多交叉表的研究項(xiàng)目中這一過程不可替代,在小型調(diào)查研究中也很有用。分類不僅是快速處理信息的方法,而且是解決問題的手段。本章所舉的兩個例子是關(guān)于生物學(xué)和物理學(xué)方面的分類。分類應(yīng)用于各門學(xué)科,產(chǎn)生了大量的重大發(fā)現(xiàn);可以想見,情報工作同樣可以產(chǎn)生類似“發(fā)現(xiàn)”。
一、科學(xué)研究與情報工作中的分類
????????科學(xué)家可以將某個物體、生物、事件、狀態(tài)或活動進(jìn)行歸類,然后推斷其特征,這些特征如果不歸類可能就不太明顯。例如,生物學(xué)家看到一個四趾、伸縮爪動物的腳印,根據(jù)物種知識將其歸類為哺乳動物(兩棲動物有四個腳趾卻沒有爪子,爬行動物有五個腳趾但爪子不可伸縮)。歸類后,根據(jù)哺乳動物的特征,推斷出該動物多毛并哺乳幼仔。此外,根據(jù)伸縮爪的特征,生物學(xué)家推斷它是食肉動物,所以很可能長有門牙、犬齒和白齒。這樣,生物學(xué)家憑著一只腳印,通過將觀察現(xiàn)象歸類,然后根據(jù)該類的共同特征推斷其他特征,從而準(zhǔn)確地再現(xiàn)了這個未曾見過的動物。


????????情報中類似的推斷可用于分析外軍飛機(jī)的性能。例如,俄羅斯“蘇霍伊”(Sukhoi) 強(qiáng)擊機(jī)“擊劍手”(Fencer) 除了可變機(jī)翼,與 Su-7BM“裝配匠”(Fitter)外形很相似。盡管細(xì)看會發(fā)現(xiàn)兩者各有特點(diǎn),但可以推斷兩者任務(wù)差不多,且新型號“擊劍手”的性能不會比其前代機(jī) Su-7和Su-17低。同樣,民用11-18 中程運(yùn)輸機(jī)與11-38反潛戰(zhàn)/巡邏機(jī)幾乎一模一樣。由于接觸民用飛機(jī)比軍用飛機(jī)容易,可以通過仔細(xì)研究 11-18飛機(jī)來了解11-38軍機(jī)的特征。

????????




????????為進(jìn)一步說明分類在情報研究與分析中的應(yīng)用,在此簡要探討一下元素周期表的發(fā)展歷程。1869 年,季米特里·伊萬諾維奇·門捷列夫發(fā)表了篇文章,根據(jù)元素表現(xiàn)出的屬性將其分類。他寫道,“當(dāng)我按照元素原子量大小從最小開始排列它們時,發(fā)現(xiàn)這些屬性存在周期性······我將元素屬性和原子量之間的相互關(guān)系命名為“周期律’,這些關(guān)系適用于所有元素,并且具有周期性?!?/p>
????????他發(fā)現(xiàn)了一個重要的事實(shí),即有些情況下,他的分類標(biāo)準(zhǔn)(原子量)在排列某些元素時并不恰當(dāng)。例如,如果只按照原子量的標(biāo)準(zhǔn),碲的原子量為 127.61,在元素周期表中應(yīng)排在碘 (126.91)之后,但是根據(jù)確的其他屬性把它排列在碘前,就可以使它歸人與其屬性非常相似的硒族元素:同時,碘也可以歸入與自己屬性非常相似的溴族。

????????這種排列配置的價值顯而易見,當(dāng)門捷列夫無法補(bǔ)全周期表時,他聲稱,周期表中的空缺元素“應(yīng)當(dāng)被發(fā)現(xiàn)”。而且,根據(jù)空缺元素前后元素的屬性,門捷列夫還預(yù)測了那些待發(fā)現(xiàn)元素的屬性。(門捷列夫在有生之年發(fā)現(xiàn)了他所預(yù)測元素中的三種,它們的屬性與他之前的預(yù)測相符。

????????在情報分析中,創(chuàng)造一個作戰(zhàn)序列與建立元素周期表相似。例如.基于對敵人作戰(zhàn)原則的了解和以往的經(jīng)驗(yàn),可以確定敵人通常在邊境部署兩支部隊(duì),預(yù)備一支部隊(duì)?;趯σ恢н吘巢筷?duì)和另一支 (假如說預(yù)備部隊(duì))以及它們編制的了解,就可以試著推斷另一支邊境部隊(duì)的編制和身份一一即使無法接觸到這一部隊(duì)。當(dāng)然,情報分析人員(和門捷列夫一樣)不能確信缺失元素的成分是什么,但他確實(shí)有一個看似合理的想法。


????????分析和研究人員利用分類輔助推斷的另一個例子是,如果分析人員了解敵人通常部署某種武器系統(tǒng)(如地對空導(dǎo)彈系統(tǒng))的特定幾何模式,當(dāng)他獲得某個未知武器系統(tǒng)的部分信息,而這些信息與先前了解的武器系統(tǒng)部署模式相吻合,那么他可以根據(jù)該未知系統(tǒng)的布局將其歸入某具體武器種類,再根據(jù)該武器種類的知識推斷未知系統(tǒng)的其余布局和大致特點(diǎn)。
????????此外,在情報分析中,分類還可用于系統(tǒng)的宣傳分析或內(nèi)容分析(關(guān)于外國出版物、大眾傳媒或軍方和政界要人的公開聲明)。最基本的系統(tǒng)內(nèi)容分析包括公眾話語分析、重要內(nèi)容識別、將編碼話語(內(nèi)容成分)歸入預(yù)設(shè)話語類、列表結(jié)果分析(如相關(guān)性、解讀等)。盡管說起來簡單,但具體實(shí)施起來要復(fù)雜得多。例如,內(nèi)容要素 (或者最好是錄音材料)也許是一個短語、幾個詞或僅僅一個詞,那錄音材料就必須精確界定,還必須毫不含糊地界定錄音材料的分類或類別,僅僅是錄音材料的分類規(guī)則也許就要查閱幾百頁之多的工具書。
【宣傳分析中容易混淆編碼和分類過程,因?yàn)樗诸惖恼Z句本身模棱兩可關(guān)于宣傳分析問題的更多討論,】


二、為什么要分類?
????????分析和研究人員對信息分類的原因有兩個:理解信息和出于方便。作為理解的輔助手段,分類通??梢员砻餍畔⒅g的關(guān)系,這些關(guān)系在雜亂無章的情況下往往難以察覺,明確信息關(guān)系可為下一步的比較和預(yù)測打下基礎(chǔ)?;厮葜暗膬蓚€例子,正是由于對信息進(jìn)行分類和排序,門捷列夫才能預(yù)測缺失元素的屬性,同樣的,分析或研究人員基于結(jié)構(gòu)相似性兩種飛機(jī)歸入同一類,才推斷出兩者具有同樣的性能特點(diǎn)。
????????信息分類還可幫助研究人員發(fā)現(xiàn)缺少的信息,這是提出未來信息搜集要求的第一步。此外,分類體系可為研究人員呈現(xiàn)信息結(jié)構(gòu)的全貌,為其研究提供一個模式或格式塔(結(jié)構(gòu))。但多數(shù)研究人員對信息進(jìn)行分類是為了方便,有了分類體系,他們在與他人交流時就可以使用屬名(generic or class names)而不用提及其具體名稱。例如,在多數(shù)情況下使用“Do”(destroyer)或“驅(qū)逐艦”比使用““普雷斯頓’號驅(qū)逐艦,編號?795、之后的“弗菜徹’級”更方便。(當(dāng)然,有時也需要使用某物體全稱。)
????????此外,分類體系可以將研究人員從紛繁復(fù)雜的細(xì)節(jié)中解放出來,以便集中精力分析他所研究的那一類現(xiàn)象的群體特征或?qū)傩?。由于對分類信息進(jìn)行了索引,因而很容易檢索。因此,依靠分類體系,研究人員既可以只需要類別屬性時過濾細(xì)節(jié),也可以在必要時提取細(xì)節(jié)。總之,對信息分類使分析人員能夠?qū)o限的信息轉(zhuǎn)化成有限的、易于管理的成分,這些成分既能存儲也能檢索。
????????設(shè)計(jì)周密的分類體系帶來的另一個便利是它提供了一種方法,該方法使得在每次加入新信息時,不需要對文檔進(jìn)行大量調(diào)整。有了詳盡的分類體系,研究人員只需將已經(jīng)建立的類別進(jìn)行擴(kuò)充,就可以加人新信息。
????????最后,分類體系還為使用者帶來一個便利,即只要懂得了該體系的基本原理,無論多少人都可以使用同一分類體系。分類體系的基本原理指的是信息分類(或納入體系) 和檢索的規(guī)則。事實(shí)上,只要把規(guī)則定清楚,信息的實(shí)際分類、存儲和檢索就可以自動操作。
【AI自動檢索分類,不錯的選擇】

三、編碼:最基礎(chǔ)的分類
????????最基礎(chǔ)、分析和研究人員最熟悉的分類過程,也許就是編碼過程。
????????誠然,編碼起初是為了處理大量信息,但也可以有效地應(yīng)用于小型研究項(xiàng)目中。編碼有兩個基本步驟:
(1) 將信息分類;
(2) 根據(jù)項(xiàng)目類別給每個項(xiàng)目分配一個編號或代碼。
????????使用計(jì)算機(jī)處理信息時,這一簡單步驟必不可少。每一個進(jìn)人計(jì)算機(jī)數(shù)據(jù)庫的信息都要經(jīng)過分類和編碼,這對于分析人員進(jìn)行人工分析也很有幫助。
????????關(guān)于個人資料和回答問題的內(nèi)容。首先,信息以單獨(dú)的訪談計(jì)劃表或問卷調(diào)查表的形式加以記錄。顯然,這種形式的信息處理起來幾乎不可能,而且,任何單獨(dú)信息顯示的只是來自或關(guān)于單個對象的信息,不能顯示總體人群回答問題的模式。然而,如果按照預(yù)先確定的分類模式對這些回答進(jìn)行編碼,只需將回答類別制成表格,就可以分析群體回答的特征。
????????記錄所有實(shí)驗(yàn)對象的回答,如何將同樣的信息進(jìn)行匯總,以便做進(jìn)一步分析。例如,我們可以看出,所有尉官的回答都比較一致,但與其他對象的回答不同,步兵和炮兵的回答相似,但與后勤兵的回答相異。誠然,由于該樣本量相對較小,因而各類人員的統(tǒng)計(jì)差別并不明顯,但這樣的制表的確可以顯示出回答模式的差異。如果將這些數(shù)據(jù)輸入計(jì)算機(jī)內(nèi),就可以不斷增加數(shù)量,也許還可以揭示出更多該匯總表中所沒有揭示的回答模式,如年齡與軍銜、兵種與年齡、部門與兵種的相關(guān)性等。
????????所舉的這一實(shí)例中,樣本大小只有 89 人,如果樣本量再大些,就需要使用數(shù)據(jù)處理系統(tǒng)。當(dāng)然,如果必須進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析(不包括計(jì)數(shù)),就需要用到計(jì)算機(jī),或者至少需要一個手動計(jì)算器。
【適合“手動處理”的極限數(shù)為大約 150個實(shí)驗(yàn)對象】
【當(dāng)然,你可以嘗試一秒內(nèi)錄入多條信息。。。?!?/span>
【插圖社政敏感,已做無害化刪減處理。。?!?/span>

四、分類的兩種含義
????????分類作為一個動詞,有兩種含義,一方面指的是將某一具體信息分配到分類計(jì)劃預(yù)先確定的位置,另一方面指的是將信息按照相關(guān)子類分開并組織起來。嚴(yán)格來講,第二種做法稱為劃分 (division)。分類的第一種含義,即將某一具體信息分配到分類計(jì)劃預(yù)先確定的位置,可以用截獲接收機(jī)操作員偵查雷達(dá)信號的活動來舉例說明。操作員發(fā)現(xiàn)該信號的參數(shù)與某類預(yù)警雷達(dá)完全相關(guān),據(jù)此判斷該信號來自某特定預(yù)警雷達(dá)。在本例中.預(yù)先確定的每個信號參數(shù)的上下限構(gòu)成了分類的標(biāo)準(zhǔn)。
【類別也稱為定類尺度。上面所定義的分類的第一個含義實(shí)際上是一種計(jì)量方式,雖然只是一個粗略的計(jì)量】
????????分類的第二種含義,即將信息按照相關(guān)子類分開并組織起來。以軍用交通工具分析人員的活動為例,分析人員可將軍用交通工具這一總類劃分成任何子類,如他可以按照推進(jìn)模式、軸數(shù)、用途、重量等方式分類。以下的討論主要圍繞分類的第二種含義 (即進(jìn)行劃分) 展開。

五、分類的步驟
????????分類過程可分為五步,這種步驟劃分沒有精確的標(biāo)準(zhǔn)或嚴(yán)格的次序但通常在將某一對象分類前會確立分類標(biāo)準(zhǔn)。具體步驟如下 ;
1.確定分類體系的目的。
這一步驟非常重要,因?yàn)榉诸愺w系的目的決定了分類的類型。
????????分類學(xué)(關(guān)于分類的科學(xué)) 學(xué)者知道兩種基本的分類體系:自然體系和人為體系。自然體系基于被劃分事物的基本屬性,如由幾部分組成、尺寸、顏色或形狀。自然分類的例子包括之前所說的元素周期表、基于植物花器部分的植物分類、基于頻率和其他信號特征的雷達(dá)分類,或者基于推進(jìn)模式/發(fā)動機(jī)數(shù)量的飛機(jī)分類等。
????????人為分類往往會顯示使用者的需求。根據(jù)生產(chǎn)國對雷達(dá)進(jìn)行分類、將飛機(jī)分為“可疑的”和“友好的”、將海岸和登陸海灘按照適合登陸作戰(zhàn)的程度進(jìn)行劃分等,都是人為分類的例子。
????????完全自然和完全人為分類體系的折中稱為診斷系統(tǒng) (diagnostic? system)。診斷系統(tǒng)既能反映被分類事物或現(xiàn)象的自然屬性,又能反映分類者的意圖。例如,按照不同氣候條件下的交通處理能力對道路進(jìn)行分類,按照其功能對雷達(dá)進(jìn)行分類等。
????????索引分類(index classification) 完全屬于人為分類。索引分類首先考慮的是數(shù)據(jù)的可訪問性,從這個意義上來說,使用者的需求決定了分類標(biāo)準(zhǔn)的選擇。索引分類的例子包括:杜威十進(jìn)制分類系統(tǒng)、美國國會圖書館分類系統(tǒng)、書籍的索引以及按字母順序排列的任何信息。與情報關(guān)系更密切的索引分類包括按照纜索數(shù)目對船只進(jìn)行分類、按照字母順序?qū)以走M(jìn)行列表,以及按照信息到達(dá)時間進(jìn)行分錄分類等。
????????總之,制定分類方案的目的決定了哪種分類體系最為恰當(dāng)。
2.確定分類目的后,需要觀察待分類現(xiàn)象或關(guān)于現(xiàn)象的信息中哪些特征可作為分類標(biāo)準(zhǔn)。
????????研究人員應(yīng)該思考這些事物、事件或其他現(xiàn)象的共性是什么?它們具有哪些特色或獨(dú)特性?研究人員應(yīng)充分展開想象力,考慮到待分類事物的所有相關(guān)因素,有些出現(xiàn)在腦海中的特征剛開始似乎比較膚淺,但這一步驟是找出各種分類可能性的一個嘗試性步驟。
3.從需要分類的事物、事件或現(xiàn)象中找出能夠滿足分類目的的特征。
????????分類的功能應(yīng)圍繞那些與分類目的有關(guān)的現(xiàn)象特征。任何現(xiàn)象都可以有多種分類法,最好的分類法是能滿足使用者特定需求的分類法。例如,如果研究人員研究大殺傷半徑武器系統(tǒng),他會發(fā)現(xiàn)基于武器系統(tǒng)精度的分類與此沒有關(guān)系,因?yàn)闅霃娇梢詮浹a(bǔ)任何精度不足。
????????根據(jù)不同需要可以對導(dǎo)彈進(jìn)行如下分類:如果射程是重要的考慮因素,導(dǎo)彈可分為遠(yuǎn)程導(dǎo)彈(大于 5000 海里)、洲際彈道導(dǎo)彈和中程導(dǎo)彈(300-1500 海里)或中彈道導(dǎo)彈和短程導(dǎo)彈 (小于 300 海里):如果速度是重要的考慮因素,導(dǎo)彈可分為亞音速、音速、超音速(噴氣速率介1至5馬赫之間)和極超音噴氣速率超過 5 馬),基于控制系統(tǒng),導(dǎo)彈可分為非制導(dǎo)/自由飛行火箭或制導(dǎo)導(dǎo)彈。制導(dǎo)導(dǎo)彈根據(jù)其制導(dǎo)系統(tǒng)還可以進(jìn)行再分類,如指令制導(dǎo)、航跡推算、定位和自導(dǎo)或?qū)さ闹茖?dǎo)系統(tǒng)導(dǎo)彈還有其他的分類方法,但要明白,任何現(xiàn)象毫無例外都可以根據(jù)其自身特征進(jìn)行各種分類,但最重要的是要根據(jù)分類者的需要。
4.確定各等級間或等級與等級之間的關(guān)系。
????????這一步涉及兩件事,首先是給出判斷兩個事物相關(guān)的定性標(biāo)準(zhǔn),其次是給出事物劃分的高低等級。基本來講,研究人員必須確定(或建立) 各個條目對應(yīng)虛構(gòu)的抽象概念階中的哪一級。例如,“蘇聯(lián)噴氣戰(zhàn)斗機(jī)”作為一種空中飛行器在虛構(gòu)的抽象概念階中,高于“米格戰(zhàn)斗機(jī)”但低于該階中的“固定翼飛機(jī)”。
????????分析和研究人員也會碰到不需要劃分等級的情況。例如,雷達(dá)可按照頻率分類為脈沖重復(fù)頻率(PRF)、脈沖寬度、掃描頻率和偏振模式。這種情況下,具有相同運(yùn)行參數(shù)的雷達(dá)可劃歸一類。例如,將運(yùn)行頻率在1550-3900兆赫的雷達(dá)劃為一類,稱為 S 波段雷達(dá),或者將位于某個特定地理位置的各種雷達(dá)劃為一類,再按照功能進(jìn)一步分類等等。這些分類均沒有考慮等級因素。
5.將分類標(biāo)準(zhǔn)應(yīng)用于“全體”,所有個體都劃歸到相應(yīng)組中。
????????這一步完成后,你就已經(jīng)做完了一輪工作。這一步驟的做法與分類的第一種含義完全契合,也就是說,將個體劃歸到特定類別中。

六、分類體系的測試
????????在大規(guī)模應(yīng)用某個分類體系前,應(yīng)該進(jìn)行初步的試驗(yàn),在試驗(yàn)前,還應(yīng)圍繞以下幾個問題對該體系進(jìn)行檢查 :
1.現(xiàn)象的分類規(guī)則是否一致?
2.各類別是否相互排斥,即類別之間有無重疊??
(現(xiàn)象可以有多種分類法,但每種分類模式都自成體系。)
3.體系是否完善?能否滿是設(shè)計(jì)意圖
(即是否存在與現(xiàn)有類別不適應(yīng)的成分) ?
4.每種分類是否都可以至少劃分成兩項(xiàng)?
(如果沒有兩個次級項(xiàng),就不能稱其為一個類)

七、分類是去掉部分之后對現(xiàn)實(shí)的抽象
????????之前關(guān)于分類的討論是圍繞分類二元設(shè)計(jì)的“兩可”邏輯。應(yīng)該注意所有分類計(jì)劃都具有任意性,每種分類體系或多或少都能反映現(xiàn)實(shí)世界。盡管我們可以抽象地說某個事物或事件屬于這個或那個類別,但現(xiàn)實(shí)世界很難符合一個理想的分類體系。分類者通常只是隨機(jī)決定群組分配,只要記住分類的目的,隨機(jī)決定并沒有什么壞處。但是,保持一致性非常重要,這樣,任何使用該體系的人才會將同樣的現(xiàn)象以同樣的方式分類。最后需要記住的是,即使對專業(yè)分類學(xué)者或“分類者”來說,分類本身也不是結(jié)果,尤其是在情報研究中,分類只是分析過程的第一步。

八、小 結(jié)
分類,即將信息分配到不同類別的過程,是各類研究、許多問題解決活動和所有檢測活動的一個必要步驟。
分類有兩個主要的目的更好地理解信息,更方便地存儲和檢索信息。
分類過程通常涉及五步:
確定分類的目的;
研究待分類現(xiàn)象的信息,以便建立將信息歸類的依據(jù);
按照信息分類的目的選擇恰當(dāng)?shù)姆诸愐罁?jù);
識別各類信息之間及各自之間的關(guān)系,例如等級關(guān)系、子集關(guān)系等等;
將信息劃歸到具體的群組或類別中。
分類規(guī)則要求 :
現(xiàn)象(或信息)的歸類要一致 ;
各分級或分類之間應(yīng)相互排斥?;
體系要完整,所有成分都能夠歸入某一類,并且不會剩下任何成分;
- 每個母集至少要有兩個子集。