案例:神經(jīng)網(wǎng)絡(luò)建模 + 可視化分析 = 提效增質(zhì)的利器!

在電子制造業(yè)企業(yè),由于器件尺寸比較小、生產(chǎn)周期比較短等特征,設(shè)備及產(chǎn)品的異常診斷能力變得非常重要,其能力的強弱甚至在某種程度上成為企業(yè)競爭力的一部分。如何快速、高效地識別這些異常,如何利用計算機系統(tǒng)輔助人類做好提前預(yù)警和分析,成為企業(yè)提效增質(zhì)、提高良率不可或缺的一項重要競爭優(yōu)勢。

今天我們以高科技電子行業(yè)的一個案例為例,來看看如何通過強大的神經(jīng)網(wǎng)絡(luò)建模+獨特的可視化分析,幫助數(shù)據(jù)分析人員大幅減少異常芯片的識別與偵測時間,從而從根本上為企業(yè)提效增質(zhì)。本文作者袞雪,JMP特約專欄作者,數(shù)據(jù)分析愛好者。如果你也想成為JMP合作專欄作者,或者想投稿,歡迎在JMP微信公眾號對話框私信小編,或發(fā)送郵件至 jmpmarketing@sas.com 和小編聊聊哦~
為什么可續(xù)的數(shù)據(jù)分析如此重要?
眾所周知,質(zhì)量對于公司來說意味著制造成本、出貨周期和品牌價值。所以幾乎每家企業(yè)都把質(zhì)量看作重中之重。那么如何改善企業(yè)的基準(zhǔn)質(zhì)量水平則是一項艱巨的任務(wù)。
以上是常見的電子類企業(yè)的典型生產(chǎn)步驟,其中:
晶圓生長晶圓生長是指半導(dǎo)體集成電路制作所用的硅晶片,由于其形狀為圓形,故稱為晶圓;在硅晶片上可加工制作成各種電路元件結(jié)構(gòu),而成為有特定電性功能的集成電路產(chǎn)品。
封裝工藝封裝工藝是將通過測試的晶圓按照產(chǎn)品類型及功能需求加工得到獨立芯片的過程。
最終測試最終測試是通過一系列的檢測項目來偵測每顆獨立芯片的好壞的過程。我們重點看下這里的“最終測試”步驟,也即是檢測整個晶圓上所有芯片質(zhì)量的過程。
在最終測試階段,傳統(tǒng)方法采用的是人工識別,即通過個人判斷將有問題的晶圓圖一一記錄下來,再做后續(xù)處理工作。
然而實際工作中,人工識別常常會面臨以下問題:漏檢圖形
每個人在面臨上百張晶圓檢測圖的時候,幾乎不可能做到每張圖一一過目,很可能由于疲勞等因素錯過了一些重要的圖形,而這些圖形往往蘊藏著潛在的信息。耗時過長
即使個人能夠在力所能及的范圍內(nèi),觀察到一些晶圓檢測圖,但整個過程非常耗時,沒有將人工的時間用在解決核心問題上。標(biāo)準(zhǔn)不統(tǒng)一
對于沒有出現(xiàn)過的圖形,其判斷標(biāo)準(zhǔn)會隨著個人的標(biāo)準(zhǔn)不同有所差異,這樣同樣會造成潛在信息的丟失。
基于以上這些不可避免的因素,計算機高科技領(lǐng)域可視化分析技術(shù)就能夠大顯身手了。比如,我們把每顆獨立芯片的檢測結(jié)果按照它們在晶圓上面的位置一一對應(yīng),所得的檢測結(jié)果輸入到JMP軟件,借助于JMP獨特的可視化神器——圖形生成器,就可以輕松生成以下的晶圓檢測圖,從而快速地識別出有問題的產(chǎn)品。

其中,不同顏色代表著最終測試檢測值的大小。紅色最大,依次遞減,藍色最小。
從圖上輕松看到,晶圓右下方藍色部分的檢測值偏低。這意味著什么呢?意味著在晶圓生長的時候這一區(qū)域有異常,需要盡快調(diào)查及解決。這樣工程師就可以馬上著手針對這類有問題的芯片進行快速跟進了。那么,具體該如何開展實施呢?我們以一個案例來說明。
案例分析—快速識別晶圓缺陷
某電子企業(yè)的工程師在最終測試階段收集到了1559個芯片的缺陷數(shù)據(jù),想分析其中某一項缺陷的比率隨著位置的變化是否呈現(xiàn)規(guī)律。如果某一位置的缺陷率為‘0’,代表在這個位置沒有出現(xiàn)過這項缺陷。如果在這個位置的缺陷率很高,則表明,次品集中在這個位置。
通過這種缺陷圖形的尋找,最終為前道諸多工序建立另一種質(zhì)量偵測手段或者指標(biāo),可以作為整體質(zhì)量提升的突破。

在數(shù)據(jù)表中,LocX和LocY列分別是行、列坐標(biāo)值,數(shù)值類型為名義值。最后一列為缺陷率,即在過去一段時間內(nèi)某一位置出現(xiàn)缺陷的比率。
為了更好地判斷問題,項目團隊最終選擇了神經(jīng)網(wǎng)絡(luò)算法。原因有以下幾點:
項目需要算法能夠從原始數(shù)據(jù)中自動發(fā)現(xiàn)需要檢測的特征。
神經(jīng)網(wǎng)絡(luò)的算法一般都有多個層次,每一個層次做一次變換,這樣可以有多次機會抓取不同特征。
通常來說,用來做訓(xùn)練的數(shù)據(jù)量越多,可以更好地提高其準(zhǔn)確性。
一圖勝千言!接下來我們看看如何在JMP中一步步實施分析。
首先,將數(shù)據(jù)導(dǎo)入JMP,把收集到的位置缺陷率轉(zhuǎn)換為數(shù)據(jù)值并通過圖形生成器來呈現(xiàn)。打開JMP菜單:分析(Analyze) -> 預(yù)測建模(Predictive modeling) -> 神經(jīng)(Neural),把需要觀測的缺陷率放在“Y,Response”,把Loc X和Loc Y放入“X,F(xiàn)actor”:

進入模型配置窗口,按照以下參數(shù)輸入。本例從默認的神經(jīng)網(wǎng)絡(luò)模型開始,逐步增加更復(fù)雜的模型有兩個隱藏層和其他的激活函數(shù)。最終選定以下配置(截圖所示)。
在fitting option部分,告訴JMP重復(fù)多少次模型擬合算法。最終JMP會選擇具有最佳驗證統(tǒng)計量的迭代作為最終模型。本文最終采用10.

點擊Model左邊紅色小箭頭,選擇保存公式(Save Formulas),主要是為了存儲變換之后的數(shù)值以備用。
這樣經(jīng)過行列轉(zhuǎn)換后,得到以下新的數(shù)據(jù)表:

如果用圖形來簡單說明轉(zhuǎn)換過程的話,就如下圖所示:

接下來,應(yīng)用JMP 獨有的“圖形生成器(Graph Builder)”開展分析。這里我們將LocX放到橫軸,LocY放到縱軸,Transform Value放到右上角的Color中,點擊Graph Builder下面的紅色小箭頭,選擇Local Data Filter:

在Local Data Filter下選擇Label:

然后,再選擇紅色小箭頭——“Animation”,得到以下動態(tài)圖形:

這個動圖主要展示了JMP在內(nèi)部運算過程中是如何逐一掃描整個wafer,最終找到最優(yōu)解的過程。其中H1_1是指第一個隱藏層的第一個節(jié)點,以此類推。
這就是在模型構(gòu)建層面我們的思路和策略。那么,具體到實際項目的應(yīng)用層面,應(yīng)該怎么部署和分析呢?我們來繼續(xù)探討。
落地應(yīng)用:項目部署及成效
按照上面JMP生成的模型,接下來我們就可以部署在應(yīng)用層面。
在部署層面,實際上我們只需要建立一個ranking model,即排序模型。這個模型不需要保證每一個計算結(jié)果都非常精確,最重要的是能夠在多個wafer map中抓到最顯著的圖形即可。由于數(shù)據(jù)量較大以及服務(wù)器是Linux系統(tǒng)(相對穩(wěn)定),故而采用python程序從數(shù)據(jù)庫中提取數(shù)據(jù),根據(jù)以上神經(jīng)網(wǎng)絡(luò)方法把有問題的wafer map按照RSquare排序。
之所以選擇RSquare排序,是想按照模型的顯著性來代表是否抓到了pattern。即模型越顯著,代表著抓到pattern的可能性越大。關(guān)于Generalized R-square如何計算(截圖所示),可參考之前我們推送的文章“我的智造我做主-一個案例帶你看明白神經(jīng)網(wǎng)絡(luò)如何助力企業(yè)提速增效”。

舉例如下,這里有以下7類次品(從Defect A到Defect G),每一行代表wafer map上X,Y坐標(biāo),以及在相應(yīng)坐標(biāo)位置上不同次品類型分別累計(某一周)的缺陷率。

按照上一節(jié)介紹的算法以及Rsquare排序如下,這時我們發(fā)現(xiàn)Defect C和Defect A是所有類型的次品中值最高的(如果定義閾值為>0.7的話,當(dāng)然閾值可以根據(jù)案例自己定義)。

那么經(jīng)過Graph Builder 生成的Defect C和Defect A次品圖形確實非常值得研究,而值最低的Defect D,經(jīng)過Graph Builder畫出wafer map后圖形確實不明顯。
Defect C(RSquare值高)-右側(cè)邊緣圖形:

Defect A(RSSquare值高)-中心右上方圖形:

Defect D(RSSquare值低)-幾乎看不出圖形

以下是系統(tǒng)架構(gòu)示意圖:

需要注意的是,人工根據(jù)樣本數(shù)據(jù),通過JMP計算,需要每個月為模型更新第一層和第二層layer中的節(jié)點數(shù)(比如對于新出現(xiàn)的pattern,當(dāng)前配置是否可以識別到,需要考慮調(diào)整節(jié)點數(shù)等),以便使模型的計算更加有效。
通過這個方法,經(jīng)實踐證明,企業(yè)中每名數(shù)據(jù)分析人員平均每周減少60%的圖形識別時間,而且異常圖形平均偵測時間累計較以前縮短70%,為企業(yè)質(zhì)量管控整體水平提升做出了巨大的貢獻。
思考:你的企業(yè)是否遇到同樣問題?
通過上述實戰(zhàn)案例我們可以看到,產(chǎn)品的良率偵測僅僅依靠人工不僅耗時耗力,還容易出現(xiàn)錯誤、漏檢等情況,而重要的質(zhì)量風(fēng)險卻往往隱藏在某些人工無法識別的地方。
這就好比一座冰山,人們往往關(guān)注露出水面部分的問題,但是水面以下的部分往往由于各種原因沒有辦法看到。

借助于先進的計算機系統(tǒng)和技術(shù),可以很好地解決問題:
計算機可以利用人工休息時間(如周末 / 晚上),搜尋整個冰山,持續(xù)運算以尋找有圖案的晶圓圖,然后將有顯著圖案的部分標(biāo)注出來,從而有效節(jié)省了人工的搜尋時間,將人工精力更多地放在解決問題上。
計算機可以做到及時且穩(wěn)定的輸出搜尋結(jié)果,一旦偵測到問題,立即上報,從而從根本上節(jié)省了質(zhì)量偵測的周期時間。
事實上,不僅僅是在電子類企業(yè),對于醫(yī)療、環(huán)保、生物保護等各個領(lǐng)域,如果能將圖像識別與可視化技術(shù)廣泛結(jié)合起來使用,必將為疾病的早期診斷與治療、環(huán)境的異常偵測與保護、野生動物身份識別與保護等提供科學(xué)的技術(shù)支撐和推動作用。