最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

案例 | 基于JMP的機(jī)器學(xué)習(xí),解決半導(dǎo)體良率問題

2021-09-27 11:43 作者:JMP數(shù)據(jù)分析  | 我要投稿

伴隨半導(dǎo)體行業(yè)的數(shù)據(jù)采集能力持續(xù)增強(qiáng),數(shù)據(jù)分析業(yè)務(wù)場(chǎng)景日趨復(fù)雜,通過(guò)挖掘數(shù)據(jù)背后信息解決實(shí)際業(yè)務(wù)問題、支持量化決策的價(jià)值日益突顯。機(jī)器學(xué)習(xí)方法在解決一些復(fù)雜的數(shù)據(jù)分析業(yè)務(wù)場(chǎng)景時(shí),能夠保障分析結(jié)果的準(zhǔn)確性,并能提高分析效率。

那么,究竟機(jī)器學(xué)習(xí)在半導(dǎo)體行業(yè)有哪些應(yīng)用?本文以一個(gè)典型性案例來(lái)介紹機(jī)器學(xué)習(xí)在半導(dǎo)體良率提升方面的應(yīng)用及思路,希望對(duì)大家有所啟發(fā)。


為什么選擇機(jī)器學(xué)習(xí)?

機(jī)器學(xué)習(xí),是一種可以基于樣本數(shù)據(jù)自動(dòng)化構(gòu)建數(shù)學(xué)模型,以便能夠基于新觀測(cè)的輸入數(shù)據(jù)來(lái)預(yù)測(cè)輸出結(jié)果的分析方法。


以半導(dǎo)體為代表的現(xiàn)代高端制造業(yè)和質(zhì)量管理大致經(jīng)歷了以下幾個(gè)發(fā)展階段:

  • 企業(yè)通過(guò)IT建設(shè), 搭建業(yè)務(wù)管理系統(tǒng),全面管理數(shù)據(jù)信息,開啟業(yè)務(wù)數(shù)據(jù)化的進(jìn)程;

  • 通過(guò)過(guò)引進(jìn)諸如六西格瑪?shù)瘸墒斓墓芾眢w系,改善運(yùn)營(yíng)水平;

  • 不斷提升數(shù)據(jù)采集能力,打造智能工廠;

  • 希望充分挖掘數(shù)據(jù)背后的價(jià)值,從而形成數(shù)據(jù)業(yè)務(wù)化的閉環(huán)。

在數(shù)據(jù)無(wú)處不在、數(shù)據(jù)量爆炸式增長(zhǎng)的今天,如何高效的利用數(shù)據(jù)、選擇適合的分析方法成為了關(guān)鍵,機(jī)器學(xué)習(xí)正是在這樣的背景下走入了工程人員的視野。


相比傳統(tǒng)方法,機(jī)器學(xué)習(xí)有哪些優(yōu)勢(shì)?

在機(jī)器學(xué)習(xí)的世界里:

  • 解決問題的方法從來(lái)都不是唯一的;

  • 多個(gè)算法往往可以用來(lái)解決同一個(gè)問題,并且沒有哪個(gè)算法總是表現(xiàn)最優(yōu)

  • 因此,從中選擇最適合的那一個(gè)。

從數(shù)據(jù)科學(xué)角度看,機(jī)器學(xué)習(xí)訓(xùn)練模型的過(guò)程是一個(gè)“偏差-方差權(quán)衡 (Bias-Variance Trade-off)”的問題,通過(guò)交叉驗(yàn)證可以盡可能地規(guī)避欠擬合和過(guò)擬合問題。

  • 所謂偏差小,也就是擬合效果好,即盡可能地契合所有樣本觀測(cè)點(diǎn);

  • 所謂方差小,也就是對(duì)于同一總體數(shù)據(jù),每一次抽樣樣本擬合的模型應(yīng)該差不多。


下面,我們通過(guò)一個(gè)案例研究來(lái)具體問題具體分析。


案例背景

半導(dǎo)體終端產(chǎn)品的產(chǎn)生需要經(jīng)由數(shù)百個(gè)步驟組成的制造過(guò)程,數(shù)據(jù)量龐大,而且異常復(fù)雜。在制造過(guò)程的最后,還有兩個(gè)用于對(duì)芯片進(jìn)行分類的補(bǔ)充步驟:參數(shù)測(cè)試和電性晶圓分類,這兩個(gè)步驟都是電性測(cè)試,也是本文案例的分析對(duì)象。


定義業(yè)務(wù)問題

工程師在某半導(dǎo)體產(chǎn)品 EWS (Electrical Wafer Sort) 測(cè)試的 BIN10 上觀測(cè)到了良率損失(在某些晶圓上的良率損失高達(dá) 10%),推測(cè)該損失與某個(gè) PT 參數(shù)效應(yīng)有關(guān),因此,一旦確定了 PT 參數(shù),就很容易找到相關(guān)的過(guò)程參數(shù),從而形成糾正和預(yù)防措施。

因此,棘手問題是:如何迅速找到與 BIN10 不良最密切相關(guān)的 PT 參數(shù)?

接下來(lái),我們按照典型的機(jī)器學(xué)習(xí)預(yù)測(cè)建模流程的“天龍八步”來(lái)詳細(xì)分析問題。


數(shù)據(jù)采集和準(zhǔn)備

  • 將用于良率分析的數(shù)據(jù)進(jìn)行關(guān)聯(lián);

  • 比如,按 Lot ID + Wafer ID 關(guān)聯(lián) EWS,Parameter Test,Equipment,甚至 OVL, ADI, THK 等 Inline Test 數(shù)據(jù);

  • 最終,對(duì)于本例的數(shù)據(jù)集約 ~560 行,~650 列,即某種意義上的寬型數(shù)據(jù)。



數(shù)據(jù)變換

通過(guò)JMP直觀的直方圖,可以看到,由于 EWS1_BIN10 數(shù)據(jù)近似服從對(duì)數(shù)正態(tài)分布 (偏態(tài)分布),因此工程師對(duì)其進(jìn)行對(duì)數(shù)變換,從而轉(zhuǎn)換為近似正態(tài)分布 (對(duì)稱分布)

一般情況下,這有利于后續(xù)的預(yù)測(cè)建模分析。




預(yù)測(cè)建模方法選擇

傳統(tǒng)統(tǒng)計(jì)分析方法(如單因子分析)分析 EWS1_BIN10 和所有 Parameter Test 參數(shù)的相關(guān)性往往低效,且具有片面性;

數(shù)據(jù)缺失問題(40% 左右的 Parameter Test 列變量缺失值比例在 25% 以上),高維寬型數(shù)據(jù)的多重共線性和超飽和問題等又導(dǎo)致傳統(tǒng)統(tǒng)計(jì)分析方法往往具有局限性。

工程師最終發(fā)現(xiàn)基于決策樹的集成算法隨機(jī)森林 (Bootstrap Forest)?等機(jī)器學(xué)習(xí)算法更適合應(yīng)對(duì)此類問題。


隨機(jī)森林是基于決策樹的一種集成機(jī)器學(xué)習(xí)方法。

其差異性在于:

  • 隨機(jī):樣本的隨機(jī)性 / 預(yù)測(cè)變量的隨機(jī)性

  • 森林構(gòu)建多棵決策樹共同參與決策

從改進(jìn)單棵決策樹的準(zhǔn)確性,并減少方差,讓預(yù)測(cè)建模效果更好。


隨機(jī)森林預(yù)測(cè)建模

使用變換后的 Log(Bin10) 作為響應(yīng) Y,使用 595 個(gè) PT Parameters 作為預(yù)測(cè)變量 Xs ,進(jìn)行 Bootstrap Forest 建模。

隨機(jī)森林總共構(gòu)建 100 棵樹,在每一個(gè)拆分處考慮 148 個(gè)隨機(jī)選擇的預(yù)測(cè)變量。

每次訓(xùn)練模型的樣本都是基于Bootstrap的抽樣方式構(gòu)成的隨機(jī)訓(xùn)練集。利用這兩個(gè)隨機(jī)性,提升模型的準(zhǔn)確度。


模型診斷及結(jié)果分析


從模型的輸出報(bào)表,可以看到:

  • 訓(xùn)練集獲得了較高的 R2,驗(yàn)證集和測(cè)試集的 R2 損失較小,并且兩者的偏差較小,因此,所建立的模型可以很好地解釋過(guò)程變異。

  • 此外,通過(guò)查看對(duì)森林有非零貢獻(xiàn)的列變量,識(shí)別可能影響 Y 的因子,而根因?qū)⑹悄切┴暙I(xiàn)最大的因子,因?yàn)樘囟ㄗ兞颗c響應(yīng)的相關(guān)性越大,被選擇的頻率就越高。



根因識(shí)別

工程師將列貢獻(xiàn)最大的變量提取出來(lái)后發(fā)現(xiàn):

  • 列貢獻(xiàn)大?(本例選取Top6)?的預(yù)測(cè)變量之間可能存在共線性,因此,可以結(jié)合主成分或多元相關(guān)分析和工程經(jīng)驗(yàn)進(jìn)一步甄別;

  • 對(duì)于本例,工程師最終將 171_PT 識(shí)別為最重要的影響因子。



結(jié)果驗(yàn)證

工程師通過(guò)進(jìn)一步追溯變異源,發(fā)現(xiàn) 171_PT 和某關(guān)鍵工藝設(shè)備之間存在明顯的相關(guān)性,Tukey-Kramer 多重比較確認(rèn)了該差異的顯著性。

因此,工程師可以展開更進(jìn)一步的排查設(shè)備問題,找到導(dǎo)致過(guò)程輸出變異和波動(dòng)的原因,從而形成有針對(duì)性的預(yù)防措施和改進(jìn)措施。


模型部署及應(yīng)用

越來(lái)越多的高端制造企業(yè)期望借助不同的工具和方法搭建大數(shù)據(jù)分析平臺(tái),打造智能工廠,因此,我們將類似本案例所獲得模型以通用代碼形式部署于企業(yè)級(jí)的大數(shù)據(jù)分析平臺(tái),這是實(shí)現(xiàn)預(yù)測(cè)性質(zhì)量控制和預(yù)測(cè)性維護(hù)的有效手段之一,也是被證明行之有效的科學(xué)方法。

JMP作為業(yè)界頂尖的數(shù)據(jù)分析品牌,提供了豐富多樣的預(yù)測(cè)建模和數(shù)據(jù)挖掘手段,并持續(xù)被Forrester評(píng)為數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和預(yù)測(cè)分析領(lǐng)域的領(lǐng)導(dǎo)者,其系列產(chǎn)品廣泛地被財(cái)富500強(qiáng)公司、世界50強(qiáng)半導(dǎo)體企業(yè)、主要政府機(jī)構(gòu)所使用,并能夠幫助決策者、分析人員真正地從數(shù)據(jù)中挖掘出對(duì)企業(yè)經(jīng)營(yíng)決策有益的信息。


想要了解更多案例研究及JMP在半導(dǎo)體領(lǐng)域的應(yīng)用,歡迎下載完整白皮:https://www.jmp.com/zh_cn/whitepapers/bootstrap-forest-yield-analysis.html?utm_campaign=wp7011U0000009iC4&utm_source=bilibili&utm_medium=social

你也可以下載JMP免費(fèi)試用:

https://www.jmp.com/zh_cn/download-jmp-free-trial.html?utm_campaign=td7013Z000002sEGsQAM&utm_source=bilibili&utm_medium=social

案例 | 基于JMP的機(jī)器學(xué)習(xí),解決半導(dǎo)體良率問題的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
隆化县| 永福县| 高平市| 东乡县| 新巴尔虎右旗| 济源市| 图木舒克市| 九江市| 克东县| 晋州市| 大姚县| 岳池县| 西丰县| 上高县| 邛崃市| 咸阳市| 福海县| 昌黎县| 达日县| 阿克苏市| 周宁县| 巨鹿县| 广汉市| 即墨市| 林芝县| 定州市| 滕州市| 太仓市| 岗巴县| 镇江市| 潮州市| 道孚县| 临武县| 赤水市| 龙江县| 鹤山市| 通许县| 崇仁县| 潮安县| 会昌县| 彭山县|