人工智能AI面試題-6.1 如何通俗理解深度學(xué)習(xí)中的注意力力機(jī)制
6.1 如何通俗理解深度學(xué)習(xí)中的注意力力機(jī)制 最近兩年,注意力模型(??Attention Model)被廣泛使用在??自然語言處理、??圖像識(shí)別及語音識(shí)別等各種不同類型的深度學(xué)習(xí)任務(wù)中,是深度學(xué)習(xí)技術(shù)中最值得關(guān)注與深入了解的核心技術(shù)之一。本文以機(jī)器翻譯為例,深入淺出地介紹了深度學(xué)習(xí)中注意力機(jī)制的原理及關(guān)鍵計(jì)算機(jī)制,同時(shí)也抽象出其本質(zhì)思想,并介紹了注意力模型在圖像及語音等領(lǐng)域的典型應(yīng)用場景。 ??注意力模型最近幾年在深度學(xué)習(xí)各個(gè)領(lǐng)域被廣泛使用,無論是圖像處理、語音識(shí)別還是??自然語言處理的各種不同類型的任務(wù)中,都很容易遇到注意力模型的身影。所以,了解注意力機(jī)制的工作原理對于關(guān)注深度學(xué)習(xí)技術(shù)發(fā)展的技術(shù)人員來說有很大的必要。 ??人類的視覺注意力 從注意力模型的命名方式看,很明顯其借鑒了??人類的注意力機(jī)制,因此,我們首先簡單介紹??人類視覺的選擇性注意力機(jī)制。 ??圖1 ??人類的視覺注意力 視覺注意力機(jī)制是??人類視覺所特有的??大腦信號(hào)處理機(jī)制。??人類視覺通過快速掃描全局圖像,獲得需要重點(diǎn)關(guān)注的??目標(biāo)區(qū)域,也就是一般所說的注意力焦點(diǎn),而后對這一區(qū)域投入更多注意力資源,以獲取更多所需要關(guān)注目標(biāo)的細(xì)節(jié)信息,而抑制其他無用信息。這是??人類利用有限的注意力資源從??大量信息中快速篩選出高價(jià)值信息的????手段,是??人類在長期進(jìn)化中形成的一種??生存機(jī)制,??人類視覺注意力機(jī)制極大地提高了視覺信息處理的效率與準(zhǔn)確性。 ??圖1形象化展示了??人類在看到一副圖像時(shí)是如何??高效分配有限的注意力資源的,其中紅色區(qū)域表明??視覺系統(tǒng)更關(guān)注的目標(biāo),很明顯對于圖1所示的場景,??人們會(huì)把注意力更多投入到??人的臉部,??文字的標(biāo)題以及??文章首句等位置。 深度學(xué)習(xí)中的注意力機(jī)制從本質(zhì)上講和??人類的選擇性視覺注意力機(jī)制類似,核心目標(biāo)也是從眾多信息中選擇出對當(dāng)前任務(wù)目標(biāo)更關(guān)鍵的信息。 ??Encoder-Decoder框架 要了解深度學(xué)習(xí)中的注意力模型,就不得不先談Encoder-Decoder框架,因?yàn)槟壳按蠖鄶?shù)注意力模型附著在Encoder-Decoder框架下,當(dāng)然,其實(shí)注意力模型可以看作一種通用的思想,本身并不依賴于特定框架,這點(diǎn)需要注意。 Encoder-Decoder框架可以看作是??一種深度學(xué)習(xí)領(lǐng)域的研究模式,應(yīng)用場景異常廣泛。??圖2是??文本處理領(lǐng)域里常用的Encoder-Decoder框架最抽象的一種表現(xiàn)。