NeuroImage | 右側(cè)顳上回在語義規(guī)則學(xué)習(xí)中的作用:來自強(qiáng)化學(xué)習(xí)模型的證據(jù)

在現(xiàn)實生活中,許多規(guī)則的獲取通常需要使用語言作為橋梁,特別是語義在信息傳遞中起著至關(guān)重要的作用。另外,個體使用的語言往往具有明顯的獎勵和懲罰元素,如贊揚和批評。一種常見的規(guī)則是尋求更多的贊揚,同時避免批評。以往的研究使用概率反轉(zhuǎn)學(xué)習(xí)任務(wù)來檢查抽象規(guī)則的學(xué)習(xí)。這個任務(wù)的結(jié)構(gòu)涉及兩個行為選擇的獎勵分配:當(dāng)一個行為是高獎勵,則另一個必然是高懲罰,反之亦然,并且在一段時間后規(guī)則將會發(fā)生偶然性的反轉(zhuǎn)。這些研究經(jīng)常使用不規(guī)則的圖像作為刺激,以檢查非語言刺激和反應(yīng)之間的聯(lián)系。然而,與非語言刺激相比,詞匯的語義處理需要額外的認(rèn)知資源,語義和反應(yīng)之間的連接可能會更加復(fù)雜。
近日,遼寧師范大學(xué)腦與認(rèn)知神經(jīng)科學(xué)研究中心的劉歡歡副教授(通訊作者)和劉林焱(第一作者)在國際高水平期刊《NeuroImage》上發(fā)表題為“The right superior temporal gyrus plays a role in semantic-rule learning: Evidence supporting a reinforcement learning model”的研究論文。論文在強(qiáng)化學(xué)習(xí)框架下,采用Rescorla-Wagner強(qiáng)化學(xué)習(xí)算法的分層貝葉斯擴(kuò)展模型,涉及期望值、預(yù)測誤差、學(xué)習(xí)率和結(jié)果敏感性,以此推斷被試與規(guī)則學(xué)習(xí)相關(guān)的內(nèi)部狀態(tài),設(shè)計了語義規(guī)則和顏色規(guī)則的學(xué)習(xí)任務(wù),并巧妙的加入了一個弱語義規(guī)則學(xué)習(xí)任務(wù),即第二語言(L2)下的規(guī)則學(xué)習(xí)。結(jié)果表明涉及語義的規(guī)則學(xué)習(xí)并不是類似于條件刺激-反應(yīng)的一般符號學(xué)習(xí),而是具有自己獨特的特征,右側(cè)顳上溝在這種語義規(guī)則的學(xué)習(xí)中至關(guān)重要。
實驗設(shè)計
實驗要求被試判斷何種規(guī)則(即語義規(guī)則或顏色規(guī)則)對應(yīng)當(dāng)前規(guī)則學(xué)習(xí)任務(wù)中的最高獎勵概率。例如,前20?次試驗中的規(guī)則是顏色,那么選擇正確的顏色會導(dǎo)致獎勵與懲罰的比例為80:20。此時,如果被試根據(jù)語義類別選擇刺激,則獎勵與懲罰的比例為50:50。該實驗共進(jìn)行四輪,其中兩次以中文呈現(xiàn),兩次以英文呈現(xiàn)(見圖1)。

實驗結(jié)果

如圖2所示,當(dāng)規(guī)則更新時,被試重新學(xué)習(xí)了正確的規(guī)則。強(qiáng)化學(xué)習(xí)模型一共建立了四個語言模型、四個規(guī)則模型和一個基線模型?;€模型不包括語言和規(guī)則的影響。通過一般適用信息標(biāo)準(zhǔn)(WAIC)篩選出最優(yōu)的語言模型和最優(yōu)的規(guī)則模型。最后,將最優(yōu)的語言模型和最優(yōu)的規(guī)則模型結(jié)合,形成一個整合模型。如圖3所示,根據(jù)強(qiáng)化學(xué)習(xí)模型WAIC指標(biāo)的比較,整合模型具有最低的WAIC。

敏感性分析如圖4所示,L1組的敏感性顯著高于L2。結(jié)果敏感度越高,被試越傾向于獲得獎勵或不接受懲罰。fMRI的結(jié)果也表明在反饋階段,左側(cè)紋狀體(MNI空間坐標(biāo):-33, - 6, 9)在L1組下的激活強(qiáng)于L2(GRF校正),支持了母語反饋比外語反饋的規(guī)則學(xué)習(xí)更敏感。此外,敏感性與不同語言下的平均獎勵得分的相關(guān)分析表明,敏感度越高的被試積累的獎勵越多,任務(wù)表現(xiàn)越好。

如圖5所示,語義規(guī)則下對于預(yù)測誤差的加工定位于右側(cè)顳上回(STG),表明右側(cè)STG是言語刺激學(xué)習(xí)中一個獨特的腦區(qū)。注意,這是回歸的斜率差異,而不是激活的差異。語義規(guī)則條件主效應(yīng)的回歸方向為正,而顏色規(guī)則條件的回歸方向為負(fù),表明不同規(guī)則在右側(cè)STG的活動模式差異是定性的,而不是定量的。

結(jié)論
這項研究揭示了語義影響規(guī)則學(xué)習(xí)的神經(jīng)基礎(chǔ)。研究修正了傳統(tǒng)的強(qiáng)化學(xué)習(xí)模型,將語言對結(jié)果敏感性的影響、規(guī)則對學(xué)習(xí)率的影響納入其中,以證實語義通過特殊的“條件刺激”影響規(guī)則學(xué)習(xí)。結(jié)果表明,母語的規(guī)則學(xué)習(xí)對反饋更為敏感,被試能夠根據(jù)當(dāng)前規(guī)則調(diào)整自己的學(xué)習(xí)策略。重要的是,這項研究揭示了語言刺激的規(guī)則學(xué)習(xí)存在獨特的神經(jīng)機(jī)制,定位于右側(cè)STG。這些發(fā)現(xiàn)強(qiáng)調(diào)了依賴于語言的規(guī)則學(xué)習(xí)有其特殊性,不同于一般符號的學(xué)習(xí)。
論文信息:Linyan Liu, Dongxue Liu, Tingting Guo, John W. Schwieter, & Huanhuan Liu, The right superior temporal gyrus plays a role in semantic-rule learning: Evidence supporting a reinforcement learning model, NeuroImage (2023), doi: https://doi.org/10.1016/j.neuroimage.2023.120393
小伙伴們關(guān)注茗創(chuàng)科技,將第一時間收到精彩內(nèi)容推送哦~
