人工智能AI面試題-7.6什么是DSSM?有什么優(yōu)缺點(diǎn)?
7.6
什么是
DSSM?
有什么優(yōu)缺點(diǎn)? ?? 什么是DSSM? 有什么優(yōu)缺點(diǎn)? ?? DSSM(深度結(jié)構(gòu)語義模型)的原理十分簡單,就像找數(shù)據(jù)中的寶藏一樣。通過海量點(diǎn)擊和曝光數(shù)據(jù),我們利用深度神經(jīng)網(wǎng)絡(luò)(DNN)將查詢(Query)和標(biāo)題(Title)轉(zhuǎn)化成低維度的語義向量。然后,我們使用余弦距離來計(jì)算這兩個(gè)語義向量之間的距離,最終訓(xùn)練出一個(gè)語義相似度模型。這個(gè)模型可以用來預(yù)測(cè)兩個(gè)句子的語義相似度,同時(shí)還能夠獲取某個(gè)句子的低維度語義向量表示。 ? 優(yōu)點(diǎn): DSSM 使用字向量作為輸入,這樣可以減少對(duì)分詞的依賴。而且,這種方法可以提高模型的泛化能力,因?yàn)槊總€(gè)漢字的語義信息可以被多次重復(fù)利用。此外,傳統(tǒng)的輸入層通常使用無監(jiān)督方法(如Word2Vec的詞向量或LDA的主題向量)來映射詞匯,然后將它們累加或拼接在一起。這樣的方法可能引入誤差,而DSSM采用統(tǒng)一的有監(jiān)督訓(xùn)練,不需要在中間過程中使用無監(jiān)督模型的映射,因此可以提高精度。 ? 缺點(diǎn): DSSM 使用詞袋模型(BOW),因此丟失了語序信息和上下文信息,就好像一本字典一樣,單詞的順序無關(guān)緊要。另外,DSSM采用弱監(jiān)督和端到端的模型,預(yù)測(cè)結(jié)果可能不太可控,有點(diǎn)像是迷路了的機(jī)器學(xué)習(xí)模型。 這就是DSSM的故事,它有著鮮明的優(yōu)點(diǎn)和缺點(diǎn),就像編程中的bug和feature一樣,總是需要我們權(quán)衡和選擇。 ????