您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶(hù)?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

遞歸自編碼器的廣告短語(yǔ)相關(guān)性

大?。?/span>0.72 MB 人氣: 2017-12-26 需要積分:1

  針對(duì)現(xiàn)有廣告短語(yǔ)相關(guān)性研究成果多采用字面匹配,忽略了短語(yǔ)所包含的深層語(yǔ)義信息,限制了任務(wù)的性能等問(wèn)題,提出了采用深度學(xué)習(xí)算法研究廣告短語(yǔ)的相關(guān)性,采用遞歸自編碼器( RAE)對(duì)短語(yǔ)進(jìn)行深層結(jié)構(gòu)分析,使得短語(yǔ)向量包含深層的語(yǔ)義信息,以此來(lái)構(gòu)建廣告語(yǔ)境下的短語(yǔ)相關(guān)性計(jì)算方法。具體地,給定一個(gè)包含若干詞的序列,序列中所有相鄰的兩個(gè)元素嘗試合并產(chǎn)生一個(gè)重構(gòu)誤差,遍歷將重構(gòu)誤差最小的元素兩兩合并,形成類(lèi)似哈夫曼樹(shù)結(jié)構(gòu)的短語(yǔ)樹(shù)。采用梯度下降法最小化短語(yǔ)樹(shù)的重構(gòu)誤差,采用余弦距離度量短語(yǔ)之間的相關(guān)性。實(shí)驗(yàn)結(jié)果顯示,通過(guò)引入詞語(yǔ)權(quán)重信息,加大了重要詞語(yǔ)在最終短語(yǔ)向量表示中貢獻(xiàn)的信息量,使得RAE更適合短語(yǔ)計(jì)算;比起傳統(tǒng)LDA和BM25算法,在50%召回率的條件下,提出的算法的準(zhǔn)確率分別提高了4.59個(gè)百分點(diǎn)和3.21個(gè)百分點(diǎn),這證明了所提算法的有效性。

遞歸自編碼器的廣告短語(yǔ)相關(guān)性

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶(hù)評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?