遞歸自編碼器的廣告短語(yǔ)相關(guān)性
推薦 + 挑錯(cuò) + 收藏(0) + 用戶(hù)評(píng)論(0)
針對(duì)現(xiàn)有廣告短語(yǔ)相關(guān)性研究成果多采用字面匹配,忽略了短語(yǔ)所包含的深層語(yǔ)義信息,限制了任務(wù)的性能等問(wèn)題,提出了采用深度學(xué)習(xí)算法研究廣告短語(yǔ)的相關(guān)性,采用遞歸自編碼器( RAE)對(duì)短語(yǔ)進(jìn)行深層結(jié)構(gòu)分析,使得短語(yǔ)向量包含深層的語(yǔ)義信息,以此來(lái)構(gòu)建廣告語(yǔ)境下的短語(yǔ)相關(guān)性計(jì)算方法。具體地,給定一個(gè)包含若干詞的序列,序列中所有相鄰的兩個(gè)元素嘗試合并產(chǎn)生一個(gè)重構(gòu)誤差,遍歷將重構(gòu)誤差最小的元素兩兩合并,形成類(lèi)似哈夫曼樹(shù)結(jié)構(gòu)的短語(yǔ)樹(shù)。采用梯度下降法最小化短語(yǔ)樹(shù)的重構(gòu)誤差,采用余弦距離度量短語(yǔ)之間的相關(guān)性。實(shí)驗(yàn)結(jié)果顯示,通過(guò)引入詞語(yǔ)權(quán)重信息,加大了重要詞語(yǔ)在最終短語(yǔ)向量表示中貢獻(xiàn)的信息量,使得RAE更適合短語(yǔ)計(jì)算;比起傳統(tǒng)LDA和BM25算法,在50%召回率的條件下,提出的算法的準(zhǔn)確率分別提高了4.59個(gè)百分點(diǎn)和3.21個(gè)百分點(diǎn),這證明了所提算法的有效性。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
遞歸自編碼器的廣告短語(yǔ)相關(guān)性下載
相關(guān)電子資料下載
- rnn是遞歸神經(jīng)網(wǎng)絡(luò)還是循環(huán)神經(jīng)網(wǎng)絡(luò) 164
- 基于RZ/T2M的EnDat編碼器方案 458
- 遞歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)形式主要分為 129
- 簡(jiǎn)述遞歸神經(jīng)網(wǎng)絡(luò)的計(jì)算過(guò)程 135
- 遞歸神經(jīng)網(wǎng)絡(luò)與循環(huán)神經(jīng)網(wǎng)絡(luò)一樣嗎 139
- 帶Arduino的旋轉(zhuǎn)編碼器設(shè)計(jì) 旋轉(zhuǎn)編碼器的工作原理和特點(diǎn) 124
- 遞歸神經(jīng)網(wǎng)絡(luò)主要應(yīng)用于哪種類(lèi)型數(shù)據(jù) 208
- 遞歸神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)嗎 199
- 遞歸神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)、特點(diǎn)、優(yōu)缺點(diǎn)及適用場(chǎng)景 184
- 循環(huán)神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)的區(qū)別 155