您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

一種非規(guī)范中文地址的行政區(qū)劃提取算法

大小:1.20 MB 人氣: 2017-12-05 需要積分:2

  由于互聯(lián)網(wǎng)上中文地址的非規(guī)范化表達(dá),導(dǎo)致互聯(lián)網(wǎng)中的中文地址信息在地理位置服務(wù)中難以直接應(yīng)用。針對(duì)此問(wèn)題,提出一種非規(guī)范中文地址的行政區(qū)劃提取算法。首先,對(duì)原始數(shù)據(jù)進(jìn)行“路”特征詞分組預(yù)處理;再利用行政區(qū)劃字典和移動(dòng)窗口最大匹配算法,從中文地址中提取所有可能的行政區(qū)劃數(shù)據(jù)集;然后,利用中文地址行政區(qū)劃元素之間具有層次關(guān)系的特點(diǎn),建立行政區(qū)劃條件集合運(yùn)算規(guī)則,對(duì)獲取的數(shù)據(jù)集進(jìn)行集合運(yùn)算;再利用行政區(qū)劃匹配度建立一種行政區(qū)劃集合解析規(guī)則,來(lái)計(jì)算行政區(qū)劃可信度;最后,得到可信度最大信息量最完整的中文地址的行政區(qū)劃。利用從互聯(lián)網(wǎng)中提取的約25萬(wàn)條中文地址數(shù)據(jù)進(jìn)行是否采用“路”特征詞分組處理以及是否進(jìn)行可信度計(jì)算處理,對(duì)算法的可用性進(jìn)行了驗(yàn)證,并與目前的地址匹配技術(shù)進(jìn)行對(duì)比,準(zhǔn)確率達(dá)到93. 51%。

一種非規(guī)范中文地址的行政區(qū)劃提取算法

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?