一種面向數(shù)學檢索的LaTeX數(shù)學表達式解析與索引方法
大小:0.69 MB 人氣: 2017-12-22 需要積分:1
標簽:LATEX(8412)
針對數(shù)學表達式復雜二維結(jié)構(gòu)特性所導致的普通文本檢索技術(shù)難以對其進行檢索的問題,提出了一種面向數(shù)學檢索的LaTeX數(shù)學表達式解析與索引方法。在充分考慮公式特點的基礎上,通過對LaTeX構(gòu)成特點的分析和歸納,設計了LaTeX數(shù)學表達式的解析和檢索特征提取算法;以此為基礎,構(gòu)建了一種適應數(shù)學表達式特性的雙層索引結(jié)構(gòu),利用所提取數(shù)學表達式各層次運算數(shù)和運算符信息,分別以Treap數(shù)據(jù)結(jié)構(gòu)和倒排索引結(jié)構(gòu)構(gòu)成數(shù)學表達式索引,為實現(xiàn)進一步的數(shù)學表達式檢索匹配打下基礎。在瀏覽器/服務器模式下采用6234條數(shù)學教材中的公式作為數(shù)據(jù)集進行實驗,在解析獲得的124960個基線層數(shù)最高為11層的表達式節(jié)點上,建立索引平均耗時為33. 8317 s。實驗結(jié)果表明所提出的LaTeX表達式解析算法和索引結(jié)構(gòu)能夠適應數(shù)學表達式的特點,有助于實現(xiàn)具有較高效率和準確性的數(shù)學表達式檢索。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%