信息檢索論文 [一種基于網(wǎng)頁(yè)分割的Web信息檢索方法]
發(fā)布時(shí)間:2020-03-07 來(lái)源: 短文摘抄 點(diǎn)擊:
[摘要]提出一種基于網(wǎng)頁(yè)內(nèi)容分割的web信息檢索算法。該算法根據(jù)網(wǎng)頁(yè)半結(jié)構(gòu)化的特點(diǎn),按照HTML標(biāo)記和網(wǎng)頁(yè)的內(nèi)容將網(wǎng)頁(yè)進(jìn)行區(qū)域分割。在建立HTML標(biāo)記樹的基礎(chǔ)上,利用內(nèi)容相似性和視覺相似性進(jìn)行節(jié)點(diǎn)的整合。在檢索和排序中,根據(jù)用戶的查詢,充分利用區(qū)域信息來(lái)對(duì)相關(guān)的檢索結(jié)果進(jìn)行排序。
[關(guān)鍵詞]網(wǎng)頁(yè)分割 信息檢索 HTML標(biāo)記 相似性
[分類號(hào)]TP391
注:“本文所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以pdf格式閱讀原文”。
相關(guān)熱詞搜索:分割 信息檢索 網(wǎng)頁(yè) 一種基于網(wǎng)頁(yè)分割的Web信息檢索方法 信息檢索方法 一種基于網(wǎng)頁(yè)分割的web
熱點(diǎn)文章閱讀