資料介紹
??? 網(wǎng)頁(yè)去重處理是提高檢索質(zhì)量的有效途徑,本文給出了一個(gè)基于特征碼的網(wǎng)頁(yè)去重算法,介紹了算法的具體實(shí)現(xiàn)步驟,采用二叉排序樹(shù)實(shí)現(xiàn)。算法有較高的判斷正確率,在信息檢索中有較好的應(yīng)用前景。
關(guān)鍵字:網(wǎng)頁(yè)去重; 網(wǎng)頁(yè)特征碼; 二叉排序樹(shù)
??? 隨著網(wǎng)絡(luò)技術(shù)和信息技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)已經(jīng)成為人們獲取信息的一個(gè)重要途徑。現(xiàn)有的搜索引擎面臨的最大一個(gè)問(wèn)題就是返回的結(jié)果集中包含大量重復(fù)的信息。如何更有效地幫助用戶獲取所需要的信息,能夠快速、準(zhǔn)確地為用戶提供信息,是網(wǎng)絡(luò)信息服務(wù)面臨的新課題。優(yōu)化搜索結(jié)果可以采用多種手段,如通過(guò)提取網(wǎng)頁(yè)的特征進(jìn)行基于內(nèi)容的信息檢索,利用用戶反饋的信息進(jìn)一步精確檢索結(jié)果,將結(jié)果集中的重復(fù)信息盡可能地消除等。
由于網(wǎng)絡(luò)信息分布的特點(diǎn),網(wǎng)站上的信息存在相互轉(zhuǎn)載及鏡像站點(diǎn)等情況。出現(xiàn)相同網(wǎng)頁(yè)主要有以下幾種情形:網(wǎng)頁(yè)的URL 完全相同;網(wǎng)頁(yè)的URL 形式不同,但網(wǎng)站域名所對(duì)應(yīng)的IP 是相同的;URL雖然不同,但網(wǎng)頁(yè)內(nèi)容完全相同;URL 不同,為不同的網(wǎng)頁(yè)形式,但網(wǎng)頁(yè)上主要內(nèi)容是相同的。本文主要討論對(duì)于網(wǎng)頁(yè)內(nèi)容重復(fù)性的消除。
- 可提高跨模態(tài)行人重識(shí)別算法精度的特征學(xué)習(xí)框架 9次下載
- 一種融合人臉跟蹤和聚類的人臉圖像去重方法 7次下載
- 基于工控協(xié)議功能碼特征的同源攻擊分析方法 11次下載
- 16位CRC驗(yàn)證碼生成VI工具下載 55次下載
- 基于局部區(qū)域特征選擇的內(nèi)容一致性行人重識(shí)別算法 5次下載
- 使用Python實(shí)現(xiàn)對(duì)excel文檔去重及求和的方法和代碼說(shuō)明 16次下載
- 基于數(shù)據(jù)路由的分布式備份數(shù)據(jù)去重系統(tǒng) 1次下載
- 基于XML特征的網(wǎng)頁(yè)文本抽取方法 0次下載
- 基于圖片特征的并行化海量圖片快速去重技術(shù) 2次下載
- 基于網(wǎng)頁(yè)文件代碼分類的惡意代碼檢測(cè)系統(tǒng) 4次下載
- 基于視覺(jué)特征的網(wǎng)頁(yè)正文提取方法研究 0次下載
- 蠕蟲(chóng)病毒特征碼自動(dòng)提取原理與設(shè)計(jì)
- 靜態(tài)網(wǎng)頁(yè)設(shè)計(jì)教程,下載 0次下載
- 基于SHA-1的郵件去重算法
- 基于小世界現(xiàn)象的網(wǎng)頁(yè)消重和排序
- sim卡pin碼怎么設(shè)置 pin碼和puk碼有什么區(qū)別 4977次閱讀
- Python 字典組成的數(shù)組怎么進(jìn)行去重 491次閱讀
- 什么是網(wǎng)頁(yè)應(yīng)用程序測(cè)試? 861次閱讀
- 用Python寫(xiě)個(gè)小工具網(wǎng)頁(yè) 1330次閱讀
- Python字典組成的數(shù)組如何進(jìn)行去重? 923次閱讀
- 結(jié)構(gòu)光|格雷碼解碼方法 1283次閱讀
- 什么是BCD碼 1.6w次閱讀
- 如何從網(wǎng)頁(yè)控制arduino? 4186次閱讀
- 網(wǎng)頁(yè)無(wú)法打開(kāi)的解決辦法 1.1w次閱讀
- 電腦打不開(kāi)網(wǎng)頁(yè)的解決方法 6823次閱讀
- 如何將視頻轉(zhuǎn)換生成二維碼掃碼觀看 1.2w次閱讀
- 解析無(wú)線遙控器中固定碼與學(xué)習(xí)碼之間的區(qū)別 2.3w次閱讀
- 一文解析段碼LCD液晶屏驅(qū)動(dòng)方法 5.1w次閱讀
- pin碼初始密碼是多少 8.5w次閱讀
- 余3碼至8421BCD碼的轉(zhuǎn)換_8421BCD碼轉(zhuǎn)換成余3碼 19.3w次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費(fèi)下載
- 0.00 MB | 1490次下載 | 免費(fèi)
- 2單片機(jī)典型實(shí)例介紹
- 18.19 MB | 93次下載 | 1 積分
- 3S7-200PLC編程實(shí)例詳細(xì)資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識(shí)別和講解說(shuō)明
- 4.28 MB | 18次下載 | 4 積分
- 5開(kāi)關(guān)電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費(fèi)
- 6基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
- 0.11 MB | 4次下載 | 免費(fèi)
- 7基于單片機(jī)和 SG3525的程控開(kāi)關(guān)電源設(shè)計(jì)
- 0.23 MB | 3次下載 | 免費(fèi)
- 8基于單片機(jī)的紅外風(fēng)扇遙控
- 0.23 MB | 3次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費(fèi)
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費(fèi)
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費(fèi)
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費(fèi)
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費(fèi)
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費(fèi)
- 8開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21539次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537791次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191183次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183277次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138039次下載 | 免費(fèi)
評(píng)論