資料介紹
大型網(wǎng)站是網(wǎng)絡(luò)信息的核心,其信息規(guī)模之大,更新速度之快是中小型網(wǎng)站不可比擬的,對大型網(wǎng)站網(wǎng)頁搜索的好壞直接影響搜索引擎的整體性能。本文在分析分類網(wǎng)頁更新策略的基礎(chǔ)上,根據(jù)大型網(wǎng)站本身的特點提出了一種增量式信息更新方法。實驗分析表明,這種增量式信息更新方法很大程度上提高了大型網(wǎng)站搜索引擎網(wǎng)頁的更新效率。
關(guān)鍵詞:大型網(wǎng)站;搜索引擎;更新
互聯(lián)網(wǎng)的飛速發(fā)展使網(wǎng)絡(luò)成為人們獲取信息的一個不可或缺的重要來源,基于Internet 的各類信息檢索服務應運而生并得到了迅速發(fā)展,據(jù)統(tǒng)計,搜索已經(jīng)成為第二大網(wǎng)絡(luò)應用[1]。網(wǎng)絡(luò)信息的快速增長和網(wǎng)頁動態(tài)變化的特性使因信息更新或網(wǎng)址變動造成的搜索引擎信息缺失日益增加,導致搜索引擎整體性能下降。因此,如何快速有效地對搜索引擎網(wǎng)頁進行更新,保證索引信息的有效性,成為一個重要的研究課題。大型網(wǎng)站是提供網(wǎng)絡(luò)信息的核心,與中小型網(wǎng)站信息相比,大型網(wǎng)站具有信息量大、結(jié)構(gòu)化程度高、時效性強、更新速度快、更新周期不一致等特點。CNNIC 2003 年報告[2]顯示,排名前100 位的大型網(wǎng)站只占網(wǎng)站總數(shù)的1/6000,而網(wǎng)頁總數(shù)和網(wǎng)頁總字節(jié)數(shù)則占到1/10,可見對大型網(wǎng)站搜索的好壞直接影響搜索引擎的整體效果。
本文針對大型網(wǎng)站的特點提出了一種增量式搜索引擎網(wǎng)頁動態(tài)更新方法。該方法根據(jù)大型網(wǎng)站網(wǎng)頁特征對其進行分類,具有相同屬性的網(wǎng)頁組成一個子網(wǎng)站,不同的子網(wǎng)站采用不同的更新機制。對子網(wǎng)站的劃分充分體現(xiàn)了大型網(wǎng)站信息量大、結(jié)構(gòu)化程度高的特點,不同子網(wǎng)站采用不同的更新周期則適應了不同類型網(wǎng)頁更新周期不一致的特征。
關(guān)鍵詞:大型網(wǎng)站;搜索引擎;更新
互聯(lián)網(wǎng)的飛速發(fā)展使網(wǎng)絡(luò)成為人們獲取信息的一個不可或缺的重要來源,基于Internet 的各類信息檢索服務應運而生并得到了迅速發(fā)展,據(jù)統(tǒng)計,搜索已經(jīng)成為第二大網(wǎng)絡(luò)應用[1]。網(wǎng)絡(luò)信息的快速增長和網(wǎng)頁動態(tài)變化的特性使因信息更新或網(wǎng)址變動造成的搜索引擎信息缺失日益增加,導致搜索引擎整體性能下降。因此,如何快速有效地對搜索引擎網(wǎng)頁進行更新,保證索引信息的有效性,成為一個重要的研究課題。大型網(wǎng)站是提供網(wǎng)絡(luò)信息的核心,與中小型網(wǎng)站信息相比,大型網(wǎng)站具有信息量大、結(jié)構(gòu)化程度高、時效性強、更新速度快、更新周期不一致等特點。CNNIC 2003 年報告[2]顯示,排名前100 位的大型網(wǎng)站只占網(wǎng)站總數(shù)的1/6000,而網(wǎng)頁總數(shù)和網(wǎng)頁總字節(jié)數(shù)則占到1/10,可見對大型網(wǎng)站搜索的好壞直接影響搜索引擎的整體效果。
本文針對大型網(wǎng)站的特點提出了一種增量式搜索引擎網(wǎng)頁動態(tài)更新方法。該方法根據(jù)大型網(wǎng)站網(wǎng)頁特征對其進行分類,具有相同屬性的網(wǎng)頁組成一個子網(wǎng)站,不同的子網(wǎng)站采用不同的更新機制。對子網(wǎng)站的劃分充分體現(xiàn)了大型網(wǎng)站信息量大、結(jié)構(gòu)化程度高的特點,不同子網(wǎng)站采用不同的更新周期則適應了不同類型網(wǎng)頁更新周期不一致的特征。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- FPGA加速視覺搜索引擎解決方案
- 基于蛻變測試的用戶搜索引擎性能分析 9次下載
- PHP教程之PHP動態(tài)網(wǎng)頁怎么轉(zhuǎn)換成HTML 3次下載
- 一個大規(guī)模超文本網(wǎng)絡(luò)搜索引擎剖析(英文版) 0次下載
- 基于JAVA技術(shù)的搜索引擎的研究與實現(xiàn)
- 主題搜索引擎的研究
- 教育網(wǎng)BBS搜索引擎設(shè)計與實現(xiàn)
- 分布式多搜索引擎系統(tǒng)的研究與實現(xiàn)
- 基于壓縮后綴數(shù)組技術(shù)的搜索引擎
- 原創(chuàng)優(yōu)先的搜索引擎排序算法
- 基于偽爬行器的主題式元搜索引擎研究與設(shè)計
- 搜索引擎查詢?nèi)罩镜木垲?/a>
- 基于網(wǎng)格技術(shù)的并行搜索引擎
- 基于網(wǎng)絡(luò)搜索引擎的網(wǎng)絡(luò)話題分析框架
- 電子商務網(wǎng)站常用推廣方法
- javascript:void(0) 是否影響SEO優(yōu)化 174次閱讀
- 實踐JLink 7.62手動增加新MCU型號支持新方法 807次閱讀
- 谷歌搜索引擎優(yōu)化的各個方面和步驟 928次閱讀
- 使用Rust語言重寫的代碼搜索引擎黑鳥系統(tǒng)Blackbird正式啟用 889次閱讀
- 一個基于GPT-4的代碼搜索引擎,開源了! 1425次閱讀
- 實測沒有廣告的百度開發(fā)者搜索 2833次閱讀
- 大數(shù)據(jù)是如何優(yōu)化企業(yè)搜索引擎 2262次閱讀
- Elasticsearch概述 怎么安裝ES 4335次閱讀
- IMEC提出扇形晶圓級封裝的新方法 4168次閱讀
- 如何用Python實現(xiàn)一個大數(shù)據(jù)搜索引擎 3059次閱讀
- 能不能用文本處理的方法,得到《三國演義》中的人物社交網(wǎng)絡(luò)再進行分析呢? 2853次閱讀
- 目前微通道面臨的限制,突破硅技術(shù)的一種新方法 4437次閱讀
- 基于深度學習技術(shù),從頭開始搭建圖像語義搜索引擎 4912次閱讀
- 一種新方法來檢測這些被操縱的換臉視頻的“跡象” 5824次閱讀
- 垂直搜索引擎是什么_垂直搜索引擎有哪些 7943次閱讀
下載排行
本周
- 1DC電源插座圖紙
- 0.67 MB | 2次下載 | 免費
- 2AN158 GD32VW553 Wi-Fi開發(fā)指南
- 1.51MB | 2次下載 | 免費
- 3AN148 GD32VW553射頻硬件開發(fā)指南
- 2.07MB | 1次下載 | 免費
- 4AN111-LTC3219用戶指南
- 84.32KB | 次下載 | 免費
- 5AN153-用于電源系統(tǒng)管理的Linduino
- 1.38MB | 次下載 | 免費
- 6AN-283: Σ-Δ型ADC和DAC[中文版]
- 677.86KB | 次下載 | 免費
- 7SM2018E 支持可控硅調(diào)光線性恒流控制芯片
- 402.24 KB | 次下載 | 免費
- 8AN-1308: 電流檢測放大器共模階躍響應
- 545.42KB | 次下載 | 免費
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費
- 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 138次下載 | 1 積分
- 3基于STM32單片機智能手環(huán)心率計步器體溫顯示設(shè)計
- 0.10 MB | 130次下載 | 免費
- 4使用單片機實現(xiàn)七人表決器的程序和仿真資料免費下載
- 2.96 MB | 44次下載 | 免費
- 53314A函數(shù)發(fā)生器維修手冊
- 16.30 MB | 31次下載 | 免費
- 6美的電磁爐維修手冊大全
- 1.56 MB | 24次下載 | 5 積分
- 7如何正確測試電源的紋波
- 0.36 MB | 17次下載 | 免費
- 8感應筆電路圖
- 0.06 MB | 10次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191367次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論