您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>C/C++語言編程>

VC++搜索引擎網(wǎng)絡(luò)爬蟲設(shè)計(jì)與實(shí)現(xiàn)文檔下載

大小:1455KB 人氣: 2018-04-08 需要積分:1
{$username}的空間

用戶級(jí)別:注冊(cè)會(huì)員

貢獻(xiàn)文章:

貢獻(xiàn)資料:

網(wǎng)絡(luò)中的資源非常豐富,但是如何有效的搜索信息卻是一件困難的事情。建立搜索引擎就是解決這個(gè)問題的最好方法。
本文首先詳細(xì)介紹了基于英特網(wǎng)的搜索引擎的系統(tǒng)結(jié)構(gòu),然后具體闡述了如何設(shè)計(jì)并實(shí)現(xiàn)搜索引擎的搜索器——網(wǎng)絡(luò)爬蟲。
多線程網(wǎng)絡(luò)爬蟲程序是從指定的Web頁面中按照寬度優(yōu)先算法進(jìn)行解析、搜索,并把搜索到的每條URL進(jìn)行抓取、保存并且以URL為新的入口在互聯(lián)網(wǎng)上進(jìn)行不斷的爬行的自動(dòng)執(zhí)行后臺(tái)程序。
網(wǎng)絡(luò)爬蟲主要應(yīng)用socket套接字技術(shù)、正則表達(dá)式、HTTP協(xié)議、windows網(wǎng)絡(luò)編程技術(shù)等相關(guān)技術(shù),以C++語言作為實(shí)現(xiàn)語言,并在VC6.0下調(diào)試通過。
在網(wǎng)絡(luò)爬蟲的設(shè)計(jì)與實(shí)現(xiàn)的章節(jié)中除了詳細(xì)的闡述技術(shù)核心外還結(jié)合了多線程網(wǎng)絡(luò)爬蟲的實(shí)現(xiàn)代碼來說明,易于理解。本網(wǎng)絡(luò)爬蟲是一個(gè)能夠在后臺(tái)運(yùn)行的以配置文件來作為初始URL,以寬度優(yōu)先算法向下爬行,保存目標(biāo)URL的網(wǎng)絡(luò)程序,能夠執(zhí)行普通用戶網(wǎng)絡(luò)搜索任務(wù)。

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?