Baiduspider - 百度蜘蛛:
百度是如何收錄到那么多網(wǎng)頁的呢?這個百度用以抓取互聯(lián)網(wǎng)上數(shù)以億計的網(wǎng)頁的程序,就叫做Baiduspider - 百度蜘蛛。
它是一個程序,夜以繼日得在互聯(lián)網(wǎng)上找尋新的URL,接著抓取URL上的內(nèi)容,返回到百度的網(wǎng)頁暫存數(shù)據(jù)庫。
百度用來抓取網(wǎng)頁內(nèi)容的程序,叫做Baiduspider,抓取其他內(nèi)容的蜘蛛,則是新的名字:
產(chǎn)品名稱 對應(yīng)user-agent
網(wǎng)頁搜索 Baiduspider
無線搜索 Baiduspider-mobile
圖片搜索 Baiduspider-image
視頻搜索 Baiduspider-video
新聞搜索 Baiduspider-news
百度搜藏 Baiduspider-favo
百度聯(lián)盟 Baiduspider-cpro
不少朋友會在自己的網(wǎng)站日志里看到這個蜘蛛Baiduspider-cpro,現(xiàn)在我們明白它是百度聯(lián)盟蜘蛛,用以百度聯(lián)盟程序匹配相應(yīng)的廣告。
閱讀本文的人還可以閱讀: