HTTPS是以安全為目標(biāo)的HTTP通道,是HTTP的安全版,保證數(shù)據(jù)傳輸?shù)陌踩行ПU嫌脩綦[私數(shù)據(jù),截取也無法解密。
?
HTTPS的收錄機(jī)制是什么?
一、蜘蛛如何發(fā)現(xiàn)HTTPS
1、網(wǎng)頁中出現(xiàn)的超鏈接是不是HTTPS,如果是HTTPS蜘蛛會認(rèn)為是HTTPS站點。
2、站長平臺鏈接提交工具,比如主動提交,文件中如果提交的是HTTPS的鏈接則以HTTPS的形式來發(fā)現(xiàn)。
3、參考抓取相對路徑,如果第一個網(wǎng)頁是HTTPS,網(wǎng)站里面的內(nèi)容路徑提供的也是相對路徑,認(rèn)為這種鏈接是HTTPS。
4、觀察歷史的鏈接,通過這種方式的原因主要是為了糾錯,如果提取HTTPS是錯誤的會出現(xiàn)以下兩種情況:第一種,因為HTTPS不可訪問導(dǎo)致抓取失敗。第二種,抓取成功但是可能會導(dǎo)致展現(xiàn)出來的效果不是站長想要的。
二、HTTPS鏈接的抓取
鏈接的抓取有兩種:第一種HTTPS抓取,它沒有HTTP的版本。第二種是通過HTTP重定向到HTTPS。通過這兩種方式都是可以正常的進(jìn)行抓取,和HTTP抓取的效果是一樣的。
三、HTTPS的展現(xiàn)方式
HTTPS數(shù)據(jù),在展現(xiàn)端會有明顯的提示。
閱讀本文的人還可以閱讀:
HTTPS的工作原理,哪些網(wǎng)站適合使用HTTPS?
?
?
?
?
?
?
?
?
?