劉連康:教你如何正確認識百度蜘蛛(BaiduSpider)IP段

劉連康 2020年9月7日21:04:37SEO新聞資訊評論1,58722691字閱讀8分58秒閱讀模式

百度蜘蛛是一個自動程序,它的英文名稱叫做BaiduSpider。由于百度蜘蛛是我們人類設計和制造出來一個產物,因此它每天都會按照我們人類的思維方式,在互聯網上爬行和抓取網頁、圖片和視頻等內容,然后分門別類建立索引數據庫,使用戶能在百度搜索引擎中搜索到自己想要的東西。

劉連康:教你如何正確認識百度蜘蛛(BaiduSpider)IP段

我們做的是網站SEO,因此研究百度蜘蛛對網站優化很有好處。如果你想知道百度蜘蛛有沒有來你的網站,它都抓取了哪些網頁,狀態碼是什么等等,我們都可以通過網站日志來查看。

 

網站日志是一個神奇的東西,可以看得出百度蜘蛛的工作情況究竟是怎么樣的。

 

當然,網站日志也可以看得出哪個地區的人在你網站上面做壞事,比方說:有人眼紅你的網站,用ddos或者是CC攻擊你的網站,讓你的網站一天到晚打不開,你就可以通過網站日志查看是哪個地區的IP。

 

其實康哥很少研究網站日志,因為康哥做SEO都是使用正規手法,從來不作弊,文章也都是原創為主。說得簡單些,只要是經過我們SEO過的網站,都不會出現那種很嚴重的什么降權啊、進入沙盒很久很久之類的啊等等問題。

 

不過呢,有些做SEO的朋友也經常來請教過康哥怎么查看網站日志里面的百度蜘蛛IP段,比方說他們想要知道:哪些IP段是百度來的,哪些IP段是百度權重IP,也想知道哪些IP段是進入沙盒或者是降權的IP段等等。

 

這種問題很簡單,下面康哥就給你們詳細的介紹一下好了,希望能對你們研究百度蜘蛛有所幫助。

 

如果你的網站是123.125.68.*這個IP段的百度蜘蛛經常來,別的來得比較少,那就表示你的網站可能要進入沙盒了,或者是被降權。

 

220.181.68.*每天這個IP段只是不斷增加,不曾看見減少,很有可能進入了沙盒或者是被K站。

 

對了,說到這里康哥就不得不給你們介紹一下什么是百度沙盒,有些SEO新手朋友還是不太明白,有必要科普一下哈。

 

百度沙盒也就是說你的網站不會馬上就被百度封殺掉,但是卻無法獲得很好的排名。你網站有好多關鍵詞原本有不錯的排名,突然有一天就消失不見了,這就是典型的進入了沙盒。

 

還有一個情況也會把你網站搞到沙盒里面去,那就是一個網頁里面的關鍵詞鏈接,也就是你們常說的什么錨文本。

 

如果你在一個網頁里面做四五個關鍵詞鏈接,或者是做更多的關鍵詞鏈接進去,那么你的網站必然也會被百度放進沙盒。

 

因此,大家要合理的去優化網站內部鏈接,一篇文章只做1-2個關鍵詞鏈接即可,千萬不要貪多。相反,網站里面的文章你寫多少進去都可以,越多越好,要盡可能原創。

 

不扯那么多了,我們還是繼續來研究一下百度蜘蛛(BaiduSpider)IP段。

 

220.181.7.*、123.125.66.* 代表百度蜘蛛IP造訪,準備抓取你網站內容。

 

121.14.89.*這個IP段作為度過新站考察期,也就是我們剛才講的百度沙盒。

 

203.208.60.*這個IP段出現在新站及站點有不正?,F象。

 

210.72.225.*這個IP段不間斷巡邏各站。

 

125.90.88.* 這個IP段的地區是廣東茂名市電信,也屬于百度蜘蛛IP段,主要是造成成分,是新上線站較多,還有使用過站長工具,或者是SEO綜合檢測造成的。

 

220.181.108.95這個是百度抓取首頁的專用IP,是百度蜘蛛的權重IP段!

 

如果你的網站是220.181.108.*段不斷來抓取的話,康哥可以很負責任的告訴你:你的網站會天天得到百度蜘蛛的抓取和更新,發布的文章秒收錄不是問題,絕對錯不了。

 

220.181.108.92也是跟剛剛講的IP段一樣,有98%的幾率是抓取你網站首頁,可能還會抓取其他 ,不一定就是內頁。

 

大家要注意了,220.181.108*段都是屬于百度蜘蛛權重IP段,此IP段爬過的文章或者是首頁基本上24小時之內會給你放出來!

 

123.125.71.106是抓取網站內頁收錄的,權重較低,爬過此段的內頁文章不會很快放出來,因為不是什么原創文章。

 

220.181.108.91屬于綜合的,主要抓取首頁和內頁或者是其他,也是屬于百度蜘蛛的權重IP段,爬過的文章或者是首頁基本24小時之內就會放出來。

 

220.181.108.75重點抓取更新文章的內頁,抓取率能夠達到90%,8%抓取首頁,2%其他。也是百度蜘蛛權重IP 段,爬過的文章或者是首頁基本上是在24小時之內放出來。

 

220.181.108.86專用抓取網站首頁IP 權重段,一般返回代碼是304 0 0,代表未更新,意思就是說這個IP段的百度蜘蛛已經訪問過你的某個網頁了,只是它發現你這個網頁沒有更新過任何內容。

 

123.125.71.95這個IP段是抓取內頁收錄的,權重較低,爬過此段的內頁文章不會很快放出來,因為不是原創文章。

 

123.125.71.97也是一樣,抓取內頁收錄的,權重較低,爬過此段的內頁文章不會很快放出來,因為不是原創文章。

 

220.181.108.89是專用抓取首頁IP權重段,一般返回代碼是304 0 0,代表未更新。

 

220.181.108.94專用抓取首頁IP權重段,一般返回代碼是304 0 0,代表未更新。

 

220.181.108.97專用抓取首頁IP權重段,一般返回代碼是304 0 0,代表未更新。

 

220.181.108.80專用抓取首頁IP權重段,一般返回代碼是304 0 0,代表未更新。

 

220.181.108.77 專用抓首頁IP權重段,一般返回代碼是304 0 0,代表未更新。

 

123.125.71.117 抓取內頁收錄的,權重較低,爬過此段的內頁文章不會很快放出來,因為不是原創文章。

 

220.181.108.83專用抓取首頁IP權重段,一般返回代碼是304 0 0,代表未更新。

 

到了這里大家要注意一下:其實呢,康哥給你們講到的以上百度蜘蛛IP尾數還有很多很多。

 

但是如果你在網站日志看到了很多段位一樣的123.125.71.*IP,那就代表百度蜘蛛抓取內頁,并且收錄的權重會比較低,原因就在于你的網站是采集文章或者是拼接文章,暫時被百度收錄了,但是不給你放出來,也就是待定的意思。

 

220.181.108.*段IP主要是抓取網站首頁,抓取率占到了80%,內頁占30%,這個IP段的百度蜘蛛爬過的文章或者是首頁,絕對是24小時內放出來和隔夜快照的。

 

好了,今天有關于百度蜘蛛(BaiduSpider)IP段的研究康哥就已經給大家講解完畢,如果你的網站SEO排名很不理想,站內站外也都優化過了,也不見起作用,那就趕緊從FTP里面下載網站日志研究一下吧。

 

本文為原創文章,版權歸作者所有,歡迎轉載,轉載請注明作者和出處,謝謝!

作者:劉連康

首發:劉連康博客

  • 我的微信
  • 這是我的微信掃一掃
  • weinxin
  • 我的微信公眾號
  • 我的微信公眾號掃一掃
  • weinxin
劉連康
  • 本文由 發表于 2020年9月7日21:04:37
匿名

發表評論

匿名網友 填寫信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

確定