五月初接了個網站的活兒,忙活了1個月左右,先看爛大街的登高效果圖,終于有所欣慰。
1、 網站背景
老板20幾萬買了個老域名,而且是賣相一看就很牛的域名,但是發了海量的內容就是不見排名。碼迷發現該域名底子尚可,但是通過site發現,52萬的收錄量,絕大一部分是歷史收錄。
詢問那邊技術是否批量提交404鏈接,技術說因為沒有舊數據就沒有提交。
我去,如果不通過站長后臺提交404鏈接,百度就會不斷嘗試訪問舊頁面,就會導致海量的404錯誤返回給爬蟲,肯定會導致搜索引擎認為網站不穩定導致降權狀態。
經過碼迷半個月的推鴨子上架的折騰以及苦口婆心的勸導,技術那邊終于用Wayback Machine Downloader以及其他手段找回了20來萬的404鏈接地址,并且用百度站長的死鏈提交工具提交。
2、大爺永遠是大爺
提交404鏈接后,碼迷原本以為等著生效,網站權重基本就有好轉,但是碼迷發現,百度爬蟲根本就不鳥站長后臺提交的404鏈接,一個舊網址還破天荒爬20遍。
碼迷終于明白大爺永遠是大爺,說某爬蟲部本來就爛的一比,看來不能指望百度死鏈提交工具了。
3、 我在哪里?我是誰?我應該做什么?
我現在做的是如何阻止百度不斷的訪問老頁面。
因為爬蟲對于一個網址是寶貴的資源,是有限的資源。
在固定數量的爬蟲下,一定要引導爬蟲盡大限度去訪問質量高的頁面?,F在的問題是,因為攤派到舊鏈接的爬蟲太多了,訪問新內容的爬蟲反而沒有多少名額。那怎么辦???!
4、大光頭的Broken Link Building秘笈
想起了之前拜讀過的國外大光頭的Broken Link Building Guide(死鏈404外鏈建設指南),里面有一段重建無效內容的章節。
大光頭一比一替換死鏈內容顯然成本太大,我有個大膽的想法,我能不能把舊的內容隨機301到新內容上?會不會有效果。
那就小規模試驗唄。拿了一個小站做了下目錄整體301試驗,可以發現百度爬蟲對301的處理方法:爬蟲遇到301后,交給另外一個IP的爬蟲再次爬取
那么百度后續處理效果如何,我用question/51k109頁面做了簡單的追蹤:
老頁面:
新頁面:
看到了沒有,百度對301處理后會有兩個快照,新頁面反而出圖了,說明301后的權重成功轉移了。
好,我們開干
5、擼代碼
如果訪問舊的頁面(舊頁面的擴展名是xhtml或者asp,具體問題具體分析),就隨機跳轉到文章頁或者學校頁(文章頁學校頁轉化搞內容質量好,具體問題具體分析)
301的見效是很快的一般頂多兩個周,可以看到六月二十來號曲線往上翹了。
做SEO就是要見針插眼才能藥到病除,但是不了解搜索引擎的原理是萬萬不行的。所以碼迷的小伙伴們,當親們聆聽著風中琴聲悠揚,一定要關注碼迷SEO公眾號,因為老司機就像一把梭子,更多的流量玩法在秋名山等你,贏了會所嫩模輸了下海干活,下期雜談不見不散。
近期小伙伴群分享一二事
本文網址: http://www.699tw.com/seojishu/section-20
留言評論