本篇文章2102字,讀完約5分鐘

一、死鏈介紹

1、什么是死鏈

幾乎所有的網(wǎng)站或智能小程序都會遇到內(nèi)容失效、過期,頁面不需要再展現(xiàn)的情況,這些無法對用戶提供任何有價值信息的頁面就是死鏈接,它包括協(xié)議死鏈和內(nèi)容死鏈兩種形式。

1.png

2、為什么要及時處理死鏈

當站點/小程序死鏈數(shù)據(jù)累積過多并且被展示到搜索結(jié)果頁時,會影響百度搜索對站點/小程序的評價,對站點/小程序的訪問體驗和用戶轉(zhuǎn)化都會起到負面影響。另一方面,百度檢查死鏈的流程也會為站點/小程序帶來額外負擔,影響對其他正常頁面的抓取和索引。

二、百度搜索建議的死鏈類型及設置方案

常見的死鏈包括協(xié)議死鏈(百度搜索建議的死鏈類型)和內(nèi)容死鏈,還有一些對百度并不友好的“個性化死鏈”。

協(xié)議死鏈:頁面的TCP協(xié)議狀態(tài)/HTTP協(xié)議狀態(tài)明確表示的死鏈,常見的如404、410。

內(nèi)容死鏈:服務器返回狀態(tài)是正常的,但內(nèi)容已經(jīng)變更為不存在、已刪除或需要權限等與原內(nèi)容無關的信息頁面。

2.png

在此,百度搜索建議的死鏈設置方案為:

第一步,將返回碼設置為404或者410:如果站點/小程序已永久刪除相應內(nèi)容,并且不打算對內(nèi)容進行替換,建議開發(fā)者將返回碼設置成404或410,百度爬蟲嘗試抓取網(wǎng)頁時,如果返回碼為404或410,會將URL判定為死鏈,進而從搜索中刪除

3.png

第二步,設置完返回碼后,修改頁面標題,明確表示該頁面為死鏈,頁面內(nèi)容可以進行個性化設置。

對百度搜索不友好的死鏈類型及不推薦的死鏈方案:

1、個性化死鏈

部分開發(fā)者追求個性化和用戶體驗,在頁面內(nèi)容失效后并未做協(xié)議死鏈處理,也就是說返回狀態(tài)碼依然是200,僅僅是在頁面上做了一個有趣的個性化圖片,通過圖片告訴用戶這個頁面沒有有價值的內(nèi)容,這類死鏈是百度搜索不提倡的。

2、頁面內(nèi)容為死鏈但是返回碼為200

3、頁面重定向到首頁、錯誤頁面、登錄頁面

例如:頁面A內(nèi)容已經(jīng)失效,用戶點擊頁面后,頁面跳轉(zhuǎn)到了站點首頁。

不推薦的死鏈設置方案可能會使搜索引擎造成混淆,使得站點的無效內(nèi)容在搜索結(jié)果中展現(xiàn),最終影響站點的排名和評價。

三、如何處理死鏈

【站點】

第一步,篩查站點內(nèi)部存在的死鏈,制作死鏈文件,并將這些死鏈頁面設置成為404頁面,即百度訪問它們時返回碼為404。

第二步,將死鏈文件放置在網(wǎng)站根目錄下

比如您的網(wǎng)站為example.com,您已制作了一個silian_example.xml死鏈文件,則將silian_example.xml上傳至網(wǎng)站根目錄即example.com/silian_example.xml。

第三步,登錄百度搜索資源平臺-死鏈提交工具提交死鏈數(shù)據(jù)

(1)通過搜索資源平臺-搜索服務-資源提交-死鏈提交,到達操作頁面;

(2)填寫死鏈文件更新周期,可選“每隔xx小時/天更新一次”;

(3)填寫死鏈文件地址,請留意提交框右側(cè)的配額提示;

(4)管理已提交的死鏈列表,可查看死鏈文件狀態(tài)和死鏈處理狀態(tài)。

特別提醒:

1、在提交死鏈時,要保證所有頁面都處于404狀態(tài),提交文件中請勿包括活鏈URL,如有活鏈會導致活鏈URL從搜索中移除。

2、索引型死鏈Sitemap文件工具將不予處理,請勿提交索引型死鏈Sitemap文件。

6.jpg

【小程序】

整理出需要刪除的資源path路徑,通過智能小程序開發(fā)者平臺-自然搜索-資源刪除工具進行提交。

特別提醒:

1、死鏈文件每?一條path路徑,?件支持txt格式,每個文件最多允許1000個path路徑,且需小于10MB;

2、為避免誤刪除影響小程序已有流量,每天最多可提交一次死鏈文件。

附錄:

常見的死鏈返回碼:

404 Not Found,表示服務器沒有找到任何匹配請求URL的東西,沒有說明這種情況是暫時的還是永久的。

410 Gone,表示請求的內(nèi)容在服務器上不再可用,且沒有已知的轉(zhuǎn)發(fā)地址。410通常表示資源永久性的失效。

正常頁面返回碼:

200 OK,表示請求成功。

如果相關內(nèi)容已刪除或移動,不建議返回成功狀態(tài)碼(200 OK)而是返回404、410狀態(tài)碼。

204 NoContent,表示這個請求沒有要發(fā)送的內(nèi)容,但是報頭可能有用。用戶代理可以使用新的報頭來更新此資源的緩存頭。

如果頁面已經(jīng)刪除,請返回404/410,返回204可能給搜索引擎造成混淆。

其他返回碼:

如果正常頁面長期返回非2xx、3xx的錯誤碼,可能會影響相應內(nèi)容的收錄和搜索展現(xiàn)。常見的錯誤碼如下:

403  Forbidden,表示客戶端沒有獲取內(nèi)容的權限。

429 Too ManyRequests,表示用戶在給定時間內(nèi)發(fā)送了太多的請求。

500 Internal ServerError,表示服務器遇到了不知道如何處理的情況。

503 ServiceUnavailable,表示服務器還沒有準備好處理請求。通常的情況是服務器超載或者正在維護。

7.png

如果由于抓取頻次過高導致429、5xx錯誤,開發(fā)者可以在百度搜索資源-抓取頻次-抓取頻次上限調(diào)整頁面對百度爬蟲的抓取頻次進行設置。

本文鏈接:http://www.cjzzc.com/article/1268.html

標題:【網(wǎng)站優(yōu)化必看】網(wǎng)站死鏈介紹及設置方法

地址:http://www.datongoofay.com//xwdt/43880.html