經(jīng)常會看到有些站長說看不懂網(wǎng)站日志,其中不乏做了3年以上的老站長。網(wǎng)站日志其實是seo優(yōu)化中的基礎知識,很多然看不懂,可能是網(wǎng)站日志中有許多我們看不懂的代碼。其實我們不需要看懂全部,只需了解我們需要的就可以了。
網(wǎng)站日志分析什么內(nèi)容,有什么用?
首先說下日志記錄的內(nèi)容分類:1、訪客訪問信息,2、蜘蛛抓取信息。
1、訪客訪問信息的內(nèi)容:
2014-07-01 00:23:04 W3SVC50722105 61.155.150.92 GET /news/1.html – 80 – 222.88.71.11 Mozilla/5.0+(Windows+NT+6.1;+WOW64;+rv:30.0)+Gecko/20100101+Firefox/30.0 200 0 0
這是一段用戶訪問記錄,內(nèi)容是7月1日凌晨12點23分的時候,IP地址為222.88.71.11的用戶使用火狐瀏覽器正常訪問了網(wǎng)站www.biz365.net/news/seo/690.html這篇文章。這條記錄信息需要注意的幾個點:訪問網(wǎng)頁地址、訪問時間、IP地址以及返回狀態(tài)碼。前面幾條比較明晰,狀態(tài)碼可能是站長們比較頭疼的。
2014-06-30 16:52:52 W3SVC50722105 61.155.150.92 GET /html/success.html – 80 – 202.108.4.123 Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1) 404 0 64
這是一條用戶訪問404錯誤信息,由于網(wǎng)站改版造成的目錄及網(wǎng)頁文件更改后遺癥。這些信息也有可能被蜘蛛抓取,所以需要提交百度改版信息或robots屏蔽或提交死鏈接來屏蔽蜘蛛的抓取。從而減少頁面404錯誤抓取信息。
2014-06-20 17:35:10 W3SVC50722105 61.155.150.92 HEAD /www.***.net.rar – 80 – 27.150.236.228 Mozilla/4.0+(compatible;+MSIE+8.0;+Windows+NT+6.1;+Trident/4.0) 404 0 2
這是用戶用軟件批量掃描網(wǎng)站備份文件所造成的404錯誤信息其中的一條,很多黑客用這種方法下載網(wǎng)站備份信息從而爆破網(wǎng)站達到網(wǎng)站入侵的方法,可以把網(wǎng)站備份信息單獨存放到web目錄外的其他目錄中預防這種情況發(fā)生以及通過屏蔽IP地址等方法解決。
2、蜘蛛抓取信息:
2014-06-30 16:00:46 W3SVC50722105 61.155.150.92 GET /product/qy/12.html – 80 – 66.249.64.36 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 200 0 0
這是谷歌機器人對www. 域名/product/qy/12.html網(wǎng)頁文件的正常抓取信息。
2014-07-01 02:47:09 W3SVC50722105 61.155.150.92 GET /sitemap.xml – 80 – 123.125.71.106 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) 304 0 0
這是百度蜘蛛對www.域名/sitemap.xml網(wǎng)站地圖的304抓取信息,304代表著文件無修改,百度服務器已經(jīng)存放了相同信息,緩存信息無修改,無需更新。
日志分析是SEO中非常重要的一個操作。新網(wǎng)站上線可以通過日志進行查看是否被蜘蛛抓取,網(wǎng)站是否存在404錯誤進行及時糾錯,是否被整站掃描下載等,這只是一些常見的日志用途。通過日志分析還可以得到很多其他的信息,希望廣大SEO從業(yè)人員可以對日志分析重視起來,通過日志分析或許更多的網(wǎng)站信息。
附網(wǎng)站各種狀態(tài)碼:
1xx(臨時響應)
表示臨時響應并需要請求者繼續(xù)執(zhí)行操作的狀態(tài)代碼。
代碼 說明
100 (繼續(xù)) 請求者應當繼續(xù)提出請求。 服務器返回此代碼表示已收到請求的第一部分,正在等待其余部分。
101 (切換協(xié)議) 請求者已要求服務器切換協(xié)議,服務器已確認并準備切換。
2xx (成功)
表示成功處理了請求的狀態(tài)代碼。
代碼 說明
200 (成功) 服務器已成功處理了請求。 通常,這表示服務器提供了請求的網(wǎng)頁。
201 (已創(chuàng)建) 請求成功并且服務器創(chuàng)建了新的資源。
202 (已接受) 服務器已接受請求,但尚未處理。
203 (非授權信息) 服務器已成功處理了請求,但返回的信息可能來自另一來源。
204 (無內(nèi)容) 服務器成功處理了請求,但沒有返回任何內(nèi)容。
205 (重置內(nèi)容) 服務器成功處理了請求,但沒有返回任何內(nèi)容。
206 (部分內(nèi)容) 服務器成功處理了部分 GET 請求。
3xx (重定向)
表示要完成請求,需要進一步操作。 通常,這些狀態(tài)代碼用來重定向。
代碼 說明
300 (多種選擇) 針對請求,服務器可執(zhí)行多種操作。 服務器可根據(jù)請求者 (user agent) 選擇一項操作,或提供操作列表供請求者選擇。
301 (永久移動) 請求的網(wǎng)頁已永久移動到新位置。 服務器返回此響應(對 GET 或 HEAD 請求的響應)時,會自動將請求者轉到新位置。
302 (臨時移動) 服務器目前從不同位置的網(wǎng)頁響應請求,但請求者應繼續(xù)使用原有位置來進行以后的請求。
303 (查看其他位置) 請求者應當對不同的位置使用單獨的 GET 請求來檢索響應時,服務器返回此代碼。
304 (未修改) 自從上次請求后,請求的網(wǎng)頁未修改過。 服務器返回此響應時,不會返回網(wǎng)頁內(nèi)容。
305 (使用代理) 請求者只能使用代理訪問請求的網(wǎng)頁。 如果服務器返回此響應,還表示請求者應使用代理。
307 (臨時重定向) 服務器目前從不同位置的網(wǎng)頁響應請求,但請求者應繼續(xù)使用原有位置來進行以后的請求。
4xx(請求錯誤)
這些狀態(tài)代碼表示請求可能出錯,妨礙了服務器的處理。
代碼 說明
400 (錯誤請求) 服務器不理解請求的語法。
401 (未授權) 請求要求身份驗證。 對于需要登錄的網(wǎng)頁,服務器可能返回此響應。
403 (禁止) 服務器拒絕請求。
404 (未找到) 服務器找不到請求的網(wǎng)頁。
405 (方法禁用) 禁用請求中指定的方法。
406 (不接受) 無法使用請求的內(nèi)容特性響應請求的網(wǎng)頁。
407 (需要代理授權) 此狀態(tài)代碼與 401(未授權)類似,但指定請求者應當授權使用代理。
408 (請求超時) 服務器等候請求時發(fā)生超時。
409 (沖突) 服務器在完成請求時發(fā)生沖突。 服務器必須在響應中包含有關沖突的信息。
410 (已刪除) 如果請求的資源已永久刪除,服務器就會返回此響應。
411 (需要有效長度) 服務器不接受不含有效內(nèi)容長度標頭字段的請求。
412 (未滿足前提條件) 服務器未滿足請求者在請求中設置的其中一個前提條件。
413 (請求實體過大) 服務器無法處理請求,因為請求實體過大,超出服務器的處理能力。
414 (請求的 URI 過長)請求的 URI(通常為網(wǎng)址)過長,服務器無法處理。
415 (不支持的媒體類型) 請求的格式不受請求頁面的支持。
416 (請求范圍不符合要求) 如果頁面無法提供請求的范圍,則服務器會返回此狀態(tài)代碼。
417 (未滿足期望值) 服務器未滿足"期望"請求標頭字段的要求。
5xx(服務器錯誤)
這些狀態(tài)代碼表示服務器在嘗試處理請求時發(fā)生內(nèi)部錯誤。 這些錯誤可能是服務器本身的錯誤,而不是請求出錯。
代碼 說明
500 (服務器內(nèi)部錯誤) 服務器遇到錯誤,無法完成請求。
501 (尚未實施) 服務器不具備完成請求的功能。 例如,服務器無法識別請求方法時可能會返回此代碼。
502 (錯誤網(wǎng)關) 服務器作為網(wǎng)關或代理,從上游服務器收到無效響應。
503 (服務不可用) 服務器目前無法使用(由于超載或停機維護)。通常,這只是暫時狀態(tài)。
504 (網(wǎng)關超時) 服務器作為網(wǎng)關或代理,但是沒有及時從上游服務器收到請求。
505 (HTTP 版本不受支持)服務器不支持請求中所用的 HTTP 協(xié)議版本。
評論(0人參與,0條評論)
發(fā)布評論
最新評論