觸屏版
全國(guó)服務(wù)熱線:0571-87205688
登錄
注冊(cè)
客戶中心
關(guān)注云客
網(wǎng)站日志既可使用工具,也可直接在看。直接在看源文件,信息會(huì)更加完整。網(wǎng)站日志是記錄Web服務(wù)器接收處理請(qǐng)求以及運(yùn)行時(shí)錯(cuò)誤等各種原始信息的以.log結(jié)尾的文件,確切地講,應(yīng)該是服務(wù)器日志。
網(wǎng)站日志最大的意義是記錄網(wǎng)站運(yùn)營(yíng)中空間等的運(yùn)營(yíng)情況,被訪問請(qǐng)求的記錄。通過網(wǎng)站日志可以清楚地得知用戶在什么IP、什么時(shí)間、用什么操作系統(tǒng)、什么瀏覽器、什么分辨率顯示器的情況下訪問了你網(wǎng)站的哪個(gè)頁(yè)面,是否訪問成功。
網(wǎng)站日志的很多信息在百度統(tǒng)計(jì)、百度站長(zhǎng)工具等都已經(jīng)數(shù)據(jù)化或者圖表化,比如訪客訪問了哪些文件、蜘蛛抓取哪些文件顯示404等。
網(wǎng)站日志數(shù)據(jù)分析解讀如下。
(1) 訪問次數(shù)、停留時(shí)間、抓取量
從這些項(xiàng)數(shù)據(jù)中可以得知: 平均每歡抓取頁(yè)面數(shù)、單頁(yè)抓取停留時(shí)間和平均每次停留時(shí)間。平均每次抓取頁(yè)面數(shù)=總抓取量/訪問次數(shù),單頁(yè)面抓取停留時(shí)間=每次停留/每次抓取,平均每次停留時(shí)間=總停留時(shí)間訪問次數(shù)。
從這些數(shù)據(jù)可以看出蜘蛛的活躍度,網(wǎng)站對(duì)蜘蛛的親和度,以及抓取深度等,總抓取量、總訪問次數(shù)、平均抓取量、總停留時(shí)間、單頁(yè)抓取停留、平均停留時(shí)間等指標(biāo)越高,通常表明網(wǎng)站友好性越好,站點(diǎn)質(zhì)量越高,越受搜索引擎喜歡。而單頁(yè)抓取停留時(shí)間表明網(wǎng)站頁(yè)面訪問速度、時(shí)間越長(zhǎng),表明網(wǎng)站訪問速度越慢,對(duì)搜索引擎抓取收錄較不利,我們應(yīng)盡量提高網(wǎng)頁(yè)加載速度,減少單一頁(yè)面停留時(shí)間,讓爬蟲資源更多地去抓取收錄。另外,根據(jù)這些數(shù)據(jù)我們還可以統(tǒng)計(jì)出一段時(shí)間內(nèi)網(wǎng)站的整體趨勢(shì)表現(xiàn),如蜘蛛訪問次數(shù)趨勢(shì)、停留時(shí)間趨勢(shì)、抓取趨勢(shì)。長(zhǎng)期觀察這些數(shù)據(jù),可以起到對(duì)優(yōu)化效果進(jìn)行評(píng)估的作用,并及時(shí)發(fā)現(xiàn)哪些頁(yè)面及目錄表現(xiàn)好,哪些表現(xiàn)不好,更貼近搜索引擎,也可及時(shí)發(fā)現(xiàn)異常變動(dòng),做好應(yīng)對(duì)。
(2) 目錄抓取統(tǒng)計(jì)
通過日志分析我們可以看到網(wǎng)站哪些目錄受蜘蛛喜歡、抓取目錄深度、重要頁(yè)面目錄抓取狀況、無(wú)效頁(yè)面目錄抓取狀況等。通過對(duì)比目錄下頁(yè)面抓取及收錄情況,我們可以發(fā)現(xiàn)更多問題。對(duì)于重要目錄,我們需要通過內(nèi)外調(diào)整增加權(quán)重及爬取; 對(duì)于無(wú)效頁(yè)面,在Robots.TXT 中進(jìn)行屏蔽。
另外,通過多日日志統(tǒng)計(jì),我們可以看到站內(nèi)外行為給目錄帶來(lái)的效果,優(yōu)化是否合理,是否達(dá)到了預(yù)期效果。對(duì)于同一目錄,以長(zhǎng)期時(shí)間段來(lái)看,我們可以看到該目錄下頁(yè)面表現(xiàn)、根據(jù)行為推測(cè)表現(xiàn)的原因等。
(3 )頁(yè)面抓取
在網(wǎng)站日志分析中,我們可以看到具體被蜘蛛爬取的頁(yè)面。在這些頁(yè)面中,我們可以分析出蜘蛛爬取了哪些需要被禁止爬取的頁(yè)面、爬取了哪些無(wú)收錄價(jià)值頁(yè)面、爬取了哪些重復(fù)頁(yè)面URL等。為充分利用蜘蛛資源,我們需要將這些地址在Robots.txt中禁止爬取。
另外,我們還可以分析未收錄頁(yè)面原因,對(duì)于新文章,是因?yàn)闆]有被爬取到而未收錄抑或爬取了但未放出。對(duì)于某些閱讀意義不大的頁(yè)面,可能我們需要它作為爬取通道,對(duì)于這些頁(yè)面,我們是否應(yīng)該做Noindex標(biāo)簽等。
(4)蜘蛛訪問IP
通過蜘蛛的IP段和前三項(xiàng)數(shù)據(jù)來(lái)判斷網(wǎng)站的降權(quán)情況,IP分析的更多用途是判斷是否存在采集蜘蛛、假蜘蛛、惡意點(diǎn)擊蜘蛛等,從而對(duì)那些訪問來(lái)源進(jìn)行屏蔽、禁止訪問處理,以節(jié)省帶寬資源及減輕服務(wù)器壓力,留給訪客及蜘蛛更好的訪問體驗(yàn)。
(5)訪問狀態(tài)碼
蜘蛛經(jīng)常出現(xiàn)的狀態(tài)碼包括301、404等。出現(xiàn)這些狀態(tài)碼要及時(shí)處理,以避免對(duì)網(wǎng)站造成壞的影響。
(6)抓取時(shí)間段
通過分析對(duì)比多個(gè)單日蜘蛛小時(shí)爬取量,可以了解到特定蝴蛛對(duì)于本網(wǎng)站在特定時(shí)間的活躍時(shí)段。通過對(duì)比周數(shù)據(jù),可以看到特定蜘蛛在一周中的活躍周期。了解這個(gè)對(duì)于網(wǎng)定指導(dǎo)意義,而之前所謂小三大四等均為不科學(xué)說(shuō)法。
(7) 蜘蛛爬取路徑
在網(wǎng)站日志中我們可以跟蹤到特定IP 的訪問路徑,如果我們跟蹤特定蜘蛛的訪問路徑就能發(fā)現(xiàn)對(duì)于本網(wǎng)站結(jié)構(gòu)下蜘蛛的爬取路徑偏好。由此,我們可以適當(dāng)?shù)匾龑?dǎo)蜘蛛的爬取路徑,讓蜘蛛更多地爬取重要、有價(jià)值、新更新頁(yè)面。其中,爬取路徑中我們又可以分析頁(yè)面物理結(jié)構(gòu)路徑偏好以及URL 邏輯結(jié)構(gòu)爬取偏好。通過這些,可以讓我們從搜索引擎的視角去審視自己的網(wǎng)站。
seo分析,確定好在網(wǎng)站前期需要開展的SEO 工作之后,剩下的即調(diào)配所需人力、物力,并制定推進(jìn)方案一步步完善各個(gè)優(yōu)化細(xì)節(jié),并跟蹤監(jiān)控優(yōu)化效果,最終一步步達(dá)成收錄、流量、關(guān)鍵詞排名及網(wǎng)站Alexa排名目標(biāo)。一個(gè)好的SEO方案不僅僅是知道該干什么,更重要的是將需要做的事情按部就班地推行下去,執(zhí)行力尤為最要,最好的辦法是將所有SEO工作分解細(xì)化,去執(zhí)行。
評(píng)論(0人參與,0條評(píng)論)
發(fā)布評(píng)論
最新評(píng)論