觸屏版
全國(guó)服務(wù)熱線:0571-87205688
登錄
注冊(cè)
客戶中心
關(guān)注云客
幾乎任何有抱負(fù)的通用搜索引擎都有一個(gè)共同的夢(mèng)想:整合人類所有信息,并讓大家用最便捷的方式各取所需。
對(duì)此,百度說(shuō):“讓人們最便捷地獲取信息,找到所求”;谷歌說(shuō):“整合全球信息,使人人皆可訪問(wèn)并從中受益”。
這兩者表達(dá)的實(shí)際上是同一個(gè)愿景。
然而,這注定是一項(xiàng)不可能完成的任務(wù)。據(jù)科學(xué)家估測(cè),人類信息大概只有0.2%實(shí)現(xiàn)了web化,并且這個(gè)比例很可能在持續(xù)降低。更甚的是,即便在已經(jīng)web化的信息中,搜索引擎的蜘蛛能抓取到的和不能抓取到的比例為1:500。
萬(wàn)里長(zhǎng)征的第一步即是對(duì)付“暗網(wǎng)”。所謂“暗網(wǎng)”,簡(jiǎn)言之即為“搜索引擎抓取不到的網(wǎng)頁(yè)數(shù)據(jù)”。點(diǎn)亮“暗網(wǎng)”早已納入各大搜索引擎的日程之中,很明顯,這將是一場(chǎng)曠日持久的戰(zhàn)爭(zhēng)。
“暗網(wǎng)”之謎
1994年,學(xué)者JillEllsworth 提出了一個(gè)名為“Invisible Web”(不可見(jiàn)網(wǎng)絡(luò),即暗網(wǎng))的新詞匯,并對(duì)其下了定義:這些網(wǎng)站可能已經(jīng)被合理地設(shè)計(jì)出來(lái)了,但是它們卻沒(méi)有被任何搜索引擎索引,以至于事實(shí)上沒(méi)有人能找到它們。
而從信息量來(lái)講,與現(xiàn)在能夠索引的數(shù)據(jù)相比,“暗網(wǎng)”更是要龐大得多。根據(jù)Bright Planet公司此前發(fā)布的一個(gè)名為《TheDeep WebSurfacing The Hidden Value》(深層次網(wǎng)絡(luò),隱藏的價(jià)值)白皮書中提供的數(shù)據(jù),“暗網(wǎng)”包含100億個(gè)不重復(fù)的表單,其包含的信息量是“非暗網(wǎng)”的40倍,有效高質(zhì)內(nèi)容總量至少是后者的1000倍到2000倍。更讓人無(wú)所適從的是,Bright Planet發(fā)現(xiàn),無(wú)數(shù)網(wǎng)站越來(lái)越像孤立的系統(tǒng),似乎沒(méi)有打算與別的網(wǎng)站共享信息,如此一來(lái),“暗網(wǎng)”已經(jīng)成為互聯(lián)網(wǎng)新信息增長(zhǎng)的最大來(lái)源,也就是說(shuō),互聯(lián)網(wǎng)正在變得“越來(lái)越暗”。
當(dāng)然,所謂“暗網(wǎng)”,并不是真正的“不可見(jiàn)”,對(duì)于知道如何訪問(wèn)這些內(nèi)容的人來(lái)說(shuō),它們無(wú)疑是可見(jiàn)的。
迎戰(zhàn)“暗網(wǎng)”
對(duì)于龐大的“暗網(wǎng)”,目前搜索業(yè)界通行的策略主要有兩種:其一,構(gòu)建更有針對(duì)性的“暗網(wǎng)”爬蟲,以便獲取后臺(tái)數(shù)據(jù)庫(kù);其二,與“暗網(wǎng)”網(wǎng)站合作,實(shí)現(xiàn)信息的對(duì)接和上浮。
對(duì)于第一種策略,它始終貫穿搜索引擎的發(fā)展過(guò)程。百度產(chǎn)品部相關(guān)人士對(duì)此表示,目前針對(duì)搜索引擎的升級(jí)和更新中,大部分與“暗網(wǎng)”問(wèn)題有關(guān),只不過(guò)對(duì)普通用戶來(lái)講,他們很難察覺(jué)。
第二種策略似乎更成效。不管是國(guó)外的谷歌、雅虎,還是國(guó)內(nèi)的百度,都有針對(duì)性的計(jì)劃,并且用戶已經(jīng)體驗(yàn)到了它們帶來(lái)的變化。
巨頭的較勁
股民劉先生最近在百度搜索時(shí)無(wú)意中發(fā)現(xiàn),當(dāng)關(guān)鍵詞為股票代碼時(shí),得到的結(jié)果第一項(xiàng)便是該股票的K線圖,還有當(dāng)日的成交量等信息。而切換到谷歌,得到的結(jié)果如出一轍。他體驗(yàn)到的這一技術(shù),在百度被稱為“阿拉丁”,在谷歌則叫“onebox”。
除了股票,在百度搜索英文單詞、人民幣匯率、天氣預(yù)報(bào)、電視節(jié)目表等等,網(wǎng)民都會(huì)有意外收獲。這一點(diǎn),網(wǎng)民的感觸要比在谷歌中深,一個(gè)典型的例子是,在百度和谷歌中分別輸入“天氣”,百度將直接根據(jù)用戶的IP判斷其所處位置,給出當(dāng)?shù)氐奶鞖馇闆r,而谷歌則在第一個(gè)結(jié)果中給出了一個(gè)搜索框,讓用戶進(jìn)一步查詢。
顯然,在用戶體驗(yàn)上,百度占了上風(fēng)。這得益于其上線不久的“搜索開(kāi)放平臺(tái)”,這一平臺(tái)是“阿拉丁”計(jì)劃的一部分。其運(yùn)作邏輯是:百度開(kāi)放API接口,各大網(wǎng)站提交已經(jīng)結(jié)構(gòu)化的數(shù)據(jù),設(shè)定好關(guān)鍵詞和展示方式、位置,獲得百度審核后,當(dāng)網(wǎng)民檢索設(shè)定的關(guān)鍵詞,則自動(dòng)觸發(fā)這一機(jī)制,展現(xiàn)最直接的信息。
對(duì)比百度搜索開(kāi)放平臺(tái)和谷歌onebox,兩者的最大區(qū)別就是與網(wǎng)站的互動(dòng),前者更為充分。換句話說(shuō),onebox更多是谷歌自己在使勁,而搜索開(kāi)放平臺(tái)則是百度與站長(zhǎng)一起在努力。據(jù)百度阿拉丁項(xiàng)目負(fù)責(zé)人透露,平臺(tái)上線兩個(gè)月以來(lái),站長(zhǎng)提交的資源數(shù)量超過(guò)3000個(gè)。
搜索的變革
在對(duì)付“暗網(wǎng)”的過(guò)程中,搜索引擎正在完成它的蛻變,不論是后臺(tái)還是前臺(tái),這才是這場(chǎng)戰(zhàn)役的真正意義?!八阉饕嬖絹?lái)越聰明了,它能看穿我的心思。”90后網(wǎng)民小龔說(shuō)。他是一個(gè)球迷,平時(shí)最喜歡看意甲,一天在百度搜索“意甲射手榜”,“居然結(jié)果中直接就是榜單,讓人意外?!?/p>
一位業(yè)內(nèi)人士表示,搜索引擎試圖讓人們以最小的成本獲得最直接的信息,“哪怕是少一次鼠標(biāo)點(diǎn)擊,也是巨大進(jìn)步。”
有意思的是,隨著百度搜索開(kāi)放平臺(tái)、谷歌onebox、雅虎Search Monkey等計(jì)劃的展開(kāi),搜索結(jié)果真正變得“亂糟糟”的——你總能看到網(wǎng)頁(yè)鏈接的結(jié)果中間夾雜著圖片、新聞、視頻,或者圖形、表格等信息,這種變革對(duì)網(wǎng)民的體驗(yàn)大有裨益。
而評(píng)論人士則指出,這些計(jì)劃將搜索引擎從“只讀時(shí)代”帶入了“可寫時(shí)代”。或許未來(lái),對(duì)于每一個(gè)網(wǎng)站,每一個(gè)用戶,都有資格改變搜索引擎。
新一代基于知識(shí)的搜索引擎面世
從SOSO預(yù)覽功能看站內(nèi)優(yōu)化
詳情頁(yè)優(yōu)化那些不得不說(shuō)的細(xì)節(jié)
客戶要的是產(chǎn)品帶來(lái)的變化
站長(zhǎng)SEO體會(huì):紙上得來(lái)終覺(jué)淺絕知此事要躬行
友情鏈接出現(xiàn)有跳轉(zhuǎn)的原因分析
新站順利通過(guò)考核期需要注意那幾點(diǎn)因素
搜索引擎不收錄內(nèi)頁(yè) 手把手教你制作網(wǎng)站地圖
科學(xué)的做seo讓SEOer的工作變的更輕松
和競(jìng)爭(zhēng)對(duì)手做對(duì)比seo優(yōu)化關(guān)鍵點(diǎn)分析
評(píng)論(0人參與,0條評(píng)論)
發(fā)布評(píng)論
最新評(píng)論