觸屏版
全國服務(wù)熱線:0571-87205688
登錄
注冊
客戶中心
關(guān)注云客
搜索引擎(Search Engine)是指根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網(wǎng)上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務(wù),將用戶檢索相關(guān)的信息展示給用戶的系統(tǒng)。一個搜索引擎由搜索器 、索引器 、檢索器和用戶接口4個部分組成。
搜索器的功能是在互聯(lián)網(wǎng)中漫游,發(fā)現(xiàn)和搜集信息。索引器的功能是理解搜索器所搜索的信息,從中抽取出索引項,用于表示文檔以及生成文檔庫的索引表。檢索器的功能是根據(jù)用戶的查詢在索引庫中快速檢出文檔,進行文檔與查詢的相關(guān)度評價,對將要輸出的結(jié)果進行排序,并實現(xiàn)某種用戶相關(guān)性反饋機制。用戶接口的作用是輸入用戶查詢、顯示查詢結(jié)果、提供用戶相關(guān)性反饋機制。
搜索引擎包括全文索引、目錄索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、門戶搜索引擎與免費鏈接列表等。
全文搜索引擎是名副其實的搜索引擎,國外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,國內(nèi)著名的有百度、360搜索、搜狗。它們都是通過從互聯(lián)網(wǎng)上提取的各個網(wǎng)站的信息(以網(wǎng)頁文字為主)而建立的數(shù)據(jù)庫中,檢索與用戶查詢條件匹配的相關(guān)記錄,然后按一定的排列順序?qū)⒔Y(jié)果返回給用戶,因此他們是真正的搜索引擎。
全文搜索引擎是從網(wǎng)站提取信息建立網(wǎng)頁數(shù)據(jù)庫的概念,搜索引擎的自動信息搜集功能分兩種:
一種是定期搜索,即每隔一段時間(比如Google一般是28天),搜索引擎主動派出“蜘蛛”程序,對一定IP地址范圍內(nèi)的互聯(lián)網(wǎng)網(wǎng)站進行檢索,一旦發(fā)現(xiàn)新的網(wǎng)站,它會自動提取網(wǎng)站的信息和網(wǎng)址加入自己的數(shù)據(jù)庫。
另一種是提交網(wǎng)站搜索,即網(wǎng)站擁有者主動向搜索引擎提交網(wǎng)址,它在一定時間內(nèi)(2天到數(shù)月不等)定向向你的網(wǎng)站派出“蜘蛛”程序,掃描你的網(wǎng)站并將有關(guān)信息存入數(shù)據(jù)庫,以備用戶查詢。
隨著搜索引擎索引規(guī)則發(fā)生很大變化,主動提交網(wǎng)址并不保證你的網(wǎng)站能進入搜索引擎數(shù)據(jù)庫,最好的辦法是多獲得一些外部鏈接,讓搜索引擎有更多機會找到你并自動將你的網(wǎng)站收錄。
當(dāng)用戶以關(guān)鍵詞查找信息時,搜索引擎會在數(shù)據(jù)庫中進行搜尋,如果找到與用戶要求內(nèi)容相符的網(wǎng)站,便采用特殊的算法——通常根據(jù)網(wǎng)頁中關(guān)鍵詞的匹配程度、出現(xiàn)的位置、頻次、鏈接質(zhì)量——計算出各網(wǎng)頁的相關(guān)度及排名等級,然后根據(jù)關(guān)聯(lián)度高低,按順序?qū)⑦@些網(wǎng)頁鏈接返回給用戶。這種引擎的特點是搜全率比較高。
從搜索結(jié)果來源的角度,全文搜索引擎又可細(xì)分為兩種:
一種是擁有自己的檢索程序(Indexer),俗稱“蜘蛛”(Spider)程序或“機器人”(Robot)程序,并自建網(wǎng)頁數(shù)據(jù)庫,搜索結(jié)果直接從自身的數(shù)據(jù)庫中調(diào)用,如上面提到的7家引擎;
另一種則是租用其他引擎的數(shù)據(jù)庫,并按自定的格式排列搜索結(jié)果,如Lycos引擎。
目錄索引也稱為分類檢索,是因特網(wǎng)上最早提供WWW資源查詢的服務(wù),主要通過搜集和整理因特網(wǎng)的資源,根據(jù)搜索到網(wǎng)頁的內(nèi)容,將其網(wǎng)址分配到相關(guān)分類主題目錄的不同層次的類目之下,形成像圖書館目錄一樣的分類樹形結(jié)構(gòu)索引。目錄索引無需輸入任何文字,只要根據(jù)網(wǎng)站提供的主題分類目錄,層層點擊進入,便可查到所需的網(wǎng)絡(luò)信息資源。
雖然有搜索功能,但嚴(yán)格意義上不能稱為真正的搜索引擎,只是按目錄分類的網(wǎng)站鏈接列表而已,用戶完全可以按照分類目錄找到所需要的信息,不依靠關(guān)鍵詞(Keywords)進行查詢。
目錄索引雖然有搜索功能,但在嚴(yán)格意義上算不上是真正的搜索引擎,僅僅是按目錄分類的網(wǎng)站鏈接列表而已。用戶完全可以不用進行關(guān)鍵詞(Keywords)查詢,僅靠分類目錄也可找到需要的信息。
目錄索引中最具代表性的莫過于大名鼎鼎的Yahoo雅虎,其他著名的還有Open Directory Project(DMOZ)、LookSmart、About等。國內(nèi)的搜狐、新浪、網(wǎng)易搜索也都屬于這一類。
元搜索引擎在接受用戶查詢請求時,同時在其他多個引擎上進行搜索,并將結(jié)果返回給用戶。
著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索結(jié)果排列方面,有的直接按來源引擎排列搜索結(jié)果,如Dogpile,有的則按自定的規(guī)則將結(jié)果重新排列組合,如Vivisimo。
通用搜索引擎就如同互聯(lián)網(wǎng)第一次出現(xiàn)的門戶網(wǎng)站一樣,大量的信息整合導(dǎo)航,極快的查詢,將所有網(wǎng)站上的信息整理在一個平臺上供網(wǎng)民使用。
大家熟知的搜索引擎Google、百度、雅虎、必應(yīng)、搜狗、有道等是通用搜索引擎現(xiàn)如今的杰出代,他們?yōu)榛ヂ?lián)網(wǎng)的發(fā)展做出了重要的貢獻。
通用搜索引擎的缺點:信息量大、深度不夠、查詢不夠精準(zhǔn)。
垂直搜索引擎為2006年后逐步興起的一類搜索引擎。不同于通用的網(wǎng)頁搜索引擎,垂直搜索專注于特定的搜索領(lǐng)域和搜索需求(例如:機票搜索、旅游搜索、生活搜索、小說搜索、視頻搜索、購物搜索等等),在其特定的搜索領(lǐng)域有更好的用戶體驗。
垂直搜索引擎是專門針對某一個行業(yè)的專業(yè)搜索引擎,是通用搜索引擎的細(xì)分和延伸,對于網(wǎng)頁庫中的某類專們的信息進行處理、整合,定向分字段,抽取出需要的數(shù)據(jù)進行處理后再以某種形式返回給用戶。
我們常見的淘寶、去哪兒、搜房等都是屬于這一類的網(wǎng)站。
垂直搜索引擎優(yōu)點:保證信息的收錄齊全與更新及時、深度好、檢出結(jié)果重復(fù)率低、相關(guān)性強、查準(zhǔn)率高。
相比通用搜索動輒數(shù)千臺檢索服務(wù)器,垂直搜索需要的硬件成本低、用戶需求特定、查詢的方式多樣。
集合式搜索引擎:如HotBot在2002年底推出的引擎,該引擎類似META搜索引擎,但區(qū)別在于不是同時調(diào)用多個引擎進行搜索,而是由用戶從提供的4個引擎當(dāng)中選擇,因此叫它“集合式”搜索引擎更確切些。
門戶搜索引擎:如AOL Search、MSN Search等雖然提供搜索服務(wù),但自身即沒有分類目錄也沒有網(wǎng)頁數(shù)據(jù)庫,其搜索結(jié)果完全來自其他引擎。
免費鏈接列表(Free For All Links,簡稱FFA):這類網(wǎng)站一般只簡單地滾動排列鏈接條目,少部分有簡單的分類目錄,不過規(guī)模比起Yahoo等目錄索引來要小得多。
(1)、所謂通用搜索引擎,并不能夠囊括所有的網(wǎng)頁,據(jù)google的人說,也就猜測覆蓋了40%不到的網(wǎng)頁,也就是說,更多的網(wǎng)頁是沒有被通用搜索引擎收錄的。那些沒有機會收錄的網(wǎng)頁,有些是需要身份驗證等之后才可以看到,有些是根本未被通用搜索引擎的蜘蛛爬到,這些信息卻往往是寶貴的,更有價值的。
(2)、在搜索收錄的分析過程中,如果不加上行業(yè)特點和特性進行分析,很難說會更準(zhǔn)確分析到網(wǎng)頁的重要性和分析的準(zhǔn)確。這個也是垂直的意義所在。當(dāng)然,并非你垂直了,你的搜索收錄和搜索結(jié)果就一定比通用搜索更準(zhǔn)確。
(3)、通用搜索引擎一般就是一次性給你很多的信息。從這個角度講,我們所看到的信息就會呈現(xiàn)出很大一部分的搜索垃圾,影響用戶的感受,以及繼續(xù)試用搜索的興趣。而垂直搜索引擎應(yīng)該可以更好的做到理解垂直用戶的需求,從而給出更好的結(jié)果。
(4)、從搜索信息的結(jié)果來看,除了上面的垃圾會過多外,還會存在信息不符合要求的情況,有時候用戶搜索某類事物,并以此作為關(guān)鍵字,他需要的是關(guān)于這個事物的數(shù)量、價格等甚至相關(guān)比較信息,而通用搜索引擎只能給你線索,給你網(wǎng)頁。通用搜索引擎由于自身巨大,他做不到更深入分析后給出更符合行業(yè)、用戶需求的結(jié)果。除此以外,垂直搜索引擎還可以粘住用戶,從而區(qū)別通用搜索引擎。
(5)、在通用搜索引擎里面,其實也有類似產(chǎn)品服務(wù)的,如google的group和百度的貼吧。在這個分類里面,百度貼吧稍勝一籌。通過垂直搜索搜索引擎,是可以打造社區(qū)的。社區(qū)的一大特性是就是物以類聚,垂直搜索恰好是分類人群的很好途徑。
(6)、由于垂直搜索引擎的服務(wù)對象有限,所以可以在基礎(chǔ)成本上要少,從而可以更好為用戶服務(wù),可以在個性化服務(wù)上做得更好。
評論(0人參與,0條評論)
發(fā)布評論
最新評論