觸屏版
全國服務(wù)熱線:0571-87205688
登錄
注冊
客戶中心
關(guān)注云客
2.1 采集冒充原創(chuàng),篡改關(guān)鍵信息
當(dāng)前,大量的網(wǎng)站批量采集原創(chuàng)內(nèi)容后,用人工或機(jī)器的方法,篡改作者、發(fā)布時間和來源等關(guān)鍵信息,冒充原創(chuàng)。此類冒充原創(chuàng)是需要搜索引擎識別出來予以適當(dāng)調(diào)整的。
2.2 內(nèi)容生成器,制造偽原創(chuàng)
利用自動文章生成器等工具,“獨(dú)創(chuàng)”一篇文章,然后安一個吸引眼球的title,現(xiàn)在的成本也低得很,而且一定具有獨(dú)創(chuàng)性。然而,原創(chuàng)是要具有社會共識價值的,而不是胡亂制造一篇根本不通的垃圾就能算做有價值的優(yōu)質(zhì)原創(chuàng)內(nèi)容。內(nèi)容雖然獨(dú)特,但是不具社會共識價值,此類偽原創(chuàng)是搜索引擎需要重點(diǎn)識別出來并予以打擊的。
2.3 網(wǎng)頁差異化,結(jié)構(gòu)化信息提取困難
不同的站點(diǎn)結(jié)構(gòu)化差異比較大,html標(biāo)簽的含義和分布也不同,因此提取關(guān)鍵信息如標(biāo)題、作者和時間的難易程度差別也比較大。做到既提得全,又提得準(zhǔn),還要最及時,在當(dāng)前的中文互聯(lián)網(wǎng)規(guī)模下實(shí)屬不易,這部分將需要搜索引擎與站長配合好才會更順暢的運(yùn)行,站長們?nèi)绻酶逦慕Y(jié)構(gòu)告知搜索引擎網(wǎng)頁的布局,將使搜索引擎高效地提取原創(chuàng)相關(guān)的信息。
評論(0人參與,0條評論)
發(fā)布評論
最新評論