日韩中文精品无码_91尤物在线看网址_欧美成 人影片 aⅴ免费观看_久草免费福利资源站在线观看

內(nèi)頁Banner背景圖
創(chuàng)絡(luò)講堂
白色波浪圖形
灰色波浪圖形 灰色波浪圖形
白色波浪圖形 白色波浪圖形
白色波浪圖形 白色波浪圖形
白色波浪圖形 白色波浪圖形
本文于2012-03-17最后更新,距今已超過1年,如不符合現(xiàn)在的實(shí)際情況,可聯(lián)系創(chuàng)絡(luò)客服獲取幫助或查閱近期文章。

可能大家在優(yōu)化自己網(wǎng)站的時(shí)候,還從來沒有認(rèn)真分析過或者系統(tǒng)的學(xué)習(xí)過搜索引擎的搜索規(guī)則和其中的原理。深圳網(wǎng)絡(luò)公司【創(chuàng)絡(luò)】通過一些渠道了解到的資料可能會對大家展開更高層次的網(wǎng)站優(yōu)化有一定幫助,如果您現(xiàn)在正在朝著這樣的方向發(fā)展,那么僅僅知道網(wǎng)站內(nèi)容和外鏈?zhǔn)沁h(yuǎn)遠(yuǎn)不夠的。因此,本文將是技術(shù)角度出發(fā)的一些文字,希望能對讀者有一定的幫助。

搜索引擎之所以可以在數(shù)秒鐘甚至一秒鐘內(nèi)完成數(shù)億級別的數(shù)據(jù)處理,并不是因?yàn)樗阉饕婢邆涠嗝磸?qiáng)大的計(jì)算能力,而是全部的網(wǎng)頁都是經(jīng)過預(yù)處理,為排名做好了足夠的準(zhǔn)備的。網(wǎng)站要有排名,就必須被索引,而搜索引擎現(xiàn)在就主要是對網(wǎng)站文字進(jìn)行提取后進(jìn)行預(yù)處理,預(yù)處理的過程就是去除從HTML代碼中抓取的標(biāo)簽、JS程序等不可以用來排名的內(nèi)容,提取可以用于排名的頁面文字內(nèi)容。

其中,中文和英文的索引還有一個(gè)很重要的區(qū)別,那就是中文會有一個(gè)分詞技術(shù)。搜索引擎儲存和處理頁面以及用戶搜索都是以詞為基礎(chǔ)的。

分詞技術(shù)主要包括兩種,一種是詞典匹配,也就是將待分析的一段漢字與一個(gè)事先造好的詞典中的詞條進(jìn)行匹配,如果發(fā)現(xiàn)詞典中已有詞條那么說明匹配成功,就分出一個(gè)關(guān)鍵詞來。

第二種分詞技術(shù)是基于統(tǒng)計(jì)的智能方法,也就是通過分析大量文字樣本,計(jì)算出字與字相鄰出現(xiàn)的統(tǒng)計(jì)概率,幾個(gè)字相鄰出現(xiàn)越多,就越可能成為一個(gè)單詞。這種方法的優(yōu)勢是對新出現(xiàn)的詞反應(yīng)更快速,有利于消除歧義,詞典匹配和智能匹配這兩種分詞技術(shù)通常是互相協(xié)調(diào),搭配使用,以提高搜索引擎的精確度。

上一條 返回目錄 下一條
更多閱讀選擇
相關(guān)文章
我們推薦了一些您可能也會感興趣的文章
客服電話
  • 0755-23698839
  • 134-1757-3710
  • 132-6576-8769
創(chuàng)絡(luò)建站客服二維碼
不出售過期域名
微信咨詢