中國企業(yè)做網(wǎng)站SEO主要看重百度排名,而網(wǎng)站關(guān)鍵詞質(zhì)量的好壞是影響百度排名的重要因素,如果你對百度搜索引擎分詞技術(shù)有一定理解,那么對你做有關(guān)提升關(guān)鍵詞排名的工作將會變得簡單得多。作者:高輝,seo網(wǎng)站優(yōu)化師,網(wǎng)站建設(shè)高手,sem運營高手,電話18107340881【同微信】http://
分詞技術(shù):什么是分詞, 如何分詞搜索引擎會承認,這是一位朋友提的問題,想必大家也聽說過,很好奇,什么是分詞技術(shù),什么又是百度分詞呢?分詞大家容易理解。就是一段詞用字符分開,比如標點符號,空格等。
那什么叫分詞技術(shù)呢?分詞技術(shù)就是SEO針對用戶提交查詢的關(guān)鍵串進行的查詢處理后根據(jù)用戶的關(guān)鍵詞串用各種匹配方法進行的一種技術(shù)。大家好好理解。那么我們要理解分詞技術(shù)先要理解一個概念。那就是查詢處理,當(dāng)用戶向搜索引擎提交查詢后,搜索引擎接收到用戶的信息要做一系列的處理。
首先是到數(shù)據(jù)庫里面索引相關(guān)的信息,這就是查詢處理,那么查詢處理又是如何工作的呢?很簡單,把用戶提交的字符串沒有超過3個的中文字,就會直接到數(shù)據(jù)庫索引詞匯。超過4個中文字的,首先用分隔符比如空格,標點符號,將查詢串分割成若干子查詢串。舉個例子。“什么是百度分詞技術(shù)” 我們就會把這個詞分割成“ 什么是,百度,分詞技術(shù)。”這種分詞方法叫做反向匹配法。
然后再看用戶提供的這個詞有沒有重復(fù)詞匯。如果有的話,會丟棄掉,默認為一個詞匯。接下來檢查用戶提交的字符串,有沒有字母和數(shù)字。如果有的話,就把字母和數(shù)字認為一個詞。好了,這就是SEO的查詢處理。
講了查詢處理后,大家對分詞技術(shù),尤其是中文分詞技術(shù)有了一個基本的了解。其實我講的都是搜索引擎的原理。好了,我接下來講分詞的原理。我們用百度來舉例,百度是如何來分詞的呢?分詞技術(shù)現(xiàn)今非常成熟了。他分為3種技術(shù)。
1.字符串匹配的分詞方法
2.詞義分詞法。
3.統(tǒng)計分詞法。
一、字符串匹配的分詞方法(分三種)
1.正向最大匹配法
什么意思呢?就是把一個詞從左至右來分詞。舉個例子,“不知道你在說什么”這句話采用正向最大匹配法是如何分的呢?“不知道,你,在,說什么”與正向最大匹配法相對應(yīng)的是反向最大匹配發(fā)。這是第二種分詞方法。
2.反向最大匹配法
上面我舉的例子是如何分的呢 "不知道你在說什么"。反向最大匹配法來分上面這段是如何分的。“不,知道,你在,說,什么”,這個就分的比較多了,反向最大匹配法就是從右至左。
3.就是最短路徑分詞法
這個怎么理解呢 ,就是說我一段話里面要求切出的詞數(shù)是最少的。還是上面那句話“不知道你在說什么”最短路徑分詞法網(wǎng)站開發(fā)就是指,我把上面那句話分成的詞要是最少的。不知道,你在,說什么,這就是最短路徑分詞法,分出來就只有3個詞了 。好了,當(dāng)然還有上面三種可以相互結(jié)合組成一些分詞方法。比如正向最大匹配法和反向最大匹配法組合起來就可以叫做雙向最大匹配法。
二、詞義分詞法
這種其實就是一種機器語音判斷的分詞方法。很簡單,進行句法、語義分析,利用網(wǎng)站優(yōu)化句法信息和語義信息來處理歧義現(xiàn)象來分詞,這種分詞方法,現(xiàn)在還不成熟。處在測試階段。
三、統(tǒng)計的分詞方法
這個很簡單,就是根據(jù)詞組的統(tǒng)計,就會發(fā)現(xiàn)兩個相鄰的字出現(xiàn)的頻率最多,那么這個詞就很重要。就可以作為用戶提供字符串中的分隔符。這樣來分詞。比如,“我的,你的,許多的,這里,哪里,那里”。等等,這些詞出現(xiàn)的比較多,就從這些詞里面分開來。來源:http://,北京網(wǎng)站建設(shè),網(wǎng)站建設(shè)公司,企業(yè)網(wǎng)站優(yōu)化,營銷網(wǎng)站設(shè)計,網(wǎng)站建設(shè),北京網(wǎng)站建設(shè)公司,北京網(wǎng)站優(yōu)化,北京網(wǎng)站優(yōu)化公司
猜你喜歡
聯(lián)絡(luò)方式:
電話:181-0734-0881
郵箱:1713521713@qq.com
-
域名知多少,淺析域名
一、域名的含義域名是Internet網(wǎng)絡(luò)上的一個服務(wù)器或一個網(wǎng)絡(luò)系統(tǒng)的名字,在全世界,沒有重復(fù)的域名。域名的形式是以若干個英文字母和數(shù)字組成,由"."分隔成幾部分,如baidu.com就是...
-
百度驚雷算法首推,快排行業(yè)將退出SEO江湖
近幾年,百度在保障用戶體驗提升內(nèi)容生態(tài)良性發(fā)展方面下了很多功夫,從打擊外鏈、采集、站群、頁面友好度等方面都經(jīng)過了多次的算法調(diào)整,例如:青藤算法、綠蘿算法、颶風(fēng)算法、清風(fēng)...
-
線上營銷線下消費 小程序開啟流量爭奪戰(zhàn)
不知不覺,小程序也已上線一周年了,小程序的出現(xiàn)為創(chuàng)業(yè)者們打開了一個新的程序入口,僅僅一年的時間,小程序已經(jīng)涵蓋了衣食住行各個方面。甚至支付寶、美團、滴滴、京東,還有三大運...
-
網(wǎng)站如何選擇合適的關(guān)鍵詞
對于網(wǎng)站SEO,選好關(guān)鍵詞是搜索引擎營銷至關(guān)重要的一步,選對關(guān)鍵詞能讓網(wǎng)站權(quán)重快速提高,今天我就教大家如何選擇網(wǎng)站SEO關(guān)鍵詞。...
-
網(wǎng)站關(guān)鍵詞排名大量下滑到底有哪些因素
客觀原因:影響排名的因素很多,有主觀也有一些是人力無法控制的客觀原因,而我們常見的客觀原因包括二點:...