<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
<title><![CDATA[沧海一粟]]></title> 
<link>http://www.dzhope.com/index.php</link> 
<description><![CDATA[Web系统架构与服务器运维,php开发]]></description> 
<language>zh-cn</language> 
<copyright><![CDATA[沧海一粟]]></copyright>
<item>
<link>http://www.dzhope.com/post//</link>
<title><![CDATA[百度搜索引擎分词的秘密]]></title> 
<author>jed &lt;jed521@163.com&gt;</author>
<category><![CDATA[搜索优化]]></category>
<pubDate>Thu, 12 Oct 2006 00:33:29 +0000</pubDate> 
<guid>http://www.dzhope.com/post//</guid> 
<description>
<![CDATA[ 
	分词技术是搜索引擎里比较重要的一项技术，分词的准确与否，将会成为一个搜索引擎搜索结果是否准确的一个重要因素。 <br/><br/>如：以"始终贯穿着一条线"为例 <br/><br/>在百度中分为：始终 贯穿 着一 条线 一条线 <br/><br/>这里比较难理解百度的意图,但百度可能是对冷门词偏向于最大切分法,即是把可能的词全取出来,然后再进行搜索 <br/><br/>在google中：始终 贯穿 一条线 <br/><br/>显然google是标准的句法分析 <br/><br/>从这方面看，可以认为百度有点洒流氓的味道，但在句子中含有较多热门词的时候，百度偏重于对热门词的检索，这往往会造成如果搜索一个热门词配一个冷门词的时候，百度里结果通常没有google的结果好，这可能是一个重要原因。 <br/><br/>Tags - <a href="http://www.dzhope.com/tags/seo%25E4%25BC%2598%25E5%258C%2596/" rel="tag">seo优化</a>
]]>
</description>
</item><item>
<link>http://www.dzhope.com/post//#blogcomment</link>
<title><![CDATA[[评论] 百度搜索引擎分词的秘密]]></title> 
<author> &lt;user@domain.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate> 
<guid>http://www.dzhope.com/post//#blogcomment</guid> 
<description>
<![CDATA[ 
	
]]>
</description>
</item>
</channel>
</rss>