您好,匿名用户
随意问技术百科期待您的加入

如何设计一种只需要针对文章的标题进行分词搜索,而不需要对文章内容全文搜索?

+1 投票
例如:文章标题是: 中国劣货盛行的原因
假设用户输入:“中国房价上涨的原因” 采用某种分词技术 分词后为:中国 房价 上涨 的 原因
如何在后台进行搜索匹配并将全部匹配的信息排在第一条,之后将近似的信息靠后排序?
后台的文章标题是否要在建立文章的同时也进行分词并存储?
期待你的解答。Thanks.
用户头像 提问 2012年 12月1日 @ Nasus 上等兵 (329 威望)
编辑 2012年 12月10日 @Saber
分享到:

1个回答

+1 投票

首先,在搜索引擎里的内容一定是分次以后的一个索引,也就是倒排索引(http://zh.wikipedia.org/wiki/%E5%80%9...)。
排序问题比较复杂,你这里说的是完全按照相关性来排,一般的搜索引擎都提供相关性排序算法,只是不同的引擎算法和实现不同。
但是在实际运用中,不同的业务需求,对相关性的要求也不一样,往往要加上许多其他的因子,所以排序算法一般自己去实现。
如果想了解相关性排序的算法,建议可以去看看 Lucene 的相关实现。

用户头像 回复 2012年 12月1日 @ Olaf 上等兵 (366 威望)
提一个问题:

相关问题

+1 投票
0 回复 89 阅读
+2 投票
1 回复 802 阅读
+5 投票
0 回复 111 阅读
+2 投票
1 回复 956 阅读
用户头像 提问 2013年 1月12日 @ Dante 上等兵 (290 威望)
0 投票
1 回复 38 阅读

欢迎来到随意问技术百科, 这是一个面向专业开发者的IT问答网站,提供途径助开发者查找IT技术方案,解决程序bug和网站运维难题等。
温馨提示:本网站禁止用户发布与IT技术无关的、粗浅的、毫无意义的或者违法国家法规的等不合理内容,谢谢支持。

欢迎访问随意问技术百科,为了给您提供更好的服务,请及时反馈您的意见。
...