Lucene学习一
  vvb6bOG0D5hl 2023年11月19日 35 0


最近要用到全文检索技术。
这个Lucene是个在java界有着很高声誉的全文检索包。
通过学习,自己对它算是有个初步了解。所以写下心得与经验跟朋友们分享。
对于整个网站的结构我说下我的看法
数据库+前端技术+后台处理技术。
上面的这些我就不说了。用来用去就是那几个,你觉得那个用的顺手就行了。

搜索引擎技术呢,我觉得要点是:
1。把我们分散的数据资源整合起来-----对应于Lucene的Index也就是索引的意思。
我们把数据库的数据,按照自己的方式进行索引,关于索引的技术可以上网查看。这些索引的数据结构是可以自己定义的,这样方便查询。
2。 搜索技术,因为我们的资源太分散了,就拿数据里面的资源来说吧,每个表都不同,里面的字段都不同,如果单纯采用数据库来做的话,你可能要写很多个api进 行搜索。并对搜索结果进行出里,这样我们就要自己做很多事情。这么麻烦的话,我们何不把这些数据库里面的数据进行索呢,把我们需要的数据,归类,整理,然 后保存到索引中,虽然这样会增加磁盘的容量,但我觉得这应该就不是问题。
对于搜索技术,我们这里又要涉及到关于分词的技术,因为我们中文不同洋文,对分词技术的要求比较高。在这里,我也只是略微看了下Lucene的理论,具体实现,我也很模糊。如果分词分的好,对于搜索精度是有很大帮助的。

3。说实话索引就是一个数据库。他可以更新,删除,修改等。
先记录下这么多,以后在项目中实践的时候,继续说说我的理解
理解可能偏差比较大。大家不要被我误导啊。

不错的关于lucene英文书 点此下载

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月19日 0

暂无评论

推荐阅读
vvb6bOG0D5hl