一个入门的搜索引擎
工具/原料
eclipse
方法/步骤
1
下载Lucene,本文中使用的是:2.9.4,下载后解压,Lucene所需要的基本jar文件如下列表:
2
由于Lucene中的中文分词实现不了我们所需要的功能,所以,需要下载第三方包,最新版本为:paoding-analysis-2.0.4-beta.zip 下载解压后,Lucene使用'疱丁'所需要的jar文件如下列表:
3
打开Eclipse并创建一个Java Project(项目名称和项目所在的路径不能包含空格),本例中Project Name:Paoding 1_1:在Paoding Project 创建一个Folder--lib(用于存放所有的jar),把前面所说的jar文件拷贝到lib目录下,并把lib下所有的jar添加到项目ClassPath下. 1_2:拷贝{PAODING_HOME}/dic目录 至 Paoding项目/src下整个项目结构图如下:
4
创建TestFileIndex.java类,实现功能是:把d:\data\*.txt所有文件读入内存中,并写入索引目录(d:\luceneindex)下TestFileIndex.java
5
创建TestFileSearcher.java,实现在的功能是:读取索引中的内容:TestFileSearcerh.java
6
运行其中main方法即可