共 12 篇文章 |
|
阅54 转2 评0 公众公开 10-09-03 16:35 |
Lucene 及 Lucene.net 国内外的一些学习资源汇总 - eaglet - 博...目前互联网上关于Lucene 及 Lucene.net 的文章很多,看了一些,感觉绝大部分还是偏向于应用,真正深入探讨其核心算法的文章不是太多,最近打算深入研究一下Lucene.net,把一些关键技术点的核心算法搞清楚。lucene 官方网站, Luncene.net 官方网站(英文) 这两个网站大家应该都... 阅21 转自thy 公众公开 10-08-24 16:56 |
当前几个主要的Lucene中文分词器的比较 基本介绍:paoding :支持不限制个数的用户自定义词库,纯文本格式,一行一词,使用后台线程检测词库的更新,自动编译更新过的词库到二进制版本,并加载imdict :暂时不支持用户自定义词库。或者自己再包装一下,将 paoding 的词库更新检测做一个单独的模块实现,然后就可以在所有基于词库的分词算法之间... 阅876 转2 评0 公众公开 10-08-19 16:39 |
lucene3.0创建索引及多目录搜索详解最近项目中用到了Lucene3.0,如下:创建索引:// 压缩存储(True则为复合索引格式) indexWriter.setUseCompoundFile(true);long startTime = new Date().getTime();String temp = "";// 增加索引字段//// 在Field中有三个内部类:Field.Index,Field.Store,Field.termVector,而构造函数也用到了它... 阅5276 转91 评0 公众公开 10-08-19 10:18 |
Lucene 3.0的简单解析及变化Lucene 3.0的简单解析及变化。3、index Index包含了索引的读写类,例如对索引文件的segment进行写、合并、优化的IndexWriter类和对索引进行读取和删除操作的 IndexReader类,这里要注意的是不要被IndexReader这个名字误导,以为它是索引文件的读取类,实际上删除索引也是由它完成, IndexWriter只关心如何将索... 阅3187 转12 评0 公众公开 10-08-18 14:54 |
doc3.add(new Field("subject", "asp是一种网站开发语言", Field.Store.YES, Field.Index.ANALYZED, TermVector.WITH_POSITIONS_OFFSETS)); writer.addDocument(doc1); writer.addDocument(doc2); writer.addDocument(doc3); writer.op... 阅187 转4 评0 公众公开 10-08-18 11:02 |
lucene3.0 中BooleanQuery 的使用 | 亲亲宝宝lucene3.0中BooleanQuery 实现与或的复合搜索 .BooleanClause用于表示布尔查询子句关系的类,包括:BooleanClause.Occur.MUST,BooleanClause.Occur.MUST_NOT,BooleanClause.Occur.SHOULD。QueryParser parser = new QueryParser(Version.query = parser.parse(str);BooleanQuery q = new BooleanQ... 阅228 转2 评0 公众公开 10-08-18 10:28 |
阅153 转1 评0 公众公开 10-08-18 10:28 |
lucene3.0中两个索引文件的联合查询 | 亲亲宝宝由于lucene生成索引文件比较耗时,索引我们可以把经常变动的和不变化的防到两个索引文件中,查询时使用联合查询,可以在两个索引中同时查找.IndexSearcher[] searchers = new IndexSearcher[2];searchers[0] = new IndexSearcher(m_indexpath);MultiSearcher multiSearcher = new MultiSearcher(sear... 阅630 转4 评0 公众公开 10-08-18 09:59 |
lucene3.0范围查找TermRangeQuery | 亲亲宝宝在lucene3.0中,范围查询也有很大的变化,RangeQuery已经不推荐使用,使用TermRangeQuery和NumericRangeQuery两个替代。TermRangeQuery:主要用于文本范围查找;IndexReader reader = IndexReader.TermRangeQuery query = new TermRangeQuery(field, "2009年01月01日","2009年0... 阅380 转1 评0 公众公开 10-08-18 09:51 |