pengx的图书馆

他的首页他的馆藏他的动态馆友反馈关于他分享对话

pengx

文章		关注		粉丝		访问		贡献

关注

粉丝

访问

贡献

他的首页

他的馆藏

他的动态

馆友反馈

关于他

共 8 篇文章

显示摘要

每页显示

条

搜索引擎也开源

Lucene本身只支持文本文件及少量语种的索引，并且不具备爬虫功能，而这正是Lucene的魅力所在，通过Lucene提供的丰富接口，我们可以根据自身的需要在其上添加具体语言的分词器，针对具体文档的文本解析器等，而这些具体的功能实现都可以借助于一些已有的相关开源软件项目、甚至是商业软件来完成，这也保证了Lucene在索引及搜索方面的专注性。LIU...

阅758 转2 评0 公众公开 10-07-02 17:06

Lucene进阶:and 和or的条件查询

在用Lucene实现全站搜索的过程中,很可能会遇到这样的问题,只所有某种特定的信息资源,而不是全部.如:某综合性站点,有新闻,产品,论坛,Blog,视频等资源,而搜索的时候先选一个类型(下拉列表),再输入关键字进行搜索(当然,这种情况可以直接用sql来实现,我们这里是基于lucene的实现考虑).这种情况下,就要用到and和or的查询了

阅792 转4 评0 公众公开 09-02-16 16:32

lucene 全文检索简介

因此， lucene提供了一种简单文件索引格式，也就是所谓的复合索引格式。4，Lucene查询总结：Lucene 面向全文检索的优化在于首次索引检索后，并不把所有的记录（Document）具体内容读取出来，而起只将所有结果中匹配度最高的头100条结果（TopDocs）的ID放到结果集缓存中并返回，这里可以比较一下数据库检索：如果是一个10,000条的数据库检索结...

阅1387 转15 评0 公众公开 08-09-09 14:37

分词：词典正反向全切分/词典正反向最大匹配切分

IKAnalyzer基于lucene2.0版本API开发，实现了以词典分词为基础的正反向全切分以及正反向最大匹配切分两种算法，是Lucene Analyzer接口的实现，代码使用例子如下：正反向全切分算法：分词效果测试，命令行如下：java -classpath IKAnalyzer.jar;lucene-core-2.0.0.jar org.mira.lucene.analysis.IK_CAnalyzer 中华人民共和国香港特别行政区...

阅1301 转7 评1 公众公开 08-09-09 10:10

Lucene学习笔记

Lucene学习笔记收藏1．Lucene的工作流程：(1) 使用IndexWriter，在指定的目录建立索引的文件 (2) 将需要检索的数据转换位Document的Filed对象，然后将Document用IndexWriter添加倒索引的文件中 (3) 处理索引信息，关闭IndexWriter流 (4) 创建搜索的Query (5) 给IndexSearcher2．Lucene的字段类型Lucene有四种不同的字段类型：Keyword，U...

阅1067 转15 评0 公众公开 08-09-05 11:13

LUCENE Filed详解

} public Field(String name, String string, boolean store, boolean index, boolean token) { this(name, string, store, index, token, false);}//最低层的构造函数 public Field(String name, String string, boolean store, boolean index, boolean token, boolean storeTermVector)...

阅494 转3 评0 公众公开 08-09-05 10:29

lucene多种搜索方式详解例子

import org.apache.lucene.analysis.import org.apache.lucene.document.import org.apache.lucene.index.import org.apache.lucene.queryParser.import org.apache.lucene.search.import org.apache.lucene.search.highlight.searcher = new IndexSearcher(IndexReader.open("E:\\lucene\\test4\\index"));// query=MultiFieldQu...

阅5187 转27 评0 公众公开 08-09-05 10:08

学习Lucene的资料

Lucene是一个基于Java的全文索引工具包。

阅346 转3 评0 公众公开 08-09-04 12:08

他的文章
他的书籍

筛选

不限类型

网文

撰写

文档

不限 Word PPT Excel RTF PDF TXT

思维导图

相册

音乐

视频

显示摘要不显示摘要

每页10条每页30条每页50条

返回
顶部