破宝

我是一块破破烂烂的宝贝石头。
随笔 - 94, 评论 - 1281, 引用 - 52

导航

关于

自选精华版 RECOMMENDATIONS
留言板 GUESTBOOK

本人 blog 文章、图片及其他资源等,除另有声明外,均遵循以下原则向全球(当然包括朝鲜、古巴、利比亚等国)共享:

1。欢迎转载、复制、传播、引用,但转载、复制(包括但不仅限于作为参考资料复制到本地)、传播、引用同时必须在显著位置注明作者(破宝/percyboy)和文章原始 URL 地址等信息。但商业转载、复制、传播(尤指用于图书、光盘等媒体的部分或全部),须事先征得本人的许可。

2。文章以“现状”提供,不为由于使用本站资源而造成的任何损失而负责,仅提供力所能及的咨询和参考意见。

3。关于修改:允许您将本 blog 中的资源作为参考资料复制时的一定修改,但仍须保留作者和出处信息;其他情况下的修改(包括修改后再发布),须和本人确认许可。
 

标签

每月存档

最新留言

广告

 

Lucene 是一个基于 Java 的全文索引工具包,Lucene的贡献者 Doug Cutting 是一位资深全文索引/检索专家,曾经是 V-Twin 搜索引擎(Apple 的 Copland 操作系统的成就之一)的主要开发者,后在 Excite 担任高级系统架构设计师,目前从事于一些 Internet 底层架构的研究。他贡献出的 Lucene 的目标是为各种中小型应用程序加入全文检索功能。

Lucene 的发展历程:早先发布在作者自己的 www.lucene.com,后来发布在 SourceForge,2001年年底成为 APACHE 基金会 Jakarta 的一个子项目

已经有很多Java项目都使用了Lucene作为其后台的全文索引引擎,比较著名的有:

  • Jive:WEB论坛系统;
  • Eyebrows:邮件列表 HTML 归档/浏览/查询系统,本文的主要参考文档“TheLucene search engine: Powerful, flexible, and free”作者就是 EyeBrows 系统的主要开发者之一,而 EyeBrows 已经成为目前 APACHE 项目的主要邮件列表归档系统;
  • Cocoon:基于 XML 的 Web 发布框架,全文检索部分使用了Lucene;
  • Eclipse:基于 Java 的开放开发平台,帮助部分的全文索引使用了 Lucene。

以上文字源于车东的介绍,原文在:http://www.chedong.com/tech/lucene.html(车东声明该文章可以自由转载,但必须注明作者、出处以及他的声明)

Lucene 本身不支持中文的索引,但它良好的架构设计,使得只需根据语言词法分析接口,增加一个中文解析器即可实现中文的索引。这一工作是由车东完成的:WebLucene 中提供了 CJKTokenizer,可以分析东亚文字。

NLucene 是将 Lucene 从 Java 移植到 .NET 的一个 SourceForge 项目,它从 Lucene 1.2 版本转化而来。

因为 NLucene 项目已经有接近两年时间没有新版本推出了,但 Lucene 却一直在发展,终于有人“等不下去了”,于是又有了 Lucene .NET,它是从 Lucene 1.3 版本移植来的。

但由于 CJKTokenizer 不是 Lucene 本身自带的,所以无论是 NLucene,还是 Lucene .NET 都没有实现中文的词法分析器,也就是说它们现在还不支持中文的全文索引。

但有了 NLucene、Lucene .NET 以及车东 Java CJKTokenizer 所作的工作,相信支持中文的 Lucene .NET 很快就会出现。

打印 | 张贴于 2003-12-31 06:59:00 | Tag:暂无标签

留言反馈

#回复: NLucene 和 Lucene .NET 编辑
谢谢了 请给我一份fatten@126.com 找不到下载
2008-02-04 12:22:00 | [匿名用户:.net]
#回复: NLucene 和 Lucene .NET 编辑
给也发我一份 ,谢谢kerro0506@sina.com
2008-01-22 11:56:00 | [匿名用户:泛海云梦]
#回复: NLucene 和 Lucene .NET 编辑
可以给我发一份lucene.net 版吗?
mataobin@163.com 非常感谢!
2007-11-20 16:17:00 | [匿名用户:Toby]
#回复: NLucene 和 Lucene .NET 编辑
发我一份lucene.net 版,谢谢lokfunotes@gmail.com
2007-10-25 13:58:00 | [匿名用户:lokfu]
#回复: NLucene 和 Lucene .NET 编辑
发我一份lucene.net 版,谢谢expectxuehai@sohu.com
2007-09-03 13:47:00 | [匿名用户:expectpp]
#回复: NLucene 和 Lucene .NET 编辑
我也要 lucene.net 版的,如果有朋友有也给我发一份,jiangbo0115@163.com
2007-08-28 22:39:00 | [匿名用户:何求]
#回复: NLucene 和 Lucene .NET 编辑
在项目中用到,希望LZ发一份,谢谢
bensharp1985@163.com
2007-06-25 09:17:00 | [匿名用户:Ben]
#全文检索for .net 编辑
FreeTextBox就是一个,它在1.6.5版本之后发布的2.0开始了商业路线,2.0提供了DLL方式的免费版本,源代码版本则必须购买商业的许可licence;不过它留下了1.6...
2007-01-20 12:05:00 | [匿名用户:风过 无痕]
#re: NLucene 和 Lucene .NET 编辑
谢谢你的文章,我现在要研究这个项目,可以发源码给我吗?非常感谢
E-Mail:xiaoxiao5302000@163.com
2006-10-18 20:58:00 | [匿名用户:xiaoxiao]
#re: NLucene 和 Lucene .NET 编辑
我正在研究这个东西作项目要用。有源码也给我发一份感激
x_s_l2004@163.com
2006-07-12 18:43:00 | [匿名用户:vaiyanzi]
#NLucene 和 Lucene .NET 编辑
2005-10-27 14:33:00 | [匿名用户:虫子]
#re: NLucene 和 Lucene .NET 编辑
小弟想研究一下lucene.net,请问能发一分源码吗?
asuka_02@citiz.net
2004-12-30 09:45:00 | [匿名用户:lu]
#re: NLucene 和 Lucene .NET 编辑
各位大哥,如虎
取得body内容
2004-12-28 21:23:00 | [匿名用户:ll]
#.NET 的 Lucene 编辑
Ping Back来自:blog.csdn.net
2004-11-23 15:51:00 | [匿名用户:rijcm]
#re: NLucene 和 Lucene .NET 编辑
现在已经发布了语言包啊,不过好像没有.Net的例子。
2004-08-02 14:39:00 | [匿名用户:仪表]
#回复: NLucene 和 Lucene .NET 编辑
不错,全文检索是我关心的领域!
2004-07-16 12:13:00 | [匿名用户:旅行家]
#回复: NLucene 和 Lucene .NET 编辑
不错,

有空看看他的分词算法。
2003-12-31 09:00:00 | [匿名用户:ghj1976]
对不起,目前本随笔不允许发表新评论.

Powered by: Joycode.MVC引擎 0.5.1.8