RSS 2.0 Feed
2003-12 Entries
摘要: Lucene 是一个基于 Java 的全文索引工具包,Lucene的贡献者 Doug Cutting 是一位资深全文索引/检索专家,曾经是 V-Twin 搜索引擎(Apple 的 Copland 操作系统的成就之一)的主要开发者,后在 Excite 担任高级系统架构设计师,目前从事于一些 Internet 底层架构的研究。他贡献出的 Lucene 的目标是为各种中小型应用程序加入全文检索功能。 Lucene 的发展历程:早先发布在作者自己的 www.lucene.com,后来发布在 SourceForge,2001年年底成为 APACHE 基金会 Jakarta 的一个子项目。 已经有很多Java项目都使用了Lucene作为其后台的全文索引引擎,比较著名的有: Jive:WEB论坛系统; Eyebrows:邮件列表 HTML 归档/浏览/查询系统,本文的主要参考文档“TheLucene search engine: Powerful, flexible, and free”作者就是 EyeBrows 系统的主要开发者之一,而 EyeBrows 已经成为目前 APACHE 项目的主要邮件列表归档系统; Cocoon:基于 XML 的 Web 发布框架,全文检索部分使用了Lucene; Eclipse:基于 Java 的开放开发平台,帮助部分的全文索引使用了 Lucene。 以上文字源于车东的介绍,原文在:http://www.chedong.com/tech/lucene.html(车东声明该文章可以自由转载,但必须注明作者、出处以及他的声明) Lucene 本身不支持中文的索引,但它良好的架构设计,使得只需根据语言词法分析接口,增加一个中文解析器即可实现中文的索引。这一工作是由车东完成的:WebLucene 中提供了 CJKTokenizer,可以分析东亚文字。 NLucene 是将 Lucene 从 Java 移植到 .NET 的一个 SourceForge 项目,它从 Lucene 1.2 版本转化而来。 因为 NLucene 项目已经有接近两年时间没有新版本推出了,但 Lucene 却一直在发展,终于有人“等不下去了”,于是又有了 Lucene .NET,它是从 Lucene 1.3 版本移植来的。 但由于 CJKTokenizer 不是 Lucene 本身自带的,所以无论是 NLucene,还是 Lucene .NET 都没有实现中文的词法分析器,也就是说它们现在还不支持中文的全文索引。 但有了 NLucene、Lucene .NET 以及车东 Java CJKTokenizer 所作的工作,相信支持中文的 Lucene .NET 很快就会出现。...[阅读全文]

posted @ | Feedback (20) |

摘要:还有点小地方没有翻译,先放上来给大家测试,有什么BUG的话,及时和我联系(通过Email或者blog均可) → http://www2.zzu.edu.cn/pb/w/ndoc/...[阅读全文]

posted @ | Feedback (41) |

摘要:南方日报: 广东电子政务拒绝微软 百亿大单落入Linux 近日,关于中日韩三国联盟开发Linux软件、中国政府计划注资支持Linux,以及IBM、Sun等国际IT巨头掀起Linux桌面风暴的消息不断见诸报端。已在金融、电信、电力等行业得到大规模应用的Linux,在近年来飞速发展的电子政务市场应用状况又如何呢?记者昨日走访了广东省信息产业厅,该厅科技与政策法规处副处长赵愚表示,根据信产部的要求,未来广东省的电子政务建设也将采用基于Linux和J2EE架构的跨平台方案。这就意味着今后几年广东规模达数百亿元的电子政务市场将对微软说“不”。 广东电子政务确定用Linux   “我国在电子政务系统采用Linux平台的大原则早已确定。”赵愚表示。随着Linux操作系统和J2EE技术架构应用的日益成熟,中国政府选择了“跨平台”、“国产化”、“产业化”作为中国软件产业发展的基本策略加以明确。今年10月28日,“Linux&J2EE电子政务产品方案研讨会暨WPS2003政府采购换装工作会议”在广州举行,会议吸引了IBM、Oracle、金山、金蝶、同望科技、中科红旗等众多国内外知名厂商,而会议的牵头者则是广东省发展计划委员会、广东省信息产业厅两个政府部门。   此次会议上,广东省计委、信息产业厅联手推荐了三套基于Linux&J2EE技术的电子政务产品方案,方案在同望iTPO业务基础平台上,整合了中科红旗、RedHat的服务器Linux操作系统、Oracle数据库、IBMDB2数据库和中间件WebSphere、服务器X440,以及金蝶中间件Apusic和办公套件金山WPS2003及永中Office。而在桌面系统占据垄断地位的微软操作系统以及Office软件,则并不在此次政府的推荐之列。   国家工程院院士倪光南认为,电子政务等关系到国计民生的信息系统,有必要采用基于Linux的自主操作系统。开放源代码的Linux虽然不属于“自主知识产权”软件,但可以进行修改、发展,并可以由我国公司自主发布版本,同样能满足信息安全的自主和可控原则。 政府倡导公平开放   “政府出面做推介,并不是因为这些厂商的产品好到值得政府推荐,而是要在电子政务建设中倡导一种公平竞争和开放的消费潮流。”赵愚表示。他进一步解释说,“各级政府在进行电子政务建设时,不仅最初要考虑上什么方案,也要有长远规划,考虑日后的撤换与升级成本,尽量选择有公平竞争环境的方案,避免在一个厂商的树上吊死。”   其实,政府的这种思路恰恰拒绝了以封闭著称的微软。赵愚强调,“从硬件设备、操作系统、数据库到办公软件,这中间的任何一个厂商及产品都可以随时找到替代。但如果用微软的产品,无论想换其他厂商的硬件或软件,都会出现无法很好兼容的问题,除非不计成本彻底换掉。” from http://tech.sina.com.cn/it/2003-12-17/1342269606.shtml 只学 MS .NET 是不是风险太大了呢? ...[阅读全文]

posted @ | Feedback (19) |

摘要:做 ASP 项目时可以使用这个,see http://www.ewebsoft.com/product/ewebeditor/?action=demo...[阅读全文]

posted @ | Feedback (6) |

摘要:今天坐了一天,把以前的东西整理了一通,简单“装饰”一下,放到网上给大家看: Cross-Browser Rich Text Editor      一个兼容多种浏览器(IE5.5+, Mozilla1.3+)的编辑器 dotnetBB 论坛上使用的编辑器      使用的是 DIV 而非 IFRAME 动网 HTML 编辑器      很老的一个,好像是动网新闻上的? 一个叫 ManyMonkeys 的编辑器      我最早见到的支持实时显示 B,I,U 等按钮状态的编辑器 我比着上面那个自己做的一个编辑器      比较粗糙,但也够用 看来蝈蝈俊是比较偏爱让 B,I,U 等按钮状态实时显示的,我早上就看到他的想法,现在已经看到他已经把 0.6 版拿出来了。但就我这里的效果看,并不见得好,主要是: 总是觉得晃眼,特别是鼠标划过工具条的时候; 当我快速的在文本框里敲字母时,能够感到明显的延迟;  在文本框中敲字母时,能够看到 IE 状态栏不停的晃着“正在下载图片 http://...../.../.../undefined...”的字幕,不爽; 我打开“任务管理器”,查看 CPU 占用率:只要我在文本框里敲字母,占用率就维持在 80% 左右(在默认的 FreeTextBox 1.6.3 中 CPU 占用率一般低于 10%;我的机器不太好,800MHz,但我想网吧里的机器比我的也好不了多少吧?)。 其实一句话,“晃眼”!和上面我列出的第四个编辑器一样的毛病。其实当时我正是看到 ManyMonkeys 的那个可以实时显示状态,所以比着它做,但后来发现“延时”和“晃眼”的问题很烦人,最后终于放弃实时显示。蝈蝈俊,看看能不能让用户自己选择是否开启“实时状态显示”的功能?(并不是每个用户都需要这个功能的) ——查了一下访问记录,很多朋友是搜索“在线编辑器”进来的,所以添一句:ASP.NET 下比较好的在线编辑器是 FreeTextBox,大家可以看看它的中文版本。...[阅读全文]

posted @ | Feedback (45) |

摘要:今天弄了一天,总算把 CHM 的部分弄得差不多了,还有点小问题,其它几种还没有作。...[阅读全文]

posted @ | Feedback (3) |