搜索到与相关的文章
编程技术

Lucene.net中文分词探究

一、中文分词方式:中文分词几种常用的方式:A.单字分词单字分词,顾名思义,就是按照中文一个字一个字地进行分词。如:我们是中国人,效果:我\们\是\中\国\人。B.二分法二分法,就是按两个字进行切分。如:我们是中国人,效果:我们\们是\是中\中国\国人。C.词库分词词库分词,就是按某种算法构造词然后去匹配已建好的词库集合,如果匹配到就切分出来成为词语。通常词库分词被认为是最理想的中文分词算法如:我们是中国人,通成效果为:我们\是\中国\中国人。二、Lucen

系统 2019-08-29 23:46:24 1970

编程技术

ACE日志重定向(一)

前面提到的日志功能,只是简单的将日志打印出来,拥有了重定向功能后,这样的日志将会更强大。今天暂时将相关重定向的代码贴上来。再次申请,vs2005下编译通过。下次再进行改进,并更上所有测试程序。//LogManager.h://#include"ace/log_msg.h"#include"ace/Object_Manager.h"#include"aceSingleton.h"#includeusingstd::ofstream;#pra

系统 2019-08-29 23:27:56 1970

编程技术

浮动的X-menu