1、mmseg4j用Chih-HaoTsai的MMSeg算法(http://technology.chtsai.org/mmseg/)实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。2、MMSeg算法有两种分词方法:Simple和Complex,都是基于正向最大匹配。Complex加了四个规则过虑。官方说:词语的正确识别率达到了98.41%。mmseg4j已经实现了这两
系统 2019-08-12 01:33:32 2586
epoll-I/Oeventnotificationfacility在linux的网络编程中,非常长的时间都在使用select来做事件触发。在linux新的内核中,有了一种替换它的机制,就是epoll。相比于select,epoll最大的优点在于它不会随着监听fd数目的增长而减少效率。由于在内核中的select实现中,它是採用轮询来处理的,轮询的fd数目越多,自然耗时越多。而且,在linux/posix_types.h头文件有这种声明:#define__F
系统 2019-08-12 01:33:29 2586
如图:意思是frame表示view在整体中的矩形区域坐标bounds表示是内部区域坐标圖片出自http://cs193p.stanford.edu/downloads/05-ViewsAnimation.pdfcocoa中frame和bounds的区别
系统 2019-08-12 01:32:54 2586
http://www.cnblogs.com/daiye/archive/2010/11/29/1890881.html""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""一般设定""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""设定默认解码setfenc=utf-8setfenc
系统 2019-08-12 01:32:38 2586
在学生时代,就羡慕实验室,老师在里面可以鼓捣各种有意思的东西。上大学的时候,终于有机会在实验室做大量实验了,因为我是物理系,并且,遇到了一位非常令我尊敬的老师――高老师,让我在他的实验室里面,把所有已经破旧损坏的实验仪器修理装配好,并且按照要求做好实验样例。经过一番折腾,才明白,要做好实验,不仅仅花费精力,还有不菲的设备成本呢。后来工作的时候,更感觉到实验设备费用之高昂,因此做实验的时候总要小心翼翼。再后来,终于发现原来计算机是一个最好的实验室。在这里做实
系统 2019-09-27 17:56:55 2585
python基础语法这个是我初学Python写的博客第一次写博客为了让自己记忆深刻一些。目的很单纯:我是为了学习人工智能才来学习python的python就是一种面向对象的一种语言(高级语言)python一切皆对象注释:python的注释分为两种单行注释#多行注释可以用多个"""注释内容"""号,还有'''注释内容"'行与缩进:这个是python与其他语言不一样的地方,python是通过缩进是否一致来判断是不是同一代码块(一般缩进都是占四个空格)例如:标识
系统 2019-09-27 17:54:11 2585
2019年7月15日17:24:49地点:武汉本人小白一枚记录一下学python的一点心得,主要记录python的基本数据类型。python基本数据类型包括:int(整型),float(浮点型),complex(复数),string(字符串),dict(字典),list(列表),tuple(元祖),set(集合),bool(布尔值)。记住查看数据类型时用type函数查看即可。int—整型a=0print(type(a))b=1**8#**表示乘方的意思,即
系统 2019-09-27 17:51:36 2585
前言想要提升一下shell的效率,因此按照这篇文章进行zsh的配置,并且在完成oh-my-zsh安装之后,原本的terminal也可以进行一些指令的补全了。但是在运行python的时候发现只能打开python2.7了,python3指令失效。解决方案我是使用的anaconda作为python环境管理,之前下载好anaconda之后是直接切换到python3环境的,简而言之本来命令python是直接启动python3的。因此将anaconda路径放入zsh配
系统 2019-09-27 17:50:42 2585
实现一个简单的发号器根据snowflake算法的原理实现一个简单的发号器,产生不重复、自增的id。1.snowflake算法的简单描述这里的snowflake算法是用二进制的,有64位。其中41位的时间戳表示:当前时间戳减去某个设定的起始时间,10位标识表示:不同的机器、数据库的标识ID等等,序列号为每秒或每毫秒内自增的id。我做的时候没有用位运算去实现,而是做了一个十进制的,16位的(当时项目要求是16位的)。但是实现发号器的基本策略是一样的,通过时间戳
系统 2019-09-27 17:50:10 2585
aaptdumpbadgingD:\chinaaccschool.apk#这个是文件的路径运行后可得到包名和Activity也有可能没有Activity用另一种方法需要先知道其中一个应用的Activity先打开连接上模拟器。然后在安卓模拟器上面打开需要获取的应用。然后用这个方法得到当前应用的b=driver.current_activityprint(b)desired_caps={'platformName':'Android',#平台名称'platfo
系统 2019-09-27 17:45:49 2585