搜索到与相关的文章
各行各业

基于统计的中文分词

分词方法目前的分词方法归纳起来有3类:第一类是基于语法和规则的分词法。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来进行词性标注,以解决分词歧义现象。因为现有的语法知识、句法规则十分笼统、复杂,基于语法和规则的分词法所能达到的精确度远远还不能令人满意,目前这种分词系统还处在试验阶段。第二类是机械式分词法(即基于词典)。机械分词的原理是将文档中的字符串与词典中的词条进行逐一匹配,如果词典中找到某个字符串,则匹配成功,可以切分,否则不予

系统 2019-08-12 09:27:05 2112

各行各业

Nginx+keepalived双机热备

[plain]viewplaincopyNginxMaster:192.168.128.134NginxBackup:192.168.128.138VIP:192.168.128.177Nginx安装见nginx安装配置文档Master与Backup的Nginx配置一致.在MASTER跟BACKUP上安装Keepalived:[plain]viewplaincopy#tarzxvfkeepalived-1.1.15.tar.gz-C../software#

系统 2019-08-12 09:26:59 2112

各行各业

Memcache存储大量数据的问题

Memcache存储大数据的问题huangguisuMemcached存储单个item最大数据是在1MB内,假设数据超过1M,存取set和get是都是返回false,并且引起性能的问题。我们之前对排行榜的数据进行缓存。因为排行榜在我们全部sqlselect查询里面占了30%,并且我们排行榜每小时更新一次,所以必须对数据做缓存。为了清除缓存方便,把全部的用户的数据放在同一key中,因为memcached:set的时候没有压缩数据。在測试服測试的时候,没发现问

系统 2019-08-12 09:26:46 2112

数据库相关

rand()函数的最大值问题

今天在做dram的模拟时候,需要用rand()函数模拟dram的cell的retentiontime,所以查看了一个rand()函数,该函数能产生0到RAND_MAX之间的数。不同平台下RAND_MAX值不同,我在32bit的windowsVC6.0下测试,得出RAND_MAX的值为32767(即2^15-1)。我在64bit的ubuntu下,测试,得到RAND_MAX的值为2147483647(即2^31-1)。rand()函数的最大值问题

系统 2019-08-12 01:54:24 2112

数据库相关

rman 使用catalog备份的演示

介绍了如何使用catalog方式做RMAN备份,以及如何取消以catalog方式做备份。第一步:创建RMANCATALOG表空间及用户。[oracle@oel-01~]$sqlplus/assysdbaSQL>createtablespacecatalog1datafile'/u01/app/oracle/oradata/bys001/catalog1.dbf'size50m;Tablespacecreated.SQL>createuserrmanuser

系统 2019-08-12 01:54:18 2112

数据库相关

找工作笔试面试那些事儿(10)---SQL语句总结

SQL语句中常用关键词及其解释如下:1)SELECT将资料从数据库中的表格内选出,两个关键字:从(FROM)数据库中的表格内选出(SELECT)。语法为SELECT"栏位名"FROM"表格名"。2)DISTINCT在上述SELECT关键词后加上一个DISTINCT就可以去除选择出来的栏位中的重复,从而完成求得这个表格/栏位内有哪些不同的值的功能。语法为SELECTDISTINCT"栏位名"FROM"表格名"。3)WHERE这个关键词可以帮助我们选择性地抓资

系统 2019-08-12 01:54:18 2112

数据库相关

Add Binary

题目:Giventwobinarystrings,returntheirsum(alsoabinarystring).Forexample,a="11"b="1"Return"100".分析:可以根据二进制的加法原理解决此问题,要注意string与int之间的转换。代码如下:stringaddBinary(stringa,stringb){intn1=a.length();if(n1==0)returnb;intn2=b.length();if(n2==0

系统 2019-08-12 01:54:17 2112

数据库相关

hdu1159-Common Subsequence

CommonSubsequencedp之最长公共子序列//FileName:hdu1159.cpp//Author:rudolf//CreatedTime:2013年04月25日星期四12时12分33秒#include#include#include#include#include#include#include#include#include

系统 2019-08-12 01:53:39 2112

数据库相关

【vijos】1764 Dual Matrices(dp)

https://vijos.org/p/1764自从心态好了很多后,做题的确很轻松。这种题直接考虑我当前拿了一个,剩余空间最大能拿多少即可。显然我们枚举每一个点拿出一个矩形(这个点作为右下角),然后剩余空间我们只需要考虑i+1~n和j+1~m这一块空间即可(至于为什么多想想QAQ)所以我们维护i+1~n和j+1~m能取到的最大矩形即可。显然二维前缀和,然后再维护一个二维mx[i][j]=max{get(i,j),mx[i+1][j],mx[i][j+1]}

系统 2019-08-12 01:53:06 2112

数据库相关

类和类实例的内建函数

内建函数描述issubclass(sub,sup)如果类sub是类sup的子类,则返回True,反之,为False。isinstance(obj1,obj2)如果实例obj1是类obj2或者obj2子类的一个实例;或者如果obj1是obj2的类型,则返回True;反之,为False。hasattr(obj,attr)如果obj有属性attr(用字符串给出),返回True,反之,返回False。getattr(obj,attr[,default])获取obj

系统 2019-08-12 01:52:44 2112