搜索到与相关的文章
各行各业

YARN

YARNHadoop2.0与HAdoop1.0的区别:Hadoop1.0主要由HDFS和MapReduce两个系统够长,但在Hadoop2.0中主要由HadoopCommon、HDFS、HadoopYARN和HadoopMapReduce2.0构成。Hadoop1.0更多是在于离线的数据处理,Hadoop2.0可以支持MapReduce计算框架之外,可以支持Spark、Strom等的实时数据处理框架。在hadoop2.0中,YARN负责集群的资源管理,管理

系统 2019-08-12 09:27:11 2138

各行各业

基于统计的中文分词

分词方法目前的分词方法归纳起来有3类:第一类是基于语法和规则的分词法。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来进行词性标注,以解决分词歧义现象。因为现有的语法知识、句法规则十分笼统、复杂,基于语法和规则的分词法所能达到的精确度远远还不能令人满意,目前这种分词系统还处在试验阶段。第二类是机械式分词法(即基于词典)。机械分词的原理是将文档中的字符串与词典中的词条进行逐一匹配,如果词典中找到某个字符串,则匹配成功,可以切分,否则不予

系统 2019-08-12 09:27:05 2138

各行各业

Nginx+keepalived双机热备

[plain]viewplaincopyNginxMaster:192.168.128.134NginxBackup:192.168.128.138VIP:192.168.128.177Nginx安装见nginx安装配置文档Master与Backup的Nginx配置一致.在MASTER跟BACKUP上安装Keepalived:[plain]viewplaincopy#tarzxvfkeepalived-1.1.15.tar.gz-C../software#

系统 2019-08-12 09:26:59 2138

各行各业

Github链接及git学习心得总结

https://github.com/luhan420Git是一个分布式管理工具,通过指纹字符串来时刻保持数据的完整性,关心的是文件数据整体的变化,并不保存变化前后的差异数据;Git在本地磁盘保存有关项目的历史更新,所有绝大多数操作只需要访问本地文件资源,并不需要Internet。当然可以使用GitHbub将代码托管,进行远程开发,方便团队比较分散的情况(这正体现Git分布式的优势);开发人员只需将项目clone到本地,进行相应的开发然后push上传到Gi

系统 2019-08-12 09:26:42 2138

数据库相关

OR导致笛卡尔积

近期监控数据库,发现以下语句跑得很慢,原来运行计划走了导致笛卡尔积,来看以下语句:SQL>explainplanfor2SELECTCOUNT(*)3FROM"GD_FS"."TZZ_SJ_DEV_DISC_79073""A2",4"GD_FS"."TZZ_SJ_DEVELOP_MONTH""A1"5WHERE"A1"."SERV_ID"="A2"."SERV_ID"6AND"A1"."STAT_DATE"="A2"."STAT_DATE"7AND"A2"

系统 2019-08-12 01:55:11 2138

数据库相关

rand()函数的最大值问题

今天在做dram的模拟时候,需要用rand()函数模拟dram的cell的retentiontime,所以查看了一个rand()函数,该函数能产生0到RAND_MAX之间的数。不同平台下RAND_MAX值不同,我在32bit的windowsVC6.0下测试,得出RAND_MAX的值为32767(即2^15-1)。我在64bit的ubuntu下,测试,得到RAND_MAX的值为2147483647(即2^31-1)。rand()函数的最大值问题

系统 2019-08-12 01:54:24 2138

数据库相关

rman 使用catalog备份的演示

介绍了如何使用catalog方式做RMAN备份,以及如何取消以catalog方式做备份。第一步:创建RMANCATALOG表空间及用户。[oracle@oel-01~]$sqlplus/assysdbaSQL>createtablespacecatalog1datafile'/u01/app/oracle/oradata/bys001/catalog1.dbf'size50m;Tablespacecreated.SQL>createuserrmanuser

系统 2019-08-12 01:54:18 2138

数据库相关

删除重复行

delete表whereidnotin(SELECTMAX(id)ASidFROM表GROUPBYrows)---删除重复行select*from表whereidin(SELECTMAX(id)ASidFROM表GROUPBYrows)--重复行只查询一条删除重复行

系统 2019-08-12 01:53:26 2138

数据库相关

SQL重复记录处理(查找,过滤,删除)

注:此处“重复”非完全重复,意为某字段数据重复HZT表结构IDintTitlenvarchar(50)AddDatedatetime数据IDTitleAddDate1我本有心12008-01-1710:27:24.8272我本有心12008-03-1710:27:21.7803我本有心22008-05-1710:27:30.4204我本有心22008-09-1710:27:30.4205我本有心32008-01-2010:27:30.4206我本有心320

系统 2019-08-12 01:53:15 2138

数据库相关

用户定义函数信息

有几种系统存储过程和目录视图可提供有关存储过程的信息。使用它们,您可以:查看函数的定义,也就是用于创建用户定义函数的Transact-SQL语句。如果您没有用于创建函数的Transact-SQL脚本文件,这会很有用。获得有关函数的信息(例如函数的架构、创建时间及其参数)。列出指定函数所使用的对象及使用指定函数的对象。此信息可用来识别那些受数据库中某个对象的更改或删除影响的函数。查看用户定义函数的定义sys.sql_modules(Transact-SQL)

系统 2019-08-12 01:34:03 2138