搜索研发部官方博客»BlogArchive»相似度计算常用方法综述相似度计算常用方法综述(2012-7-0509:07:59)标签:主题相似度,向量空间模型,相似度计算分类:数据挖掘引言相似度计算用于衡量对象之间的相似程度,在数据挖掘、自然语言处理中是一个基础性计算。其中的关键技术主要是两个部分,对象的特征表示,特征集合之间的相似关系。在信息检索、网页判重、推荐系统等,都涉及到对象之间或者对象和对象集合的相似性的计算。而针对不同的应用场景,受限于数据规模、
系统 2019-08-12 01:32:55 3208
一、Digester简介JakartaCommonsDigester是Apache小组的Jakarta项目下的子项目,是目前比较流行的、开源的XML文件处理包。目前最新版本是2.0版本。许多应用都需要处理XML格式的数据,这时Digester是个很好的选择。Digeste提供事件驱动管理器处理XML文件。开发者可以使用熟悉简单的API,以SAX方式解析XML。提供开发友好的SAX事件接口,使开发者只需集中注意力解决处理过程就可以了。使用Digester,需
系统 2019-08-29 22:23:35 3207
1.用grid包,下面展示其用法。library(grid)dat<-data.frame(x=rep(seq(0,0.8,1/5),5),y=rep(seq(0,0.8,1/5),each=5),val=rnorm(25,20,5))#makingrelativevalues(%)tobeusedforcolor-gradiationinplotdat$rel<-100*dat$val/max(dat$val)#creatinggrey-tonesrel
系统 2019-08-12 09:30:30 3207
本文纯属个人见解,是对前面学习的总结,如有描述不正确的地方还请高手指正~一、配置YUM仓库修改原始的yum仓库配置:vim/etc/yum.repos.d/CentOS-Base.repo在[base]和[updates]节(section)分部的尾部入插一行:exclude=postgresql*用以取消从默许仓库安装和更新PostgresQL。二、下载和安装PGDGRPM件文注:本例子为在CentOS6.332-bit上安装PostgrSQL9.11、
系统 2019-08-12 01:54:26 3207
一、查看U盘是否挂载。root用户进行下列操作。(1)#fdisk–l显示所有磁盘,一般最后一行/dev/sdb1指的就是U盘。(2)#mount–l显示所有挂载的文件系统及其位置,如果/dev/sdb1已经挂载,则会列出挂载点位置(我的对应/media/….)。如果已经自动挂载,则只需将文件拷到/media/….即可。二、挂载U盘。(1)mkdirMountPoint新建目录。(2)#mount/dev/sdb1/MountPoint将U盘挂载到Moun
系统 2019-08-12 01:32:08 3207
OpenCASCADEColorScaleeryar@163.comAbstract.Thecolorscaleisaspecializedlabelobjectthatdisplaysacolormapandanaccompanyingnumericalscaleforcolormappedorcontourdataplots.AsthegeometrymodelingkernelofSALOME,OpenCASCADEprovidesthecolors
系统 2019-08-12 01:31:48 3207
1.SELECT子句中避免使用“*”当你想在SELECT子句中列出所有的COLUMN时,使用动态SQL列引用‘*’是一个方便的方法.不幸的是,这是一个非常低效的方法.实际上,ORACLE在解析的过程中,会将“*”依次转换成所有的列名,这个工作是通过查询数据字典完成的,这意味着将耗费更多的时间.2.使用DECODE函数来减少处理时间使用DECODE函数可以避免重复扫描相同记录或重复连接相同的表.例如:Sql代码SELECTCOUNT(*),SUM(SAL)F
系统 2019-08-29 23:05:59 3206
感觉挺经典的js文章,传个附件。“JavaScript中没有‘类’,类已化于无形,与对象融为一体。正是由于放下了‘类’这个概念,JavaScript的对象才有了其他编程语言所没有的活力。”这句看了很有感悟,也许这就是Javascript强大之所在吧。Javascript因此具有了动态增删对象功能的能力。functionmyfunc(){alert("hello");}myfunc();//这里调用myfunc,输出yeah而不是hellofunctionm
系统 2019-08-12 09:30:05 3206
javascript原型继承最近接触了一下html5,当然,接触过html5的人都知道,html5也不过是提供一些新的标签而已,至于整下实现的核心,还是在javascript这里。暑假还搞了ext4的webdesktop,更多的也是javascript的东西。对于javascript,以前就只会document.getElementById()和alert(),现在才开始慢慢深入了解。如果本文有什么不对的地方,请指出。关于javasript,它是基于对象的
系统 2019-08-12 09:29:40 3206
[转]宽字符的介绍2009-04-2810:51转自:http://dev.csdn.net/article/77757.shtm2.2宽字符和C宽字符不一定是Unicode。Unicode是宽字符集的一种。然而,因为本书的焦点是Windows而不是C执行的理论,所以书中把宽字符和Unicode作为同义语。2.2.1char数据类型(1)下面的语句定义并初始化了一个只包含一个字符的变量:charc='A';变量c需要1个字节来保存,并将用十六进位数0x41
系统 2019-08-12 01:32:29 3206