关联规则如何并行实现呢?一个很直观的想法是要么分数据要么分计算。本文要说的是分数据,想法来自mahout的fp-tree并行实现。其中分数据的博客已在前篇mahout关联规则FPGrowthDriver源码分析之如何分数据中说明,如何建树可以在网上查找(这个相对来说比较简单)或者直接看此片论文:《MiningFrequentPatternswithoutCandidateGeneration》,这篇博客要说的是如何挖掘已经建好的FP-tree,也是参考《M
系统 2019-08-29 22:05:15 2322
现在是晚上9点45,距离下课还有五分钟的时间,觉得自己看不了什么东西了,也做不下什么题了,就下这样一篇文章吧。说是写在前面,其实在这篇文章的前面已经有几篇博文了。至于为什么要开通这个Blog,原因很简单,只是想和网上的大牛们多多交流,吸取他们的经验和知识,来充实自己,同时把自己的成果share到网上,供大家指出不足和错误。我有许多同学的blog已经建了很久,效果很不错。其实早在去年末我就有了这个想法。当时选择的是新浪blog。但是经过我的实际应用发现,新浪
系统 2019-08-12 09:26:48 2322
最近遇到一个奇怪的Oracle问题:Oracle数据库里面有一个表,在查询表的varchar2类型的column时总是查找不到正常的结果,查询其他类型的column可以返回正常结果。简化的例子如下ID列的类型为numberNAME列的类型为varchar2(10)里面的数据如下:(1,'94'),(2,'94'),(3,'testname')select*fromTestTablewhereid=1能返回正常结果select*fromTestTablewh
系统 2019-08-12 01:55:43 2322
In-MemoryDatabasesIn-MemoryDatabasesAnSQLitedatabaseisnormallystoredinasingleordinarydiskfile.However,incertaincircumstances,thedatabasemightbestoredinmemory.ThemostcommonwaytoforceanSQLitedatabasetoexistpurelyinmemoryistoopenthed
系统 2019-08-12 01:54:40 2322
Java开发环境的配置首先我们要下载JDK。到Oracle官网上去下载即可,目前最新版是JavaSE8u25。开始我很混乱,JavaSE和JDK是什么关系呢?最后查了一下JavaSE=JDK+JRE。JDK就是Java开发工具包,JRE就是Java运行环境,我们做开发,需要本地运行调试,直接安装JavaSE就好了。JavaSE是Java开发的标准版本,JavaEE和JavaME都是基于它的。安装好JDK后,我们需要配置本地开发环境。在我们计算机的属性中高级
系统 2019-08-12 01:33:41 2322
http://www.eclipse-workbench.com/jsp/http://www.objectlearn.com/index.jsphttp://www.crionics.com/products/opensource/eclipse/eclipse.jsphttp://eclipse-plugins.2y.net/eclipse/index.jsp----------goodhttp://www.cnblogs.com/AFH/admin/
系统 2019-08-12 01:33:32 2322
当多个WebService的时候,我们要管理它的Session。这个时候我们得依靠ServiceGroupContext保存session信息;然后在发布WebService的时候,services.xml文件的的service表情的scope就不再说request或是transportsession了,而是application;最后同样要开启对session的管理,即options.setManageSession(true);1、首先多个WebSer
系统 2019-08-12 01:32:29 2322
劳工的天空(博客空间搬家了)_百度空间迁移记录背景:原来在ubuntu9.04上开发的系统,要在centos5上面进行部署,环境变化很大,代码拷贝过去无法运行1、将系统升级yumupdate2、安装python2.6centos5上面默认安装的是python2.4,需要并行安装一个python2.6yuminstallgcc*automake*make*lib*python*perl*wgetyuminstallopensslopenssl-develsq
系统 2019-08-12 01:31:48 2322
最长公共子序列python实现1、dp基本思路:公共子序列最优子结构:将问题分解表成更简单的子问题,这个子问题可以分解成更多的子问题使用动态规划算法求解,这个过程需要在一个表中储存同一级别的子问题的解,因此这个解可以被更高级的子问题使用。2、问题的解定义两个序列X、Y,二维数组f[i][j]表示X的i位和Y的j位之前的最长公共子序列长度,则有f[1][1]=same(1,1)f[i][j]=max(f[i-1][j-1]+same(i,j),f[i-1][
系统 2019-09-27 17:56:18 2321
前言如果在程序中我们需要重复的执行某条或某些指令,例如用程序控制机器人踢足球,如果机器人持球而且还没有进入射门范围,那么我们就要一直发出让机器人向球门方向奔跑的指令。当然你可能已经注意到了,刚才的描述中其实不仅仅有需要重复的动作,还有我们上一个章节讲到的分支结构。再举一个简单的例子,比如在我们的程序中要实现每隔1秒中在屏幕上打印一个"hello,world"这样的字符串并持续一个小时,我们肯定不能够将print('hello,world')这句代码写上36
系统 2019-09-27 17:54:54 2321