搜索到与相关的文章
编程技术

挖掘FP-Tree

关联规则如何并行实现呢?一个很直观的想法是要么分数据要么分计算。本文要说的是分数据,想法来自mahout的fp-tree并行实现。其中分数据的博客已在前篇mahout关联规则FPGrowthDriver源码分析之如何分数据中说明,如何建树可以在网上查找(这个相对来说比较简单)或者直接看此片论文:《MiningFrequentPatternswithoutCandidateGeneration》,这篇博客要说的是如何挖掘已经建好的FP-tree,也是参考《M

系统 2019-08-29 22:05:15 2346

Java

将BIRT整合到自己的Java项目中(二)

关于编写viewer,关键在于使用ReportEngineAPI,这个在birt官方文档上有很详细的描述。这里将几个主要环节总结一下:启动ReportEngine这里需要注意启动ReportEngine的开销问题和图片链的协议的问题。使用IReportEngineFactory比每次new一个出来性能方面要好很多。使用HTMLEmitterConfig可以使得生成的HTML报表中的图片的src指向一个web资源而非file资源。publicIReportE

系统 2019-08-12 09:30:39 2346

编程技术

利用CORS实现跨域请求

跨域请求一直是网页编程中的一个难题,在过去,绝大多数人都倾向于使用JSONP来解决这一问题。不过现在,我们可以考虑一下W3C中一项新的特性——CORS(Cross-OriginResourceSharing)了。本文的所有代码均来自http://www.html5rocks.com/en/tutorials/cors/,如果您对其中的任何技术细节存在疑问,请以原文为准。客户端创建XmlHttpRequest对象对于CORS,Chrome、FireFox以及

系统 2019-08-12 09:30:32 2346

各行各业

博弈论 简介

1博弈论简介2博弈论基础知识34(一)巴什博奕(BashGame):56只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个.最后取光者得胜.78若(m+1)|n,则先手必败,否则先手必胜。910显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,后取者都能够一次拿走剩余的物品,后者取胜.因此我们发现了如何取胜的法则:如果n=(m+1)r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者

系统 2019-08-12 09:27:07 2346

各行各业

Spring Atomikos分布式事务

分布式事务必须使用的数据库支持并且提供XA连接驱动如mysql的5.0+版本驱动中就有com.mysql.jdbc.jdbc2.optional.MysqlXAConnection等这些对XA分布事务支持的连接,所以理所当然我们要使用XA事务就必须使用这种XA连接,mysql5.1是支持分布事务的,mysql驱动需要5.0+Atomikos分两个:一个是开源的TransactionEssentials,一个是商业的ExtremeTransactions。T

系统 2019-08-12 09:27:02 2346

各行各业

关于分布式开发的资料

我说的都是基于TCP消息传递的分布式。网络层:Netty,Mina.我自己用的Netty,公司用的Mina.(都是NIO,异步,当你有同步需求的时候很蛋疼,比如负载均衡)消息传输格式:googleprotocolbuffer(我用的就是这个,序列化和饭序列化速度很快,缺点:要定义格式文件,没有继承的概念!!用编译器生成java代码,所以不要想extends)集群管理,心跳,FailOver通知,leader选举:zookeeper(基本快成行业标准了。)负

系统 2019-08-12 09:26:41 2346

数据库相关

SQL高效率

1一个业务保证在同一事务中2SQL语句的SQL保留字大写3不要写SELECT*FROMxxx,请将需要的字段名称写出来4Insert语句一定要给出要插入值的字段列表,以保证更改了表结构增加了字段也不会影响现有系统的运行5两张以上的表请使用别名,别名使用1到3个字符表示6多表连接时,使用表的别名来引用列7不许出现带参数的sql语句拼接,所有的参数必须用参数化传进语句中8不等于统一使用<>,不使用!=9判空,统一使用ISNULL10存储过程中不允许进行COMM

系统 2019-08-12 01:52:20 2346

各行各业

分布式与集群的区别

简单说,分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数来提升效率。例如:如果一个任务由10个子任务组成,每个子任务单独执行需1小时,则在一台服务器上执行改任务需10小时。采用分布式方案,提供10台服务器,每台服务器只负责处理一个子任务,不考虑子任务间的依赖关系,执行完这个任务只需一个小时。(这种工作模式的一个典型代表就是Hadoop的Map/Reduce分布式计算模型)而采用集群方案,同样提供10台服务器,每台服务器

系统 2019-08-12 01:33:16 2346

数据库相关

操作型数据库的春天:MongoDB 1.5亿美元融资背

大部分融资都要耗时数月,但非关系式数据库MongoDB仅用3周时间就完成了1.5亿美元的融资。为什么这个进程会这么快,MongoDBCEOMaxSchireson在接受采访时说,这是因为投资者看到了200亿美元规模的“操作型数据库(operationaldatabases)”的重大机遇。Schireson说,作为数据库市场的一部分,操作型数据库市场的演进很慢(MongoDB占据了70%的市场份额)。所以,“改变的需求更甚。”几乎每一家公司都要用到操作型数据

系统 2019-08-12 01:32:21 2346