搜索到与相关的文章
编程技术

【Lucene3.0 初窥】索引文件格式(5):posting数

★.frq词语频率数据文件.prx词语位置数据文件1、frq保存了词语所在文档的文档列表(docID)和该词语出现在文档中的频率信息。FreqFile(.frq)-->TermCountfrq文件包含TermCount个项。每一项都代表一个词,按照tis中的term的顺序排列。它分成两个部分:一部分是倒排表本身,也即一串的文档号及词频;另一部分是跳跃表,为了更快的访问和定位倒排表中文档号及词频的位置。TermFreq

系统 2019-08-29 21:59:39 2253

编程技术

Unicode详解

最近一直在忙点私活,又好久没写blog了,再不写点的话二月份就又要以单篇文章结束了。前一阵子一直在研究Unicode,索性把研究结果介绍一下吧。可能大家都听说过Unicode、UCS-2、UTF-8等等词汇,但它们具体是什么意思,是什么原理,之间有什么关系,恐怕就很少有人明白了。下面就分别介绍一下它们。基本知识字节和字符的区别Bi

系统 2019-08-12 09:29:50 2253

编程技术

k-means clustering K平均算法

此算法的主要作用:屏幕上很多的点,把相邻的点聚到离他最近的点。k-meansalgorithm算法是一个聚类算法,把n个对象根据他们的属性分为k个分割,kclassCluster{public$points;public$avg

系统 2019-08-12 09:29:49 2253

编程技术

checkpoint原理和过程

理解这两个概念,对于理解Hadoop是如何管理备份,SecondaryNamenode、CheckpointNamenode和BackupNode如何工作的很重要。fsimage:文件是文件系统元数据的一个永久性检查点,包含文件系统中的所有目录和文件idnode的序列化信息。edits:文件系统的写操作首先把它记录在edit中将文件系统个元数据操作分开操作,是为了提升内存的处理效率。如果不分开处理,即所有的写操作均记录在一个文件中,比如,fsimage中,

系统 2019-08-12 09:29:27 2253

各行各业

Grizzly NIO框架 理论篇 【2】

TransportsandConnections这两个东西,是灰熊框架的核心结构~Transports工具包含有TCP或UDP的协议,合并各种组件资源(Thread-Pool线程池、MemoryManager内存管理器等等。从结构来说,没什么东西,主要还是使用上1、使用Future模式建立ConnectionFutureclientConnectionFuture=tcpNioTransport.connect("grizzly.j

系统 2019-08-12 09:27:25 2253

各行各业

selenium从入门到应用 - 8,selenium+testNG实

本系列所有代码https://github.com/zhangting85/simpleWebtest本文将介绍一个Java+TestNG+Maven+Selenium的web自动化测试脚本环境下selenium和testNG的多线程并发测试的实现,并提供全部代码。这里我的多线程的执行测试用例,目的首先是为了提高测试执行速度,然后是为做分布式测试提供技术基础。testNG自带了多线程机制,那么为什么要我们还要自己写一些代码呢?因为seleniumwebdr

系统 2019-08-12 09:27:21 2253

各行各业

Elasticsearch 分片交互过程分析

1、Elasticseach如何将数据存储到分片中问题:当我们要在ES中存储数据的时候,数据应该存储在主分片和复制分片中的哪一个中去;当我们在ES中检索数据的时候,又是怎么判断要查询的数据是属于哪一个分片。数据存储到分片的过程是一定规则的,并不是随机发生的。规则:shard=hash(routing)%number_of_primary_shardsRouting值可以是一个任意的字符串,默认情况下,它的值为存数数据对应文档_id值,也可以是用户自定义的值

系统 2019-08-12 09:26:57 2253

数据库相关

1056. Computer Net

http://acm.timus.ru/problem.aspx?space=1&num=1056求树的圆心两遍bfs找到直径然后圆心有一个或两个代码:#include#include#include#include#include#include#include#include#include#include

系统 2019-08-12 01:53:26 2253

数据库相关

不用存储过程,直接用代码来实现数据分页

我介绍了原创企业级控件库之大数据据量分页控件,这个控件主要是通过存储过程进行数据分页,得到了大家的支持,也给出了许多宝贵的建议,在这儿先感谢各位。同时也让我更有信心进行以后的文章(企业级控件库系列)。分页对于每个项目来说都有它存在的意义,想起在以前刚刚刚软件开发时,由于刚刚毕业,理论知识雄厚,但实际工作经验欠缺,记得几年前做开发时,数据量很大,要用分页,一开始真不知道如何是好,方法到知道,但速度与稳定性却没有经验。在这儿,我只是起到一个抛砖引玉的作用,以便

系统 2019-08-12 01:52:44 2253

数据库相关

1101-Trees on the Level

描述Treesarefundamentalinmanybranchesofcomputerscience.Currentstate-of-theartparallelcomputerssuchasThinkingMachines'CM-5arebasedonfattrees.Quad-andoctal-treesarefundamentaltomanyalgorithmsincomputergraphics.Thisprobleminvolvesbuild

系统 2019-08-12 01:52:28 2253