上接《索引创建(2):DocumentWriter处理流程三》1.4索引数据池存储细节倒排索引(token->postinglist)表的数据信息在内存中并不是直接存储在postingsHash中的,而是存放在三大数据缓冲池中——CharBlockPool,ByteBlockPool,IntBlockPool。这三个池均都由若干个固定长度的buffer数组构成。DocumentsWriter对它们进行管理和维护(包括分配新的块或者回收不用的块的操作),以达
系统 2019-08-29 21:59:45 1786
——对用例模型及其应用的一次有益的探讨前言:这是一次对用例模型的探讨。怎样建立用例模型,怎样编写用例说明,它与需求规格说明书有什么区别,它能替代需求规格说明书吗?也许在这里可以找到你要的答案。进入软件业稍微久一点儿的人恐怕都不会陌生,软件开发的最初阶段都是谈需求、写需求规格说明书。需求规格说明书是与客户最终确认到纸上的,非常正式的公文。软件开发应当做什么,做成什么样子,什么东西不做,项目范围有多宽,需求规格说明书都是白纸黑字写得清清楚楚,谁都无法抵赖。所以
系统 2019-08-29 21:59:01 1786
算法分析之分治法学习总结(一)一)解决问题的类型:当我们要解决一个输入规模(n)很大的问题时,直接处理往往比较困难或者根本无法求解,我们希望把输入规模缩小,即分成很多份,分别解决了,并且这些小问题容易合起来从而解决整个问题。二)解题关键:1)如何分:我们往往先把输入分成两个与原来相同的子问题,如果规模还太大,我们对这些子问题再做上述处理,直到这些子问题容易解决为止.2)合并子问题:往往分治法的难点在于分完之后怎么合并.合并策略决定了算法的优劣,合并问题根据
系统 2019-08-12 09:30:06 1786
"""python提取文本的tfidf特征"""importmathfromcollectionsimportCounter#1.语料库corpus=['thisisthefirstdocument','thisisthesecondseconddocument','andthethirdone','isthisthefirstdocument']#2.对语料进行分词word_list=[]foriinrange(len(corpus)):word_lis
系统 2019-09-27 17:57:10 1785
在python2中字符串分为unicode和str类型StrToUnicode使用decode(),解码UnicodeToStr使用encode(),编码返回数据给前端时需要先将unicode转换为str类型,事实上,python2中的str就是一串字节(byte),而网络通信时,传输的就是字节.如果前端需要接收json数据,需要使用json.dumps()将数据转换为json格式进行返回,当数据是嵌套类型的数据,内层的数据可能无法直接转换为str类型的数
系统 2019-09-27 17:57:03 1785
Python之读取用户指令和格式化打印一、读取用户指令当你的程序要接收用户输入的指令时,可以用input函数:name=input("请输入你的名字:")print("Hi"+name)程序中只要有input函数就会等待用户输入完并按回车键之后才会继续往下执行代码注:input()函数接收得到的值只是字符串,即使你输入的是数字或者其他数据类型的值,它也会把数字按照字符串处理,即接收得到值只会字符串。二、格式化打印假设现在需要打印出以下格式的内容,该怎么实现
系统 2019-09-27 17:56:58 1785
封装面向对象三大特性:继承封装多态隐藏对象的属性和实现细节,仅对外提供公共访问方法广义上的封装:把方法和变量都封装在类中狭义上的封装:在类的外部干脆不能调用了优点将变化隔离便于使用提高复用性提高安全性封装原则:将不需要对外提供的内容隐藏起来把属性都隐藏,提供公共方法对齐访问私有变量和私有方法在python中用双下划线开头的方式将属性隐藏起来(设置成私有的)代码实例#其实这仅仅这是一种变形操作#类中所有双下划线开头的名称如__x都会自动变形成:_类名__x的
系统 2019-09-27 17:56:45 1785
dict的很多方法跟list有类似的地方,下面一一道来,并且会跟list做一个对比嵌套嵌套在list中也存在,就是元素是list,在dict中,也有类似的样式:>>>a_list=[[1,2,3],[4,5],[6,7]]>>>a_list[1][1]5>>>a_dict={1:{"name":"qiwsir"},2:"python","email":"qiwsir@gmail.com"}>>>a_dict{1:{'name':'qiwsir'},2:'p
系统 2019-09-27 17:56:38 1785
pillowPillow是PIL的一个派生分支,但如今已经发展成为比PIL本身更具活力的图像处理库。pillow可以说已经取代了PIL,将其封装成python的库(pip即可安装),且支持python2和python3,目前最新版本是3.0.0。Pillow的Github主页:https://github.com/python-pillow/PillowPillow的文档(对应版本v3.0.0):https://pillow.readthedocs.org
系统 2019-09-27 17:56:31 1785
画矩形函数调用:cv2.rectangle(img,pt1,pt2,color,thickness,line_type,shift)img:图像.pt1:矩形的一个顶点。pt2:矩形对角线上的另一个顶点color:线条颜色(RGB)或亮度(灰度图像)(grayscaleimage)。thickness:组成矩形的线条的粗细程度。取负值时(如CV_FILLED)函数绘制填充了色彩的矩形。line_type:线条的类型。见cvLine的描述shift:坐标点的
系统 2019-09-27 17:56:28 1785