原著:MattPietrek翻译:VCKBASE译注:本文都翻译了一大半了,才发现网上已经有一篇董岩的译本(http://www.diybl.com/course/3_program/c++/cppsl/200866/122881.html),看完他的译文,感觉所有涉及关键技术的地方董岩翻译得非常到位,所以自己就没有再花时间往下译,本文后面的部分基本上都是采用了董岩的译文。此外,董岩在译文后面附带有一篇附录,专门解释“prolog和epilog”,后来我发
系统 2019-08-29 22:05:27 2114
上接《索引创建(2):DocumentWriter处理流程一》1.3.2第二车间——DocInverterPerFieldDocInverterPerField负责对DocFieldProcessorPerThread对象的Fieldable[]数组的内容建立倒排索引,也就是处理同名字的所有Field。但实际上这个类主要解决的是前期工作,比如分词,统计位置信息等。倒排索引结构的核心的工作由TermsHashPerField和FreqProxTermsWri
系统 2019-08-29 21:59:47 2114
算法分析之分治法学习总结(一)一)解决问题的类型:当我们要解决一个输入规模(n)很大的问题时,直接处理往往比较困难或者根本无法求解,我们希望把输入规模缩小,即分成很多份,分别解决了,并且这些小问题容易合起来从而解决整个问题。二)解题关键:1)如何分:我们往往先把输入分成两个与原来相同的子问题,如果规模还太大,我们对这些子问题再做上述处理,直到这些子问题容易解决为止.2)合并子问题:往往分治法的难点在于分完之后怎么合并.合并策略决定了算法的优劣,合并问题根据
系统 2019-08-12 09:30:06 2114
今天安装Atlas时遇到一个小问题,在安装VS.net模板时失败,提示“安装已停止,原因是ProjectType值的目录不存在。对于您所安装的VisualStudio,该项目类型无效。”,原因是目录“VisualWebDeveloper”不存在,解决办法很简单,确认目录“\DocumentsandSettings\\MyDocuments\VisualStudio2005\Templates\ProjectTemplates\VisualWeb
系统 2019-08-12 09:26:54 2114
创建爬虫目录:scrapystartprojectspiderName调试命令scrapyshell网站名调试命令可直接进行css和xpath的调试;成功执行命令之后可使用:response.xpath(xpath表达式)获取所需的内容。xpath说明:XPath是一门在XML文档中查找信息的语言表达式描述实例nodename选取nodename节点的所有子节点//div/从根节点选取/div//不考虑位置选择节点//div.选取当前节点./div…选取当
系统 2019-09-27 17:56:45 2113
最近开始研究Python的并行开发技术,包括多线程,多进程,协程等。逐步整理了网上的一些资料,今天整理了一下greenlet相关的资料。并发处理的技术背景并行化处理目前很受重视,因为在很多时候,并行计算能大大的提高系统吞吐量,尤其在现在多核多处理器的时代,所以像lisp这种古老的语言又被人们重新拿了起来,函数式编程也越来越流行。介绍一个python的并行处理的一个库:greenlet。python有一个非常有名的库叫做stackless,用来做并发处理,主
系统 2019-09-27 17:56:35 2113
trainData['survey_time']=pd.to_datetime(trainData['survey_time'],format='%Y/%m/%d%H:%M')trainData['survey_time']=trainData['survey_time'].dt.year格式化日期转换为dt然后直接取年python中时间日期格式化符号:%y两位数的年份表示(00-99)%Y四位数的年份表示(000-9999)%m月份(01-12)%d月内
系统 2019-09-27 17:55:28 2113
锁在使用用的过程中需要导入threading模块的Lock类使用锁:当多个线程几乎同时修改某一个共享数据的时候,需要进行同步控制线程同步能够保证多个线程安全访问竞争资源,最简单的同步机制是引入互斥锁。互斥锁为资源引入一个状态:锁定/非锁定。锁的语法创建锁、锁定锁、释放锁fromthreadingimportLock#创建锁mutex=Lock()#获取锁(上锁)mutex.acquire()#释放锁(解锁)mutex.release()在锁定锁的过程中ac
系统 2019-09-27 17:55:04 2113
认识错误编写的程序不能正常执行,或者执行的结果不是我们期望的,俗称BUG,是程序员在开发时非常常见的,初学者常见错误的原因包括:手误对已经学习过的知识理解还存在不足对语言还有需要学习和提升的内容在学习语言时,不仅要学会语言的语法,而且还要学会如何认识错误和解决错误的方法每一个程序员都是在不断地修改错误中成长的常见错误:1>手误2>将多条print写在一行每行代码负责完成一个动作3>缩进错误Python是一个格式非常严格的程序设计语言4>python2.x默
系统 2019-09-27 17:54:37 2113
Python面向对象编程——总结面向对象的优点一、从代码级别看面向对象1、在没有学习类这个概念时,数据与功能是分离的defexc1(host,port,db,charset):conn=connect(host,port,db,charset)conn.execute(sql)returnxxxdefexc2(host,port,db,charset,proc_name)conn=connect(host,port,db,charset)conn.call
系统 2019-09-27 17:53:53 2113