搜索到与相关的文章
编程技术

OPIC in Nutch

庄子曾说:“吾生也有涯,而知也无涯,以有涯随无涯,殆已”。当然,我们不能拿老祖宗这句话作为消极怠工的借口,不过在学习和工作的时候,的确需要要分辨事情的轻重缓急,否则一味蛮干,最终结果只能是--“殆已”。突然发现这句话对于网络爬虫也是很有启发意义的,对于浩瀚无边的互联网而言,网络爬虫涉及到页面确实只是冰山一角。因此,如何确定一个页面的重要性,从而在抓取过程中进行合理的调度,以最小的代价(硬件、带宽)获取到最大的利益(数量最多的重要的网页)是设计网络爬虫过程中

系统 2019-08-29 22:43:59 2263

编程技术

js--搜索框提示仿百度

大概要实现的内容这是一个很简单的示例,服务器端只是用了一个jsp页面,返回的类型为xml。先讲下是怎么回事,就是在浏览器端,通过ajax请求,发送一串英文字母,服务器端通过比较,返回具有相同前缀的英文单词。就这么个意思。工程是在IntelliJIDE中完成的。做前端开发感觉用IntelliJ比较方便,因为对于写javascript的话,有函数名的提示。本例提供下载。望各位提出宝贵意见哈。一、客户端JSP页面Html代码收藏代码<%--CreatedbyIn

系统 2019-08-29 22:19:25 2263

编程技术

如何在eclipse上安装插件

InstallationInstructionsHereyouwillfindascreenshottouroftheSubclipseinstallationprocessinEclipse3.x.TheseparticularscreenswerecapturedinEclipse3.0.2runningonWindowsXP.InstallSubclipseinEclipse3.xStep1:BegintheinstallationfromtheEc

系统 2019-08-29 22:18:46 2263

编程技术

openfire 数据库

关于数据库有三个地方需要注意:1.plugin.xml数据库及其版本的相关配置2.系统自带表ofVersion表中,关于插件数据库的版本记录3.database下相关sql文件(对应表的创建或更新),并向ofVersion中插一条字段(记录插件数据库版本)。首先说下个人对OpenFire插件数据库加载的理解:(只要会用的话,不需要看此。或者看完数据库的创建步骤知道怎么回事,再来看这里的理解也行)1)plugin.xml中配置数据库(及其版本),知道要需要哪

系统 2019-08-29 22:10:41 2263

编程技术

Eclipse 的一个挺有意思的插件

发现一个挺有意思的插件Name:FindBugsupdatesiteURL:http://findbugs.cs.umd.edu/eclipseFindBugs可以找出程序中容易出现的BUG,还可以帮助你找出程序中影响程序效率的语句。总体来说,我还是比较喜欢的Eclipse的一个挺有意思的插件

系统 2019-08-12 09:29:47 2263

各行各业

设定范围和步长的递增数验证器Validator

1、接口注释@Target({METHOD,FIELD,ANNOTATION_TYPE,CONSTRUCTOR,PARAMETER})@Retention(RUNTIME)@Documented@Constraint(validatedBy={IncrementalValidator.class})public@interfaceIncrementalInteger{Stringmessage()default"{common.incrementalInt

系统 2019-08-12 09:27:17 2263

数据库相关

索引结构基础

索引可以是“稠密的”,即数据文件中每个记录在索引文件中都设有一个索引项;索引也可以是“稀疏的”,即数据文件中只有一些记录在索引文件中表示出来,通常为每个数据块在索引文件中设一个索引项。索引还可以是“主索引”或者“辅助索引”。主索引能确定记录在数据文件中的位置,而辅助索引不能。比如说,通常我们会在关系的主键上建立主索引,而在其他的属性上建立辅助索引。3.1.1顺序文件是对关系中的元组按主键进行排序而生成的文件。关系中的元组按照这个次序分布在多个数据块中。3.

系统 2019-08-12 01:53:23 2263

数据库相关

poj 3114 Countries in War

http://poj.org/problem?id=3114题目大意:n个间谍他们之间传送信息需要一定的时间一个联通分量里面的间谍属于一个国家,之间的信息传递不需要时间然后问你从一个间谍传一个信息到另一个间谍那需要最少时间也可能传不到联通缩点+最短路缩点所得到的新图可能是因为有重边或是太稠密用邻接表容易超时基本步骤:1,输入去重边2,Tarjan缩点3,重新调整缩点后间谍之间的信息传递时间4,最短路注意:图有可能不完全连通代码及其注释:#include

系统 2019-08-12 01:51:52 2263

Python

Python入门基础系列1

一名大三(马上大四实习)软件工程学子,入门基础的所有内容都是我在观看网易云课堂的Alex老师的Python课程之后自己所留下的复习笔记,以便加深自己的印象。本文非常非常非常的基础!!!一、开发工具的选择我下载了多款IDE工具,包含eclipse+pydevAnacondacanopypycharm最后通过多方面综合(安装/环境配置过程操作难度,后期运用起来的难易程度)最后选择了Pycharm,因为就我个人来看,我感觉学生党用jetbrains的IDE真的是

系统 2019-09-27 17:56:28 2262