搜索到与相关的文章
Python

Python制作简单的网页爬虫

1.准备工作:工欲善其事必先利其器,因此我们有必要在进行Coding前先配置一个适合我们自己的开发环境,我搭建的开发环境是:操作系统:Ubuntu14.04LTSPython版本:2.7.6代码编辑器:SublimeText3.0这次的网络爬虫需求背景我打算延续DotNet开源大本营在他的那篇文章中的需求,这里就不再详解。我们只抓取某一省中所有主要城市从2015-11-22到2015-10-24的白天到夜间的所有天气情况。这里以湖北省为例。2.实战网页爬虫

系统 2019-09-27 17:37:46 2049

编程技术

开源搜索引擎资源

开放源代码搜索引擎为人们学习、研究并掌握搜索技术提供了极好的途径与素材,推动了搜索技术的普及与发展,使越来越多的人开始了解并推广使用搜索技术。使用开源搜索引擎,可以大大缩短构建搜索应用的周期,并可根据应用需求打造个性化搜索应用,甚至构建符合特定需求的搜索引擎系统。搜索引擎的开源,无论是对技术人员还是普通用户,都是一个福音。搜索引擎的工作流程主要分为三步:从互联网抓取网页→创建抓取网页的索引库→从索引库中进行搜索。首先需要一个能访问网络的爬虫器程序,依据UR

系统 2019-08-29 23:51:17 2049

编程技术

结合ALBPM学习工作流模式

工作流模式网站:http://is.tm.tue.nl/research/patterns/patterns.htm列出了21种工作流模式。http://www.workflowpatterns.com在上面21种模式的基础上进行扩展,共计43种;另外将这些种模式归为Control-FlowPatterns大类,增加的其他大类还有WorkflowDataPatterns,WorkflowResourcePatterns,ExceptionHandlingP

系统 2019-08-29 23:46:32 2049

编程技术

049_《Delphi XML权威指南》

《DelphiXML权威指南》Delphi教程系列书籍(049)《DelphiXML权威指南》网友(邦)整理EMail:shuaihj@163.com下载地址:Pdf原书名:DelphiDeveloper'sGuidetoXML原出版社:WordwarePublishing作者:[美]KeithWood译者:林琪等出版社:中国电力出版社ISBN:7508313194上架时间:2003-5-26出版日期:2003年4月开本:16开页码:466版次:1-1内容

系统 2019-08-29 23:43:16 2049

编程技术

应用Rails进行REST 开发(二)

实例应用我们以《RapidWebDevelopmentmitRubyonRails》中的一个例子“项目管理应用”来描述Rails的REST方面的特性。首先创建一个rails的应用:(原书中的rails为1.2)>railsontrack创建开发和测试的数据库。>mysql-urails-pEnterpassword:*****mysql>createdatabaseontrack_development;mysql>createdatabaseontrac

系统 2019-08-29 23:32:01 2049

编程技术

trie 树

http://www.cppblog.com/zoyi-hang/archive/2008/04/06/46355.htmltrie树好不容易写的一个模版~本来是想按照我们数据结构教程的trie树来写,但是他的实现我实在觉得太难所以还是采用简化版的trie树这个应该算是比较标准的trie树结构,但是他的插入实现起来不仅仅是插入本身的单词,可能还需要修改原来的数结构比如说本身已经存在了bobwhite,现在添加bobwhq,就要在第二层的基础上继续扩展,bo

系统 2019-08-29 22:51:38 2049

编程技术

struts 2.3.4 文件上传,FileName,ContentType

刚开始学Struts2,下午参照黑弓老师的视频写一个简单的文件上传模块,结果弄了一下午,File,FileName和ContentType全为null,实在搞不懂了,大家帮我看看,谢谢了!!先贴代码:Fileupload.jsp代码<%@pagelanguage="java"contentType="text/html;charset=UTF-8"pageEncoding="UTF-8"%><%@taglibprefix="s"uri="/struts-t

系统 2019-08-29 22:51:32 2049

编程技术

重新索引互联网 --转自爱范儿

重新索引互联网http://www.ifanr.com/40769重新索引互联网Facebook雇佣公关抹黑Google的过程已经水落石出。问题是:Google那么多产品,Facebook为何对SocialCircle这么敏感?Google:索引互联网Google号称自己的使命是“索引互联网”。这件事的难点并非派出多少爬虫,而是对收集来的海量内容做排序:怎样让真正重要的网页,的排到Google搜索结果的前面来?Google的搜索结果排序有其他算法的辅助和人

系统 2019-08-29 22:41:48 2049

编程技术

JVM体系机构

图1JVM体系结构JVM_ARGS="-Xmx2g-Xms2g-Xmn1024m-XX:PermSize=256m-Xss256k-XX:+DisableExplicitGC-XX:+UseConcMarkSweepGC-XX:+CMSParallelRemarkEnabled-XX:+UseCMSCompactAtFullCollection-XX:LargePageSizeInBytes=128m-XX:+UseFastAccessorMethods-

系统 2019-08-29 22:29:37 2049