前段时间自学了python,作为新手就想着自己写个东西能练习一下,了解到python编写爬虫脚本非常方便,且最近又学习了MongoDB相关的知识,万事具备只欠东风。程序的需求是这样的,爬虫爬的页面是京东的电子书网站页面,每天会更新一些免费的电子书,爬虫会把每天更新的免费的书名以第一时间通过邮件发给我,通知我去下载。一、编写思路:1.爬虫脚本获取当日免费书籍信息2.把获取到的书籍信息与数据库中的已有信息作比较,如果书籍存在不做任何操作,书籍不存在,执行插入数
系统 2019-09-27 17:38:35 2076
一、如何拆分含有多种分隔符的字符串?实际案例我们要把某个字符串依据分隔符号拆分不同的字符段,该字符串包含多种不同的分隔符,例如:s='asd;aad|dasd|dasd,sdasd|asd,,Adas|sdasd;Asdasd,d|asd'其中<,>,<;>,<|>,<\t>都是分隔符,如何处理?解决方案连续使用split()方法,每次处理一种分隔符#使用Python2defmySplit(s,ds):res=[s]fordinds:t=[]map(lam
系统 2019-09-27 17:38:05 2076
前面的两篇文章我们已经介绍了Tcp连接池和Tcp连接池管理器,并且引入了ITcpPool接口,这个接口可以将单个连接池和一组连接池统一起来,使它们有相同的外部使用方式。现在我们需要考虑的问题是,当消息分派器分派一个接收到的请求时,如果这个请求需要被FS上的某个功能插件处理,那么消息分派器是如何将这个消息分派到对应的FS上去的?回顾介绍消息分派器时画出的各消息组件联系图,我们非常自然的想到,创建一个消息处理器,这个消息处理器将请求消息通过Tcp连接池转发给对
系统 2019-08-29 23:48:14 2076
(完全限定类名:DataRabbit.ORM.IOrmAccesser)在DataRabbit框架中,通过IOrmAccesser来对数据库进行ORM访问,只要Entity(即ORM中的“O”)的定义与数据库表的结构完全一致,即可使用IOrmAccesser来对其进行ORM操作。1.EntityEntity除了包括成员变量与属性(这些变量与属性与数据库表的结构完全一致)外,不需要包含任何其它元素。在轻量的数据访问框架--序的例子代码中,我们已经看到了一个S
系统 2019-08-29 23:36:46 2076
首先我们需要知道,tcp/ip协议并不是一个协议,而是一个协议族,里面包好tcp,udp,ip等协议,tcp/ip网络协议栈包括应用层,传输层,网络层和链路层。tcp协议是一中面向连接的,可靠的传输层协议。连接过程就像打电话的过程。现在简要介绍其三次握手的过程:第一次握手:客户A向客户B发送一个连接请求,在这个包中,syn=1,seq=x,第二次握手:客户B接受到了A发送的包,然后发送一个包进行确认,该包中syn=1,ack=1,ack_seq=x+1,s
系统 2019-08-29 23:28:40 2076
好记性不如烂笔头,现在每次碰见问题和觉得应该记录下来的东西都会保持写博客的习惯,今后再次碰见这种问题,就不用把时间浪费了。这段时间用ExtJS用的多一点,前段时间碰见的分页问题,今天做个笔记吧。为了简单明了,此project使用的是servlet的方式,如果你使用的是struts2或者springMVC,则相应的改变成对于方式就可以了。首先在页面引入ext所不要的文件,这个自然不必多说了吧,另外为了整个项目清晰明了,EXTJS代码也最好和JSP页面(当然了
系统 2019-08-29 23:23:06 2076
润乾报表培训http://blog.sina.com.cn/runqiantraining在Eclipse里集成润乾报表任务背景eclipse程序员在使用润乾报表做开发的过程中会发现诸多的不便,首先,要把润乾的web发布包集成到eclipse应用中是一件比较麻烦的事情,需要逐个文件拷贝部署,还需要往web.xml里手工添加润乾的配置信息;手工配置润乾报表的各种配置文件;在eclipse里无法管理润乾报表模板,设计、修改润乾报表时,需要
系统 2019-08-29 22:57:42 2076
Stringhql="selectu.name,u.passwordfromUseru";Queryquery=session.createQuery(hql);Iteratoriter=query.iterator();while(iter.next())...{Objectobj[]=(Object[]iter.next());System.out.println(obj[0]+obj[1]);}以上代码需要逐一去访问结果集,非常不方便Hibernat
系统 2019-08-29 22:56:36 2076
.NETFramework提供了一系列同步基元来控制线程交互并避免争用条件。这可大致分为三个类别:锁定、通知和联锁操作。上述类别的定义并非是绝对的:有些同步机制具有多个类别的特征;一次释放一个线程的事件从功能上来说类似于锁;任何锁的释放都可看作一个信号;而联锁操作可用于构造锁。但是,这些类别仍然是有用的。记住线程同步是协作这一点非常重要。只要有一个线程避开同步机制直接访问受保护的资源,该同步机制就不是有效的。本概述包含以下几节:锁定通知轻量同步类型Spin
系统 2019-08-29 22:23:02 2076
使用JNA简单调用DLL里的函数1、在VC下创建一个动态链接库项目testJNA2、在头文件里声明函数extern"C"_declspec(dllexport)intadd(intfirst,intsecond);红色字体部分是必须的,包括定义结构体时也需要。应该是说此函数是发布的。3、在源码里实现函数intadd(intfirst,intsecond){printf("(c)testjna:%d+%d=%d",first,second,first+sec
系统 2019-08-12 09:30:24 2076