AllITeBooks多线程爬取-写在前面对一个爬虫爱好者来说,或多或少都有这么一点点的收集癖~发现好的图片,发现好的书籍,发现各种能存放在电脑上的东西,都喜欢把它批量的爬取下来。然后放着,是的,就这么放着.......然后慢慢的遗忘掉.....AllITeBooks多线程爬取-爬虫分析打开网址http://www.allitebooks.com/发现特别清晰的小页面,一看就好爬在点击一本图书进入,发现下载的小链接也很明显的展示在了我们面前,小激动一把,这
系统 2019-09-27 17:56:53 2035
Python的环境变量环境变量说明PYTHONSTARTUP在交互式启动时执行的文件(无默认值)PYTHONPATH‘:'-以默认模块搜索路径为前缀的分隔目录列表。结果是sys.path。PYTHONHOME交替的目录(或者:).默认的模块搜索路径为/pythonX.X.PYTHONCASEOK忽略import语句中的大小写(Windows)。PYTHONIOENCODING用于stdin/stdout/stderr中的编码PYTHONHASHSEED如果
系统 2019-09-27 17:56:35 2035
定制pattern的string模板(template)详解string.Template的pattern是一个正则表达式,可以通过覆盖pattern属性,定义新的正则表达式.如:使用新的定界符"{{",把{{var}}作为变量语法.代码:#-*-coding:utf-8-*-'''''Createdon2014.6.5@author:Administrator@edition:python3.3.0,eclipsepydev'''importstring
系统 2019-09-27 17:56:16 2035
python访问抓取网页常用命令简单的抓取网页:importurllib.requesturl="http://google.cn/"response=urllib.request.urlopen(url)#返回文件对象page=response.read()直接将URL保存为本地文件:importurllib.requesturl="http://google.cn/"response=urllib.request.urlopen(url)#返回文件对象
系统 2019-09-27 17:56:08 2035
网上很多的滚动条办法,可能是系统间的差异,或者浏览器的差役,导致结果可能不尽人意我的经常使用的环境是,ubuntu+chrome+chromedirver+selenium+python3.5.2以下笔记,是给基于上环境的滚动到指定位置tagelement=driver..find_elements_by_xpath("//div[@class='_3-kxx']")#目标元素的定位筛选driver.execute_script("returnargume
系统 2019-09-27 17:54:55 2035
1、捕获摄像头和实时显示importcv2importnumpyasnpimportpickleimportmatplotlib.pyplotaspltcap=cv2.VideoCapture(0)whileTrue:ret,frame=cap.read()#Ouroperationsontheframecomeheregray=cv2.cvtColor(frame,cv2.COLOR_BGR2GRAY)#Displaytheresultingframec
系统 2019-09-27 17:54:46 2035
主要逻辑是判断文件的最后修改时间与创建时间是否在秒级别上一致,此代码适用于Python2.importtimeimportos#ReadfimenameFileName='D:/scapegoat/xx.csv'#printfilecreationtimeprinttime.strftime('%Y-%m-%d%H:%M:%S',time.localtime(os.stat(FileName).st_ctime))#printfilemodifiedtim
系统 2019-09-27 17:54:41 2035
正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同;但不用担心,不被支持的语法通常是不常用的部分。在前面学习了比较多模式,有前向搜索的,也有后向搜索的,有肯定模式的,也有否定模式的。这次再来学习一个,就是后向搜索肯定模式,意思就
系统 2019-09-27 17:53:26 2035
json.load读取文件(file),解析为json对象(dict类型);json.loads读取字符串(string),解析为json对象;json.dump写文件(file),将json对象写入文件;json.dumps写字符串,将json对象写成string。importjsonimportosjson_obj={'name':'Michael','age':13}print("jsondict:",type(json_obj))#json对象是一
系统 2019-09-27 17:52:39 2035
最近在工作中遇到一个问题,就是有一个功能希望在各种服务器上实现,而服务器上的系统版本可能都不一样,有的是CentOS6.x,有的是CentOS7.x。需要说明的一点是,CentOS6.x上的Python版本是2.6.x的,而CentOS7.x上的Python版本是2.7.x的,这意味着我要实现的功能要适配这两种版本的系统。你可能会说,这有什么的,自己写的时候,注意一下就好了。事情其实没有那么容易,我要实现的功能是基于一个框架进行定制,需要修改不少的框架代码
系统 2019-09-27 17:51:50 2035