-re.I#忽略大小写-re.M#多行匹配,将正则作用到源数据的每一行-re.S#单行匹配,将正则作用到整个源数据,输出一个整体字符串(包括换行符也打印)string='''fallinlovewithyouiloveyouverymuchilovesheiloveher'''#去除以i开头的每一行数据re.findall('^i.*',string,re.M)['iloveyouverymuch','iloveshe','iloveher']#匹配全部行
系统 2019-09-27 17:51:20 2138
pythonelasticsearch从创建索引到写入数据创建索引fromelasticsearchimportElasticsearches=Elasticsearch('192.168.1.1:9200')mappings={"mappings":{"type_doc_test":{#type_doc_test为doc_type"properties":{"id":{"type":"long","index":"false"},"serial":{"t
系统 2019-09-27 17:51:01 2138
今天主要是来说一下怎么可视化来监控你的爬虫的状态。相信大家在跑爬虫的过程中,也会好奇自己养的爬虫一分钟可以爬多少页面,多大的数据量,当然查询的方式多种多样。今天我来讲一种可视化的方法。关于爬虫数据在mongodb里的版本我写了一个可以热更新配置的版本,即添加了新的爬虫配置以后,不用重启程序,即可获取刚刚添加的爬虫的状态数据。1.成品图这个是监控服务器网速的最后成果,显示的是下载与上传的网速,单位为M。爬虫的原理都是一样的,只不过将数据存到InfluxDB的
系统 2019-09-27 17:50:52 2138
效果左边原图,右面添加字体后保存的图。代码#-*-coding:utf-8-*-importPIL.ImageasImageimportPIL.ImageColorasImageColorimportPIL.ImageDrawasImageDrawimportPIL.ImageFontasImageFont"""author@:xunapython2.7"""#设置字体(LiberationSans-Regular.ttf这是我ubuntu16.04自带的
系统 2019-09-27 17:50:37 2138
1.json模块提供了一种很简单的方式来编码和解码JSON数据。其中两个主要的函数是json.dumps()和json.loads(),要比其他序列化函数库如pickle的接口少得多。下面演示如何将一个Python数据结构转换为JSON:'''遇到问题没人解答?小编创建了一个Python学习交流QQ群:857662006寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!'''importjsondata={'name':'ACME
系统 2019-09-27 17:50:20 2138
1.下载地址https://www.python.org/,目前版本是https://www.python.org/downloads/release/python-373/,https://www.python.org/downloads/release/python-2715/。2.依次完成v2版本和v3版本的安装,安装是勾选pip和安装环境变量。3.进入v2版本的安装目录,重命名python为python24.cmd进入v2版本的scripts目录,
系统 2019-09-27 17:49:49 2138
s与==区别:is用于判断两个变量引用对象是否为同一个,==用于判断引用变量的值是否相等。aisb相当于id(a)==id(b),id()能够获取对象的内存地址。如果a=10;b=a;则此时a和b的内存地址一样的;但当a=[1,2,3];另b=a[:]时,虽然a和b的值一样,但内存地址不一样。如果此时定义a=10、b=10,然后再对比aisb会发现返回的结果是True,这是因为在Python中会实现创建一个小型的整形池,范围为[-5,256],为这些整形开
系统 2019-09-27 17:49:44 2138
关于我一个有思想的程序猿,终身学习实践者,目前在一个创业团队任teamlead,技术栈涉及Android、Python、Java和Go,这个也是我们团队的主要技术栈。Github:https://github.com/hylinux1024微信公众号:终身开发者(angrycode)在前一篇《一文彻底搞懂Python可迭代(Iterable)、迭代器(Iterator)和生成器(Generator)的概念》的文中,知道生成器(Generator)可由以下两
系统 2019-09-27 17:49:37 2138
一、Python开机自动运行假如Python自启动脚本为auto.py。那么用root权限编辑以下文件:sudovim/etc/rc.local如果没有rc.local请看这篇文章在exit0上面编辑启动脚本的命令/usr/bin/python3/home/selfcs/auto.py>/home/selfcs/auto.log最后重启Linux,脚本就能自动运行并打印日志了。二、让Python脚本定时启动用root权限编辑以下文件sudovim/etc/
系统 2019-09-27 17:49:28 2138
Python标准库中collections对集合类型的数据结构进行了很多拓展操作,这些操作在我们使用集合的时候会带来很多的便利,多看看很有好处。defaultdict是其中一个方法,就是给字典value元素添加默认类型,之前看到过但是没注意怎么使用,今天特地瞅了瞅。首先是各大文章介绍的第一个例子:复制代码代码如下:importcollectionsascolldefdefault_factory():return'defaultvalue'd=coll.d
系统 2019-09-27 17:48:36 2138