先说一个比较�宓氖虑椋涸谛聪好滓衾质蕴�下载器的时候遇到一个问题,因为保存的文件都是用音乐的标题命名的,所以碰到一些诸如「��峙/outborder」等含有非法字符(哼哼,说的就是你→_→Windows)的标题的时候,就会保存失败。于是我想起了迅雷的解决方法:把所有的非法字符替换成下划线。于是就引入了正则表达式的使用。一番搜索囫囵吞枣后,我写下了这样的函数:复制代码代码如下:defsanitize_filename(filename):returnre.s
系统 2019-09-27 17:53:30 2243
在接触python时最开始接触的代码,取长方形的长和宽,定义一个长方形类,然后设置长方形的长宽属性,通过实例化的方式调用长和宽,像如下代码一样。classRectangle(object):def__init__(self):self.width=10self.height=20r=Rectangle()print(r.width,r.height)此时输出结果为1020但是这样在实际使用中会产生一个严重的问题,__init__中定义的属性是可变的,换句话
系统 2019-09-27 17:52:24 2243
常见的反爬机制及处理方式1、Headers反爬虫:Cookie、Referer、User-Agent解决方案:通过F12获取headers,传给requests.get()方法2、IP限制:网站根据IP地址访问频率进行反爬,短时间内进制IP访问解决方案:1、构造自己IP代理池,每次访问随机选择代理,经常更新代理池2、购买开放代理或私密代理IP3、降低爬取的速度3、User-Agent限制:类似于IP限制解决方案:构造自己的User-Agent池,每次访问随
系统 2019-09-27 17:51:32 2243
本节收录了稍作剪辑的PEP8摘要(PythonEnhancementProposal,Python增强提案)。PEP8由GuidovanRossum和BarryWarsaw撰写,是Python的最接近编程风格手册的东西。这里省略了一些比较具体的部分,但主要内容都已包括。应该尽可能让代码遵守PEP8规范,代码会由此更具Python风格。访问Python官方网站的文档部分并搜索PEP,就可以获得PEP8全文及Python历史上发布的所有其他PEP。PEP既是P
系统 2019-09-27 17:51:18 2243
场景说明假设有一个mysql表被水平切分,分散到多个host中,每个host拥有n个切分表。如果需要并发去访问这些表,快速得到查询结果,应该怎么做呢?这里提供一种方案,利用python3的asyncio异步io库及aiomysql异步库去实现这个需求。代码演示importloggingimportrandomimportasynciofromaiomysqlimportcreate_pool#假设mysql表分散在8个host,每个host有16张子表TB
系统 2019-09-27 17:50:32 2243
目录一、Admin的配置1.激活管理工具2.使用管理工具3.注册超级用户4.修改语言二、管理数据模型1.注册medel类到admin2.自定制类一、Admin的配置Admin是Django的一个强大的功能,它能从数据库中读取数据,并呈现在页面中,进行管理。默认情况下,它的功能已经非常强大,如果你不需要复杂的功能,它已经够用,但是有时候,一些特殊的功能还需要定制,比如搜索功能,下面这一系列文章就逐步深入介绍如何定制适合自己的admin应用。1.激活管理工具通
系统 2019-09-27 17:49:37 2243
如下所示:#coding:utf-8importosimportpsutilimporttimedefwrite_pid():pid=os.getpid()fp=open("pid.log",'w')fp.write(str(pid))fp.close()defread_pid():ifos.path.exists("pid.log"):fp=open("pid.log",'r')pid=fp.read()fp.close()returnpidelse:r
系统 2019-09-27 17:48:34 2243
python编程中常用的12种基础知识总结:正则表达式替换,遍历目录方法,列表按列排序、去重,字典排序,字典、列表、字符串互转,时间对象操作,命令行参数解析(getopt),print格式化输出,进制转换,Python调用系统命令或者脚本,Python读写文件。1、正则表达式替换目标:将字符串line中的overview.gif替换成其他字符串复制代码代码如下:>>>line=''>>>mo=re.compile(r'(?<=SRC=)"([\w+\.]+
系统 2019-09-27 17:47:40 2243
html页面一般都会指定一个编码,如何获取到是处理html页面的第一步,因为错误的编码必然带来后面处理的问题。这里我用python的正则表达式写了个:importrea=["",'','','','','','']b="
系统 2019-09-27 17:47:13 2243
python中正则表达式使用文章目录python中正则表达式使用一、简介二、使用2.1常用规则2.1.1正则表达式字符串写法2.1.2常用匹配规则2.1.3贪婪与非贪婪匹配2.2常用方法2.2.1编译2.2.2匹配2.2.3查找2.2.4替换2.2.5切分2.3分组2.3.1分组使用2.3.2指定分组不捕获2.3.3分组特殊规则2.4断言一、简介这里介绍python中的正则表达式使用,包含正则表达式常用规则、常用方法、贪婪与非贪婪匹配、分组、断言等操作。二
系统 2019-09-27 17:46:46 2243