背景由于工作性质,经常面对不同的问题,某些场景下SQL+Excel、常用办公软件不能处理,这时到网上找一些案例,自己动手用python处理。后续,借此博客记录比较典型的处理过程。后续,陆续实际处理的问题,如1.合并PDF2.拆分PDF3.敏感字段MD5脱敏4.从非架构化的大文本文件中提取指定条件的记录需求工作和生活中有时会遇到将多个pdf文件,合并成一个大文件的情况。例如,扫描时,普通扫描仪或打印机一页生成一个PDF,而一份资料实际多页。Adobe的收费版
系统 2019-09-27 17:57:30 2055
pythontime.sleep()-睡眠线程还是进程?它会阻止线程。如果查看Python源代码中的Modules/timemodule.c,您会看到在调用中floatsleep(),睡眠操作的实质部分包含在Py_BEGIN_ALLOW_THREADS和Py_END_ALLOW_THREADS块中,允许其他线程继续执行当前线程睡觉。你也可以用一个简单的python程序来测试它:importtimefromthreadingimportThreadclass
系统 2019-09-27 17:57:08 2055
首先,什么是魔法方法呢?在python中方法名如果是xxxx()的,那么就有特殊的功能,因此叫做“魔法”方法。__init__()方法当一个实例被创建的时候调用的初始化方法,在创建对象时默认调用。__init__()方法中默认有一个参数名字为self,如果在创建对象时传递了2个参数,那么__init__()方法除了self作为第一个形参外还需要2个形参,例如__init__(self,x,y)。之前我们是这样给对象添加属性的:classStudent:pa
系统 2019-09-27 17:56:52 2055
Python详解基本语法概要:函数的返回值是函数重要的组成部分。函数的根本在于实现程序的部分功能,所以很多时候我们需要将函数执行后的结果返回给程序再由程序作出进一步的操作。可以说是函数的返回值令函数与函数之间,函数与主程序之间更加紧密的联系起来。函数的返回值在Python的函数中都有一个返回值,默认为None。也可以使用returnvalue语句来定义一个且只能定义一个可为任意类型的返回值。但是我们能够返回一个序列类型的对象,来实现返回多个值的效果。Exa
系统 2019-09-27 17:56:49 2055
译序如果说优雅也有缺点的话,那就是你需要艰巨的工作才能得到它,需要良好的教育才能欣赏它。——EdsgerWybeDijkstra在Python社区文化的浇灌下,演化出了一种独特的代码风格,去指导如何正确地使用Python,这就是常说的pythonic。一般说地道(idiomatic)的python代码,就是指这份代码很pythonic。Python的语法和标准库设计,处处契合着pythonic的思想。而且Python社区十分注重编码风格一的一致性,他们极力
系统 2019-09-27 17:55:36 2055
安装pymysqlpipinstallpymysql使用pymysql使用数据查询语句查询一条数据fetchone()frompymysqlimport*conn=connect(host='127.0.0.1',port=3306,user='root',password='123456',database='itcast',charset='utf8')#创建游标c=conn.cursor()#执行sql语句c.execute("select*from
系统 2019-09-27 17:55:12 2055
首先在火狐浏览器上登录知乎,然后使用火狐浏览器插件Httpfox获取GET请求的Cookie,这里注意使用状态值为200(获取成功)的某次GET.将Cookies复制出来,注意这一行非常长,不要人为添加换行符。而且Cookie中使用了双引号,最后复制到代码里使用单引号包起来。使用下边代码检验是否是模拟了登录的用户的请求:importrequestsimportreheaders={'User-Agent':'Mozilla/5.0(WindowsNT10.
系统 2019-09-27 17:55:03 2055
学了面向对象三大特性继承,多态,封装。今天我们看看面向对象的一些进阶内容,反射和一些类的内置函数。一、isinstance和issubclassclassFoo:passclassSon(Foo):passs=Son()#判断一个对象是不是这个类的对象,传两个参数(对象,类)print(isinstance(s,Son))print(isinstance(s,Foo))#type更精准print(type(s)isSon)print(type(s)isFo
系统 2019-09-27 17:54:00 2055
'''br/>题一:判断列表中含有字符串且组成新的列表打印输出知识点:列表、列表的增删改查、for循环、if判断'''#@Author:Dotest软件测试#@QQ:1274057839names=['Dotest','test','donghao',100,True]#定义空列表;容器;思考:为什么不放在for循环里面定义?str_name=[]#for循环fornameinnames:#if判断;函数:isinstance是判断是否为某类型ifisin
系统 2019-09-27 17:53:41 2055
问题说明最近在写爬虫,由于单个账号访问频率太高会被封,所以需要在爬虫执行一段时间间隔后自己循环切换账号所以就在想,有没有像单片机那样子设置一个定时中断,再定义一个中断入口,这样子每隔一段时间执行一次中断当然不能用sleep,这样子整个进程就停在这了,而不是接着爬数据解决方法用到threading的Timer,也类似单片机那样子,在中断程序中再重置定时器,设置中断,python实例代码如下importthreadingimporttimedefchange_
系统 2019-09-27 17:53:13 2055
是什么:首先,Python装饰器的作用是:让被装饰的函数在不需要任何变化的情况下,增加额外的功能。为什么:为什么要用装饰器呢,直接增加功能不就行了?因为有的程序已经上线或已经被使用,那么就不能大批量的修改源代码,于是就产生了装饰器。怎么装饰:预备知识:函数名和函数的区别,即带括号和不带括号的区别1.test1表示的是函数的内存地址。可以理解为一个指向某块内存的标签。2.test1()就是调用对在test1这个地址的内容,即函数。3.再通俗的比喻,test1
系统 2019-09-27 17:52:54 2055
本文实例讲述了决策树剪枝算法的python实现方法。分享给大家供大家参考,具体如下:决策树是一种依托决策而建立起来的一种树。在机器学习中,决策树是一种预测模型,代表的是一种对象属性与对象值之间的一种映射关系,每一个节点代表某个对象,树中的每一个分叉路径代表某个可能的属性值,而每一个叶子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值。决策树仅有单一输出,如果有多个输出,可以分别建立独立的决策树以处理不同的输出。ID3算法:ID3算法是决策树的一种
系统 2019-09-27 17:52:43 2055
前言题目来源:记得一副有趣的对联:"雾锁山头山锁雾,天连水尾水连天",上联和下联都是回文的.当然类似的还有:"上海自来水水来自海上,山西悬空寺寺空悬西山".回文是什么意思?就是把内容反过来读也是和原来一样的,譬如abccba,xyzyx,这些都是回文的.然而我们更感兴趣的是在一个英文字符串L中,怎么找出最长的回文子串.例如L="caayyhheehhbbbhhjhhyyaac",那么它最长的回文子串是"hhbbbhh".这个任务看似简单,但是如果我告诉你L
系统 2019-09-27 17:52:40 2055
Python数据类型C++数据类型list列表定义:list1=['physics','chemistry',1997,2000]访问元素:list1[0]、list1[2:4]tuple元组+list列表dict字典定义:dict={'a':1,'b':2,'b':'3'}访问元素:dict['a']maptuple元组tuple与list的区别:tuple不可修改定义:tup1=('physics','chemistry',1997,2000)tup2
系统 2019-09-27 17:52:37 2055
-基于如下5点展开requests模块的学习什么是requests模块requests模块是python中原生的基于网络请求的模块,其主要作用是用来模拟浏览器发起请求。功能强大,用法简洁高效。在爬虫领域中占据着半壁江山的地位。为什么要使用requests模块因为在使用urllib模块的时候,会有诸多不便之处,总结如下:手动处理url编码手动处理post请求参数处理cookie和代理操作繁琐......使用requests模块:自动处理url编码自动处理po
系统 2019-09-27 17:52:20 2055