朋友需要对一个pdf文件进行分割,在网上查了查发现这个pypdf2可以完成这些操作,所以就研究了下这个库,并做一些记录。首先pypdf2是python3版本的,在之前的2版本有一个对应pypdf库。可以使用pip直接安装:pipinstallpypdf2官方文档:pythonhosted.org/PyPDF2/里面主要有这几个类:PdfFileReader。该类主要提供了对pdf文件的读操作,其构造方法为:PdfFileReader(stream,stri
系统 2019-09-27 17:53:00 2057
python正则表达式转发自“Echo_fy发表于https://cloud.tencent.com/developer/article/1149679”文章目录python正则表达式1、正则解说2、中文字符集3、re模块常用方法1、正则解说数量词的贪婪模式与非贪婪模式正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符;非贪婪的则相反,总是尝试匹配尽可能少的字符。例如:
系统 2019-09-27 17:52:59 2057
前言:用python实时实现监控一个文件夹功能,将监控到的Excel(笔者目前用于解析excel文件)解析写到mysql中,起功能和sparkStreaming中的textFileStream功能,个人感觉python代码更好看。毕竟java代码看起来比较繁琐,scala代码简洁,可是它也是借鉴python发展而来啊。python实现看门狗功能代码:#!/usr/bin/python#-*-coding:UTF-8-*-importtimefromwatc
系统 2019-09-27 17:52:09 2057
python标准库包含于日期(date)和时间(time)数据的数据类型,datetime、time以及calendar模块会被经常用到。datetime以毫秒形式存储日期和时间,datetime.timedelta表示两个datetime对象之间的时间差。下面我们先简单的了解下python日期和时间数据类型及工具给datetime对象加上或减去一个或多个timedelta,会产生一个新的对象fromdatetimeimportdatetimefromda
系统 2019-09-27 17:51:56 2057
安装模块windows:pipinstallpymysqlubuntu:sudopip3installpymysqlpython操作mysql步骤importpymysql(1)链接mysql数据库db=pymysql.connect(主机名,用户名,密码,数据库名)(2)设置字符编码db.set_charset('utf8')(3)创建游标对象cursor=db.cursor()(4)准备sql语句sql='...'(5)执行sql语句cursor.ex
系统 2019-09-27 17:51:03 2057
今天介绍个神奇的网站!堪称爬虫偷懒的神器!我们在写爬虫,构建网络请求的时候,不可避免地要添加请求头(headers),以mdn学习区为例,我们的请求头是这样的:一般来说,我们只要添加user-agent就能满足绝大部分需求了,Python代码如下:在学习过程中有什么不懂得可以加我的python学习交流扣扣qun,784758214群里有不错的学习视频教程、开发工具与电子书籍。与你分享python企业当下人才需求及怎么从零基础学习好python,和学习什么内
系统 2019-09-27 17:50:07 2057
Qt与Python脚本实战之一(爬虫)Python环境安装1.Python版本选择(2.7or3.6.x)版本不同区别蛮大2.安装pip一个Python包管理工具类似nodejs的npm(都是提供了海量第三方包)编写python代码实现爬取.1.需要用到的库有:Requestslxml如果没有安装的请自己安装一下(pipinstallxxx)2.IDE:pycharmorQtcreator3.python版本:3.64.代码实现的是多线程下载实现功能爬取指
系统 2019-09-27 17:49:43 2057
目录一、multiprocess模块二、multiprocess.process模块三、process模块介绍3.1方法介绍3.2属性介绍3.3在windows中使用process模块的注意事项四、使用process模块创建进程4.1在Python中启动的第一个子进程4.2join方法4.3查看主进程和子进程的进程号4.4多个进程同时运行4.5多个进程同时运行,再谈join方法(1)4.6多个进程同时运行,再谈join方法(2)4.7通过继承Process
系统 2019-09-27 17:49:09 2057
python基础学习笔记(七)2013-04-2400:16虫师阅读(...)评论(...)编辑收藏本章介绍如何将语句组织成函数,这样,可以告诉计算机如何做事。下面编写一小段代码计算婓波那契数列(前两个数的和是第三个数)fibs=[0,1]#定义一个列表,初始内容是0,1foriinrange(8):#循环8次fibs.append(fibs[-2]+fibs[-1])#append在末尾追加一个数,这个是它前面两个数的和#输入>>>fibs#输出[0,1
系统 2019-09-27 17:48:55 2057
一概述1为什么要序列化因为TCP/IP协议只支持字节数组的传输,不能直接传对象。对象序列化的结果一定是字节数组!当两个进程在进行远程通信时,彼此可以发送各种类型的数据。无论是何种类型的数据,都会以二进制序列的形式在网络上传送。发送方需要把这个对象转换为字节序列,才能在网络上传送;接收方则需要把字节序列再恢复为对象。2序列化和反序列化序列化(serialization):及有序的列,数据转换成二进制的有序的过程协议:规定序列化和反序列化的转换方式及就是把数据
系统 2019-09-27 17:47:02 2057