朋友需要对一个pdf文件进行分割,在网上查了查发现这个pypdf2可以完成这些操作,所以就研究了下这个库,并做一些记录。首先pypdf2是python3版本的,在之前的2版本有一个对应pypdf库。可以使用pip直接安装:pipinstallpypdf2官方文档:pythonhosted.org/PyPDF2/里面主要有这几个类:PdfFileReader。该类主要提供了对pdf文件的读操作,其构造方法为:PdfFileReader(stream,stri
系统 2019-09-27 17:53:00 2103
通过使用turtle绘画象棋棋盘,供大家参考,具体内容如下#绘制象棋棋盘importturtlet=turtle.Pen()t.width(2)#设置画笔粗细t.speed(1)#设置画笔移动速度#画竖线t.penup()t.goto(-400,-400)foriinrange(9):t.pendown()ifi!=0andi!=8:t.goto(-400+i*100,0)t.penup()t.goto(-400+i*100,100)t.pendown()
系统 2019-09-27 17:51:32 2103
方法一:>>>str1='''Leventselève,ilfauttenterdevivre.起风了,唯有努力生存。(纵有疾风起,人生不言弃。)'''>>>str1'Leventselève,ilfauttenterdevivre.\n起风了,唯有努力生存。\n(纵有疾风起,人生不言弃。)'编辑的时候,引号挺对的,但是不知道为什么发布的时候,第一行的引号总是多了一些,其实应该是下面这样的:不过感觉这种方法不够纯粹,因为字符串里含有\n。方法二:>>>st
系统 2019-09-27 17:50:53 2103
Pycharm鼠标移动到函数上,CTRL+Q可以快速查看文档,CTR+P可以看基本的参数。apply(),applymap()和map()apply()和applymap()是DataFrame的函数,map()是Series的函数。apply()的操作对象是DataFrame的一行或者一列数据,applymap()是DataFrame的每一个元素。map()也是Series中的每一个元素。apply()对dataframe的内容进行批量处理,这样要比循环
系统 2019-09-27 17:50:41 2103
机器学习的三要素:模型,策略,算法模型:感知机是二分类线性分类模型,属于判别模型。策略:基于误分类点到超平面的总距离。学习算法:略感知机存在的问题:存在多解,解依赖于初始超平面的选择以及迭代过程中误分类点的选择。训练集线性不可分,算法无法收敛,解决方法:pocket算法或者使用核函数。无法解决异或问题Python代码实现:importnumpyasnpdeftrain(X_train,Y_train):print(np.shape(X_train))m,n
系统 2019-09-27 17:48:45 2103
例1importosprint'Process(%s)start...'%os.getpid()pid=os.fork()ifpid==0:print'Iamchild(%s)andmyfatheris%s.'%(os.getpid(),os.getppid())else:print'I(%s)justcreatedachildprocess(%s).'%(os.getpid(),pid)加载os模块后,首先os.fork()函数生成一个子进程,返回值pi
系统 2019-09-27 17:48:17 2103
insert()方法插入对象obj到列表的偏移量索引。语法以下是insert()方法的语法:list.insert(index,obj)参数index--这是要插入对象obj必要的索引obj--这是将被插入到给定的列表中的对象返回值此方法不返回任何值,但它插入指定的索引处的指定元素例子下面的例子显示了insert()方法的使用#!/usr/bin/pythonaList=[123,'xyz','zara','abc']aList.insert(3,2009
系统 2019-09-27 17:46:55 2103
本文实例展示了Python生成验证码的方法,具有很好的实用价值。分享给大家供大家参考。具体实现方法如下:前台页面代码如下:看不清换一张后台程序如下:importStringIOimportImage,ImageDraw,ImageFont,random#相应的模块需要安装fromxxx.settingsimportauthcode_font#请确保改字体存在defmake_image(request):mp=hashlib.md5()mp.update(s
系统 2019-09-27 17:46:23 2103
Tqdm是一个易用性强、扩展性高的Python进度条库,可以在Python长循环中添加一个进度提示信息,我们只需要封装任意的迭代器tqdm(iterator)即可。安装学习交流群:243771258安装过程如下:自动控制进度更新学习交流群:243771258传入可迭代对象输出结果为:使用方法trangetrange(i)是tqdm(range(i))的简单写法。学习交流群:243771258输出结果为:学习交流群:243771258为进度条设置描述在for
系统 2019-09-27 17:46:11 2103
Python中的包包是一个分层次的文件目录结构,它定义了一个由模块及子包,和子包下的子包等组成的Python的应用环境。考虑一个在Phone目录下的pots.py文件。这个文件有如下源代码:#!/usr/bin/python#-*-coding:UTF-8-*-defPots():print"I'mPotsPhone"同样地,我们有另外两个保存了不同函数的文件:Phone/Isdn.py含有函数Isdn()Phone/G3.py含有函数G3()现在,在Ph
系统 2019-09-27 17:38:40 2103
许多人都知道iPython有很好的自动补全能力,但是就未必知道python也同样可以Tab键补全,您可以在启动python后,执行下复制代码代码如下:importreadline,rlcompleter;readline.parse_and_bind("tab:complete")这就可以按Tab键补全了。python自启动如果您嫌每次都要键入这东西麻烦的话,可以把上边这行写到~/.pythonstartup.py,再~/.bashrc里加一个环境变量ex
系统 2019-09-27 17:37:58 2103
原文链接:https://www.cnblogs.com/supery007/p/8136295.html1.公众号测试地址https://mp.weixin.qq.com/debug/cgi-bin/sandboxinfo?action=showinfo&t=sandbox/index2.代码#pip3installrequestsimportrequestsimportjsondefget_access_token():"""获取微信全局接口的凭证(默
系统 2019-09-27 17:54:03 2102
我们直接用Requests、Selenium等库写爬虫,如果爬取量不是太大,速度要求不高,是完全可以满足需求的。但是写多了会发现其内部许多代码和组件是可以复用的,如果我们把这些组件抽离出来,将各个功能模块化,就慢慢会形成一个框架雏形,久而久之,爬虫框架就诞生了。利用框架我们可以不用再去关心某些功能的具体实现,只需要去关心爬取逻辑即可。有了它们,可以大大简化代码量,而且架构也会变得清晰,爬取效率也会高许多。所以如果对爬虫有一定基础,上手框架是一种好的选择。本
系统 2019-09-27 17:53:32 2102
详细见我的个人博客:Ubuntu安装Python3.6Ubuntu16.04下默认系统自带Python2和Python3.5的版本,这个版本被系统很多程序所依赖,所以不建议删除,如果使用最新的Python3.6那么我们知道编译安装源码包和系统默认包之间是没有任何影响的。一、下载tar包首先去Python官网下载Python3的源码包,网址:https://www.python.org/downloads/release/python-365/进去之后点击导
系统 2019-09-27 17:52:58 2102
Python3快速入门(十六)——Matplotlib绘图一、Matplotlib简介1、Matplotlib简介Matplotlib是Python2D-绘图领域使用最广泛的套件,可以简易地将数据图形化,并且提供多样化的输出格式。matplotlib有两个接口,一个是状态机层的接口,通过pyplot模块来进行管理;一个是面向对象的接口,通过pylab模块将所有的功能函数全部导入其单独的命名空间内。2、Matplotlib安装使用conda安装如下:cond
系统 2019-09-27 17:51:57 2102