搜索到与相关的文章
Python

python如何将多个PDF进行合并

背景由于工作性质,经常面对不同的问题,某些场景下SQL+Excel、常用办公软件不能处理,这时到网上找一些案例,自己动手用python处理。后续,借此博客记录比较典型的处理过程。后续,陆续实际处理的问题,如1.合并PDF2.拆分PDF3.敏感字段MD5脱敏4.从非架构化的大文本文件中提取指定条件的记录需求工作和生活中有时会遇到将多个pdf文件,合并成一个大文件的情况。例如,扫描时,普通扫描仪或打印机一页生成一个PDF,而一份资料实际多页。Adobe的收费版

系统 2019-09-27 17:57:30 1976

Python

Python学习笔记之读取文件、OS模块、异常处理、with as语法示例

本文实例讲述了Python学习笔记之读取文件、OS模块、异常处理、withas语法。分享给大家供大家参考,具体如下:文件读取#读取文件f=open("test.txt","r")print(f.read())#打印文件内容#关闭文件f.close()获取文件绝对路径:OS模块os.environ["xxx"]获取系统环境变量os.getcwd获取当前python脚本工作路径os.getpid()获取当前进程IDos.getppid()获取父进程ID异常#读

系统 2019-09-27 17:57:26 1976

Python

Python基础学习—列表和元组

一、listPython内置的一种数据类型是列表:listlist是一种有序的、可变的集合,可以随时添加和删除其中的元素。实例:列表:classmates>>>classmates=['Michael','Bob','Tracy']>>>classmates['Michael','Bob','Tracy']len()函数获取list元素的个数>>>len(classmates)3用索引来访问list中每一个位置的元素:索引从0开始,最后一个元素的索引是le

系统 2019-09-27 17:57:17 1976

Python

python线程中的同步问题及解决方法

多线程开发可能遇到的问题假设两个线程t1和t2都要对num=0进行增1运算,t1和t2都各对num修改1000000次,num的最终的结果应该为2000000。但是由于是多线程访问,有可能出现下面情况:fromthreadingimportThreadimporttimenum=0deftest1():globalnumforiinrange(1000000):num+=1print("--test1--num=%d"%num)deftest2():glo

系统 2019-09-27 17:57:16 1976

Python

使用Python写CUDA程序的方法

使用Python写CUDA程序有两种方式:*Numba*PyCUDAnumbapro现在已经不推荐使用了,功能被拆分并分别被集成到accelerate和Numba了。例子numbaNumba通过及时编译机制(JIT)优化Python代码,Numba可以针对本机的硬件环境进行优化,同时支持CPU和GPU的优化,并且可以和Numpy集成,使Python代码可以在GPU上运行,只需在函数上方加上相关的指令标记,如下所示:importnumpyasnpfromti

系统 2019-09-27 17:56:19 1976

Python

python网络编程实例简析

本文实例讲述了python网络编程,分享给大家供大家参考。具体方法如下:服务端代码如下:fromSocketServerimport(TCPServerasTCP,StreamRequestHandlerasSRH)fromtimeimportctimeHOST=''PORT=21567ADDR=(HOST,PORT)classMyRequestHandle(SRH):defhandle(self):print'connectingfrom..',self

系统 2019-09-27 17:56:18 1976

Python

完美解决Python2操作中文名文件乱码的问题

Python2默认是不支持中文的,一般我们在程序的开头加上#-*-coding:utf-8-*-来解决这个问题,但是在我用open()方法打开文件时,中文名字却显示成了乱码。我先给大家说说Python中的编码问题,Python中的字符串的大概分为为str和Unicode两种形式,其中str常用的编码类型为utf-8,gb2312,gbk等等,Python使用Unicode作为编码的基础类型。str记录的是字节数组,只是某种编码的存储格式,终于输出到文件或是

系统 2019-09-27 17:56:07 1976

Python

Python3网络爬虫入门详解(一)

爬虫的概念:爬虫就是获取网页并提取和保存信息的自动化程序爬虫的分类:主要有四类:通用网络爬虫,聚焦网络爬虫,增量式网络爬虫,深层网络爬虫爬虫的流程:常见的几种爬虫问题:主要有五类:静态网页的爬取,Ajax数据的爬取,动态渲染页面爬取,验证码的识别,代理的使用常见的爬虫框架:pyspider框架,Scrapy框架分布式爬虫:在多台机器上运行爬虫程序爬虫的一些常用"库":解析库:lxml;BeautifulSoup;pyquery;tesserocr请求库:r

系统 2019-09-27 17:56:05 1976

Python

python3中类的继承以及self和super的区别详解

python中类的继承:子类继承父类,及子类拥有了父类的属性和方法。python中类的初始化都是__init__()。所以父类和子类的初始化方式都是__init__(),但是如果子类初始化时没有这个函数,那么它便调用父类的__init__();如果实现了这个函数,就会覆盖父类的初始化函数。如果继承父类的__init__(),就需要在子类中显示调用这个函数。实现如下:classAnimal(object):def__init__(self):self.nam

系统 2019-09-27 17:55:47 1976

Python

Python进度条的制作代码实例

这篇文章主要介绍了Python进度条的制作代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下importsys,time#导入模块foriinrange(50):#进度条的长度sys.stdout.write("#")#进度条的内容,这里要注意了,pycharm有可能不显示write的方法sys.stdout.flush()#刷新缓存time.sleep(0.5)#间隔时间,和shell的sleep差

系统 2019-09-27 17:55:39 1976