背景由于工作性质,经常面对不同的问题,某些场景下SQL+Excel、常用办公软件不能处理,这时到网上找一些案例,自己动手用python处理。后续,借此博客记录比较典型的处理过程。后续,陆续实际处理的问题,如1.合并PDF2.拆分PDF3.敏感字段MD5脱敏4.从非架构化的大文本文件中提取指定条件的记录需求工作和生活中有时会遇到将多个pdf文件,合并成一个大文件的情况。例如,扫描时,普通扫描仪或打印机一页生成一个PDF,而一份资料实际多页。Adobe的收费版
系统 2019-09-27 17:57:30 1625
原文链接:https://edu.csdn.net/bundled/detail/49?utm_source=csdn最近Python越来越火了!前几天,PYPL(即编程语言流行指数,基于Google搜索频率而定)出炉了6月编程语言排行榜,Python拿下NO.1,成为最流行的编程语言。赢得毫无波澜!究其原因,Python随着和大数据、人工智能绑定在一起,可畏是越来越厉害了。语言简单、效率高、应用范围广,这三项优势已让其它语言无法跟进。随着Python的状
系统 2019-09-27 17:57:15 1625
进程和线程进程是程序运行的实例。一个进程里面可以包含多个线程,因此同一进程下的多个线程之间可以共享线程内的所有资源,它是操作系统动态运行的基本单元;每一个线程是进程下的一个实例,可以动态调度和独立运行,由于线程和进程有很多类似的特点,因此,线程又被称为轻量级的进程。线程的运行在进程之下,进程的存在依赖于线程;开胃菜基于Python3创建一个简单的进程示例fromthreadingimportThreadfromtimeimportsleepclassCoo
系统 2019-09-27 17:57:01 1625
今天,我实现了一个很有趣的demo,它可以在视频里找到并解析二维码,然后把解析的内容实时在屏幕上显示出来。然后我们直入主题,首先你得确保你装了opencv,python,zbar等环境。然后这个教程对于学过opencv的人可能更好理解,但是没学过也无妨,到时候也可以直接用。比如我的电脑上的环境是opencv2.4.x,python2.7,和最新的zbar,在Ubuntu12.12的系统下运行的假设你的opencv已经安装好了,那么我们就可以安装zbar你可
系统 2019-09-27 17:57:00 1625
较小文件处理方法:importhashlibimportosdefget_md5_01(file_path):md5=Noneifos.path.isfile(file_path):f=open(file_path,'rb')md5_obj=hashlib.md5()md5_obj.update(f.read())hash_code=md5_obj.hexdigest()f.close()md5=str(hash_code).lower()returnmd
系统 2019-09-27 17:57:00 1625
概述模块Pickle实现了对一个Python对象结构的二进制的序列化和反序列化。即当Python程序持续运行一些字符串、列表字典、甚至自定义的类等数据对象,需要持久化存储,即存储在磁盘中,防止运行在内存中,因断电等情况丢失数据。那么Pickle模块就派上用场了,它可以将对象转换为一种可以传输或存储的格式。python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过
系统 2019-09-27 17:56:58 1625
如下所示:#返回一个列表中第二大的数defsecond(ln):max=0s={}foriinrange(len(ln)):flag=0forjinrange(len(ln)):ifln[i]>=ln[j]andi!=j:flag=flag+1s[i]=flagifflag>max:max=flagprint(s)foriins:ifs[i]==max-1:breakprint(ln[i])second([1,2,7,4,5,6,8,5,3,3,9,9,1
系统 2019-09-27 17:56:57 1625
python中查找指定的字符串的方法如下:code#查询defselStr():sStr1='jsjtt.com'sStr2='com'#index查询某个字符串,返回索引nPos=sStr1.index(sStr2)if(nPos>=0):print'sStr1中包括sStr2中的字符'printnPos#find方法如果没有查询到返回-1nPos2=sStr1.find('abc')printnPos2#查询到返回字符所在位置printsStr1.fi
系统 2019-09-27 17:56:53 1625
类装饰器propetyproperty是一种特殊的属性,访问它时会执行一段功能(函数)然后返回值classStudent:def__init__(self,name,birth):self.name=nameself.birth=birth@property#将一个方法伪装成属性defage(self):importtimereturntime.localtime().tm_year-self.birthalex=Student('alex',1930)p
系统 2019-09-27 17:56:49 1625
获取制定标签内容,以及HTML全部文本代码#-*-coding:utf-8-*-importrehtml="岗位职责:完成推荐算法、数据统计、接口、后台等服务器端相关工作必备要求:良好的自我驱动力和职业素养,工作积极主动、结果导向"#获得全部文本dr=re.compile(r'<[^>]+>',re.S)dd=dr.sub('',html)print(dd)print("*"*20)#取出p标签中的文本html_regex=r".*?(.*?)"resul
系统 2019-09-27 17:56:47 1625