- 军军小站|张军博客
搜索到与相关的文章
Python

python抽取pdf中内容

这两天一直在windows上做用python(版本是3.6)抽取pdf中内容的东西,主要就是从pdf中提取出里面的字体和表格内容。尝试了好些个库,现在算是找到比较符合我需求(比较好用)的pdf解析的了。在这个过程中,用了以下几个库:PDFminerPDFminer算是一个还算不错的吧,安装直接用pip安装就行。如下:pipinstallpdfminer3k它这个对pdf中内容做了好些个对象,用这些对象来存储不同的信息,比如表格有LTFigure对象存储、文

系统 2019-09-27 17:50:26 1896

Python

python之简单的get和post请求

1.json模块提供了一种很简单的方式来编码和解码JSON数据。其中两个主要的函数是json.dumps()和json.loads(),要比其他序列化函数库如pickle的接口少得多。下面演示如何将一个Python数据结构转换为JSON:'''遇到问题没人解答?小编创建了一个Python学习交流QQ群:857662006寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!'''importjsondata={'name':'ACME

系统 2019-09-27 17:50:20 1896

Python

Python中的模块和包概念介绍

模块概述如果说模块是按照逻辑来组织Python代码的方法,那么文件便是物理层上组织模块的方法。因此,**一个文件被看作是一个独立模块,一个模块也可以被看作是一个文件。模块的文件名就是模块的名字加上扩展名.py。与其它可以导入类(class)的语言不同,在Python中你导入的是模块或模块属性**。模块名称空间一个名称空间就是一个名称到对象的关系映射.导入模块导入模块整体(import)方式一复制代码代码如下:importmodule1importmodul

系统 2019-09-27 17:50:10 1896

Python

Python第一课

前言一个偶然的机会来到博客园,看到了vamei的博文,瞬间被大神言简意赅,深入浅出的Python快速课程所吸引,开始了一步一步的学习编程之路。同时也惊闻大神因抑郁症去世,真是天妒英才,感慨万千。有兴趣的可以看看大神生前的文章。https://www.cnblogs.com/vamei/archive/2012/09/13/2682778.html第一课Python的优缺点以及干什么用的,想必大家都很了解。主要有:简单易学,功能强大,可移植性强等,是人工智能

系统 2019-09-27 17:49:54 1896

Python

python3.6生成器yield用法实例分析

本文实例讲述了python3.6生成器yield用法。分享给大家供大家参考,具体如下:今天看源码的时候看到了一个比较有意思的函数:yield功能与return类似,都是返回定义的函数的一个结果,不同的是return返回后这次调用函数就结束了,除了返回值,其余临时变量都会被清除。而yield会停止在当前步,并保留其余变量的值,等下次调用该函数时,从yield的下一步继续往下运行。yield的好处是如果函数需要很大的内存,比方说需要计算并返回一个很大的数列,如

系统 2019-09-27 17:49:49 1896

Python

使用Protocol Buffers的C语言拓展提速Python程序的示例

ProtocolBuffers(类似XML的一种数据描述语言)最新版本2.3里,protoc―py_out命令只生成原生的Python代码。尽管PB(ProtocolBuffers)可以为C++语言生成快速解析和序列化代码,但是这种方式对于Python不适用,并且手动生成的已包装的代码需要非常大的维护工作。在讨论组里,这是一个常见的功能要求,由于一个必备的客户端组件―AppEngine(根据团队介绍名称为AppEngine),生成原生的Python代码有更

系统 2019-09-27 17:49:21 1896

Python

【Python3网络爬虫开发实战】3.3-正则表达式

【摘要】本节中,我们看一下正则表达式的相关用法。正则表达式是处理字符串的强大工具,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下。当然,对于爬虫来说,有了它,从HTML里提取想要的信息就非常方便了。1.实例引入说了这么多,可能我们对它到底是个什么还是比较模糊,下面就用几个实例来看一下正则表达式的用法。打开开源中国提供的正则表达式测试工具http://tool.oschina.net/regex/,输入待匹配的文本,然后选择常用的

系统 2019-09-27 17:48:57 1896

Python

python基础学习笔记(四)

python基础学习笔记(四)2013-04-1823:59虫师阅读(...)评论(...)编辑收藏列表本节继续讨论列表不同元组和字符串的地方:列表是可变的(mutable)----可以改变列表的内容,并且列表有很多有用的、专门的方法。List函数可以将一个字符串拆分成列表。>>>list('chongshi')['c','h','o','n','g','s','h','i']改变列表:元素赋值例如,我们想对一个列表中的某个元素赋值。>>>x=[1,2,3

系统 2019-09-27 17:48:57 1896

Python

python初始化定长列表

>>>lst=['x'forninrange(5)]>>>print(lst)['x','x','x','x','x']>>>lst=['z']*5>>>print(lst)['z','z','z','z','z']>>>lst=[0]*3>>>print(lst)[0,0,0]

系统 2019-09-27 17:48:48 1896