搜索到与相关的文章
Python

python抽取pdf中内容

这两天一直在windows上做用python(版本是3.6)抽取pdf中内容的东西,主要就是从pdf中提取出里面的字体和表格内容。尝试了好些个库,现在算是找到比较符合我需求(比较好用)的pdf解析的了。在这个过程中,用了以下几个库:PDFminerPDFminer算是一个还算不错的吧,安装直接用pip安装就行。如下:pipinstallpdfminer3k它这个对pdf中内容做了好些个对象,用这些对象来存储不同的信息,比如表格有LTFigure对象存储、文

系统 2019-09-27 17:50:26 2050

Python

python之简单的get和post请求

1.json模块提供了一种很简单的方式来编码和解码JSON数据。其中两个主要的函数是json.dumps()和json.loads(),要比其他序列化函数库如pickle的接口少得多。下面演示如何将一个Python数据结构转换为JSON:'''遇到问题没人解答?小编创建了一个Python学习交流QQ群:857662006寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!'''importjsondata={'name':'ACME

系统 2019-09-27 17:50:20 2050

Python

Python配置文件解析模块ConfigParser使用实例

一、ConfigParser简介ConfigParser是用来读取配置文件的包。配置文件的格式如下:中括号“[]”内包含的为section。section下面为类似于key-value的配置内容。复制代码代码如下:[db]db_host=127.0.0.1db_port=22db_user=rootdb_pass=rootroot[concurrent]thread=10processor=20中括号“[]”内包含的为section。紧接着section为

系统 2019-09-27 17:50:05 2050

Python

python对Excel的读取

在python自动化中,经常会遇到对数据文件的操作,比如添加多名员工,但是直接将员工数据写在python文件中,不但工作量大,要是以后再次遇到类似批量数据操作还会写在python文件中吗?应对这一问题,可以将数据写excel文件,针对excel文件进行操作,完美解决。本文仅介绍python对excel的操作安装xlrd库xlrd库官方地址:https://pypi.org/project/xlrd/pipinstallxlrd笔者在安装时使用了pip3in

系统 2019-09-27 17:49:41 2050

Python

python-文件操作

1、a.log文件中包含以下eddy|123|18jay|456|202、目标结构:2.1、['eddy|123|18','jay|456|20']2.2、[['eddy','123','18'],['jay','456','20']]defli(f1):new_li=[]withopen('a.log',mode='r',encoding='utf-8')asf1:data=f1.read()data1=data.split('\n')returndat

系统 2019-09-27 17:49:35 2050

Python

python多线程简易版 - 线程池THREADPOOL及回调函数

threadpoolmakeRequests的原型如下defmakeRequests(callable_,args_list,callback=None,exc_callback=_handle_thread_exception),可以看出第一个参数是线程将要启动任务函数,第二个是要传个任务函数的参数列表,第三个是回调函数,可以用于收集任务结束后的结果或者环境清理args_list中每一项要么是一个单独的变量,要么是一个2个元素的元组,该元组第1项是位置参

系统 2019-09-27 17:49:19 2050

Python

python多线程与多进程及其区别详解

前言个人一直觉得对学习任何知识而言,概念是相当重要的。掌握了概念和原理,细节可以留给实践去推敲。掌握的关键在于理解,通过具体的实例和实际操作来感性的体会概念和原理可以起到很好的效果。本文通过一些具体的例子简单介绍一下python的多线程和多进程,后续会写一些进程通信和线程通信的一些文章。python多线程python中提供两个标准库thread和threading用于对线程的支持,python3中已放弃对前者的支持,后者是一种更高层次封装的线程库,接下来均

系统 2019-09-27 17:48:46 2050

Python

基于Python实现的扫雷游戏实例代码

本文实例借鉴mvc模式,核心数据为model,维护1个矩阵,0表无雷,1表雷,-1表已经检测过。本例使用python的tkinter做gui,由于没考虑可用性问题,因此UI比较难看,pygame更有趣更强大更好看,做这些小游戏更合适,感兴趣的读者可以尝试一下!具体的功能代码如下:#-*-coding:utf-8-*-importrandomimportsysfromTkinterimport*classModel:"""核心数据类,维护一个矩阵"""def

系统 2019-09-27 17:47:00 2050

Python

集成学习②——Adaboost算法原理及python实现

一、AdaBoost算法原理上一偏博客总结过,集成学习基于弱学习器之间是否依赖分为Boosting和Bagging两类,Adaboost就是Boosting中的典型代表。其核心思想是针对同一个训练集训练不同的学习器,然后将这些弱学习器集合起来,构造一个更强的最终学习算法AdaBoost是英文"AdaptiveBoosting"(自适应增强)的缩写,它的自适应在于:基于每一个分类器的误差率,来更新所有样本的权重,前一个分类器被错误分类的样本的权值会增大,而正

系统 2019-09-27 17:46:50 2050

Python

在Python操作时间和日期之asctime()方法的使用

asctime()方法将一个元组或struct_time表示的时间返回gmtime()或localtime(),以下列格式的24个字符的字符串:“TueFeb1723:21:052015”。语法以下是asctime()方法的语法:time.asctime([t]))参数t--这是9个元素或struct_time元组表示所返回gmtime的()或localtime()函数的时间。返回值此方法返回以下形式的24个字符的字符串:“TueFeb1723:21:05

系统 2019-09-27 17:46:44 2050