Python - 军军小站|张军博客
Python

Python3网络爬虫入门详解(一)

爬虫的概念:爬虫就是获取网页并提取和保存信息的自动化程序爬虫的分类:主要有四类:通用网络爬虫,聚焦网络爬虫,增量式网络爬虫,深层网络爬虫爬虫的流程:常见的几种爬虫问题:主要有五类:静态网页的爬取,Ajax数据的爬取,动态渲染页面爬取,验证码的识别,代理的使用常见的爬虫框架:pyspider框架,Scrapy框架分布式爬虫:在多台机器上运行爬虫程序爬虫的一些常用"库":解析库:lxml;BeautifulSoup;pyquery;tesserocr请求库:r

系统 2019-09-27 17:56:05 1824

Python

Python 最强 IDE 详细使用指南!

点击上方“开发者技术前线”,选择“星标”21:15在看真作者:JahongirRahmonov|机器之心编译参与:魔王PyCharm是一种PythonIDE,可以帮助程序员节约时间,提高生产效率。那么具体如何使用呢?本文从PyCharm安装到插件、外部工具、专业版功能等进行了一一介绍,希望能够帮助到大家。机器之心之前也没系统地介绍过PyCharm,怎样配置环境、怎样DeBug、怎样同步GitHub等等可能都是通过经验或者摸索学会的。在本文中,我们并不会提供

系统 2019-09-27 17:55:36 1824

Python

python基于pdfminer库提取pdf文字代码实例

安装pdfminer库windows下安装pdfminer3kpipinstallpdfminer3kLiunx下安装pdfminerpipinstallpdfminer代码frompdfminer.pdfparserimportPDFParser,PDFDocumentfrompdfminer.converterimportPDFPageAggregatorfrompdfminer.layoutimportLAParams,LTTextBoxHorizo

系统 2019-09-27 17:55:31 1824

Python

python中正则表达式的使用详解

从学习Python至今,发现很多时候是将Python作为一种工具。特别在文本处理方面,使用起来更是游刃有余。说到文本处理,那么正则表达式必然是一个绝好的工具,它能将一些繁杂的字符搜索或者替换以非常简洁的方式完成。我们在处理文本的时候,或是查询抓取,或是替换.一.查找如果你想自己实现这样的功能模块,输入某一个ip地址,得到这个ip地址所在地区的详细信息.然后你发现http://ip138.com可以查出很详细的数据但是人家没有提供api供外部调用,但是我们可

系统 2019-09-27 17:55:15 1824

Python

Python学到什么程度才可以去找工作?掌握这4点足够了!

大家在学习Python的时候,有人会问“Python要学到什么程度才能出去找工作”,对于在Python培训机构学习Python的同学来说这都不是问题,因为按照Python课程大纲来,一般都不会有什么问题,而对于自学Python来说,那就比较难掌握,冒然出去找工作非常容易受打击,从而失去学习Python的信心。接下来我们就来看看Python学到什么程度才算是真正学会Python可以去一展身手。一、确立目标、了解需求做什么事情都要先确定好目标,才不至于迷失方向

系统 2019-09-27 17:54:31 1824

Python

python脚本之一键移动自定格式文件方法实例

前言尝试用python语言写脚本是好的开始,证明我们有了自动化的思想,这对优秀的程序开发人员是很重要的,电子计算机本来就是要减少重复工作的。首先我们要用到python自带的一些包,python语言让人爱不释手的一点,就是它自带了许多简捷迅速的包,堪称攻坚手术刀,用到的包:os(操作系统相关库),shutil(高级的文件,文件夹,压缩包处理模块)。经典的开头#-*-coding:utf-8-*-importosimportshutilimportsystyp

系统 2019-09-27 17:54:28 1824

Python

Python Flask简易教程

1.WhyFlask?官方文档详细,学习成本低,有利于项目其他成员迅速投入开发框架轻,可扩展性高,且有很多好用的扩展(extension)该框架仍在积极地维护和开发2.将要介绍到的Flask的扩展flaskblueprint用于注册、管理路由flask_restful用于支持构建RESTAPIsflask_migrate用于管理数据库版本迁移flask_sqlalchemyorm,用于映射数据库对象,提供数据操作方法3.项目结构-project-user-

系统 2019-09-27 17:53:26 1824

Python

python Pandas库基础分析之时间序列的处理详解

前言在使用Python进行数据分析时,经常会遇到时间日期格式处理和转换,特别是分析和挖掘与时间相关的数据,比如量化交易就是从历史数据中寻找股价的变化规律。Python中自带的处理时间的模块有datetime,NumPy库也提供了相应的方法,Pandas作为Python环境下的数据分析库,更是提供了强大的日期数据处理的功能,是处理时间序列的利器。1、生成日期序列主要提供pd.data_range()和pd.period_range()两个方法,给定参数有起始

系统 2019-09-27 17:53:00 1824

Python

Python实现最常见加密方式详解

前言我们所说的加密方式,都是对二进制编码的格式进行加密的,对应到Python中,则是我们的Bytes。所以当我们在Python中进行加密操作的时候,要确保我们操作的是Bytes,否则就会报错。将字符串和Bytes互相转换可以使用encode()和decode()方法。如下所示:#方法中不传参数则是以默认的utf-8编码进行转换In[1]:'南北'.encode()Out[1]:b'\xe5\x8d\x97\xe5\x8c\x97'In[2]:b'\xe5\

系统 2019-09-27 17:52:59 1824

Python

理解python中生成器用法

生成器(generator)概念生成器不会把结果保存在一个系列中,而是保存生成器的状态,在每次进行迭代时返回一个值,直到遇到StopIteration异常结束。生成器语法生成器表达式:通列表解析语法,只不过把列表解析的[]换成()生成器表达式能做的事情列表解析基本都能处理,只不过在需要处理的序列比较大时,列表解析比较费内存。>>>gen=(x**2forxinrange(5))>>>genat0x0000000002FB7B40>>>>forgingen:

系统 2019-09-27 17:52:55 1824

Python

Python3 queue队列模块详细介绍

queue介绍queue是python中的标准库,俗称队列。在python中,多个线程之间的数据是共享的,多个线程进行数据交换的时候,不能够保证数据的安全性和一致性,所以当多个线程需要进行数据交换的时候,队列就出现了,队列可以完美解决线程间的数据交换,保证线程间数据的安全性和一致性。注意:在python2.x中,模块名为Queuequeue模块有三种队列及构造函数Pythonqueue模块的FIFO队列先进先出。queue.Queue(maxsize)LI

系统 2019-09-27 17:52:43 1824

Python

python之yield和Generator深入解析

首先我们从一个小程序导入,各定一个list,找出其中的素数,我们会这样写importmathdefis_Prims(number):ifnumber==2:returnTrue//除2以外的所有偶数都不是素数elifnumber%2==0:returnFalse//如果一个数能被除1和本身之外的数整除,则为合数。其实我们的判定范围到根号n就可以forcurinrange(2,int(math.sqrt(number))+1,2):ifnumber%cur=

系统 2019-09-27 17:52:34 1824

Python

python学习笔记——循环

for我们先来看一下for语句的格式:foriinrange(0,5):print(i)其中range相当于一个迭代器。我们可以这么尝试:print(list(range(0,5)))输出很简单了,就是01234当然了这里的迭代器可以用自己的list比如:cgg=["cgg","cgg1","cgg2"]foriincgg:print(i)输出结果就是三个字符串以此输出。while循环语句当然少不了while了先来看看while的格式:whilecgg<1

系统 2019-09-27 17:51:52 1824

Python

Python虚拟环境的原理及使用详解

Python的虚拟环境极大地方便了人们的生活。本指南先介绍虚拟环境的基础知识以及使用方法,然后再深入介绍虚拟环境背后的工作原理。注意:本指南在macOSMojave系统上使用最新版本的Python3.7.x。1.为什么使用虚拟环境?虚拟环境为一系列潜在问题提供简单的解决方案,尤其是在以下几个方面:允许不同的项目使用不同版本的程序包,从而解决依赖性问题。例如,可以将ProjectAv2.7用于ProjectX,并将PackageAv1.3用于ProjectY

系统 2019-09-27 17:51:02 1824

Python

解读Python中 locals() 和 globals() 内置函数

首先globals()和locals()是作用于作用域下的内置函数,所以我将它们分为作用域类型的内置函数1.作用域相关:1)globals()#返回全局作用域中的所有名字2)locals()#返回本地作用域中的所有名字可能对于这个作用域相关的内置函数,大家一接触都会很懵,这个东西是干什么的?它怎么用?今天小编就给大家来解释一下,首先我们来先看下官方的解释:globals()——获取全局变量的字典locals()——获取执行本方法所在命名空间内的局部变量的字

系统 2019-09-27 17:50:51 1824