Python - 军军小站|张军博客
Python

python selenium 查找隐藏元素 自动播放视频功能

在使用python做爬虫的过程中,有些页面的的部分数据是通过js异步加载的,js调用接口的请求中有时还带有些加密的参数很难破解无法使用requests这样的包直接爬取数据,因此需要借助seleniu来完成js的自动加载。通过selenium模拟浏览器的真是操作来获取页面中的所有请求,并且可以查找到一下页面上一些隐藏的元素,这些元素在html源码中无法看到,并且和能通过xpath和正则来捕获,因此需要使用selenium来查找隐藏元素,例如视频网站的播放按钮

系统 2019-09-27 17:57:29 2205

Python

002 Python解释器安装

首先我们来安装Python,Python3.5+以上即可1、首先进入网站下载:点击打开链接(或自己输入网址https://www.python.org/downloads/),进入之后如下图,选择图中红色圈中区域进行下载。2、下载完成后如下图所示3、双击exe文件进行安装,如下图,并按照圈中区域进行设置,切记要勾选打钩的框,然后再点击Customizeinstallation进入到下一步:4、对于上图中,可以通过Browse进行自定义安装路径,也可以直接点

系统 2019-09-27 17:56:39 2205

Python

python使用marshal模块序列化实例

本文实例讲述了python使用marshal模块序列化的方法,分享给大家供大家参考。具体方法如下:先来看看下面这段代码:importmarshaldata1=['abc',12,23,'jb51']#几个测试数据data2={1:'aaa',"b":'dad'}data3=(1,2,4)output_file=open("a.txt",'wb')#把这些数据序列化到文件中,注:文件必须以二进制模式打开marshal.dump(data1,output_fi

系统 2019-09-27 17:56:27 2205

Python

python--读写txt,csv文件(read,readline

python读写文件类型主要有txt,csv,excel,sas,spss和mysql,在这里主要介绍用的最多的txt和csv文件读写方式主要分为三种:1.python自带的函数read,readline,readlines,write2.pandas模块中的read_csv,to_csv3.csv模块中的reader,writer下面以txt为例进行介绍,csv文件的读写基本与txt一致,把文件名换了即可txt原内容learnpythonlearnpan

系统 2019-09-27 17:51:35 2205

Python

Python函数的几种参数形式

在Python中定义函数,可以用必选参数(位置参数),默认参数,可变参数,关键字参数和命名关键字参数,这5种参数都可以组合使用。但参数定义的顺序必须是:必选参数(位置参数)默认参数可变参数命名关键字参数关键字参数例如:定义:deff1(x,y=0,*args,z,**kw):print(x,y,args,z,kw)调用:f1(1,2,3,4,5,z=6,p=7,q=8)输出:12(3,4,5)6,{'p':7,'q':8}定义:deff2(x,y=0,*,

系统 2019-09-27 17:50:10 2205

Python

python学习笔记:字典的使用示例详解

经典字典使用函数dict:通过其他映射(比如其他字典)或者(键,值)这样的序列对建立字典。当然dict成为函数不是十分确切,它本质是一种类型。如同list。复制代码代码如下:items=[('name','zhang'),('age',42)]d=dict(items)d['name']len(d):返回项的数量d[k]:返回键k上面的值。d[k]=v:将k对应的值设置为k。deld[k]:删除字典中的这一项。kind:检查d中是否含有键为k的项。注:只能

系统 2019-09-27 17:48:26 2205

Python

centos7安装Python3及出现BUG记录

一、安装(傻瓜式)1、mkdir/usr/local/python32、cd/usr/local/python33、wgethttps://www.python.org/ftp/python/3.6.5/Python-3.6.5.tgz4、yum-yinstallzlib-develbzip2-developenssl-develncurses-develsqlite-develreadline-develtk-develgdbm-develdb4-dev

系统 2019-09-27 17:47:23 2205

Python

十条建议帮你提高Python编程效率

程序员的时间很宝贵,Python这门语言虽然足够简单、优雅,但并不是说你使用Python编程,效率就一定会高。要想节省时间、提高效率,还是需要注意很多地方的。今天就与大家分享资深Python程序员总结的10点建议,帮助大家大幅节省开发时间。1.不使用分号使用分号在Python中是可选的:与其他面向对象语言不同,你不需要在每一条语句后面使用分号。这看起来很简单,似乎也节省不了多少时间;但一旦你的代码量扩展到数千号,这些分号就变得分心且没有必要键入。2.使用称

系统 2019-09-27 17:38:31 2205

Python

Python实现文件复制删除

用python实现了一个小型的工具。其实只是简单地把debug目录下的配置文件复制到指定目录,把Release下的生成文件复制到同一指定,过滤掉不需要的文件夹(.svn),然后再往这个指定目录添加几个特定的文件。这个是我的第一个python小程序。下面就来看其代码的实现。首先插入必要的库:importosimportos.pathimportshutilimporttime,datetime然后就是一大堆功能函数。第一个就是把某一目录下的所有文件复制到指定

系统 2019-09-27 17:37:40 2205

Python

你不能不知道的八种 Python 图像库的图片读取方法总结

目录一、前言二、opencv——cv2.imread三、PIL——PIL.Image.open四、matplotlib——matplotlib.image.imread五、scipy.misc——scipy.misc.imread六、skimage——skimage.io.imread七、Tensorflow——tf.image.decode八、总结#、参考文章一、前言在研究深度学习计算机视觉的时候,经常需要进行图像读取,但是各种第三方库的方法又不一样,用

系统 2019-09-27 17:56:56 2204

Python

Python中的True,False条件判断实例分析

本文实例讲述了Python中的True,False条件判断用法。分享给大家供大家参考。具体分析如下:对于有编程经验的程序员们都知道条件语句的写法:以C++为例:复制代码代码如下:if(condition){doSomething();}对于Python中的条件判断语句的写法则是下面的样子:复制代码代码如下:if(condition):doSomething()那么对于条件语句中的condition什么时候为真什么时候为假呢?在C++/Java等高级语言中,

系统 2019-09-27 17:53:13 2204

Python

Python字典(Dictionary)序列化和反序列化

最近在项目中遇到把字典类型的数据保存文件,在另一个模块又把文件中的内容转换为字典的需求,在这里记录一下。字典保存成文件importpickledata=dict(key="aaa",val=22)withopen("data.txt","wb")asf:pickle.dump(data,f)文件读取为字典importpickledata={}withopen("data.txt","rb")asf:data=pickle.load(f)print(data

系统 2019-09-27 17:51:02 2204

Python

大数据入门选择python大数据么?现在程序员都是喜欢这个

Python是适合做大数据分析的计算机语言吗?如今是一个大数据时代,通过数据分析,我们可以得到任何我们想知道的事情,充分挖掘数据的价值。之前有人说过JAVA语言是最适合做数据分析的计算机编程语言之一,在这里,我想说其实Python大数据也是大数据分析最受欢迎的编程语言。Python是一个强大的,灵活的,开放的,易于学习的源语言,使用方便,并具有强大的数据操作和分析库。其简单的语法使编程新手很容易学习和掌握,经历过Matlab,,C/C++,java,或Vi

系统 2019-09-27 17:50:38 2204

Python

Python统计分析模块statistics用法示例

本文实例讲述了Python统计分析模块statistics用法。分享给大家供大家参考,具体如下:一计算平均数函数mean()>>>importstatistics>>>statistics.mean([1,2,3,4,5,6,7,8,9])#使用整数列表做参数5>>>statistics.mean(range(1,10))#使用range对象做参数5>>>importfractions>>>x=[(3,7),(1,21),(5,3),(1,3)]>>>y=

系统 2019-09-27 17:50:27 2204

Python

基于Python实现对PDF文件的OCR识别

最近在做一个项目的时候,需要将PDF文件作为输入,从中输出文本,然后将文本存入数据库中。为此,我找寻了很久的解决方案,最终才确定使用tesseract。所以不要浪费时间了,我们开始吧。1.安装tesseract在不同的系统中安装tesseract非常容易。为了简便,我们以Ubuntu为例。在Ubuntu中你仅仅需要运行以下命令:这将会安装支持3种不同语言的tesseract。2.安装PyOCR现在我们还需要安装tesseract的Python接口。幸运的是

系统 2019-09-27 17:37:44 2204