Python

python selenium 查找隐藏元素 自动播放视频功能

在使用python做爬虫的过程中,有些页面的的部分数据是通过js异步加载的,js调用接口的请求中有时还带有些加密的参数很难破解无法使用requests这样的包直接爬取数据,因此需要借助seleniu来完成js的自动加载。通过selenium模拟浏览器的真是操作来获取页面中的所有请求,并且可以查找到一下页面上一些隐藏的元素,这些元素在html源码中无法看到,并且和能通过xpath和正则来捕获,因此需要使用selenium来查找隐藏元素,例如视频网站的播放按钮

系统 2019-09-27 17:57:29 2322

Python

Python爬虫帮你打包下载所有抖音好听的背景音乐,还不快收藏一起听歌

不知道什么时候开始,中国出现了南抖音、北快手的互文格局(东市买骏马,西市买鞍鞯…)。刚才提到了,之前比较喜欢刷抖音,对于我这种佛系程序猿,看网上这些整容妹子基本一个样。喜欢抖音主要是两个初衷,学做菜听音乐。朋友之前常说,人家抖音看妹子看的乐呵呵,你看人家做菜也能津津有味,一个人在那儿傻笑…民以食为天,我看到色香味俱全的菜,做的那么好吃的乐呵乐呵还不行么。抖音捧红了很多人,也让很多本不怎么让大家熟知的歌曲、BGM,经过翻唱、混剪与视频搭配,从而传播大街小巷。

系统 2019-09-27 17:56:15 2322

Python

Python3批量移动指定文件到指定文件夹方法示例

引言某人需求:以某excel中姓名信息为名建立一系列文件夹,分别将四个文件夹中与人名对应的文件汇总到该人名对应的文件夹中,共近200人,手工处理费时费力。需求分解:从excel中提取代号index和姓名信息name以index_name格式批量建立文件夹namefolder分别遍历四个文件夹及其子文件夹,将其中“文件名filename中包含姓名name”的文档移动到该人对应的新建的文件夹namefolder中excel内容:处理前:处理后:功能实现比较容易

系统 2019-09-27 17:54:26 2322

Python

有关python变量的6个概念,一次说透

1.变量不能独立存在在C++等语言中,变量的声明和赋值是可以分开的inta;a=343;而在python中却不行,在声明python变量的同时必须进行赋值操作a=343如果你直接使用一个不存在的变量,就会发生错误,NameError:name'b'isnotdefined2.变量是内存中数据的引用a=343这样代码被执行时,首先要在内存中创建出343这个对象,然后让a指向它,这便是引用。此后,我们在程序中使用变量a时,其实都是在使用343,python可以

系统 2019-09-27 17:51:55 2322

Python

Python学习资源 | 3个高性能开源计算机视觉库

0.OpenCV:OpenCV是在BSD许可下发布的,是开源计算机视觉库,对学术和商业都是免费的。具有C+、Python和Java接口,支持Windows、Linux、MacOS、IOS和Android。OpenCV是为了提高计算效率而设计的,并且非常注重实时应用程序。该库采用优化的C/C+语言编写,可利用多核处理.通过OpenCL启用,它可以利用底层异构计算平台的硬件加速。1.SimpleCV:SimpleCV是一个用于构建计算机视觉应用程序的开源框架。

系统 2019-09-27 17:49:06 2322

Python

python -u参数分别在python2和3中的情况

看到vscode执行python代码的时候,都会使用这个参数,特地去查了一下功能。简单看下官方文档,python-h,如下简单说就是缓存开关的标志,-u就是unbuffered。具体有什么用呢,可以看下这个例子,来自这里1,环境pyhton2.7importsyssys.stdout.write("stdout1")sys.stderr.write("stderr1")sys.stdout.write("stdout2")sys.stderr.write(

系统 2019-09-27 17:48:16 2322

Python

TensorFlow实战:SoftMax手写体MNIST识别(Python完整

今天这篇文章我们使用TensorFlow针对于手写体识别数据集MNIST搭建一个softmax的多分类模型。本文的程序主要分为两大模块,一个是对MNIST数据集的下载、解压、重构以及数据集的构建;另一个是构建softmax图及训练图。本程序主要是想去理解包含在这些代码里面的设计思想:TensorFlow工作流程和机器学习的基本概念。本文所使用的数据集和Python源代码都已经上传到我的GitHub(https://github.com/ml365/soft

系统 2019-09-27 17:48:13 2322

Python

Python --我的常用函数

昆明地图defkmdt(x):importmatplotlib.pyplotaspltimportjsonwithopen('km.json','rb')asf:data=json.load(f)forfeainrange(len(data['features'])):df=data['features'][fea]['geometry']['coordinates']forf1inrange(len(df)):df1=df[f1]forf2inrange

系统 2019-09-27 17:46:53 2322

Python

Python引用类型和值类型的区别与使用解析

Python数据类型分为值类型和引用类型,下面我们看下它们的区别:值类型:对象本身不允许修改,数值的修改实际上是让变量指向了一个新的对象包含:字符串、元组、数值,本身不允许被修改引用类型:对象本身可以修改,包含:列表、字典,本身允许修改例子:a=11printid(a)a=16printid(a)结果:43525053L57628312L修改值类型的值,只是让它指向一个新的内存地址,并不会改变变量b的值l=[1,2,3]printid(l)l[0]=0pr

系统 2019-09-27 17:38:02 2322

Python

学生时代的经历,利用Python在机房杀红蜘蛛,脱离老师控制!

这个为什么说是一次学生时代的经历呢,我的出发点并没有是为了吊胃口。确实,这个Python小应用,只能在学生时代用得着吧,尤其是高中和大学,如果你没有想到也没关系,看完我下面说的就会明白了。对红蜘蛛软件感到陌生?由于电脑教学机房都是没有投影仪的,所以才有了这款红蜘蛛控制软件,在局域网络上控制学生电脑,实现屏幕监视和远程控制的功能。简单来说,就是老师为了防止学生不好好上课,利用机房电脑去做其它事情的一种流氓类型软件。为何称之为牛皮糖软件?因为你的电脑都被老师控

系统 2019-09-27 17:54:31 2321

Python

python 之 Django框架(模板系统、过滤器、simple_tag

12.35Django模板系统{{}}和{%%},变量相关的用{{}},逻辑相关的用{%%}app02/views:#模板语言测试函数deftemplate_test(request):name="张三"dic={"name":"张三","age":16,"items":"sb"}list1=[11,22,33,44,55]​classPerson(object):def__init__(self,name):self.name=name​defdream

系统 2019-09-27 17:54:08 2321

Python

python进阶之自定义可迭代的类

自定义可迭代的类列表可以获取列表的长度,然后使用变量i对列表索引进行循环,也可以获取集合的所有元素,且容易理解。没错,使用列表的代码是容易理解,也很好操作,但这是要付出代价的。列表之所以可以用索引来快速定位其中的任何一个元素,是因为列表是一下子将所有的数据都装载在内存中,而且是一块连续的内存空间。当数据量比较小时,实现比较容易;当数据量非常大时,会非常消耗内存资源。而迭代就不同,迭代是读取多少元素,就将多少元素装载到内存中,不读取就不装载。这有点像处理XM

系统 2019-09-27 17:52:25 2321

Python

用Python实现一个简单的能够发送带附件的邮件程序的教程

基本思路就是,使用MIMEMultipart来标示这个邮件是多个部分组成的,然后attach各个部分。如果是附件,则add_header加入附件的声明。在python中,MIME的这些对象的继承关系如下。MIMEBase|--MIMENonMultipart|--MIMEApplication|--MIMEAudio|--MIMEImage|--MIMEMessage|--MIMEText|--MIMEMultipart一般来说,不会用到MIMEBase,

系统 2019-09-27 17:50:33 2321