Python

python使用scrapy自动爬取多个网页

前面介绍的scrapy爬虫只能爬取单个网页。如果我们想爬取多个网页。比如网上的小说该如何如何操作呢。比如下面的这样的结构。是小说的第一篇。可以点击返回目录还是下一页对应的网页代码:我们再看进入后面章节的网页,可以看到增加了上一页对应的网页代码:通过对比上面的网页代码可以看到.上一页,目录,下一页的网页代码都在下的元素的href里面。不同的是第一章只有2个元素,从二章开始就有3个元素。因此我们可以通过下元素的个数来判决是否含有上一页和下一页的页面。代码如下最

系统 2019-09-27 17:53:35 2517

Python

解决win7操作系统Python3.7.1安装后启动提示缺少.dll文件问题

错误提示图片首先,我的操作系统是win7旗舰版,安装Python3.7.1之后启动时,提示如图错误,网上比较多的是两种处理方法:(1)安装Windows补丁程序(2)安装VCredit.exe第一种方案我这边下载了KB3118401、KB2999226,但是双击安装的时候安装不了;第二种方案大家都推荐的是安装v++2015,也安装成功了,但是安装后仍然报错。然后看着网上的推荐时间都比较早,我这边考虑是不是安装2017版本的会解决问题,因为2017除了兼容2

系统 2019-09-27 17:52:21 2517

Python

用Python识别人脸,人种等各种信息

最近几天了解了一下人脸识别,应用场景可以是图片标注,商品图和广告图中有没有模特,有几个模特,模特的性别,年龄,颜值,表情等数据的挖掘。基础的识别用dlib来实现,dlib是一个机器学习的包,主要用C++写的,但是也有Python版本。其中最流行的一个功能是FacialLandmarkDetection,配备已经训练好的轮廓预测模型,叫shape_predictor_68_face_landmarks.dat,从名字就可以看出,它可以检测出面部的68个关键点

系统 2019-09-27 17:52:05 2517

Python

简单介绍Python中的len()函数的使用

函数:len()1:作用:返回字符串、列表、字典、元组等长度2:语法:len(str)3:参数:str:要计算的字符串、列表、字典、元组等4:返回值:字符串、列表、字典、元组等元素的长度5:实例5.1、计算字符串的长度:>>>s="hellogoodboydoiido">>>len(s)215.2、计算列表的元素个数:>>>l=['h','e','l','l','o']>>>len(l)55.3、计算字典的总长度(即键值对总数):>>>d={'num':1

系统 2019-09-27 17:50:50 2517

Python

Python 变量类型详解

变量存储在内存中的值。这就意味着在创建变量时会在内存中开辟一个空间。基于变量的数据类型,解释器会分配指定内存,并决定什么数据可以被存储在内存中。因此,变量可以指定不同的数据类型,这些变量可以存储整数,小数或字符。变量赋值Python中的变量赋值不需要类型声明。每个变量在内存中创建,都包括变量的标识,名称和数据这些信息。每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。等号(=)用来给变量赋值。等号(=)运算符左边是一个变量名,等号(=)运算符右边是

系统 2019-09-27 17:50:28 2517

Python

Python照片合成

文章目录前言Github效果实现过程整体代码前言看电影的时候发现一个照片墙的功能,觉得这样生成照片挺好玩的,于是就动手用Python做了一下,觉得用来作照片纪念的效果可能会不错。Githubhttps://github.com/jiandi1027/photo.git效果实现过程1.获取图片文件夹的图片个数N,将底图拆分成XY块区域,且使X*Y(为了保证整体的协调,会舍弃几张图片,比如5张时可能只取22的4张图片)#打开图片base=Image.open(

系统 2019-09-27 17:50:27 2517

Python

Python字体反爬教科书级别的网站-猫眼电影

一.问题可以看到,猫眼网电影评分,票房等的数据在响应的html中并不是直接提供给你的。这里的xefcf,xef87等数据,是以‘特殊符号’的形式显示出来的。可以发现这里请求了一个woff字体文件,而xefcf,xef87等数据的规则就是在这其中的。所以我们只需要在请求这个网页的同时,截去这部分style,然后获得woff地址,将它下载到本地,进行解析,就可以实现对评分的解密了。但是再来看下面,当同一部电影的页面刷新时。这里的评分编码改变了,下面请求的wof

系统 2019-09-27 17:50:24 2517

Python

Python简单的数据分析:词云分析周杰伦《晴天》

直接上代码实现效果wordcloud还提供了命令行版wordcloud-cli,一行命令即可。下面进行歌词的情感分析情感分析结果s1=SnowNLP(s.sentences[0])s1.sentiments0.8849970682062196#正向情感#分析好不容易又能再多爱一天s1=SnowNLP(s.sentences[-2])s1.sentiments0.21646625648493734#这个情绪就比较负面了

系统 2019-09-27 17:48:32 2517

Python

简单实现python调用c#dll动态链接库

在python调用c#dll库时要先安装库clr,即安装pythonnet,参考文章:https://www.cnblogs.com/kevin-Y/p/10235125.html(为在python中使用dotnet程序安装clr)但是输入命令后遇到错误“'pip'不是内部或外部命令,也不是可运行的程序”,解决办法:https://blog.csdn.net/miss85246/article/details/81069276,将python路径下的Scr

系统 2019-09-27 17:47:00 2517

Python

Python操作redis实例小结【String、Hash、List、Set等】

本文实例总结了Python操作redis方法。分享给大家供大家参考,具体如下:python连接方式可参考:https://www.jb51.net/article/161353.htm这里介绍详细使用1、String操作redis中的String在在内存中按照一个name对应一个value来存储set()#在Redis中设置值,默认不存在则创建,存在则修改r.set('name','zhangsan')'''参数:set(name,value,ex=Non

系统 2019-09-27 17:55:26 2516

Python

在Python的列表中利用remove()方法删除元素的教程

remove()方法从列表中删除第一个obj。语法以下是remove()方法的语法:list.remove(obj)参数obj--这是可以从列表中移除该对象返回值此方法不返回任何值,但从列表中删除给定的对象例子下面的例子显示了remove()方法的使用#!/usr/bin/pythonaList=[123,'xyz','zara','abc','xyz'];aList.remove('xyz');print"List:",aList;aList.remov

系统 2019-09-27 17:46:57 2516

Python

Python内置函数清单

作者:Vamei出处:http://www.cnblogs.com/vameiPython内置(built-in)函数随着python解释器的运行而创建。在Python的程序中,你可以随时调用这些函数,不需要定义。最常见的内置函数是:print("HelloWorld!")在Python教程中,我们已经提到下面一些内置函数:基本数据类型type()反过头来看看dir()help()len()词典len()文本文件的输入输出open()循环设计range()

系统 2019-09-27 17:57:14 2515

Python

python运维开发常用模块(四)文件对比模块difflib

1.difflib介绍difflib作为Python的标准库模块,无需安装,作用是对比文本之间的差异,且支持输出可读性比较强的HTML文档,与Linux下的diff命令相似。我们可以使用difflib对比代码、配置文件的差别,在版本控制方面是非常有用。Python2.3或更高版本默认自带difflib模块,无需额外安装。示例1:两个字符串的差异对比[yhl@myhostpart2]$catsimple1.py#!/usr/bin/python#_*_cod

系统 2019-09-27 17:56:47 2515

Python

python爬虫实现中英翻译词典

本文实例为大家分享了python爬虫实现中英翻译词典的具体代码,供大家参考,具体内容如下通过根据某平台的翻译资源,提取出翻译信息,并展示出来,包括输入,翻译,输出三个过程,主要利用python语言实现(python3.6),抓取信息展示。importurllib.requestimporturllib.parseimportjsondefen_zh(content):url='http://fanyi.baidu.com/v2transapi'head={

系统 2019-09-27 17:56:29 2515

Python

python基础之九九乘法表

'''1*1=11*2=22*2=41*3=32*3=63*3=91*4=42*4=83*4=124*4=16..................................................9*9=81'''#第一种方式foriinrange(1,10):print()#用来保证下面j的循环结束后,再次进入i循环时,输出回车,区分上下两行forjinrange(1,i+1):print("{}*{}={}".format(j,i,j*i

系统 2019-09-27 17:56:25 2515