这篇博客做一个爬虫的实例今天刚看到一个新闻,在7月26日上映的《哪吒之魔童降世》,密钥第二次延期至10月26日。截止至9月17日,《哪吒之魔童降世》票房已超49亿票房,在豆瓣上对该电影的评价有好有坏。说实话,博主看了这个电影真的觉得蛮不错的,因此把短评中的差评爬取下来,看下差评包括哪些方面。目录一、BeautifulSoup二、xpath三、正则表达式一、BeautifulSoup首先需要了解下差评文字内容在哪些标签下:进入豆瓣该电影短评界面,检查元素:可
系统 2019-09-27 17:53:05 2120
目录第十五章、Python多线程同步锁,死锁和递归锁1.引子:2.同步锁3.死锁引子:4.递归锁RLock原理:不多说,放代码总结:5.大总结第十五章、Python多线程同步锁,死锁和递归锁1.引子:1.创建线程对象t1=threading.Thread(target=say,args=('tony',))2.启动线程t1.start()后面又说了两个点就是join和守护线程的概念以上就是python多线程的基本使用说明:前面说的两个功能是相互独立的,
系统 2019-09-27 17:51:52 2120
在用BeautifulSoup进行抓取页面的时候,会各种各样的编码错误。可以通过在beautifulsoup中指定字符编码,解决问题。复制代码代码如下:importurllib2fromBeautifulSoupimportBeautifulSouppage=urllib2.urlopen('http://www.163.com');soup=BeautifulSoup(page,from_encoding="gb2312")printsoup.origi
系统 2019-09-27 17:51:09 2120
函数:split()Python中有split()和os.path.split()两个函数,具体作用如下:split():拆分字符串。通过指定分隔符对字符串进行切片,并返回分割后的字符串列表(list)os.path.split():按照路径将文件名和路径分割开一、函数说明1、split()函数语法:str.split(str="",num=string.count(str))[n]参数说明:str:表示为分隔符,默认为空格,但是不能为空('')。若字符串
系统 2019-09-27 17:50:49 2120
本文实例讲述了Python学习笔记之集合的概念和简单使用。分享给大家供大家参考,具体如下:集合概念解释:一个包含唯一元素的可变和无序的集合数据类型。集合的一个用途是快速删除列表中的重复项。numbers=[1,2,6,3,1,1,6]unique_nums=set(numbers)print(unique_nums)#{1,2,3,6}支持in运算符,使用add方法将元素添加到集合中,并使用pop方法删除元素(会随机删除一个元素)fruit={"apple
系统 2019-09-27 17:50:46 2120
如下所示:#!/usr/bin/envpython3#-*-coding:utf-8-*-importsqlite3conn=sqlite3.connect('test.db')#创建一个Cursor:cursor=conn.cursor()#查询记录:conn=sqlite3.connect('calendar.db')cursor=conn.cursor()#执行查询语句:cursor.execute('select*fromperpetualCale
系统 2019-09-27 17:50:18 2120
SOAP.py客户机和服务器SOAP.py包含的是一些基本的东西。没有Web服务描述语言(WebServicesDescriptionLanguage,WSDL)或者任何其它附加的东西,只有用Python实现的SOAP客户机和服务器的透明支持。甚至这个包中的一个很好的功能也只是与基础架构相关:SOAP.py支持安全套接字层(SSL)用于加密的SOAP传输。为使用这个功能,您必须安装M2Crypto,M2Crypto是一个库,包含各种加密工具和格式,从RSA
系统 2019-09-27 17:49:38 2120
介绍这个例子主要利用turtle库实现根据输入动态展示不同机器人的图像和属性信息。代码部分非原创只是做了些许修改和整理使得更易阅读。图片和文件资源请访问git仓库获取:https://gitee.com/indexman/python-core涉及以下知识点:文件读取字典turtle库的使用控制语句实现的效果代码#!/bin/python3fromturtleimport*fromrandomimportchoicescreen=Screen()scree
系统 2019-09-27 17:49:09 2120
这篇快文介绍了使用Gmail作为您的e-mail服务器,通过Python的内置SMTP库发送电子邮件。它并不复杂,我保证。下面是如何在Python中登录GMail:importsmtplib#Thebelowcodeneverchanges,thoughobviouslythosevariablesneedvalues.session=smtplib.SMTP('smtp.gmail.com',587)session.ehlo()session.start
系统 2019-09-27 17:49:08 2120
python在抓取制定网站的错误提示:ssl.SSLCertVerificationError:[SSL:CERTIFICATE_VERIFY_FAILED]certificateverifyfailed:selfsignedcertificateincertificatechain(_ssl.c:1056)解决方式:在使用请求方法时添加一个参数verify=false就行了,如下:response=self.lagou_session.get(url=u
系统 2019-09-27 17:48:53 2120