这篇博客做一个爬虫的实例今天刚看到一个新闻,在7月26日上映的《哪吒之魔童降世》,密钥第二次延期至10月26日。截止至9月17日,《哪吒之魔童降世》票房已超49亿票房,在豆瓣上对该电影的评价有好有坏。说实话,博主看了这个电影真的觉得蛮不错的,因此把短评中的差评爬取下来,看下差评包括哪些方面。目录一、BeautifulSoup二、xpath三、正则表达式一、BeautifulSoup首先需要了解下差评文字内容在哪些标签下:进入豆瓣该电影短评界面,检查元素:可
系统 2019-09-27 17:53:05 1830
1变量赋值:变量可以是字符串、序列、元组、1#author:hams.ali23#界面4line='-*'*205#数字直接可以计算67_var1='23'89#字符变量拼接10_var_2='\n\tmyageis'+_var11112#不可改变数值的组元13var=(2019,9,27)1415#变量解压16x,y,z=(2019,9,17)17print(x,y,z)18print(line)#分割19#多变量解压20data=['ali','eng
系统 2019-09-27 17:53:03 1830
Python中经常遇到这样那样的字符编码问题,尤其在处理网页源码时(特别是爬虫中):UnicodeDecodeError:‘XXX'codeccan'tdecodebytesinposition12-15:illegalmultibyte...每次看到上面这段文字的时候,感觉整个世界都昏暗了,然后就只能各种搜索找资料,过后就忘了。下次遇到时就让世界再昏暗一次。为了彻底解决这个拦路虎,今天咱们就好好的来唠嗑唠嗑。下面以汉字'哈'来解释作示例解释所有的问题,汉
系统 2019-09-27 17:53:00 1830
如下所示:#coding:utf-8importbinasciia='worker'#先把worker转换成二进制数据然后在用十六进制表示b=binascii.b2a_hex(a)printb#与b2a_hex相反printbinascii.a2b_hex(b)#这个功能和b2a_hex()一样c=binascii.hexlify(a)printc#这个功能和a2b_hex()一样printbinascii.unhexlify(c)######运行结果##
系统 2019-09-27 17:52:56 1830
知识汇总:1-Python语言里一切数据都是对象2-整数:1-python2:int----long(长整数)2-python3:中只有int没有long3-怎么查看类型---type(100)--有返回值--该类型---3-浮点数--小数:type(3.0)------没有double4-数字的运算:1-加法+2-减法-3-乘法*4-除法/1-在python39/4==2.25肯定带小数点等价python2-9//4==22-在python29/4==2
系统 2019-09-27 17:52:42 1830
#下载一个网页importrequestsimportreurl='https://www.biquge5200.cc/14_14621/'#模拟浏览器发送http请求response=requests.get(url)#编码方式response.encoding='utf-8',如果下载下来的网页内容有中文乱码现象就需要加上这一句话#网页源码html=response.text#[0]取列表下第0个元素.#eg:title的输出结果为:['斗神狂飙无弹窗
系统 2019-09-27 17:52:18 1830
前言:与第一篇的面向对象内容不同的是,第一篇中的面向对象更多的是与类、对象结合起来的概念粗浅理解,就是在编程历史中诞生的一种思想方法。这篇的面向对象编程,更多落实到在语言设计实现中,是如何体现面向对象这一设计思想的。本篇内容围绕python基础教程这段:在面向对象编程中,术语对象大致意味着一系列数据(属性)以及一套访问和操作这些数据的方法。使用对象而非全局变量和函数的原因有多个,下面列出了使用对象的最重要的好处。多态:可对不同类型的对象执行相同的操作,而
系统 2019-09-27 17:51:39 1830
前言今天就简单的对日志做个封装,实际工作中直接拿去用吧方法1"""------------------------------------@Time:2019/5/228:12@Auth:linux超@File:logfile.py@IDE:PyCharm@Motto:Realwarriors,daretofacethebleakwarning,daretofacetheincisiveerror!-----------------------------
系统 2019-09-27 17:51:39 1830
http://www.cnblogs.com/baiboy/p/django1.html摘要:Django的学习教程也是分门别类,形式不一。或是较为体系的官方文档,或者风格自由的博客文档,或者偏向实例的解析文档。即使官方文档,章节较多,文字阐述累赘,有时候我们只是关注某个功能用法而已,而自由博文最大的问题是互相抄袭,结构混乱,涵盖面小且错误较为明显。由此,本文结合学习期间资料梳理和项目开发经验,整理出一套较为常用实用的文章。适用于新手入门,无论C#,C,j
系统 2019-09-27 17:51:33 1830
本文实例为大家分享了python静态服务器的具体代码,供大家参考,具体内容如下#coding:utf-8importsocketimportmultiprocessingimportreHTML_ROOT_DIR="./html"classHTTPServer(object):#初始化def__init__(self):self.serversocket=socket.socket(socket.AF_INET,socket.SOCK_STREAM)sel
系统 2019-09-27 17:51:33 1830