本文利用Python3爬虫抓取豆瓣图书Top250,并利用xlwt模块将其存储至excel文件,图片下载到相应目录。旨在进行更多的爬虫实践练习以及模块学习。工具1.Python3.52.BeautifulSoup、xlwt模块开始动手首先查看目标网页的url:https://book.douban.com/top250?start=0,然后我尝试了在代码里直接通过字符串连接仅改变”start=“后面的数字的方法来遍历所有的250/25=10页内容,但是后来
系统 2019-09-27 17:53:39 2100
英文文档classmethod(function)Returnaclassmethodforfunction.Aclassmethodreceivestheclassasimplicitfirstargument,justlikeaninstancemethodreceivestheinstance.Todeclareaclassmethod,usethisidiom:classC:@classmethoddeff(cls,arg1,arg2,...):.
系统 2019-09-27 17:52:28 2100
最近学习《Python参考手册》学到Class部分,遇到了类的构造析构部分的问题:1、什么时候构造?2、什么时候析构?3、成员变量如何处理?4、Python中的共享成员函数如何访问?------------------------探索过程:1、经过查找,Python中没有专用的构造和析构函数,但是一般可以在__init__和__del__分别完成初始化和删除操作,可用这个替代构造和析构。还有一个__new__用来定制类的创建过程,不过需要一定的配置,此处不
系统 2019-09-27 17:51:55 2100
1.交换变量值2.将一列表中的所有元素拼接成字符串3.查找list中最高频率的值4.检查两个单词是否是字谜(组成的字母和对应数量一致)5.反转字符串6.反转列表7.转置2维数组8.链式比较9.链式函数调用10.复制列表11.DictionaryGet12.按值排序字典13.ForElse14.将列表转换为逗号分隔的字符串15.合并字典16.list中的最小和最大索引17.从列表中删除重复项查看英文原文:https://hackernoon.com/pyth
系统 2019-09-27 17:51:34 2100
有时网页中会嵌套一个或者多个Frame,此时我们直接去找嵌套在Frame里面的元素会抛出异常,所以在操作的时候我们需要将页面焦点切换到Frame里面,下面我们就以一个实例演示一下!首先先创建三个html文件,文件代码如下:1)frameset.html2)frame_left.html3)frame_right.html4)frame_middle.html5)把这四个html文件放在同一个文件夹下<以下是python实现该逻辑的代码:importunit
系统 2019-09-27 17:50:57 2100
python文件的基本操作菜中菜文件操作open():打开file:文件的位置(路径)mode:操作文件模式encoding:文件编码方式f:文件句柄f=open("1.txt",mode='r',encoding='utf-8')print(f.read())f.close1.文件操作模式:r,w,a(重要)rb,wb,ab(次要)r+,w+,a+1.1r/w/a1.r操作:f=open('1.txt','r')print(f.read(
系统 2019-09-27 17:50:35 2100
实际上JSON就是Python字典的字符串表示,但是字典作为一个复杂对象是无法直接传递,所以需要将其转换成字符串形式.转换的过程也是一种序列化过程.用json.dumps序列化为json字符串格式复制代码代码如下:>>>importjson>>>dic{'Connection':['keep-alive'],'Host':['127.0.0.1:5000'],'Cache-Control':['max-age=0']}>>>jdict=json.dumps
系统 2019-09-27 17:50:19 2100
Hmac模块其实这个模块类似hashlib模块,它能将一些重要的信息通过算法加密成密文,让信息更具有安全性。关于hmac加密算法的了解:它的全名是哈希运算消息认证码(Hash-basedMessageAuthenticationCode),HMAC利用hash算法,以一个消息M和一个秘钥K作为输入,生成一个定长的消息摘要作为输出。HMAC算法利用已有的hash函数,关键问题是如何使用秘钥。使用importhmac#这个模块和hashlib机制很相似h=hm
系统 2019-09-27 17:49:28 2100
python基础学习笔记(十一)2013-05-1423:31虫师阅读(...)评论(...)编辑收藏迭代器本节进行迭代器的讨论。只讨论一个特殊方法----__iter__,这个方法是迭代器规则的基础。迭代器规则迭代的意思是重复做一些事很多次---就像在循环中做的那样。__iter__方法返回一个迭代器,所谓迭代器就是具有next方法的对象,在调用next方法时,迭代器会返回它的下一个值。如果next方法被调用,但迭代器没有值可以返回,就会引发一个Stop
系统 2019-09-27 17:48:51 2100
一、进程之间的数据共享展望未来,基于消息传递的并发编程是大势所趋即便是使用线程,推荐做法也是将程序设计为大量独立的线程集合,通过消息队列交换数据。这样极大地减少了对使用锁定和其他同步手段的需求,还可以扩展到分布式系统中。但进程间应该尽量避免通信,即便需要通信,也应该选择进程安全的工具来避免加锁带来的问题。以后我们会尝试使用数据库来解决现在进程之间的数据共享问题。1.1Manager模块介绍虽然进程间数据独立,但可以通过Manager实现数据共享,事实上Ma
系统 2019-09-27 17:48:40 2100