当年学爬虫的第一个想法就是想把双色球的数据爬下来,然后看能不能用什么牛叉的算法,或者数据分析把后面的双色球概率算出来;知道现在才抽空写了这几行代码爬取了双色球的数据,我也真是够懒的;也算是闲来无事,练手的爬虫吧;好了,多余的就不说了,直接上代码吧,代码注释已经很清楚了;importsysimportrequestsfromlxmlimportetreedefget_url(url):#请求url的方法,返回htmlheaders={'User-Agent'
系统 2019-09-27 17:47:57 1918
测试用例分为用函数和类来进行一个大字符串的字符逐一读取。测试代码Node.js函数varfs=require("fs");varcontent=fs.readFileSync("page.html",{encoding:"utf-8"});functionchars(content){varlength=content.length;varpos=0;while(pos++
系统 2019-09-27 17:47:51 1918
还是分析一下大体的流程:首先还是Chrome浏览器抓包分析元素,这是网址:https://www.douyu.com/directory/all发现所有房间的信息都是保存在一个无序列表中的li中,所以我们可以先获取一个装有li的element对象的列表,然后在对每个element逐一操作分析斗鱼的翻页,有一个下一页按钮,是个li,class="dy-Pagination-item-custom",但是当烦到最后一页的时候,class="dy-Paginat
系统 2019-09-27 17:47:21 1918
在python中可以使用in符号判断指定的元素是否存在于列表中,但我发现元组和数组存在区别,下面是详细实验结果。>>>'jb51.net'in['haotu.net','jb51.net']True>>>'jb51.net'in('haotu.net','jb51.net')True>>>'jb51.net'in['jb51.net/codes','haotu.net']False>>>'jb51.net'in('jb51.net/codes','haot
系统 2019-09-27 17:47:15 1918
1)忘记在if,elif,else,for,while,class,def声明末尾添加:(导致“SyntaxError:invalidsyntax”)该错误将发生在类似如下代码中:ifspam==42print('Hello!')2)使用=而不是==(导致“SyntaxError:invalidsyntax”)=是赋值操作符而==是等于比较操作。该错误发生在如下代码中:ifspam=42:print('Hello!')3)错误的使用缩进量。(导致“Inde
系统 2019-09-27 17:47:06 1918
字节串bytes字节串也叫字节序列,是不可变的序列,存储以字节为单位的数据字节串表示方法:b"ABCD"b"\x41\x42"...字节串的构造函数:bytes()创建一个空的字节串,同b””bytes(整数可迭代对象)用可迭代对象创建一个字节串bytes(整数n)生成n个值为0的字节串bytes(字符串,encoding='utf-8')转码字节串的运算:同其他序列的运算+、+=、*、*=<、<=、>、>=、!=、==in/notin切片和索引函数:le
系统 2019-09-27 17:47:04 1918
importosimportsysimportstring#以指定模式打开指定文件,获取文件句柄defgetFileIns(filePath,model):print("打开文件")print(filePath)print(model)returnopen(filePath,model)#获取需要处理的文件defgetProcFile(path):returnos.listdir(path)#判断是否满足某个条件,如果满足则执行defisTrue(outF
系统 2019-09-27 17:47:04 1918
一.基本数据类型整数:int字符串:str(注:\t等于一个tab键)布尔值:bool列表:list(元素的集合)列表用[]元祖:tuple元祖用()字典:dict注:所有的数据类型都存在想对应的类列里二.列表所有数据类型:基本操作:•索引•切片•追加•删除•长度•切片•循环•包含listclasslist(object):"""list()->newemptylistlist(iterable)->newlistinitializedfromiterab
系统 2019-09-27 17:46:22 1918
利用twitter/bootstrap,项目的基础模板算是顺利搞定。接下来开始处理用户中心。用户中心主要包括用户登陆、注册以及头像等个人信息维护。此前,用户的注册管理我一直使用django-registration。只是这个APP有些不思进取,09年发布了0.8alpha版后就一直没什么动静。这次决定尝试另外一个用户模块组件django-userena。相比django-registration,django-userena的功能要完善的多。除基础的登陆注
系统 2019-09-27 17:46:12 1918
filter函数:filter()函数可以对序列做过滤处理,就是说可以使用一个自定的函数过滤一个序列,把序列的每一项传到自定义的过滤函数里处理,并返回结果做过滤。最终一次性返回过滤后的结果。filter()函数有两个参数:第一个,自定函数名,必须的第二个,需要过滤的列,也是必须的DEMO需求,过滤大于5小于10的数:复制代码代码如下:#coding=utf8#定义大于5小于10的函数defguolvhanshu(num):ifnum>5andnum<10:
系统 2019-09-27 17:46:02 1918