当年学爬虫的第一个想法就是想把双色球的数据爬下来,然后看能不能用什么牛叉的算法,或者数据分析把后面的双色球概率算出来;知道现在才抽空写了这几行代码爬取了双色球的数据,我也真是够懒的;也算是闲来无事,练手的爬虫吧;好了,多余的就不说了,直接上代码吧,代码注释已经很清楚了;importsysimportrequestsfromlxmlimportetreedefget_url(url):#请求url的方法,返回htmlheaders={'User-Agent'
系统 2019-09-27 17:47:57 1822
xml模块处理文档:importxml.etree.ElementTreeasETtree=ET.parse('xmlfile')#ET.parse()解析xml文档root=tree.getroot()#获取根节点print(root.tag)#root.tag获取根节点标签这里是dataforiinroot:print(i.tag)#获取根节点下的标签print(i.attrib)#获取根节点下的标签属性标签>>:country、标签属性>>:{'na
系统 2019-09-27 17:47:56 1822
Python编程中对于某些需要重复调用的程序,可以使用函数进行定义,基本形式为:def函数名(参数1,参数2,……,参数N):执行语句函数名为调用的表示名,参数则是传入的参数,可以更具需要定义,也可以没有。#例1:简单的函数使用#coding=gb2312#定义函数defhello():print'hellopython!'#调用函数hello()>>>hellopython!函数可以带参数和返回值,参数将按从左到右的匹配,参数可设置默认值,当使用函数时没
系统 2019-09-27 17:47:48 1822
原文链接:https://aiprocon.csdn.net/m/topic/ai_procon/index作者|猪哥66来源|裸睡的猪(ID:IT--Pig)最近想爬取淘宝的一些商品,但是发现如果要使用搜索等一些功能时基本都需要登录,所以就想出一篇模拟登录淘宝的文章!看了下网上有很多关于模拟登录淘宝,但是基本都是使用scrapy、pyppeteer、selenium等库来模拟登录,但是目前我们还没有讲到这些库,只讲了requests库,那我们今天就来使用
系统 2019-09-27 17:47:29 1822
1、介绍itertools是python的迭代器模块,itertools提供的工具相当高效且节省内存。使用这些工具,你将能够创建自己定制的迭代器用于高效率的循环。-无限迭代器itertools包自带了三个可以无限迭代的迭代器。这意味着,当你使用他们时,你要知道要的到底是最终会停止的迭代器,还是需要无限地迭代鞋去。(1)count(初值=0,步长=1):count迭代器会返回从传入的起始参数开始的均匀间隔的数值。count也可以接收指定的步长参数。我们来看一
系统 2019-09-27 17:47:20 1822
Python命令行之旅:深入argparse(二)作者:HelloGitHub-ProdesireHelloGitHub的《讲解开源项目》系列,项目地址:https://github.com/HelloGitHub-Team/Article前言在上一篇“深入argparse(一)”的文章中,我们深入了解了argparse的包括参数动作和参数类别在内的基本功能,具备了编写一个简单命令行程序的能力。本文将继续深入了解argparse的进阶玩法,一窥探其全貌,助
系统 2019-09-27 17:47:15 1822
函数的嵌套defone():print("第一个函数")deftwo():one()print("第二个函数")two()递归函数,就是函数内嵌套函数自身,下面是阶乘的递归方法defone(a):ifa==1:return1else:returnone(a-1)*aone(5)匿名函数:https://blog.csdn.net/GrofChen/article/details/93018250全局变量:https://blog.csdn.net/Grof
系统 2019-09-27 17:47:12 1822
rindex()方法返回所在的子str被找到的最后一个索引,可选择限制搜索的字符串string[beg:end]如果没有这样的索引存在,抛出一个异常。语法以下是rindex()方法的语法:str.rindex(str,beg=0end=len(string))参数str--此选项指定要搜索的字符串。beg--这是开始索引,默认情况下为0len--这是最后的索引,默认情况下它等于字符串的长度。返回值此方法如果找到返回最后一个索引,否则如果没有找到str引发一
系统 2019-09-27 17:47:10 1822
首先感谢这位博主整理的AndrewNg的deeplearning.ai的相关作业:https://blog.csdn.net/u013733326/article/details/79827273开一个我的github传送门,可以看到代码。https://github.com/VVV-LHY/deeplearning.ai/tree/master/NeuralNetworkandDeepLearning/OneHiddenLayerNN今天接着day12的
系统 2019-09-27 17:46:55 1822
Python脚本有一个毛病,当使用相对路径时,被另一个不同目录下的py文件中导入时,会报找不到对应文件的问题。感觉是当前工作目录变成了导入py文件当前目录。如果你有配置文件的读取操作,然后都放在一个py文件中,而你又用的是相对路径,而且这个py文件在多个不同目录下的py文件中被导入,那就呵呵了。。。还是用绝对路径吧。解决这个问题,可以用绝对路径。当然是自动的绝对路径,而不是每次都手动给前缀赋值,让脚本自动寻找当前文件的绝对路径。此处分享在python下获取
系统 2019-09-27 17:46:48 1822