爬虫的概念:爬虫就是获取网页并提取和保存信息的自动化程序爬虫的分类:主要有四类:通用网络爬虫,聚焦网络爬虫,增量式网络爬虫,深层网络爬虫爬虫的流程:常见的几种爬虫问题:主要有五类:静态网页的爬取,Ajax数据的爬取,动态渲染页面爬取,验证码的识别,代理的使用常见的爬虫框架:pyspider框架,Scrapy框架分布式爬虫:在多台机器上运行爬虫程序爬虫的一些常用"库":解析库:lxml;BeautifulSoup;pyquery;tesserocr请求库:r
系统 2019-09-27 17:56:05 1894
'''将一个正整数分解质因数。例如:输入90,打印出90=2*3*3*5。'''frompip._vendor.distlib.compatimportraw_inputdeftest1(n):print("%d="%n,end='');whilen>1:foriinrange(2,n+1):ifn%i==0:n=int(n/i)ifn==1:print("%d"%i,end='');else:print("%d*"%i,end='');breakdeft
系统 2019-09-27 17:55:28 1894
错误写法classRemoteHandler(web.RequestHandler):@gen.coroutinedefget(self):response=httpclient('http://www.baidu.com')self.write(response.body)@gen.coroutinedefhttpClient(url):result=yieldhttpclient.AsyncHTTPClient().fetch(url)returnre
系统 2019-09-27 17:55:01 1894
Ifanobject'svaluecanbemodified,theobjectissaidtobemutable.Ifthevaluecannotbemodified,theobjectissaidtobeimmutable.mutable可变类型,例如list,set,自定义类型(等价于C#中的引用类型);immutable不可变类型,例如string,numbers等(等价于C#中的值类型);一、引用和拷贝(referencesandcopies)当
系统 2019-09-27 17:54:01 1894
基础1、判断变量是否为None主要有三种写法:ifxisNone:ifnotx:ifnotxisNone:2、lambda函数的用法被称作匿名函数,没有具体名称的函数,允许快速定义单行函数,可以用在任何需要函数的地方。lambda与def的区别:def创建方法是有名称的,lambda没有;lambda会返回一个函数对象,但这个对象不会赋给一个标识符,而def会把函数对象赋值给一个变量;lambda只是一个表达式,def是一个语句;lambda表达式":"后
系统 2019-09-27 17:53:57 1894
用Python实现常规的静态网页抓取时,往往是用urllib2来获取整个HTML页面,然后从HTML文件中逐字查找对应的关键字。如下所示:复制代码代码如下:importurllib2url="http://mm.taobao.com/json/request_top_list.htm?type=0&page=1"up=urllib2.urlopen(url)#打开目标页面,存入变量upcont=up.read()#从up中读入该HTML文件key1='ke
系统 2019-09-27 17:53:24 1894
作者|苏克1900责编|胡巍巍转载自高级农民工(ID:Mocun6)最近在网上看到一个非常有意思的Python游戏通关网站,一共有33关,每一关都需要利用Python知识解题找到答案,然后进入下一关。很考验对Python的综合掌握能力,比如有的闯关需要用到正则表达式,有的要用到爬虫。我们平常学Python都是按章节顺序、包或者模块来学,容易前学后忘。正好可以拿这个网站来综合测试一下对Python的掌握情况,以便查缺补漏。来说说这个网站怎么玩。mark这是网
系统 2019-09-27 17:53:08 1894
非阻塞IO(non-blockingIO)Linux下,可以通过设置socket使其变为non-blocking。当对一个non-blockingsocket执行读操作时,流程是这个样子:从图中可以看出,当用户进程发出read操作时,如果kernel中的数据还没有准备好,那么它并不会block用户进程,而是立刻返回一个error。从用户进程角度讲,它发起一个read操作后,并不需要等待,而是马上就得到了一个结果。用户进程判断结果是一个error时,它就知道
系统 2019-09-27 17:53:07 1894
版权声明:转载请注明作者(独孤尚良dugushangliang)出处:https://blog.csdn.net/dugushangliang/article/details/91970111python2的xrange()函数,被发展成了python3的range()函数,而python2的range()函数则同raw_input()函数一样(详见https://blog.csdn.net/dugushangliang/article/details/8
系统 2019-09-27 17:52:55 1894
原文链接:https://www.numpy.org.cn/本节内容:数组的创建数组操作(获取数组属性,数组运算,数组复制,数组展开等等)获取数组特定元素1、创建数组(1)常用的创建一维数组的方式#可以将任意类型的序列(列表、元组、字典、集合、字符串)传递给np.array()a1=np.array([1,2,3,4])#传递列表a2=np.array((1,2,3,4))#传递元组a3=np.array([1,2,3,4],dtype=float)#在创
系统 2019-09-27 17:52:35 1894