http.cookiejar前面讲到的cookie的使用,我们首先使用的是浏览器登陆之后,将中间的cookie取出来,之后将其应用到代码中,实现代码请求的功能,但是显然这样并不是非常的完美,如果代码能够自动的获取到cookie并完成后续的工作会更加的完美对于这个http.cookiejar,该模块主要的类有CookieJar、FileCookieJar、MozillaCookieJar、LWPCookieJar。对于这四类的作用非别如下:1、CookieJ
系统 2019-09-27 17:50:59 1987
**装饰器**1.装饰器的概念装饰器的本质就是一个函数,它的作用是为其他函数添加一个新的功能,但是不改变原函数的源代码和调用方式。装饰器的两大原则:不修改被修饰函数的源代码不修改被修饰函数的调用方式2.装饰器的知识储备(或者我们可以理解成,一个装饰器是由什么组成)装饰器=高阶函数+函数嵌套+闭包3.装饰器的实现首先我们定义一个累加求和的函数importtimedefcal():res=0foriinrange(100):res+=itime.sleep(1
系统 2019-09-27 17:50:53 1987
今天主要是来说一下怎么可视化来监控你的爬虫的状态。相信大家在跑爬虫的过程中,也会好奇自己养的爬虫一分钟可以爬多少页面,多大的数据量,当然查询的方式多种多样。今天我来讲一种可视化的方法。关于爬虫数据在mongodb里的版本我写了一个可以热更新配置的版本,即添加了新的爬虫配置以后,不用重启程序,即可获取刚刚添加的爬虫的状态数据。1.成品图这个是监控服务器网速的最后成果,显示的是下载与上传的网速,单位为M。爬虫的原理都是一样的,只不过将数据存到InfluxDB的
系统 2019-09-27 17:50:52 1987
方法一、input标签上传如果是input标签,可以直接输入路径,那么可以直接调用send_keys输入路径,这里不做过多赘述,前文有相关操作方法。方法二、非input标签上传这种上传方式需要借助第三方工具,主要有以下三种情况:1.AutoIt去调用它生成的au3或者exe格式的文件2.SendKeys第三方库(目前只支持到2.7版本)网址:https://pypi.python.org/pypi/SendKeys/3.Python的pywin32库,通过
系统 2019-09-27 17:50:49 1987
使用paramiko库:https://github.com/paramiko/paramiko简单封装SSH类importparamikoclassSSH:def__init__(self,host,port,user,ssh_key_path,timeout=1800):self.host=hostself.port=portself.user=userself.ssh_key_path=ssh_key_pathself.timeout=timeout
系统 2019-09-27 17:50:38 1987
是不是已经很有感觉,Python你觉得自己可以做点简单的事情了?恭喜了。(还不行?重新看看1-6课时,另外请我吃饭,慢慢教你也可以)本课,我们说bool-布尔;只有2种情况真/假;或者叫0/1;或者True/Flase在python中True/Flase第1个字母都是大写,为什么?规定。。。。。。你写了true报错,别要说我无跟你说;其次bool用在什么场景?条件判断的时候,好像if或while的情况,都需要如果为真,就如何的场景:name="samly7
系统 2019-09-27 17:50:37 1987
UnicodeDecodeError:'gbk'codeccan'tdecodebyte0x80inposition128:illegalmultibytesequence说到底是open()使用方法。原本程序是这样的:(重点看第4行)fromtkinterimport*importosdefopenFile():f=open('D:\Pythoncharmprojccts\SC\main_window.py',mode='r')whileTrue:dat
系统 2019-09-27 17:50:35 1987
以下实例为通过用户输入两个数字,并计算两个数字之和:#-*-coding:UTF-8-*-#Filename:test.py#authorby:www.runoob.com#用户输入数字num1=input('输入第一个数字:')num2=input('输入第二个数字:')#求和sum=float(num1)+float(num2)#显示计算结果print('数字{0}和{1}相加结果为:{2}'.format(num1,num2,sum))执行以上代码输
系统 2019-09-27 17:49:48 1987
练习介绍【程序功能】我们将完成一个和语义识别相关的爬虫程序,输入任意词汇、句子、文章或段落,会返回联想的词汇。【背景信息】有一个非常牛的处理语言的网站nlpir,上面有非常多的处理语言的功能(如分词标注、情感分析、相关词汇)。举个例子,我输入“音乐剧”:然后点击“Word2vec”(返回联想词汇的功能):下面就会返回“音乐剧”的联想词汇:当然这个网站还有其他的功能,像“分词标注”,就是把你输入的文本切成一个个的词,并且把这些词的词性都标出来;还有“情感分析
系统 2019-09-27 17:48:22 1987
Shellshell获取文件最后修改时间的秒时间戳:stat-c%Y$path/$newest_logshell获取当前时间的秒时间戳:date+%s两个时间戳相减:timegap=$[$timestamp-$filetimestamp]将日期时间字符串转化为时间戳:date-d"2019-08-26"+%s将时间戳转化为日期时间字符串:date-d@1566748800获取n天前的日期时间:date-d"1dayago"+"%Y-%m-%d"获取n分钟前
系统 2019-09-27 17:48:12 1987