前言我们所说的加密方式,都是对二进制编码的格式进行加密的,对应到Python中,则是我们的Bytes。所以当我们在Python中进行加密操作的时候,要确保我们操作的是Bytes,否则就会报错。将字符串和Bytes互相转换可以使用encode()和decode()方法。如下所示:#方法中不传参数则是以默认的utf-8编码进行转换In[1]:'南北'.encode()Out[1]:b'\xe5\x8d\x97\xe5\x8c\x97'In[2]:b'\xe5\
系统 2019-09-27 17:52:59 1997
一、前言大多数编译型语言,变量在使用前必须先声明,其中C语言更加苛刻:变量声明必须位于代码块最开始,且在任何其他语句之前。其他语言,想C++和java,允许“随时随地”声明变量,比如,变量声明可以在代码块的中间,不过仍然必须在变量被使用前声明变量的名字和类型。在Python中,无序此类显式变量声明语句,变量在第一次被赋值时自动声明。和其他大多数语言一样,变量只有被创建和赋值后才能被使用。#变量未声明>>>xTraceback(mostrecentcalll
系统 2019-09-27 17:52:14 1997
思路一、想要实现登录豆瓣关键点分析真实post地址----寻找它的formdata,如下图,按浏览器的F12可以找到。实战操作实现:模拟登录豆瓣,验证码处理,登录到个人主页就算是success数据:没有抓取数据,此实战主要是模拟登录和处理验证码的学习。要是有需求要抓取数据,编写相关的抓取规则即可抓取内容。登录成功展示如图:spiders文件夹中DouBan.py主要代码如下:#-*-coding:utf-8-*-importscrapy,urllib,re
系统 2019-09-27 17:52:01 1997
自己是个PS小白,没办法只能通过技术来证明自己。话不多说,直接上代码fromremovebgimportRemoveBgimportrequestsimportosif__name__=='__main__':path='%s\picture'%os.getcwd()ispath=os.path.exists(path)ifnotispath:os.mkdir(path)response=requests.post('https://api.remove.
系统 2019-09-27 17:51:25 1997
Numpy、Pandas是Python数据处理中经常用到的两个框架,都是采用C语言编写,所以运算速度快。Matplotlib是Python的的画图工具,可以把之前处理后的数据通过图像绘制出来。之前只是看过语法,没有系统学习总结过,本博文总结了这三个框架的API。以下是这三个框架的的简单介绍和区别:Numpy:经常用于数据生成和一些运算Pandas:基于Numpy构建的,是Numpy的升级版本Matplotlib:Python中强大的绘图工具NumpyNum
系统 2019-09-27 17:51:19 1997
今天主要是来说一下怎么可视化来监控你的爬虫的状态。相信大家在跑爬虫的过程中,也会好奇自己养的爬虫一分钟可以爬多少页面,多大的数据量,当然查询的方式多种多样。今天我来讲一种可视化的方法。关于爬虫数据在mongodb里的版本我写了一个可以热更新配置的版本,即添加了新的爬虫配置以后,不用重启程序,即可获取刚刚添加的爬虫的状态数据。1.成品图这个是监控服务器网速的最后成果,显示的是下载与上传的网速,单位为M。爬虫的原理都是一样的,只不过将数据存到InfluxDB的
系统 2019-09-27 17:50:52 1997
方法一、input标签上传如果是input标签,可以直接输入路径,那么可以直接调用send_keys输入路径,这里不做过多赘述,前文有相关操作方法。方法二、非input标签上传这种上传方式需要借助第三方工具,主要有以下三种情况:1.AutoIt去调用它生成的au3或者exe格式的文件2.SendKeys第三方库(目前只支持到2.7版本)网址:https://pypi.python.org/pypi/SendKeys/3.Python的pywin32库,通过
系统 2019-09-27 17:50:49 1997
一、变量赋值及命名规则①声明一个变量及赋值1#!/usr/bin/envpython2#-*-coding:utf-8-*-3#_author_soloLi4name1="solo"5name2=name16print(name1,name2)7name1="hehe"8print(name1,name2)#name1的值为hehe,name2的值为solo②变量命名的规则11、变量名只能是字母、数字或下划线的任意组合22、变量名的第一个字符不能是数字33
系统 2019-09-27 17:50:38 1997
Pyrex是一种专门设计用来编写Python扩展模块的语言。根据PyrexWeb站点的介绍,“它被设计用来在友好易用的高级Python世界和凌乱的低级C世界之间搭建一个桥梁。”虽然几乎所有的Python代码都可以作为有效的Pyrex代码使用,但是您可以在Pyrex代码中添加可选的静态类型声明,从而使得这些声明过的对象以C语言的速度运行。加速Python从某种意义上来说,Pyrex只是不断发展的Python类语言系列的一个部分:Jython、IronPyth
系统 2019-09-27 17:49:56 1997
[TOC]一、守护线程无论是进程还是线程,都遵循:守护xx会等待主xx运行完毕后被销毁。需要强调的是:运行完毕并非终止运行。对主进程来说,运行完毕指的是主进程代码运行完毕对主线程来说,运行完毕指的是主线程所在的进程内所有非守护线程统统运行完毕,主线程才算运行完毕1.1详细解释主进程在其代码结束后就已经算运行完毕了(守护进程在此时就被回收),然后主进程会一直等非守护的子进程都运行完毕后回收子进程的资源(否则会产生僵尸进程),才会结束。主线程在其他非守护线程运
系统 2019-09-27 17:49:52 1997