前情提要:Python爬虫初体验(2):多线程的应用及爬取中的实际问题从来没想过,写一个功能较为完备的爬虫代码,要花好几天的时间……这次算是增长了许多编程经验。好的废话不多说,进入正题上次的代码中,由于部分XKCD漫画有特殊格式(还有404彩蛋),而我的代码中try-except结构只处理了连接超时的问题,没有对漫画本身的格式变化进行处理,导致线程意外中断。虽然最后写了重试下载,但是它和上面的一样,有个致命问题:如果是漫画格式的问题,它会陷入无限死循环。所
系统 2019-09-27 17:53:24 2479
统计学习方法——朴素贝叶斯法原理1.朴素贝叶斯法的极大似然估计2.朴素贝叶斯极大似然学习及分类算法算法过程:2.Python实现defpriorProbability(labelList):#计算先验概率labelSet=set(labelList)#得到类别的值labelCountDict={}#利用一个字典来存储训练集中各个类别的实例数forlabelinlabelList:iflabelnotinlabelCountDict:labelCountDi
系统 2019-09-27 17:50:19 2479
一.破解参数加密有道翻译的请求是post,携带一系列参数,直接F12刷新进行调试,如下图所示:这是一个post请求,目标网址是'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'接下来让我们看看发送该请求需要携带哪些参数如图所示,红色方框里的就是需要携带的参数了。最后看一看返回的数据显而易见,返回的数据是json格式的数据。好了,现在我们可以写程序进行爬取了#-*-c
系统 2019-09-27 17:49:48 2479
本文实例讲述了Python使用import导入本地脚本及导入模块的技巧。分享给大家供大家参考,具体如下:导入本地脚本import如果你要导入的Python脚本与当前脚本位于同一个目录下,只需输入import,然后是文件名,无需扩展名.py。伪代码如下:importuseful_functionsuseful_functions.add_five([1,2,3,4])我们可以为导入模块添加别名,以使用不同的名称引用它。importuseful_functio
系统 2019-09-27 17:49:18 2479
1.计算给出两个时间之间的时间差importdatetimeasdt#currenttimecur_time=dt.datetime.today()#onedaypre_time=dt.date(2016,5,20)#eg:2016.5.20delta=cur_time-pre_time#ifyouwanttogetdiscrepancyindaysprintdelta.days#ifyouwanttogetdiscrepancyinhoursprintd
系统 2019-09-27 17:38:14 2479
Linux安装部署Python3.7环境1.Python官网下载Python3.7安装包:下载文件格式tar2.通过xftp6,将Python3.7安装包传输至虚拟机上的linux系统3.解压Python3.7安装包[root@localhost~]#cd/home/local/ProgramFiles/Python[root@localhostPython]#tar-xvfPython-3.7.1.tar使用xftp6在home文件夹下建立local->
系统 2019-09-27 17:56:57 2478
实现代码如下:说明:现在代码已实现du命令的-s统计功能,统计与系统du命令稍有差别,比如用ls-ld/root结果为4096,而du计算出来是1040,用当前python计算出来也是4096。另外暂时还没有实现类似于自动根据大小显示为人性化的单位,后续补上#!/usr/bin/python#*-*coding:utf8*-*importsysimportosfromoptparseimportOptionParser#使用选项帮助信息可以使用中文relo
系统 2019-09-27 17:54:38 2478
grpcgRPC一开始由google开发,开源的远程过程调用(RPC)系统grpc支持同步和异步调用简单模式下,调用函数就像本地调用一样,直接传输数据流式调用将信息以数据量的方式,发送或者接受,gRPC客户端调用成功的判断是独立的本地的,因此可能存在客户端与服务端判断不一致的情况例如,您可以在服务器端成功完成RPC,但在客户端失败。在客户端发送所有请求之前,服务器也可以决定完成grpc是基于HTTP2协议的封装gRPC请求和应答消息流中一般的消息顺序:请求
系统 2019-09-27 17:53:25 2478
1.贴题题目来自PythonTip信息加密给你个小写英文字符串a和一个非负数b(0<=b<26),将a中的每个小写字符替换成字母表中比它大b的字母。这里将字母表的z和a相连,如果超过了z就回到了a。例如a=”cagy”,b=3,则输出:fdjb2.说明考察点英文字母与数字的转换如果超过z的处理3.参考代码c=""#定义空字符串c用于存放加密后的字符串forjina:#遍历字符串a中的每一个英文小写字母iford(j)+b<124:#判断加密后是否不超过zc
系统 2019-09-27 17:55:58 2477
0X00前言快开学了,看到空间里面各种求填写调查问卷的,我才想起来貌似我也还没做。对于这种无意义的问卷,我是不怎么感冒的,所以我打算使用”特技”来完成,也就是python,顺便重新复习一下python,真的好久没用了。下面,表演开始……0X01代码编写思路首先先创建一份问卷我们随便填写一个问卷并提交,在提交之前开启Burpsuite截获数据包对于截获的数据包进行分析,有的被url编码了不利于分析,可以使用Burpsuite编码模块解码替换,这样就好分析了通
系统 2019-09-27 17:53:47 2477
原因因为需要在windows上调试板子的串口,用到了python的serial方法。在pycharm中虽然安装了pip和serial,但是执行py的时候一直在报错,提示AttributeError:module'serial'hasnoattribute'Serial'于是准备直接安装windows下的serial。安装环境前提:Python2.7已经安装完毕1.下载ez_setup-0.9,地址https://pypi.python.org/packag
系统 2019-09-27 17:50:44 2477
一、运算符1.1算数运算符算数运算符是运算符的一种是完成基本的算术运算使用的符号,用来处理四则运算a=10,b=20运算符描述示例+加-两个对象相加a+b输出结果30-减-得到负数或是一个数减去另一个数a-b输出结果-10*乘-两个数相乘或是返回一个被重复若干次的字符串a*b输出结果200/除-x除以yb/a输出结果2%取模-返回除法的余数b%a输出结果0**幂-返回x的y次幂a**b为10的10次方,输出结果10000000000//取整除-返回商的整数
系统 2019-09-27 17:49:35 2477
mint19.2本来pip和pip2对应python2.7pip3对应python3.6用源码安装了python3.7之后.这样版本也没问题.但是,用pip3.7安装包的时候提示pip需要升级,但是一旦升级,就不对了pippip2pip3都指向了pip3.7这导致一系列问题.包pgadmin4启动后报csrf错误,甚至进而导致docker-compose模式下postgres服务下线!而且,无法用重装python-pip,python3-pip来解决sud
系统 2019-09-27 17:46:37 2477
一、Python中的编码规则#_*_coding:utf-8_*_在python2中添加此行,可识别UTF-8编码,是16位二进制编码,可识别汉字python2.x:默认使用ASCII编码python3.x:默认使用UTF-8编码1.没有分号(编码规范PEP8)2.严格按照缩进的语言系统中默认的python为2.7.5版本:我们下载的版本为python3.6.4:测试:【1】在python2中添加此行,可识别UTF-8编码,是16位二进制编码,可识别汉字1
系统 2019-09-27 17:55:33 2476
Python中查看变量的类型,内存地址,所占字节的大小查看变量的类型#利用内置type()函数>>>nfc=["Packers","49"]>>>afc=["Ravens","48"]>>>combine=zip(nfc,afc)>>>type(combine)查看变量的内存地址#利用内置函数id(),是以十进制显示>>>id(nfc)2646554913160>>>id(afc)2646554913544查看变量所占字节的大小>>>importsys>>
系统 2019-09-27 17:55:23 2476