网络爬虫学习笔记(2)1资料《Python网络爬虫从入门到实践》唐松,陈志铨。主要面向windows平台下的python3。菜鸟教程-》python2笔记2-1Python基础(1)++python的列表还有一种只读格式——元组Tuple,它用()进行赋值,且只能在初始化时赋值。列表有追加元素的内置方法append()字典有内置方法keys()(获得所有键的值),values()元组用“()”标识,列表用“[]”标识,字典用“{}”标识type(变量)查看
系统 2019-09-27 17:52:48 2191
第一种,使用create_connection链接,需要pipinstallwebsocket-client(此方法不建议使用,链接不稳定,容易断,并且连接很耗时)importtimefromwebsocketimportcreate_connectionurl='wss://i.cg.net/wi/ws'whileTrue:#一直链接,直到连接上就退出循环time.sleep(2)try:ws=create_connection(url)print(ws
系统 2019-09-27 17:52:20 2191
图片版PDF无法复制,转化成文字版的PDF后使用更方便.我们需要用到python3.6,pypdf2,ghostscript,PythonMagick,百度文字识别服务和pdfkit.安装安装python3.6略安装ghostscripthttps://ghostscript.com/download/gsdnld.html安装wkhtmltopdfhttps://wkhtmltopdf.org/downloads.htmlpip安装PyPDF2,ghos
系统 2019-09-27 17:49:31 2191
while循环Python中while语句的一般形式while判断条件:语句while有限循环n=100sum=0counter=1whilecounter<=n:sum=sum+countercounter+=1print("1到%d之和为:%d"%(n,sum))while无限循环我们可以通过设置条件表达式永远不为false来实现无限循环,实例如下:var=1whilevar==1:#表达式永远为truenum=int(input("输入一个数字:")
系统 2019-09-27 17:49:30 2191
1.要求数据库存储通讯录,要求按姓名/电话号码查询,查询条件只有一个输入入口,自动识别输入的是姓名还是号码,允许模糊查询。2.实现功能可通过输入指令进行操作。(1)首先输入“add”,可以对通讯录进行添加联系人信息。sql1='insertintoTA(ID,NAME,AGE,ADDRESS,TELENUMBER)'sql1+='values("%d","%s","%d","%s","%s");'%(ID,name,age,address,telenumb
系统 2019-09-27 17:49:30 2191
导入time这个包就可以通过它获取是时间#-*-coding:UTF-8-*-importtimeprint(time.time())#输出:1562304217.5744529通过执行上面代码后我们发现我们得到的是一个时间戳,这个时间戳是根据1970年到现在的秒数据但是很多人需求并不要一个时间戳,而是要所有人都看的懂的(年月日,时分秒)所以我们需要将这个时间戳进行计算,一分钟是60秒,所以我们就要算分钟,这些是可以通过模运算来解决这个问题的。不过已经有人
系统 2019-09-27 17:48:52 2191
平时自己写了很多代码,但从没好好计算总共写了多少行,面试时被问起来,就傻了。。。闲来无事,写个python程序来统计下importos################################################################################defcalcLine(baseDir):lineCount=0try:forfileNameinos.listdir(baseDir):fullPath=baseD
系统 2019-09-27 17:48:48 2191
今天在做一道题时,因为忘了Python中sort和sorted的用法与区别导致程序一直报错,找了好久才知道是使用方法错误的问题!现在就大致的归纳一下sort和sorted的用法与区别1.sort:sort是Python中列表的方法sort()方法语法:list.sort(key=None,reverse=False)有两个参数,这里不讲第一个参数,第二个参数当reverse=True时为降序排列,reverse=False为升序排列,默认reverse=F
系统 2019-09-27 17:46:59 2191
list是Python中使用最频繁的数据类型,标准库里面有丰富的函数可以使用。不过,如果把多维列表转换成一维列表(不知道这种需求多不多),还真不容易找到好用的函数,要知道Ruby、Mathematica、Groovy中可是有flatten的啊。如果列表是维度少的、规则的,还算好办例如:li=[[1,2],[3,4],[5,6]]print[jforiinliforjini]#orfromitertoolsimportchainprintlist(chain
系统 2019-09-27 17:38:27 2191
具体内容如下:使用sorted将字典按照其value大小排序>>>record={'a':89,'b':86,'c':99,'d':100}>>>sorted(record.items(),key=lambdax:x[1])[('b',86),('a',89),('c',99),('d',100)]sorted第一个参数要可迭代,可以为tuple,list>>>items=[(1,'B'),(1,'A'),(2,'A'),(0,'B'),(0,'a')]>
系统 2019-09-27 17:38:00 2191
前言pandas是基于Numpy构建的含有更高级数据结构和工具的数据分析包类似于Numpy的核心是ndarray,pandas也是围绕着Series和DataFrame两个核心数据结构展开的。Series和DataFrame分别对应于一维的序列和二维的表结构。pandas约定俗成的导入方法如下:frompandasimportSeries,DataFrameimportpandasaspd1.1.Pandas分析步骤1、载入日志数据2、载入area_ip数
系统 2019-09-27 17:37:36 2191
在写这个自动化测试框架的时候,我一直在留意各方面的需求。毕竟,我本人并没有做过真正的自动化测试。管理测试方面的领导,提出一个需求,就是在用例运行失败的时候,应该将过程记录下来,并形成报告,Email给相关人员。个人认为这个需求是非常合理的。事实上,任何系统,如果没有输出,那么只能停留在程序员手里。有了报表,才叫真正解决了用户的目标需求。在分析这个需求的过程,我提出了针对每一个操作接口的每一个方法,进行Log。而完成这个工作的第一方法,就想到了AOP,也就是
系统 2019-08-29 23:23:00 2191
回归自然,做回本行业!无疑,最后的驿站着眼于家庭!感谢热工院给我提供了这个机会!西安热工研究院有限公司(一般称“西安热工研究院”,简称“西安热工院”,英文缩写“TPRI”),是我国电力行业国家级热能动力科学技术研究与热力发电技术开发的机构。主要专业于1951年在北京创建,1965年迁址西安成立西安热工研究所;先后隶属燃料工业部、电力工业部、水利电力部、能源部、国家电力公司,其间随国家电力体制改革依次更名为电力工业部热工研究院(1994年)、国家电力公司热工
系统 2019-08-29 23:13:54 2191
前言EBMIDE——服务脚本IOS前篇文章介绍了服务脚本的定义,下面介绍如何进行服务的调用。服务已经定义了所需要的输入参数in和输出参数out,服务调用则需要向服务传输正确的输入数据,服务调用完成后以相同的数据格式返回输出。服务调用数据包的定义
系统 2019-08-29 23:09:38 2191
1关键名词Project:任何您想build的事物,Maven都可以认为它们是工程。这些工程被定义为工程对象模型(POM,PojectObjectModel)。一个工程可以依赖其它的工程;一个工程也可以由多个子工程构成。POM:POM(pom.xml)是Maven的核心文件,它是指示Maven如何工作的元数据文件,类似于Ant中的build.xml文件。POM文件位于每个工程的根目录中。GroupId:groupId是一个工程的在全局中唯一的标识符,一般地
系统 2019-08-29 23:08:39 2191