起因:有一天突然想看本小说,在小说网站上不能下载,广告太多,便。。。思路:–分析网站的结构–爬取目录(获得章节名和链接)–多线程加载章节网页–正则匹配内容–保存生成错误日志–链接单个章节txt合并为一个#-*-coding:utf-8-*-"""CreatedonTueJul218:23:492019@author:24709"""importurllibimporturllib.requestimportmultiprocessingfrombs4imp
系统 2019-09-27 17:53:50 2189
作为近两年来最火的编程语言的python,受到广大程序员的追捧必然是有其原因的,如果要挑出几点来讲的话,第一条那就python语法简洁,易上手,第二条呢?便是python有着极其丰富的第三方的库。所以不管你使用的关系型数据库是oracle,mysql,sqlserver,还是关系型数据库redis,mongoDB。python都有有与之对应的第三方库。下面就来为大家一一介绍一下!Mysql我们先来看看如何对接mysql数据库,python2和python3
系统 2019-09-27 17:53:13 2189
图片版PDF无法复制,转化成文字版的PDF后使用更方便.我们需要用到python3.6,pypdf2,ghostscript,PythonMagick,百度文字识别服务和pdfkit.安装安装python3.6略安装ghostscripthttps://ghostscript.com/download/gsdnld.html安装wkhtmltopdfhttps://wkhtmltopdf.org/downloads.htmlpip安装PyPDF2,ghos
系统 2019-09-27 17:49:31 2189
多态问起面向对象的三大特性,几乎每个人都能对答如流:封装、继承、多态。今天我们就要来说一说Python中的多态。所谓多态:就是指一个类实例的相同方法在不同情形有不同表现形式。多态机制使具有不同内部结构的对象可以共享相同的外部接口。这意味着,虽然针对不同对象的具体操作不同,但通过一个公共的类,它们(那些操作)可以通过相同的方式予以调用。我在《Python中的设计模式详解之:策略模式》一文中详细描述了策略模式的实现,而策略模式就是典型的多态应用。之前的代码我就
系统 2019-09-27 17:49:30 2189
如下所示:#coding:utf-8importosimportpsutilimporttimedefwrite_pid():pid=os.getpid()fp=open("pid.log",'w')fp.write(str(pid))fp.close()defread_pid():ifos.path.exists("pid.log"):fp=open("pid.log",'r')pid=fp.read()fp.close()returnpidelse:r
系统 2019-09-27 17:48:34 2189
浏览器的简单操作#导入webdriver模块#创建driver对象,指定Chrome浏览器driver=webdriver.Chrome()#窗口最大化driver.maximize_window()#访问百度driver.get("http://baidu.com")driver.get("http://sina.com")#后退driver.back()#前进driver.forward()#刷新driver.refresh()#关闭窗口driver.
系统 2019-09-27 17:47:25 2189
对于pandas的dataframe,绘制直方图方法如下://pdf是pandas的dataframe,delta_time是其中一列//xlim是x轴的范围,bins是分桶个数pdf.delta_time.plot(kind='hist',xlim=(-50,300),bins=500)对于pandas的dataframe,绘制概率密度图方法如下://pdf是pandas的dataframe,delta_time是其中一列pdf.delta_time.d
系统 2019-09-27 17:45:41 2189
list是Python中使用最频繁的数据类型,标准库里面有丰富的函数可以使用。不过,如果把多维列表转换成一维列表(不知道这种需求多不多),还真不容易找到好用的函数,要知道Ruby、Mathematica、Groovy中可是有flatten的啊。如果列表是维度少的、规则的,还算好办例如:li=[[1,2],[3,4],[5,6]]print[jforiinliforjini]#orfromitertoolsimportchainprintlist(chain
系统 2019-09-27 17:38:27 2189
前言WAF上线之后,处理最多的是误报消除。产生误报有多种原因,比如web应用源码编写时允许客户端提交过多的cookie;比如单个参数提交的数值太大。把误报降低到了可接受的范围后,还要关注漏报。WAF不是神,任何WAF都可能被绕过。所以还需要定位漏过的攻击,明确漏报的原因,才能updateWAF的策略。要定位漏报,就必须分析Web应用的访问日志了。一个站点,每天产生的access日志大概接近1GB,显然靠肉眼看是不现实的。这就需要用python帮助自动分析。
系统 2019-09-27 17:37:54 2189
《R语言实战》基本信息原书名:RinAction:DataAnalysisandGraphicswithR作者:(美)RobertI.Kabacoff[作译者介绍]译者:高涛肖楠陈钢丛书名:图灵程序设计丛书出版社:人民邮电出版社ISBN:9787115299901上架时间:2012-12-10出版日期:2013年1月开本:16开页码:1版次:1-1所属分类:计算机>软件与程序设计>综合>高级程序语言设计更多关于》》》《R语言实战》内容简介书籍《r语言实战》
系统 2019-08-29 23:37:08 2189