网络爬虫由于一个ip频繁访问同一网站,容易返回456或者被长时间封禁。特别的本机有socks5客户端的设置如下,前提是已经安装了socks5的客户端软件,并且启动起来在固定端口为本机提供服务。使用前先更新requests版本为支持socks的版本。pipinstall-Urequests[socks]importrequestsmy_proxies={"http":"http://127.0.0.1:1080","https":"https://127.0
系统 2019-09-27 17:56:50 2668
在Python里面,使用Pandas里面的DataFrame来存放数据的时候想要把数据集进行shuffle会许多的方法,本文介绍两种比较常用而且简单的方法。应用情景:我们有下面以个DataFrame我们可以看到BuyInter的数值是按照0,-1,-1,2,2,2,3,3,3,3这样排列的,我们希望不保持这个次序,但是同时列属性又不能改变,即如下效果:实现方法:最简单的方法就是采用pandas中自带的sample这个方法。假设df是这个DataFramed
系统 2019-09-27 17:53:55 2668
前言使用pytest-cov无法统计用api调用服务的测试脚本所覆盖率,但大部分的项目基本也是使用api调用。所以我们额外需要使用coverage.pyapi来统计。当你安装pytest-cov时,已经默认安装了coverage这个库。服务启动要想扫描到代码,必须在服务启动的时候要插入coverage相关配置。我这边是flask启动的,所以在flask启动的代码上添加,如下:if__name__=='__main__':cov=Coverage()cov.
系统 2019-09-27 17:48:14 2668
以sklearn中的iris数据为例用的是Adaboost算法#-*-coding:utf-8-*-"""CreatedonThuJul421:17:192019@author:ZQQ"""importnumpyasnpfromsklearn.ensembleimportAdaBoostClassifierfromsklearn.treeimportDecisionTreeClassifierfromsklearn.model_selectionimpor
系统 2019-09-27 17:48:02 2668
写在前面之前搞树莓派,opencv的contrib版本死活装不上,最后用C++版本四线程编译了一天,浪费生命的玩意儿我明明记得之前,pipinstallopencv-contrib是可以安装的......,年级大了,老了最近终于找到了一篇推文,原来是pipinstallopencv-contrib-python,呵呵,什么时候改的??以下摘自这位大佬的博客:大佬原话OpenCVContrib是OpenCV的扩展模块,包含了许多最新的以及可能还没有正式发布有
系统 2019-09-27 17:47:33 2668
在XML解析方面,Python贯彻了自己“开箱即用”(batteriesincluded)的原则。在自带的标准库中,Python提供了大量可以用于处理XML语言的包和工具,数量之多,甚至让Python编程新手无从选择。本文将介绍深入解读利用Python语言解析XML文件的几种方式,并以笔者推荐使用的ElementTree模块为例,演示具体使用方法和场景。文中所使用的Python版本为2.7。一、什么是XML?XML是可扩展标记语言(ExtensibleMa
系统 2019-09-27 17:38:14 2668
背景谈到httpclient,可能大多数想到就是apache的那个httpclient或者jdk自带的urlconnection,也许有人会考虑使用netty无论如何,jetty的高性能实现总归是让人感到好奇,接下来我们一探究竟样例我们结合样例代码具体分析初始化httpClient=newHttpClient();httpClient.setConnectorType(HttpClient.CONNECTOR_SELECT_CHANNEL);httpCli
系统 2019-08-29 23:50:58 2668
详细内容请点击:http://www.sonatype.com/book/reference_zh/public-book.html#这里是详细的目录列表:1.介绍ApacheMaven1.1.Maven...它是什么?1.2.约定优于配置(ConventionOverConfiguration)1.3.一个一般的接口1.4.基于Maven插件的全局性重用1.5.一个“项目”的概念模型1.6.Maven是Ant的另一种选择么?1.7.比较Maven和Ant
系统 2019-08-29 23:41:32 2668
系统 2019-08-29 22:47:03 2668
如果你玩过Google+,看到过YouTube的新界面,便会体验到这个HTML5的新功能。使用pushState+Ajax(pjax),可以实现网页的ajax加载,同时又能完成URL的改变而没有网页跳转刷新的迹象,就像是改变了网页的hash(#)一样。旧的解决方案曾说SEO和ajax是天敌。此前从Twitter开始流行Ajax+hash的方式调用内容,Google给出的解决方案是“#!~string”自动转换为“?_excaped_fragment_=~s
系统 2019-08-29 22:15:51 2668