搜索到与相关的文章
Python

Python学习三:笔记

运行splash:控制台输入:dockerrun-p8050:8050scrapinghub/splash如果报错:重启Docker后再输入。

系统 2019-09-27 17:53:24 2090

Python

Python爬虫偷懒神器 —— 一键构造请求头

今天介绍个神奇的网站!堪称爬虫偷懒的神器!我们在写爬虫,构建网络请求的时候,不可避免地要添加请求头(headers),以mdn学习区为例,我们的请求头是这样的:一般来说,我们只要添加user-agent就能满足绝大部分需求了,Python代码如下:importrequestsheaders={#'authority':'developer.mozilla.org',#'pragma':'no-cache',#'cache-control':'no-cach

系统 2019-09-27 17:53:21 2090

Python

(python示例实现)

三大相关系数:pearson,spearman,kendall统计学中的三大相关性系数:pearson,spearman,kendall,他们反应的都是两个变量之间变化趋势的方向以及程度,其值范围为-1到+1。0表示两个变量不相关,正值表示正相关,负值表示负相关,值越大表示相关性越强。1.personcorrelationcoefficient(皮尔森相关性系数)皮尔逊相关系数通常用r或ρ表示,度量两变量X和Y之间相互关系(线性相关)(1)公式皮尔森相关性

系统 2019-09-27 17:53:11 2090

Python

python函数的作用域及关键字详解

函数的作用域python中的作用域分4种情况:L:local,局部作用域,即函数中定义的变量;E:enclosing,嵌套的父级函数的局部作用域,即包含此函数的上级函数的局部作用域,但不是全局的;G:globa,全局变量,就是模块级别定义的变量;B:built-in,系统固定模块里面的变量,比如int,bytearray等。搜索变量的优先级顺序依次是:作用域局部>外层作用域>当前模块中的全局>python内置作用域,也就是LEGB。local和enclos

系统 2019-09-27 17:53:09 2090

Python

python2的range()函数、xrange()函数和python

版权声明:转载请注明作者(独孤尚良dugushangliang)出处:https://blog.csdn.net/dugushangliang/article/details/91970111python2的xrange()函数,被发展成了python3的range()函数,而python2的range()函数则同raw_input()函数一样(详见https://blog.csdn.net/dugushangliang/article/details/8

系统 2019-09-27 17:52:55 2090

Python

2019最新Python爬虫面试高频率面试题总结(二)

今天接着跟大家总结Python爬虫面试中常见的高频面试题。有需要的伙伴用心看啦!1.Request中包含什么呢?1、请求方式:主要有GET和POST两种方式,POST请求的参数不会包含在url里面2、请求URLURL:统一资源定位符,如一个网页文档、一张图片、一个视频等都可以用URL来唯一确定3、请求头信息,包含了User-Agent(浏览器请求头)、Host、Cookies信息4、请求体,GET请求时,一般不会有,POST请求时,请求体一般包含form-

系统 2019-09-27 17:52:44 2090

Python

简述Python2与Python3的不同点

在Python2和Python3中都提供print()方法来打印信息,但两个版本间的print稍微有差异主要体现在以下几个方面:1.python3中print是一个内置函数,有多个参数,而python2中print是一个语法结构;2.Python2打印时可以不加括号:print'helloworld',Python3则需要加括号print("helloworld")3.Python2中,input要求输入的字符串必须要加引号,为了避免读取非字符串类型发生的

系统 2019-09-27 17:52:30 2090

Python

Python机器学习之数据探索可视化库yellowbrick-tutorial

背景介绍从学sklearn时,除了算法的坎要过,还得学习matplotlib可视化,对我的实践应用而言,可视化更重要一些,然而matplotlib的易用性和美观性确实不敢恭维。陆续使用过plotly、seaborn,最终定格在了Bokeh,因为它可以与Flask完美的结合,数据看板的开发难度降低了很多。前阵子看到这个库可以较为便捷的实现数据探索,今天得空打算学习一下。原本访问的是英文文档,结果发现已经有人在做汉化,虽然看起来也像是谷歌翻译的,本着拿来主义,

系统 2019-09-27 17:52:29 2090

Python

python 学习记录

一、计算机结构五大部件:输入设备、输出设备、存储器、运算器、控制器二、cpu、硬盘、内存三者之间的关系cpu:是计算机运算核心和控制中心,让电脑的各个部件顺利工作,起到协调和控制作用硬盘:存储资料和软件等数据设备,有容量大,断电数据不丢失的特点,也被人们称之为“数据仓库”内存:a、负责硬盘等硬件上的数据与cpu之间的数据交换处理。b、缓存系统中的临时数据。c、断电后数据丢失三、变量的命名规则:1、要具有描述性2、变量名只能_、数字、字母组成,不能有空格或特

系统 2019-09-27 17:51:18 2090

Python

Python中使用第三方库xlrd来读取Excel示例

本篇文章介绍如何使用xlrd来读取Excel表格中的内容,xlrd是第三方库,所以在使用前我们需要安装xlrd。另外我们一般会使用xlwt来写Excel,所以下一篇文章我们会来介绍如何使用xlwt来写Excel。xlrd下载:xlrd0.8.0安装xlrd安装xlrd,只需运行setup即可,另外你也可以直接解压缩到你的project中,也可以直接用xlrd的API获取Excel,这里称之为workbook复制代码代码如下:open_workbook(fi

系统 2019-09-27 17:51:03 2090