初学Python之爬虫的简单入门一、什么是爬虫?1.简单介绍爬虫爬虫的全称为网络爬虫,简称爬虫,别名有网络机器人,网络蜘蛛等等。网络爬虫是一种自动获取网页内容的程序,为搜索引擎提供了重要的数据支撑。搜索引擎通过网络爬虫技术,将互联网中丰富的网页信息保存到本地,形成镜像备份。我们熟悉的谷歌、百度本质上也可理解为一种爬虫。如果形象地理解,爬虫就如同一只机器蜘蛛,它的基本操作就是模拟人的行为去各个网站抓取数据或返回数据。2.爬虫的分类网络爬虫一般分为传统爬虫和聚
系统 2019-09-27 17:56:55 2110
抓取猫眼电影上面Top100榜单,抓取的内容有电影名称,主演,上映时间,图片,得分等信息。抓取的内容以文件形式保存,地址为https://maoyan.com/board/41.分析该榜单页面如下拉到底部点击下一页,发现此时的URL变化了。此时的URL变为https://maoyan.com/board/4?offset=10,比之前的URL多了参数offset=10,再点击下一页的URL为https://maoyan.com/board/4?offset
系统 2019-09-27 17:56:34 2110
通过1至10阶来拟合对比均方误差及R评分,可以确定最优的“最大阶数”。importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.preprocessingimportPolynomialFeaturesfromsklearn.linear_modelimportLinearRegression,Perceptronfromsklearn.metricsimportmean_squared_error,r2
系统 2019-09-27 17:56:12 2110
【时间】2019.08.15【题目】python安装pytorch-cpu(Window系统64bit)参考官网:https://pytorch.org/get-started/locally/需要安装torch和torchvision库一、使用anaconda安装:condainstallpytorch-cputorchvision-cpu-cpytorch下载太慢的话直接下载whl文件再安装:http://download.pytorch.org/wh
系统 2019-09-27 17:55:19 2110
HTTP协议简介HTTP请求1:浏览器首先向服务器发送HTTP请求,请求包括:方法:GET还是POST,GET仅请求资源,POST会附带用户数据;路径:/full/url/path;域名:由Host头指定:Host:www.sina.com以及其他相关的Header;如果是POST,那么请求还包括一个Body,包含用户数据2:服务器向浏览器返回HTTP响应,响应包括:响应代码:200表示成功,3xx表示重定向,4xx表示客户端发送的请求有错误,5xx表示服
系统 2019-09-27 17:53:33 2110
#property#内置装饰器函数只在面向对象中使用frommathimportpiclassCircle:def__init__(self,r):self.r=r@propertydefperimeter(self):return2*pi*self.r@propertydefarea(self):returnself.r**2*pic1=Circle(5)print(c1.area)#圆的面积print(c1.perimeter)#圆的周长classPe
系统 2019-09-27 17:52:45 2110
您正在使用PyCharm,那么该如何创建并运行您的第一个Python项目?在你开始之前#确保满足以下先决条件:您正在使用PyCharmCE或Professional。您已经安装了Python本身。如果您使用的是macOS或Linux,那么您的计算机已经安装了Python。你可以从python.org获得Python。选择解释器#选择用于项目的解释器是一个重要的决定。Python是一种脚本语言,这意味着您的代码将由Python解释器转换为机器代码。您可以在计
系统 2019-09-27 17:50:07 2110
图片来源于网络文/Python高效编程生活中,有时候我们需要对一些重要的文件进行加密,Python提供了诸如hashlib,base64等便于使用的加密库。但对于日常学习而言,我们可以借助异或操作,实现一个简单的文件加密程序,从而强化自身的编程能力。记得给公众号加个星标,不会错过精彩内容。基础知识在Python中异或操作符为:^,也可以记作XOR。按位异或的意思是:相同值异或为0,不同值异或为1。具体来讲,有四种可能:0^0=0,0^1=1,1^0=1,1
系统 2019-09-27 17:48:56 2110
文件多了乱放,突然有一天发现硬盘空间不够了,于是写了个python脚本搜索所有大于10MB的文件,看看这些大文件有没有重复的副本,如果有,全部列出,以便手工删除使用方式加一个指定目录的参数比如pythonredundant_remover.py/tmp主要用到了stat模块,os、sys系统模块importos,sys#引入统计模块fromstatimport*BIG_FILE_THRESHOLD=10000000Ldict1={}#filesize做ke
系统 2019-09-27 17:48:22 2110
python的zipfile提供了非常便捷的方法来压缩和解压zip文件。例如,在py脚本所在目录中,有如下文件:复制代码代码如下:readability/readability.jsreadability/readability.txtreadability/readability-print.cssreadability/sprite-readability.pngreadability/readability.css将readability目录中的文件
系统 2019-09-27 17:48:06 2110
1、拉普拉斯变换在MATLAB中,拉普拉斯变换调用格式如下:(1)F=laplace(f)对f(t)进行拉普拉斯变换,其结果为F(s);(2)F=laplace(f,v)对f(t)进行拉普拉斯变换,其结果为F(v);(3)F=laplace(f,u,v)对f(u)进行拉普拉斯变换,其结果为F(v);在调用laplace函数前,要用syms命令对所有需要用到的变量等进行说明,即说明是符号变量。Python中用laplace_transform来计算信号的拉普
系统 2019-09-27 17:47:21 2110
代码注释单行注释#多行注释'''多行注释'''#这是单行注释'''这是多行注释'''print函数用法print('hello','world',sep="#",end="!")sep表示多个值之间的间隔符,end表示以什么结尾print函数格式化%c格式化字符及其ASCII码%s格式化字符串%d格式化整数%u格式化无符号整型%o格式化无符号八进制数%x格式化无符号十六进制数%X格式化无符号十六进制数(大写)%f格式化浮点数字,可指定小数点后的精度%e用科
系统 2019-09-27 17:47:01 2110
一、logging模块讲解1.函数:logging.basicConfig()参数讲解:(1)level代表高于或者等于这个值时,那么我们才会记录这条日志(2)filename代表日志会写在这个文件之中,如果没有这个字段则会显示在控制台上(3)format代表我们的日志显示的格式自定义,如果字段为空,那么默认格式为:level:log_name:contentimportloggingLOG_FORMAT="%(asctime)s======%(level
系统 2019-09-27 17:45:46 2110
Python语言与Perl,C和Java等语言有许多相似之处。但是,也存在一些差异。在本章中我们将来学习Python的基础语法,让你快速学会Python编程。第一个Python程序交互式编程交互式编程不需要创建脚本文件,是通过Python解释器的交互模式进来编写代码。linux上你只需要在命令行中输入Python命令即可启动交互式编程,提示窗口如下:$pythonPython2.7.6(default,Sep92014,15:04:36)[GCC4.2.1
系统 2019-09-27 17:38:44 2110
服务器系统:CentOS6.5,配置:CUDA8,cudnn5.1.16,TITANX。目标环境:tensorflow-gpu、keras安装Anaconda首先,将下载好的Anaconda安装包上传到服务器,然后在服务器上进入安装包所在文件夹,运行bash命令安装。安装结束后,还需手动配置环境变量,否则运行python时,默认还是调用系统自带的python。sudogedit~/.bashrc运行上述命令打开环境配置文档,在文档末尾添加(改为自己的安装路
系统 2019-09-27 17:57:06 2109