搜索到与相关的文章
Python

python爬虫 urllib模块url编码处理详解

案例:爬取使用搜狗根据指定词条搜索到的页面数据(例如爬取词条为‘周杰伦'的页面数据)importurllib.request#1.指定urlurl='https://www.sogou.com/web?query=周杰伦''''2.发起请求:使用urlopen函数对指定的url发起请求,该函数返回一个响应对象,urlopen代表打开url'''response=urllib.request.urlopen(url=url)#3.获取响应对象中的页面数据:r

系统 2019-09-27 17:53:11 1944

Python

python:异常的简单处理

什么是异常?一般情况下,在python无法正常处理程序时就会发生一个异常(异常是python对象,表示一个错误),也就是我们俗称的程序崩了。异常就是程序运行时候发生错误的信号(在程序出现错误的时候,则会产生一个异常,若程序没有处理他,则会抛出该异常,程序的运行也随之终止)。异常的处理步骤:1、可预知的异常:如果错误发生的条件是可预知的,需要用if进行处理,在错误发生之前进行预防。2、未知的异常:try:代码块except异常类型:异常处理的方法else:如

系统 2019-09-27 17:53:08 1944

Python

Python中的pprint折腾记

1.背景看到这里提到了pprint。打算去试试.2.pprint简介找到在线官网解释:pprint―Dataprettyprinter就是一个,方便大家打印一些,相对复杂的变量的好东西。3.使用pprint去写点代码试试。代码:复制代码代码如下:#-------------------------------------------------------------------------------#Name:【记录】折腾Python中的pprint#

系统 2019-09-27 17:52:55 1944

Python

python网络爬虫学习笔记(2)

网络爬虫学习笔记(2)1资料《Python网络爬虫从入门到实践》唐松,陈志铨。主要面向windows平台下的python3。菜鸟教程-》python2笔记2-1Python基础(1)++python的列表还有一种只读格式——元组Tuple,它用()进行赋值,且只能在初始化时赋值。列表有追加元素的内置方法append()字典有内置方法keys()(获得所有键的值),values()元组用“()”标识,列表用“[]”标识,字典用“{}”标识type(变量)查看

系统 2019-09-27 17:52:44 1944

Python

详解Python核心编程中的浅拷贝与深拷贝

一、问题引出浅拷贝首先看下面代码的执行情况:a=[1,2,3]print('a=%s'%a)#a=[1,2,3]b=aprint('b=%s'%b)#b=[1,2,3]a.append(4)#对a进行修改print('a=%s'%a)#a=[1,2,3,4]print('b=%s'%b)#b=[1,2,3,4]b.append(5)#对b进行修改print('a=%s'%a)#a=[1,2,3,4,5]print('b=%s'%b)#b=[1,2,3,4,

系统 2019-09-27 17:52:42 1944

Python

Python进阶之路 3.5.2 for循环

3.5.2for循环hello大家好,不知道在上节中大家练习while循环练习得怎么样了,相信大家都已经熟悉while循环了吧,那么现在我在这里在向大家讲解一下for循环。大家肯定也很懵圈,怎么有个while循环,又有个for循环,for循环又是干嘛的?相信很多刚接触编程的朋友一定很懵圈,哈哈......因为我当时也很懵圈。好了,废话不多说,接下来就给大家将一下for循环和while循环的区别,以及for循环是什么东西。while循环的功能非常强大,它可以

系统 2019-09-27 17:52:18 1944

Python

关于《Selenium3自动化测试实战--基于python语言》

2016年1月,机缘巧合下我出版了《Selenium2自动化测试实战--基于python语言》这本书,当时写书的原因是,大部分讲Selenium的书并不讲编程语言和单元测试框,如果想在项目中使用Selenium,几乎离不开编程语言和单元测试框架,难道你只用SeleniumIDE去录制/回放脚本么?没想到受到许多测试人员的欢迎,我会时常去看网上的书评。大多是感谢的留言,书的销量也印证了这一点,当然,也有批评和建议。在此,表示感谢。随着,我对Selenium自

系统 2019-09-27 17:51:40 1944

Python

解决python 输出是省略号的问题

这个问题非常非常重要,搞了一晚上都没解决好,但是真的很简单很简单,如果你也是用的numpyarray,如果你也想得到输出矩阵的全部内容,而不是省略形式,[[0.102849430.09599310.00076021...,-0.010357750.025619380.09741836][-0.01446581-0.0427694-0.08351202...,0.024896150.05786737-0.01584686][-0.05037935-0.074

系统 2019-09-27 17:51:32 1944

Python

python BeautifulSoup设置页面编码的方法

在用BeautifulSoup进行抓取页面的时候,会各种各样的编码错误。可以通过在beautifulsoup中指定字符编码,解决问题。复制代码代码如下:importurllib2fromBeautifulSoupimportBeautifulSouppage=urllib2.urlopen('http://www.163.com');soup=BeautifulSoup(page,from_encoding="gb2312")printsoup.origi

系统 2019-09-27 17:51:09 1944

Python

python库lxml在linux和WIN系统下的安装

lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高XPath,全称XMLPathLanguage,即XML路径语言,它是一门在XML文档中查找信息的语言,它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索XPath的选择功能十分强大,它提供了非常简明的路径选择表达式,另外,它还提供了超过100个内建函数,用于字符串、数值、时间的匹配以及节点、序列的处理等,几乎所有我们想要定位的节点,都可

系统 2019-09-27 17:50:58 1944