Python

Python 自带网页解析器 html.parser

一般用xlml但遇到过解析出来的内容不一样。有误用另一种方法得到正确的,有误应该只是极少问题。这种方案备用html=browser.page_sourcehtm=bs(html,'html.parser')

系统 2019-09-27 17:53:29 1991

Python

理解python中生成器用法

生成器(generator)概念生成器不会把结果保存在一个系列中,而是保存生成器的状态,在每次进行迭代时返回一个值,直到遇到StopIteration异常结束。生成器语法生成器表达式:通列表解析语法,只不过把列表解析的[]换成()生成器表达式能做的事情列表解析基本都能处理,只不过在需要处理的序列比较大时,列表解析比较费内存。>>>gen=(x**2forxinrange(5))>>>genat0x0000000002FB7B40>>>>forgingen:

系统 2019-09-27 17:52:55 1991

Python

Python中使用socket发送HTTP请求数据接收不完整问题解决方法

由于工作的需求,需要用python做一个类似网络爬虫的采集器。虽然Python的urllib模块提供更加方便简洁操作,但是涉及到一些底层的需求,如手动设定User-Agent,Referer等,所以选择了直接用socket进行设计。当然,这样的话,需要对HTTP协议比较熟悉,HTTP协议这里就不做讲解了。整个python的代码如下:#!/usr/binenvpythonimportsockethost="www.baidu.com"se=socket.so

系统 2019-09-27 17:52:30 1991

Python

Windows 10 2019五月更新让Python安装和使用变得更加容易

尽管很多人想要学习编程,但“万事开头难”这个道理,还是会将不少人劝退。你在网上找到的大多数教程,都既定假设用户已经知道了如何执行基本操作,甚至直接跳到服务器管理等进阶内容。好消息是,在Windows102019五月更新(Version1903)中,微软为想要学习Python编程的用户,提供了一个更加便捷的部署选项。python.jpg(题图via:OnMSFT)据悉,Python是一种易于上手和阅读的编程语言,功能性毋庸置疑,但并非Windows自带。此前

系统 2019-09-27 17:51:08 1991

Python

Python实现代码统计工具

本文实例为大家分享了Python实现代码统计工具的具体代码,供大家参考,具体内容如下思路:首先获取所有文件,然后统计每个文件中代码的行数,最后将行数相加.实现的功能:统计每个文件的行数;统计总行数;支持指定统计文件类型,排除不想统计的文件类型;排除空行;排除注释行importosimportsysimportos.path#foriinsys.argv:#print(i)#判断单个文件的代码行数defcount_file_lines(file_path):

系统 2019-09-27 17:50:58 1991

Python

selenium2.0中常用的python函数汇总

本文总结分析了selenium2.0中常用的python函数。分享给大家供大家参考,具体如下:新建实例driver=webdriver.Firefox()此处定位均使用的百度首页输入框1.通过标签属性Id查找元素方法:find_element_by_id(element_id)实例:driver.find_element_by_id("kw")2.通过标签属性name查找元素方法:find_element_by_name(element_name)实例:d

系统 2019-09-27 17:50:52 1991

Python

python for和else语句趣谈

老婆给当程序员的老公打电话:“下班顺路买一斤包子带回来,如果看到卖西瓜的,买一个。”当晚,程序员老公手捧一个包子进了家门……老婆怒道:“你怎么就买了一个包子?”老公答曰:“因为看到了卖西瓜的。”程序员买西瓜的笑话可能大部分读者都知道,今天写的这篇文章和这个笑话有一定的关系。任何编程语言都提供了if...else...语句,表示如果(if)满足条件就做某件事,否则(else)就做另外一件事:ifa==b:print("true")else:print("fa

系统 2019-09-27 17:50:46 1991

Python

python基础面试题整理---从零开始 每天十题(02)

书接上回,我们继续来说说python的面试题,我在各个网站搜集了一些,我给予你们一个推荐的答案,你们可以组织成自己的语言来说出来,让我们更好的做到面向工资编程一、Q:说说你对zenofpython的理解,你有什么办法看到它。A:TheZenofPython是Python语言的指导原则,遵循这些基本原则,输入importthis,然后直接运行即可二、Q:什么是元类(meta_class)A:我们定义类来创建对象,但是现在我们知道类也是对象。那么是通过什么来创

系统 2019-09-27 17:50:41 1991

Python

python 备份zk配置项

使用python脚本备份zk中的配置python备份代码python3back.pyimportosimportos.pathfromkazoo.clientimportKazooClientfromkazoo.clientimportKazooStatezk=KazooClient('test:2181')zk.start()zkBashPath="/conf/base/"backUp_path="/tmp/test/"cs=zk.get_childre

系统 2019-09-27 17:50:23 1991

Python

Python 的可迭代对象、迭代器和生成器

迭代器和可迭代对象由for循环的内部原理说起list01=[2,434,5,6,8]foriteminlist01:print(item)大家有没有想过list类型对象为什么可以被for循环呢?能够被for循环的条件是:它是可迭代对象(iterable)。那么什么是可迭代对象呢?参考一下内置函数item()的官方说明文档:iter(object[,sentinel])返回一个iterator对象。根据是否存在第二个实参,第一个实参的解释是非常不同的。如果没

系统 2019-09-27 17:50:22 1991

Python

centos python3.4更新到3.6

centospython3.4更新到3.6python3.4是yum安装的就直接执行命令:yumupdatepython34-y如果是通过源码安装的,就需要下3.6源码包,重新解压,编译,安装

系统 2019-09-27 17:50:00 1991

Python

Python爬出基础编程

阅读更多初学Python爬虫时都会从最简单的方法开始,以下为几种常见的基础做法。"""简单的循环处理"""importrequestsurl_list=["https://www.baidu.com","https://www.cnblogs.com/"]forurlinurl_list:result=requests.get(url)print(result.text)"""线程池处理"""importrequestsfromconcurrent.fut

系统 2019-09-27 17:49:32 1991

Python

python实现对图片进行旋转,放缩,裁剪的功能

先说明下,我这是对某个目录下的图片名称进行操作,该目录下的图片名称为1.jpg,2.jpg。。。。。这样类似的图片名。1.旋转#-*-coding:utf-8-*-fromPILimportImagedefrotateimg(inputimg,outimg):im=Image.open(inputimg)#图片的宽度和高度img_size=im.sizeprint("图片宽度和高度分别是{}".format(img_size))#旋转图片#左旋转90度im

系统 2019-09-27 17:48:59 1991

Python

Python3.x版本中新的字符串格式化方法

我们知道Python3.x引入了新的字符串格式化语法。不同于Python2.x的复制代码代码如下:"%s%s"%(a,b)Python3.x是复制代码代码如下:"{0}{1}".format(a,b)今天我在用MySQLdb时,需要用带参数的复制代码代码如下:cursor.execute(sql,param)语句来完成SQL操作。被其他文章的陈旧说法给误导,用了复制代码代码如下:cursor.execute('insertintotestvalues(%s

系统 2019-09-27 17:48:45 1991

Python

Python使用稀疏矩阵节省内存实例

推荐系统中经常需要处理类似user_id,item_id,rating这样的数据,其实就是数学里面的稀疏矩阵,scipy中提供了sparse模块来解决这个问题,但scipy.sparse有很多问题不太合用:1、不能很好的同时支持data[i,...]、data[...,j]、data[i,j]快速切片;2、由于数据保存在内存中,不能很好的支持海量数据处理。要支持data[i,...]、data[...,j]的快速切片,需要i或者j的数据集中存储;同时,为了

系统 2019-09-27 17:48:09 1991