- 军军小站|张军博客
搜索到与相关的文章
Python

python爬虫学习之爬取某图片网站

0x00:使用xpath进行网页解析#coding:utf-8importrequestsimportosimportrefromlxmlimportetreeimporttimedefget_title(title):#获取标题,创建文件path=r"./Pic/"+titleifos.path.exists(path):#文件夹存在,返回returnpathelse:os.makedirs(path)#创建空文件夹returnpathdefpic_ge

系统 2019-09-27 17:48:15 1788

Python

基于Python __dict__与dir()的区别详解

Python下一切皆对象,每个对象都有多个属性(attribute),Python对属性有一套统一的管理方案。__dict__与dir()的区别:dir()是一个函数,返回的是list;__dict__是一个字典,键为属性名,值为属性值;dir()用来寻找一个对象的所有属性,包括__dict__中的属性,__dict__是dir()的子集;并不是所有对象都拥有__dict__属性。许多内建类型就没有__dict__属性,如list,此时就需要用dir()来

系统 2019-09-27 17:48:14 1788

Python

Python风格规范PEP8

分号不要在行尾加分号,也不要用分号将两条命令放在同一行.行长度每行不超过80个字符例外:长的导入模块语句注释里的URL不要使用反斜杠连接行.Python会将圆括号,中括号和花括号中的行隐式的连接起来,你可以利用这个特点.如果需要,你可以在表达式外围增加一对额外的圆括号.Yes:foo_bar(self,width,height,color='black',design=None,x='foo',emphasis=None,highlight=0)if(wi

系统 2019-09-27 17:48:08 1788

Python

使用rpclib进行Python网络编程时的注释问题

rpclib是一个非常好用的pythonwebservice库,可以动态的生成wsdl,不过这个项目已经基本停止,并被一个新的项目取代spyne,由于旧的项目工作已经比较稳定,所以我没有贸然升级到spyne。我在rpclib编写service方法时,遇到一个奇怪的错误:访问wsdl(http://localhost:9898/?wsdl)页面,返回502BadGateway。在日志中看到如下错误信息:复制代码代码如下:ValueError:Allstrin

系统 2019-09-27 17:48:07 1788

Python

python爬虫 2019中国好声音评论爬取过程解析

2019中国好声音火热开播,作为一名“假粉丝”,这一季每一期都刷过了,尤其刚播出的第六期开始正式的battle。视频视频看完了,那看下大家都是怎样评论的。1.网页分析部分本文爬取的是腾讯视频评论,第六期的评论地址是:http://coral.qq.com/4093121984每页有10条评论,点击“查看更多评论”,可将新的评论加载进来,通过多次加载,可以发现我们要找的评论就在以v2开头的js类型的响应中。请求为GET请求,地址是http://coral.q

系统 2019-09-27 17:48:03 1788

Python

Python - xml模块

xml模块处理文档:importxml.etree.ElementTreeasETtree=ET.parse('xmlfile')#ET.parse()解析xml文档root=tree.getroot()#获取根节点print(root.tag)#root.tag获取根节点标签这里是dataforiinroot:print(i.tag)#获取根节点下的标签print(i.attrib)#获取根节点下的标签属性标签>>:country、标签属性>>:{'na

系统 2019-09-27 17:47:56 1788

Python

Python 字典(Dictionary)操作详解

Python字典是另一种可变容器模型,且可存储任意类型对象,如字符串、数字、元组等其他容器模型。一、创建字典字典由键和对应值成对组成。字典也被称作关联数组或哈希表。基本语法如下:dict={'Alice':'2341','Beth':'9102','Cecil':'3258'}也可如此创建字典dict1={'abc':456}dict2={'abc':123,98.6:37}注意:每个键与值用冒号隔开(:),每对用逗号,每对用逗号分割,整体放在花括号中({

系统 2019-09-27 17:47:55 1788

Python

python 远程统计文件代码分享

python远程统计文件#!/usr/bin/python#encoding=utf-8importtimeimportosimportparamikoimportmultiprocessing#统计文件数量defget_total(ip,password,filepath):paramiko.util.log_to_file('paramiko.log')ssh=paramiko.SSHClient()ssh.set_missing_host_key_p

系统 2019-09-27 17:47:49 1788

Python

Python中logging模块的用法实例

本文实例讲述了logging模块的用法实例,分享给大家供大家参考。具体方法如下:importloggingimportoslog=logging.getLogger()formatter=logging.Formatter('[%(asctime)s][%(name)s]%(levelname)s:%(message)s')stream_handler=logging.StreamHandler()file_handler=logging.FileHand

系统 2019-09-27 17:47:39 1788

Python

python中给函数传参是传值还是传引用

首先还是应该科普下函数参数传递机制,传值和传引用是什么意思?函数参数传递机制问题在本质上是调用函数(过程)和被调用函数(过程)在调用发生时进行通信的方法问题。基本的参数传递机制有两种:值传递和引用传递。值传递(passl-by-value)过程中,被调函数的形式参数作为被调函数的局部变量处理,即在堆栈中开辟了内存空间以存放由主调函数放进来的实参的值,从而成为了实参的一个副本。值传递的特点是被调函数对形式参数的任何操作都是作为局部变量进行,不会影响主调函数的

系统 2019-09-27 17:47:11 1788