创建爬虫目录:scrapystartprojectspiderName调试命令scrapyshell网站名调试命令可直接进行css和xpath的调试;成功执行命令之后可使用:response.xpath(xpath表达式)获取所需的内容。xpath说明:XPath是一门在XML文档中查找信息的语言表达式描述实例nodename选取nodename节点的所有子节点//div/从根节点选取/div//不考虑位置选择节点//div.选取当前节点./div…选取当
系统 2019-09-27 17:56:45 1985
本文实例讲述了python实现动态创建类的方法。分享给大家供大家参考,具体如下:python作为动态语言,如何在运行时动态创建类呢(pythonCreatingclassesdynamically),这在编程时,有时候很有用处,动态生成类,给予相应的属性和方法。通常来说有如下两种方式:1.根据条件,硬编码实现。2.利用typemetaclass来实现。根据条件硬编码defchoose_class(name):ifname=='foo':classFoo(o
系统 2019-09-27 17:56:45 1985
在打包镜像时,centos原生镜像中python版本为2.7。如果我们的服务基于python3版本,则需要手动安装。在安装时,有一点需要注意的是:由于系统中某些服务以来python2.7版本,因此不要去删除或修改系统中python的默认版本,否则会产生不可预知的后果。下面给出一个python3镜像打包示例:#baseimageFROMcentos:7.2.1511#installrelatedpackagesandpython3ENVENVIRONMENT
系统 2019-09-27 17:56:38 1985
#-*-coding=utf-8-*-importjsonimportrequestsheader={'User-Agent':'googlespider','Content-Encoding':'gzip','X-Forwarded-For':'202.101.43.22',}classBusiness(object):def__init__(self):passdefmy_JSONDecodeError(self):"""我出现JSONDecodeEr
系统 2019-09-27 17:56:35 1985
python网络编程详解网络编程的专利权应该属于Unix,各个平台(如windows、Linux等)、各门语言(C、C++、Python、Java等)所实现的符合自身特性的语法都大同小异。在我看来,懂得了Unix的socket网络编程,其他的形式的网络编程方法也就知道了。这句话说得还不太严谨。准确的应该说成懂得了socket编程的原理,网络编程也就知道了,不同之处就在于每个平台,每个语言都有自己专享的语法,我们直接灵活套用就行了。下面是用python实现的
系统 2019-09-27 17:55:59 1985
1.说一说Redis是什么Redis是一种「Key-Value」的内存型、非关系型数据库,属于NoSQL的一种。Redis的读写速度特别快,特别适合读写频繁的场景。Redis支持主从复制,支持数据持久化。2.知道Redis有哪些常用数据类型吗StringListHashSetZset3.说一下Redis用来做什么利用String,可以很容易实现「计数器」功能。利用List,可以实现「粉丝列表」功能。利用Hash,可以实现「浏览记录」功能。利用Set的并集、
系统 2019-09-27 17:55:50 1985
字符串的操作太多了,也很特别,所以我要把它单独拿出来参考文章:Python中常见字符串去除空格的方法总结https://www.cnblogs.com/fandx/p/9311755.html0、python去掉字符串中空格的方法https://www.cnblogs.com/zywscq/p/5325604.html原来哥哥已经收藏你了,超过13万的阅读量1、python3字符串操作总结https://www.cnblogs.com/jiduxia/p/
系统 2019-09-27 17:55:34 1985
python学习笔记,打算用五章介绍完python基础语法及基本用法。开发环境:python3.7推荐:https://github.com/jackfrued/Python-100-Dayspython基础语法学习不错。编码规范:PEP8风格指南PEP是PythonEnhancementProposal的缩写,通常翻译为“Python增强提案”。每个PEP都是一份为Python社区提供的指导Python往更好的方向发展的技术文档,其中的第8号增强提案(P
系统 2019-09-27 17:55:19 1985
题目描述:给定一组不含重复元素的整数数组nums,返回该数组所有可能的子集(幂集)。说明:解集不能包含重复的子集。示例:输入:nums=[1,2,3]输出:[[3],[1],[2],[1,2,3],[1,3],[2,3],[1,2],[]]SOLUTION1:迭代法比较常规的迭代法思路,循环nums数组,每次访问其中元素,将其转化为数组并加到result二维数组当中。CODE:classSolution:defsubsets(self,nums):'''n
系统 2019-09-27 17:55:12 1985
前面说到了urllib2的简单入门,下面整理了一部分urllib2的使用细节。1.Proxy的设置urllib2默认会使用环境变量http_proxy来设置HTTPProxy。如果想在程序中明确控制Proxy而不受环境变量的影响,可以使用代理。新建test14来实现一个简单的代理Demo:复制代码代码如下:importurllib2enable_proxy=Trueproxy_handler=urllib2.ProxyHandler({"http":'ht
系统 2019-09-27 17:54:48 1985