较小文件处理方法:importhashlibimportosdefget_md5_01(file_path):md5=Noneifos.path.isfile(file_path):f=open(file_path,'rb')md5_obj=hashlib.md5()md5_obj.update(f.read())hash_code=md5_obj.hexdigest()f.close()md5=str(hash_code).lower()returnmd
系统 2019-09-27 17:57:00 1938
创建爬虫目录:scrapystartprojectspiderName调试命令scrapyshell网站名调试命令可直接进行css和xpath的调试;成功执行命令之后可使用:response.xpath(xpath表达式)获取所需的内容。xpath说明:XPath是一门在XML文档中查找信息的语言表达式描述实例nodename选取nodename节点的所有子节点//div/从根节点选取/div//不考虑位置选择节点//div.选取当前节点./div…选取当
系统 2019-09-27 17:56:45 1938
Python的环境变量环境变量说明PYTHONSTARTUP在交互式启动时执行的文件(无默认值)PYTHONPATH‘:'-以默认模块搜索路径为前缀的分隔目录列表。结果是sys.path。PYTHONHOME交替的目录(或者:).默认的模块搜索路径为/pythonX.X.PYTHONCASEOK忽略import语句中的大小写(Windows)。PYTHONIOENCODING用于stdin/stdout/stderr中的编码PYTHONHASHSEED如果
系统 2019-09-27 17:56:35 1938
python访问抓取网页常用命令简单的抓取网页:importurllib.requesturl="http://google.cn/"response=urllib.request.urlopen(url)#返回文件对象page=response.read()直接将URL保存为本地文件:importurllib.requesturl="http://google.cn/"response=urllib.request.urlopen(url)#返回文件对象
系统 2019-09-27 17:56:08 1938
1、概述1.1场景我们在使用Python中的方法method时,经常会看到参数中带有self,但是我们也没对这个参数进行赋值,那么这个参数到底是啥意思呢?2、知识点2.1成员函数(m)和普通方法(f)Python中的"类方法"必须有一个额外的第一个参数名称(名称任意,不过推荐self),而"普通方法"则不需要。m、f、c都是代码自动提示时的左边字母(method、function、class)#-*-coding:utf-8-*-classTest(obj
系统 2019-09-27 17:56:05 1938
本文实例展示了一个脚本python用来转化表配置数据xml并生成相应的解析代码。但是在中文编码上出现了乱码,现将解决方法分享出来供大家参考。具体方法如下:1.Python文件设置编码utf-8(文件前面加上#encoding=utf-8)2.MySQL数据库charset=utf-83.Python连接MySQL是加上参数charset=utf84.设置Python的默认编码为utf-8(sys.setdefaultencoding(utf-8)示例代码如
系统 2019-09-27 17:55:27 1938
合并多个excel1.https://jingyan.baidu.com/article/e6c8503cb6ed7ee54e1a1811.html2.python#-*-coding:utf-8-*-importxlrd,xlsxwriter#待合并excelallxls=["C:\\Users\\wangjun\\Desktop\\ALL\\lvjie(6)(1).xlsx","C:\\Users\\wangjun\\Desktop\\ALL\\lvj
系统 2019-09-27 17:55:23 1938
1、字符串1.1、如何在Python中使用字符串a、使用单引号(')用单引号括起来表示字符串,例如:str='thisisstring';printstr;b、使用双引号(")双引号中的字符串与单引号中的字符串用法完全相同,例如:str="thisisstring";printstr;c、使用三引号(''')利用三引号,表示多行的字符串,可以在三引号中自由的使用单引号和双引号,例如:'''遇到问题没人解答?小编创建了一个Python学习交流QQ群:8576
系统 2019-09-27 17:55:13 1938
题目描述:给定一组不含重复元素的整数数组nums,返回该数组所有可能的子集(幂集)。说明:解集不能包含重复的子集。示例:输入:nums=[1,2,3]输出:[[3],[1],[2],[1,2,3],[1,3],[2,3],[1,2],[]]SOLUTION1:迭代法比较常规的迭代法思路,循环nums数组,每次访问其中元素,将其转化为数组并加到result二维数组当中。CODE:classSolution:defsubsets(self,nums):'''n
系统 2019-09-27 17:55:12 1938
一、首先理解下面几个函数设置变量length()函数char_length()replace()函数max()函数1.1、设置变量set@变量名=值set@address='中国-山东省-聊城市-莘县';select@address1.2、length()函数char_length()函数区别selectlength('a'),char_length('a'),length('中'),char_length('中')1.3、replace()函数和leng
系统 2019-09-27 17:54:41 1938
正则表达式什么是正则表达式?正则表达式是对字符串(包括普通字符(例如,a到z之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是一种文本模式,该模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式可以干什么?快速高效的查找与分析字符串进行有规律查找比对字符串,也叫:模式匹配具有查找、比对、匹配、替换、插入
系统 2019-09-27 17:54:35 1938
1、判断目录是否存在、判断文件是否存在、创建目录、重命名目录或文件importos#获取当前目录路径:E:\Work\Projects\pythonprint(os.getcwd())#判断当前目录是否存在,不存在则创建目录dir1ifnotos.path.isdir('dir1'):os.mkdir('dir1')#判断指定目录是否存在,不存在则创建目录dir22ifnotos.path.isdir('E:\Work\Projects\python\di
系统 2019-09-27 17:54:34 1938
一些讨论Python中使用配置文件的最佳实践Python中使用配置文件的最好方法Python符号常量多种配置文件方案对比我的建议1.排除yamlyaml不是一个好主意,因为需要给项目引入额外的依赖。首先排除它,除非是你的个人项目,或者你的项目已经引入了这个package。2.使用setting.py如果你只是需要配置一些全局的符号常量(symbolicconstants),参考Django的做法,使用setting.py,参见:https://github
系统 2019-09-27 17:54:23 1938
迭代器迭代式访问元素的一种方式,迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。迭代器有两个基本的方法:iter()和next()。常见的字符串,列表或元组对象都可用于创建迭代器:>>>list=[1,2,3,4,5]>>>it=iter(list)>>>print(next(it))1>>>print(next(it))2迭代器对象可以使用常规for语句进行遍历:list=[
系统 2019-09-27 17:54:17 1938
如下所示:data={"北京":{"昌平":{"沙河":["oldboy","test"],"天通苑":["链接地产","我爱我家"]},"朝阳":{"望京":["奔驰","陌陌"],"国贸":["CICC","HP"],"东直门":["advent","飞信"]},"海淀":{}},"山东":{"德州":{},"青岛":{},"济南":{}},"广东":{"东莞":{},"常熟":{},"佛山":{}}}exit_flag=Falsewhilenotex
系统 2019-09-27 17:54:15 1938