写爬虫似乎没有比用Python更合适了,Python社区提供的爬虫工具多得让你眼花缭乱,各种拿来就可以直接用的library分分钟就可以写出一个爬虫出来,今天就琢磨着写一个爬虫,将廖雪峰的Python教程爬下来做成PDF电子书方便大家离线阅读。开始写爬虫前,我们先来分析一下该网站1的页面结构,网页的左侧是教程的目录大纲,每个URL对应到右边的一篇文章,右侧上方是文章的标题,中间是文章的正文部分,正文内容是我们关心的重点,我们要爬的数据就是所有网页的正文部分
系统 2019-09-27 17:55:45 1990
Python常用函数方法DataFrame与Dict的转换、reindex()对DataFrame排序注:字典没有顺序,DataFrame有顺序。importpandasaspdimportnumpyasnpdict={'c':1,'a':2,'b':3}print(dict)#打印字典#将字典转为DataFrame,列索引命名为zhi,行索引为原字典的键名df=pd.DataFrame([dict],index=['zhi'])#DataFrame转Di
系统 2019-09-27 17:55:17 1990
openpyxl特点openpyxl(可读写excel表)专门处理Excel2007及以上版本产生的xlsx文件,xls和xlsx之间转换容易注意:如果文字编码是“gb2312”读取后就会显示乱码,请先转成Unicode1、openpyxl读写单元格时,单元格的坐标位置起始值是(1,1),即下标最小值为1,否则报错!tableTitle=['userName','Phone','age','Remark']#维护表头#ifrow<1orcolumn<1:#
系统 2019-09-27 17:54:22 1990
人红是非多,最近Python就遇到了这样的问题。与国际技术社区上一片「形势大好」对比鲜明的是,国内技术圈却一直存在对Python,「力挺」和「吃瓜」两派阵营,针锋相对,那么,Python到底有没有用,真相究竟如何?是谁推波助澜了Python?Python究竟能做什么?程序员:该重新定义都说Python易学,究竟好学在哪里呢?因为其拥有大量第三方库,所以开发人员不必重复造轮子,就像搭积木一样,只要擅于利用这些库就可以完成绝大部分工作。它可以做网络爬虫。不夸张
系统 2019-09-27 17:53:43 1990
'''br/>题一:判断列表中含有字符串且组成新的列表打印输出知识点:列表、列表的增删改查、for循环、if判断'''#@Author:Dotest软件测试#@QQ:1274057839names=['Dotest','test','donghao',100,True]#定义空列表;容器;思考:为什么不放在for循环里面定义?str_name=[]#for循环fornameinnames:#if判断;函数:isinstance是判断是否为某类型ifisin
系统 2019-09-27 17:53:41 1990
最近公司一个项目需要用到IAP升级,要求将APP的版本号在hex文件添加,于是尝试用python写一个脚本,运行之后可以自动增加版本号,并且日期都是当天的importreimporttime#获取日期的数据及校验和year=int(time.strftime("%y",time.localtime()))month=int(time.strftime("%m",time.localtime()))date=int(time.strftime("%d",ti
系统 2019-09-27 17:52:41 1990
Python是静态作用域语言,尽管它自身是一个动态语言。也就是说,在Python中变量的作用域是由它在源代码中的位置决定的,这与C有些相似,但是Python与C在作用域方面的差异还是非常明显的。接下来会谈论Python的作用域规则,在这中间也会说明一下Python与C在作用域方面的不同。在Python2.0及之前的版本中,Python只支持3种作用域,即局部作用域,全局作用域,内置作用域;在Python2.2中,Python正式引入了一种新的作用域---嵌
系统 2019-09-27 17:52:41 1990
requests库的安装:ubuntu和windows下安装requests库:pipinstallrequestsrequests的介绍:Requests是一个优雅而简单的PythonHTTP库requests的文档:中文版:http://cn.python-requests.org/zh_CN/latest/英文版:http://docs.python-requests.org/en/master/api/requests的基本用法:Get请求:(一)
系统 2019-09-27 17:52:36 1990
一、文件的打开和创建1、打开复制代码代码如下:open(file,mode):>>>fo=open('test.txt','r')>>>fo.read()'hello\n'>>>fo.close()file(file,mode):>>>f=file('test.txt','r')>>>f.read()'hello\n'>>>f.close()mode可取值:2、创建用w/w+/a/a+模式打开即可。二、文件的读取1、String=FileObject.re
系统 2019-09-27 17:52:20 1990
1.交换变量值2.将一列表中的所有元素拼接成字符串3.查找list中最高频率的值4.检查两个单词是否是字谜(组成的字母和对应数量一致)5.反转字符串6.反转列表7.转置2维数组8.链式比较9.链式函数调用10.复制列表11.DictionaryGet12.按值排序字典13.ForElse14.将列表转换为逗号分隔的字符串15.合并字典16.list中的最小和最大索引17.从列表中删除重复项查看英文原文:https://hackernoon.com/pyth
系统 2019-09-27 17:51:34 1990