用PYTHON爬虫简单爬取网络小说。这里是17K小说网上,随便找了一本小说,名字是《千万大奖》。里面主要是三个函数:1、get_download_url()用于获取该小说的所有章节的URL。分析了该小说的目录页http://www.17k.com/list/2819620.html的HTML源码,发现其目录是包含在Volume里的A标签合集。所以就提取出了URLS列表。2、get_contents(target)用于获取小说指定章节的正文内容分析了小说中第
系统 2019-09-27 17:48:50 2255
某局某领导给了3只excel文件,一只里面有4个sheet需要处理,一个sheet有250+列,算下来总共有3000+列需要手动反复插入、删除列、拷贝、求和,所以给了4天的时间要完成。我不愿意做大量简单而且又是重复性工作,看了看3只表格的格式基本一样,于是我用python写了30行代码完成了这个“艰巨”任务。0x01用python操作excel需要安装xlrd、xlwt(或者其他的模块也行)。读取excel文件:workbook=xlrd.open_wor
系统 2019-09-27 17:47:50 2255
好久不见,风水轮流转,我竟然写写写python了近日有个小需求,要求收集统计一些信息上报,并直接在后台控制台打印,写入日志为了美观,需要以表格形式展现数据,形如虽说可以用prettytable实现这个效果,不过还得安装这个库,需求比较简单就不考虑安装第三方依赖了,所以得自己写照着这个图,可以发现几个关键的实现点1.由数据项的各个属性,整理出表头2.计算每个属性对应的最大宽度,作为每列的宽度3.每列左右留一些空4.表头上下,以及数据项末尾添加一行--+--外
系统 2019-09-27 17:46:44 2255
open函数你必须先用Python内置的open()函数打开一个文件,创建一个file对象,相关的辅助方法才可以调用它进行读写。语法:fileobject=open(file_name[,access_mode][,buffering])各个参数的细节如下:file_name:file_name变量是一个包含了你要访问的文件名称的字符串值。access_mode:access_mode决定了打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。这
系统 2019-09-27 17:45:46 2255
在python中,它也有这个含义,不过有点区别的是,“当...时候”这个条件成立在一段范围或者时间间隔内,从而在这段时间间隔内让python做好多事情。就好比这样一段情景:while年龄大于60岁:-------->当年龄大于60岁的时候退休-------->凡是符合上述条件就执行的动作展开想象,如果制作一道门,这道门就是用上述的条件调控开关的,假设有很多人经过这个们,报上年龄,只要年龄大于60,就退休(门打开,人可以出去),一个接一个地这样循环下去,突然
系统 2019-09-27 17:55:47 2254
在windows系统下写的python脚本,在linux下赋予权限chmod+xxxx.py以后,执行./xxx.py运行提示:bash:/usr/bin/autocrorder:/usr/bin/python^M:badinterpreter:Nosuchfileordirectory分析:这是不同系统编码格式引起的:在windows系统中编辑的.sh.py文件可能有不可见字符,所以在Linux系统下执行会报以上异常信息。一般是因为windows行结尾和
系统 2019-09-27 17:55:07 2254
qqbot是一个用python实现的、基于腾讯SmartQQ协议的QQ机器人框架,可运行在Linux、Windows和MacOSX平台下。你可以通过扩展qqbot来实现:监控、收集QQ消息自动消息推送聊天机器人通过QQ远程控制你的设备qqbot项目Gayhub地址:https://github.com/pandolia/qqbot#-*-coding:utf-8-*-importqqbotfromqqbotimportQQBotSlotasqqbotslo
系统 2019-09-27 17:54:51 2254
原文链接:https://blog.csdn.net/swinfans/article/details/86501555简介Json模块主要用来进行Python对象的序列化和反序列化。该模块中常用的方法有以下四个:json.dump将Python对象序列化为Json格式的数据流并写入文件类型的对象中json.dumps将Python对象序列化为Json格式的字符串json.load从文件类型的对象中读取Json格式的数据并反序列化成Python对象json
系统 2019-09-27 17:52:55 2254
使用Python进行项目开发时,由于不同的项目需要,可能会配置多个开发环境,不同开发环境之间的项目依赖包如果混合在一起,可能会引起意想不到的错误,本文主要介绍如何通过虚拟环境隔离不同开发环境,方便不同开发环境的共存。安装Python,本文以Python3.4为例。关于如何安装Python3.4,请参考其他经验,本文不在重复赘述。注意:将安装目录添加到环境变量中,否则无法在其他目录启动python。安装成功后截图如下所示:进入Python安装目录中的脚本目录
系统 2019-09-27 17:49:21 2254
这篇文章主要介绍了python智联招聘爬虫并导入到excel代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下写了一个智联招聘的爬虫,只要输入职位关键字,就能快速导出智联招聘上的数据,存在excel表里~importrequests,openpyxl#建立excel表joblist=[]wb=openpyxl.Workbook()sheet=wb.activesheet.title='智联招聘数据's
系统 2019-09-27 17:48:41 2254
本章包括:超越分类和回归的机器学习形式机器学习模型的正式评估程序为深度学习准备数据特征工程解决过度拟合问题接近机器学习问题的通用工作流程一、机器学习的四个分支机器学习算法通常分为四大类:1、监督学习监督学习主要包括分类和回归,但也有更多的外来变种,包括以下(有例子):1)序列生成-给定图片,预测描述它的标题。序列生成有时可以重新表述为一系列分类问题(例如重复预测序列中的单词或标记)。2)语法树预测-给定一个句子,将其分解预测为语法树。3)物体检测-给定图片
系统 2019-09-27 17:48:34 2254
利用python-docx模块,写批量生日邀请函有关python-docx的使用方法,可以参考官方的API文档。这里使用了其中的一些基本功能,来完成一个简单的任务:为参加聚会的好友,每人写一个word文档邀请函。邀请函也很简单,如下图:下面是代码:importdocxfromdocx.enum.textimportWD_PARAGRAPH_ALIGNMENT#引入文字的位置样式fromdocx.sharedimportPt#设置字体#从guest.txt文
系统 2019-09-27 17:47:40 2254
前言众所周知Python不像JS或者PHP这种弱类型语言里在字符串连接时会自动转换类型,如果直接将字符串和数字拼接会直接报错。如以下的代码:#coding=utf8str='你的分数是:'num=82text=str+num+'分|琼台博客'printtext执行结果直接报错:TypeError:cannotconcatenate'str'and'int'objects解决这个方法只有提前把num转换为字符串类型,可以使用bytes函数把int型转换为st
系统 2019-09-27 17:37:47 2254
假设名为A.py的文件需要调用B.py文件内的C(x,y)函数假如在同一目录下,则只需importBif__name__=="__main__":B.C(x,y)若只需调用单个函数,也可以fromBimportCif__name__=="__main__":C(x,y)若A.py和B.py位于不同的目录下,可以用以下方法(假设B.py位于D盘的根目录下)1.引用所在路径importsyssys.path.append('D:/')importBif__na
系统 2019-09-27 17:56:22 2253
处理丢失数据有两种丢失数据:Nonenp.nan(NaN)In[1]:importnumpyasnpIn[12]:%timeitnp.arange(0,10000,dtype=int).sum()21.3µs±1.66µsperloop(mean±std.dev.of7runs,10000loopseach)In[13]:%timeitnp.arange(0,10000,dtype=float).sum()24.2µs±2.7µsperloop(mean±
系统 2019-09-27 17:55:21 2253