首先,糗事百科大家都听说过吧?糗友们发的搞笑的段子一抓一大把,这次我们尝试一下用爬虫把他们抓取下来。友情提示糗事百科在前一段时间进行了改版,导致之前的代码没法用了,会导致无法输出和CPU占用过高的情况,是因为正则表达式没有匹配到的缘故。现在,博主已经对程序进行了重新修改,代码亲测可用,包括截图和说明,之前一直在忙所以没有及时更新,望大家海涵!糗事百科又又又又改版了,博主已经没心再去一次次匹配它了,如果大家遇到长时间运行不出结果也不报错的情况,请大家参考最新
系统 2019-09-27 17:52:43 2003
文件结构html_downloader.py-下载网页html内容#!/usr/bin/python#-*-coding:UTF-8-*-importurllib2classHtmlDownloader(object):defdownlod(self,url):ifurlisNone:returnNoneresponse=urllib2.urlopen(url)ifresponse.getcode()!=200:returnNonereturnrespon
系统 2019-09-27 17:52:08 2003
功能:为已存在的函数或对象添加额外的功能原则:不改变源代码为其添加功能不改变函数的调用方式方法:装饰器=高阶函数+嵌套函数(高阶函数:一个函数可以作为参数传递给另外一个函数,或者,一个函数的返回值是一个函数,即函数的入口地址)函数名作为参数传递给装饰器(@decorator_name)装饰函数返回函数名(函数地址)注意:默认情况下,装饰器会修改名字和文档说明,但是可以使用functools中的@wraps()解决。@wraps接受一个函数来进行装饰,并加入
系统 2019-09-27 17:51:46 2003
http://www.cnblogs.com/baiboy/p/django1.html摘要:Django的学习教程也是分门别类,形式不一。或是较为体系的官方文档,或者风格自由的博客文档,或者偏向实例的解析文档。即使官方文档,章节较多,文字阐述累赘,有时候我们只是关注某个功能用法而已,而自由博文最大的问题是互相抄袭,结构混乱,涵盖面小且错误较为明显。由此,本文结合学习期间资料梳理和项目开发经验,整理出一套较为常用实用的文章。适用于新手入门,无论C#,C,j
系统 2019-09-27 17:51:33 2003
到今日,已经去到python的第5课了,是不是很激动,已经对Python产生兴趣了,感觉python人家说胶水语言,比其他语言都简单,我还是觉得学习python再去学其他可能会更加高效。今日我们来学习列表和字典。这2个东西跟之前说的3数据类型有什么区别(字符串,整数int,浮点数float)有什么关系?这个还真是别疑惑。我们从变量这块去说吧。name="samly71"####这个name赋值字符串samly71这串;number=111####numbe
系统 2019-09-27 17:51:24 2003
Python解释器运行Python代码时,得到的是一个包含Python代码的以.py为扩展名的文本文件,要运行代码,就需要Python解释器去执行.py文件主要有以下几种解释器1.Cpython解释器(解释器是用C语言开发的)2.IPython解释器(基于Cpython之上的一个交互式解释器(>>>orIn[序号]))3.PyPy解释器(对Python代码进行动态编译,执行速度大大提高)4.Jython解释器(运行在Java平台上的python解释器,可以
系统 2019-09-27 17:51:21 2003
注释PIL是python的一个图像处理库,功能非常强大,可以实现图片的格式转换、旋转、裁剪、改变尺寸、像素处理、图片合并等等操作。PIL已经更名为pillow所以在终端输入pip3installpil会报错,而应该输入pip3installpillow进行安装。源码fromPILimportImagedefImage_PreProcessing():#待处理图片存储路径im=Image.open('UnprocessImage.jpeg')#Resize图
系统 2019-09-27 17:50:56 2003
在python自动化中,经常会遇到对数据文件的操作,比如添加多名员工,但是直接将员工数据写在python文件中,不但工作量大,要是以后再次遇到类似批量数据操作还会写在python文件中吗?应对这一问题,可以将数据写excel文件,针对excel文件进行操作,完美解决。本文仅介绍python对excel的操作安装xlrd库xlrd库官方地址:https://pypi.org/project/xlrd/pipinstallxlrd笔者在安装时使用了pip3in
系统 2019-09-27 17:49:41 2003
最近越发感觉到限制我对Python运用、以及读懂别人代码的地方,大多是在于对数据的处理能力。其实编程本质上就是数据处理,怎么把文本数据、图像数据,通过python读入、切分等,变成一个N维矩阵,然后再带入别人的模型,bingo~跑出来一个结果。结果当然也是一个矩阵或向量的形式。所以说,之所以对很多模型、代码束手无策,其实还是没有掌握好数据处理的“屠龙宝刀”,无法对海量数据进行“庖丁解牛”般的处理。因此,我想以一个别人代码中的一段为例,仔细琢磨文本数据处理的
系统 2019-09-27 17:49:36 2003
Django里面集成了SQLite的数据库,对于初期研究来说,可以用这个学习。第一步,创建数据库就涉及到建表等一系列的工作,在此之前,要先在cmd执行一个命令:pythonmanage.pymigrate这个命令就看成一个打包安装的命令,它会根据mysite/settings.py的配置安装一系列必要的数据库表第二步,我们要建立一个Model层,修改demo/model.py:fromdjango.dbimportmodelsclassQuestion(m
系统 2019-09-27 17:49:15 2003