Python

python网络爬虫原理

爬虫即网络爬虫,英文是WebSpider。翻译过来就是网络上爬行的蜘蛛,如果把互联网看作一张大网,那么爬虫就是在大网上爬来爬去的蜘蛛,碰到想要的食物,就把他抓取出来。我们在浏览器中输入一个网址,敲击回车,看到网站的页面信息。这就是浏览器请求了网站的服务器,获取到网络资源。那么,爬虫也相当于模拟浏览器发送请求,获得到HTML代码。HTML代码里通常包含了标签和文字信息,我们就从中提取到我们想要的信息。通常爬虫是从某个网站的某个页面开始,爬取这个页面的内容,找

系统 2019-09-27 17:51:06 2030

Python

用Python实现一个简单的多线程TCP服务器的教程

最近看《python核心编程》,书中实现了一个简单的1对1的TCPserver,但是在实际使用中1对1的形势明显是不行的,所以研究了一下如何在server端通过启动不同的线程(进程)来实现每个链接一个线程。其实python在类的设计上已经考虑到了这一方面的需求,我们只要在自己的server上继承一下SocketServer.BaseRequestHandler就可以了。server端代码如下:#!/usr/bin/envpythonimportSocket

系统 2019-09-27 17:48:11 2030

Python

Python 入门之 内置模块 -- random模块

Python入门之内置模块--random模块1、random模块importrandom#random--随机数(1)选择1-50之间随机的整数print(random.randint(1,50))(2)0-1之间随机小数,不包含1print(random.random())(3)1-10之间随机小数,不包含10print(random.uniform(1,10))(4)从容器中随机选择一个print(random.choice((1,2,3,4,5,7

系统 2019-09-27 17:47:58 2030

Python

python基于mysql实现的简单队列以及跨进程锁实例详解

通常在我们进行多进程应用开发的过程中,不可避免的会遇到多个进程访问同一个资源(临界资源)的状况,这时候必须通过加一个全局性的锁,来实现资源的同步访问(即:同一时间里只能有一个进程访问资源)。举个例子如下:假设我们用mysql来实现一个任务队列,实现的过程如下:1.在Mysql中创建Job表,用于储存队列任务,如下:createtablejobs(idauto_incrementnotnullprimarykey,messagetextnotnull,job

系统 2019-09-27 17:47:47 2030

Python

python里 super类的工作原理详解

super的工作原理如下:defsuper(cls,inst):mro=inst.__class__.mro()returnmro[mro.index(cls)+1]其中,cls代表类,inst代表实例,上面的代码做了两件事:获取inst的MRO列表查找cls在当前MRO列表中的index,并返回它的下一个类,即mro[index+1]当你使用super(cls,inst)时,Python会在inst的MRO列表上搜索cls的下一个类。下面看一个例子:cl

系统 2019-09-27 17:47:45 2030

Python

Python Selenium 自动配置zabbix邮箱报警功能

介绍:在上一篇博客中写了关于zabbix配置邮箱报警功能,但由于配置过程十分繁琐,这里我写了一个自动化配置的脚本(pythonselenium模块)。直接运行脚本会提高很多效率!实验环境:1.python3.72.selenium模块3.PyCharm开发软件实验步骤一、zabbix服务端和代理端安装,配置温馨提示:具体步骤参考博客https://blog.51cto.com/13760351/2431576二、zabbix服务web配置邮箱报警编写sel

系统 2019-09-27 17:47:13 2030

Python

世上最炫酷的几个Python 开源项目,了解一下

项目一:Supervisor简介:Supervisor是实际企业常用的一款Linux/Unix系统下的一个进程管理工具,基于Python开发,可以很方便的监听、启动、停止、重启一个或多个进程,而且当进程意外被杀死时,其可以实现自动恢复,很方便的做到进程自动恢复的功能,提高系统、服务的稳定性,多用于生产环境。下载地址:https://github.com/Supervisor/supervisor项目二:pyecharts简介:pyecharts是一个由Ec

系统 2019-09-27 17:45:42 2030

Python

浅析Python的Django框架中的Memcached

动态网站的问题就在于它是动态的。也就是说每次用户访问一个页面,服务器要执行数据库查询,启动模板,执行业务逻辑以及最终生成一个你所看到的网页,这一切都是动态即时生成的。从处理器资源的角度来看,这是比较昂贵的。对于大多数网络应用来说,过载并不是大问题。因为大多数网络应用并不是washingtonpost.com或Slashdot;它们通常是很小很简单,或者是中等规模的站点,只有很少的流量。但是对于中等至大规模流量的站点来说,尽可能地解决过载问题是非常必要的。这

系统 2019-09-27 17:38:44 2030

Python

Python中使用urllib2防止302跳转的代码例子

说明:python的urllib2获取网页(urlopen)会自动重定向(301,302)。但是,有时候我们需要获取302,301页面的状态信息。就必须获取到转向前的调试信息。下面代码将可以做到避免302重定向到新的网页#!/usr/bin/python#-*-coding:utf-8-*-#encoding=utf-8#Filename:states_code.pyimporturllib2classRedirctHandler(urllib2.HTTP

系统 2019-09-27 17:38:42 2030

Python

使用Python导出Excel图表以及导出为图片的方法

本篇讲下如何使用纯python代码将excel中的图表导出为图片。这里需要使用的模块有win32com、pythoncom模块。网上经查询有人已经写好的模块pyxlchart,具体代码如下:fromwin32com.clientimportDispatchimportosimportpythoncomclassPyxlchart(object):"""ThisclassexportschartsinanExcelSpreadsheettotheFileSy

系统 2019-09-27 17:37:59 2030

Python

python实现生成Word、docx文件的方法分析

本文实例讲述了python实现生成Word、docx文件的方法。分享给大家供大家参考,具体如下:http://python-docx.readthedocs.io/en/latest/index.html生成word的利器!一、快速开始fromdocximportDocumentdocument=Document()1、段落加一个段落,下面paragraph是前面内容的光标指向,后面再该处插入一句话。paragraph=document.add_parag

系统 2019-09-27 17:56:14 2029

Python

Python学习二:关于VS2017中pip3 install

Python3.6执行pip3installtesserocrpillow,报错:error:MicrosoftVisualC++14.0isrequired.Getitwith"MicrosoftVisualC++BuildTools":http://landinghub.visualstudio.com/visual-cpp-build-tools解决办法:去下方链接下载匹配版本的whl文件https://github.com/simonfluecki

系统 2019-09-27 17:55:28 2029

Python

python 级别联动实现

fromutils.httputilimportHttpfromutils.dbQryimportMyDbUtilhttp=Http()mydb=MyDbUtil()defquery_interface():list=mydb.select_some("systems","switch",1)nodes=mydb.select_some("node","switch",1)tasks=mydb.select_some("task","switch",1)a

系统 2019-09-27 17:54:44 2029

Python

Python爬虫——王者荣耀全皮肤拉取

文章目录Python爬虫——王者荣耀全皮肤拉取资源地址HeroScrapy.py运行上面的代码即可注意点Python爬虫——王者荣耀全皮肤拉取开门见山,话不多说资源地址英雄信息列表:http://pvp.qq.com/web201605/js/herolist.json皮肤前缀地址:http://game.gtimg.cn/images/yxzj/img201606/skin/hero-infoHeroScrapy.pyimportrequestsimpo

系统 2019-09-27 17:54:42 2029

Python

python django 增删改查操作 数据库Mysql

下面介绍一下django增删改查操作:1、view.py#-*-coding:utf-8-*-from__future__importunicode_literalsfromdjango.httpimportHttpResponsefrompolls.modelsimportTestfromdjango.shortcutsimportrender#Createyourviewshere.#解决乱码importsysreload(sys)sys.setdef

系统 2019-09-27 17:54:20 2029